Disec3b1o de Experimentosmontgomery

DISEÑO Y
ANÁLISIS DE
EXPERIMENTOS
"""
DISENO Y
""'
ANALISIS DE
EXPERIMENTOS
segunda edición
Douglas C. Montgomery
UNIVERSIDAD ESTATAL DE ARIZONA
~LIMUSA WILEY~
VERSIÓN AUTORIZADA EN ESPAlllOL. DE L.A OBRA PUBL.ICADA
EN INGLÉS CON EL TITULO:
DESIGN ANO ANALYSIS OF EXPERIMENTS
© JOHN W1L.EY & sous, INc., New YORK, CHtCHESTER,
BRISBANE, S1NGAPORE, TORONTO AND WEINHEIM.
COLABORADOR EN LA TRADUCCIÓN:
RODOLFO PIÑA GARCÍA
Ri::v1stóN:
GRISELDAZETINAVÉLEZ
INGENIERA OUfMICA POR LA FACULTAD DE QufMICA DE LA
UNIVERSIDAD NACIONAL AUTÓNOMA DE México. DOCENTE
EN MATEMÁTICAS. PROFESORA EN LA ESCUELA DE CIENCIAS
QufMICAS DE L.A UNtVt:ORSIOAD LA SAL.L.E
LA PRESENTACIÓN Y DISPOSICIÓN EN CONJUNTO OE
DISEÑO Y ANÁLISIS DE EXPERIMENTOS
SON PROPIEDAD DEL EDITOR. NINGUNA PARTE DE ESTÁ OBRA PUEDE

SER REPRODUCIDA O TRANSMITIDA, MEDIANTE NINGÚN SISTEMA O
MÉTODO, ELECTRÓNICO O MECÁNICO (INCLUYENDO EL FOTO
COPIADO, LA GRABACIÓN O CUALQUIER SISTEMA DE RECUPERACIÓN
Y ALMACENAMIENTO DE INFORMACIÓN), SIN CONSENTIMIENTO POR
ESCRITO DEL EDITOR.
D.ERECHOS RESERVADOS:
e 2004, EDITORIAL LIMUSA, S.A. DE C.V.

GRUPO NORIEGA EDITORES
BALDERAS 95, México, O.E
C.P.06040
~ 85038050
01 (800} 706 9100
[@ 5512 2903
,,,., limusa@_noriega.com.mx
"t www.nonega.com.mx
CANIEM NúM. 121
HECHO EN México
ISBN 9681861566
3.2
Prefacio
El presente libro es un texto de introducción que aborda el diseño y análisis de experimentos. Tiene como
base los cursos sobre diseño de experimentos que he impartido durante más de 25 años en la Universidad
Estatal de Arizona, la Universidad de Washington y el Instituto de Tecnología de Georgia. Refleja asimis
mo los métodos que he encontrado útiles en mi propia práctica profesional como consultor en ingeniería
y estadística en las áreas generales de diseño de productos y procesos, mejoramiento de procesos e inge
niería de control de calidad.
El libro está destinado a estudiantes que han llevado un primer curso de métodos estadísticos. Este
curso previo debe incluir por lo menos algunas de las técnicas de estadística descriptiva, la distribución
normal y una introducción a los conceptos básicos de los intervalos de confianza y la prueba de hipótesis
para medias y varianzas. Los capítulos 10 y 11 requieren un manejo elemental de álgebra matricial.
Como los requisitos para llevar este curso son relativamente modestos, este libro puede usarse tam
bién en un segundo curso de estadística enfocado en el diseño estadístico de experimentos para estudian
tes de licenciatura de ingeniería, física, ciencias físicas y químicas, matemáticas y otros campos de las
ciencias. Durante varios años he impartido un curso basado en este libro en el primer año de estudios de
posgrado de ingeniería. Los estudiantes de este curso provienen de los campos tradicionales de ingenie
ría, física, química, matemáticas, investigación de operaciones y estadística. También he usado este libro
como base de un curso breve para el sector industrial sobre diseño de experimentos para técnicos en ejer
cicio con una amplia diversidad en su formación profesional. Se incluyen numerosos ejemplos que ilustran
todas las técnicas de diseño y análisis. Estos ejemplos se basan en aplicaciones del diseño experimental
en el mundo real, y se han tomado de diferentes campos de la ingeniería y las ciencias. Esto lleva al terreno
de las aplicaciones a un curso académico para ingenieros y científicos y hace de este libro una útil herra
mienta de referencia para experimentadores de una amplia gama de disciplinas.
ACERCA DEL LIBRO
La presente edición constituye una revisión sustancial del libro. He procurado mantener el equilibrio en
tre los tópicos de diseño y análisis; sin embargo, hay varios temas y ejemplos nuevos; asimismo he reorga
nizado gran parte del material. En la presente edición se resalta más el uso de la computadora. Durante
los últimos años han surgido varios productos de software excelentes que auxilian al experimentador en
las fases del diseño y el análisis para esta materia. He incluido las salidas de dos de estos productos, Mini
tab y Design-Expert, en varias partes del texto. Minitab es un paquete de software de estadística de carác
ter general ampliamente disponible, que cuenta con útiles herramientas de análisis de datos y que maneja
bastante bien el análisis de experimentos tanto con factores fijos como aleatorios (incluyendo el modelo
mixto). Design-Expert es un paquete que se enfoca exclusivamente en el diseño experimental. Tiene mu
chas herramientas para la construcción y evaluación de diseños, así como múltiples características de aná
lisis. En el sitio web de este libro puede obtenerse una versión para estudiantes de Design-Expert, y se hace
una amplia recomendación para usarlo. Exhorto a todos los profesores que usen este libro para que incor
poren software de computadora en sus cursos. En mi caso particular, llevo a todas mis clases una compu
V
vi PREFACIO
tadora laptop y un monitor, y todos los diseños o tópicos del análisis tratados en clase se ilustran con la
computadora.
En esta edición destaco aún más la conexión entre el experimento y el modelo que puede desarrollar
el experimentador a partir de los resultados del experimento. Los ingenieros (y en gran medida los cientí
ficos de la física y la química) aprenden los mecanismos físicos y sus modelos mecanicistas fundamentales
al principio de su formación académica, pero en la mayor parte de sus carreras profesionales tendrán que
trabajar con estos modelos. Los experimentos diseñados estadísticamente ofrecen al ingeniero una base
válida para desarrollar un modelo empírico del sistema bajo estudio. Después este modelo empírico pue
de manipularse (tal vez utilizando una superficie de respuesta o una gráfica de contorno, o quizá matemá
ticamente) como cualquier otro modelo de ingeniería. A lo largo de muchos años de docencia he
descubierto que este enfoque es muy eficaz para despertar el entusiasmo por los experimentos diseñados
estadísticamente en la comunidad de ingeniería. En consecuencia, al inicio del libro planteo la noción de
un modelo empírico fundamental para el experimento y las superficies de respuesta y destaco la impor
tancia del mismo.
También me he esforzado por presentar mucho más rápido los puntos críticos en los que intervienen
los diseños factoriales. Para facilitar este objetivo, condensé en un solo capítulo (el 3) el material intro
ductorio sobre los experimentos completamente aleatorizados con un solo factor y el análisis de varianza.
He ampliado el material sobre los diseños factoriales y factoriales fraccionados (capítulos 5 al 9) en un es
fuerzo por hacer que el material fluya con mayor eficiencia en la perspectiva tanto del lector como del
profesor y por hacer mayor hincapié en el modelo empírico. El capítulo sobre las superficies de respuesta
(el 11) sigue inmediatamente al material sobre diseños factoriales y factoriales fraccionados y modelado
de regresiones. He ampliado este capítulo, agregando nuevo material sobre diseños óptimos alfabéticos,
experimentos con mezclas y el problema de un diseño paramétrico robusto. En los capítulos 12 y 13 se
analizan experimentos que incluyen efectos aleatorios, así como algunas aplicaciones de estos conceptos
en diseños anidados y parcelas subdivididas. El capítulo 14 es una descripción general de temas importan
tes de diseño y análisis: la respuesta no normal, el método de BoxCox para seleccionar la forma de una
transformación, y otras alternativas; experimentos factoriales no balanceados; el análisis de covarianza,
incluyendo covariables en un diseño factorial y mediciones repetidas.
A lo largo del libro he destacado la importancia del diseño experimental como una herramienta que
el ingeniero en ejercicio puede usar en el diseño y desarrollo de productos, así como en el desarrollo y me
joramiento de procesos. Se ilustra el uso del diseño experimental en el desarrollo de productos que sean
robustos a factores ambientales y a otras fuentes de variabilidad. Considero que el uso del diseño experi
mental en las fases iniciales del ciclo de un producto puede reducir sustancialmente el tiempo y el costo de
conducirlo, redundando en procesos y productos con un mejor desempeño en campo y una mayor confia
bilidad que los que se desarrollan utilizando otros enfoques.
El libro contiene más material del que puede cubrirse sin prisas en un solo curso, por lo que espero
que los profesores puedan variar el contenido de cada curso o bien estudiar más a fondo algunos temas,
dependiendo de los intereses de la clase. Al final de cada capítulo hay un grupo de problemas (excepto en
el 1). El alcance de estos problemas varía desde ejercicios de cálculo, destinados a consolidar los funda
mentos, hasta la ampliación de principios básicos.
Mi curso en la universidad lo enfoco principalmente en los diseños factoriales y factoriales fracciona
dos. En consecuencia, por lo general cubro el capítulo 1, el capítulo 2 (muy rápido), la mayor parte del ca
pítulo 3, el capítulo 4 (sin incluir el material sobre bloques incompletos y mencionando sólo brevemente
los cuadrados latinos), y trato en detalle los capítulos 5 al 8 sobre diseños factoriales con dos niveles y di
seños factoriales fraccionados. Para concluir el curso, introduzco la metodología de superficies de res
puesta (capítulo 11) y hago un repaso general de los modelos con efectos aleatorios (capítulo 12) y los
diseños anidados y en parcelas subdivididas (capítulo 13). Siempre pido a los estudiantes que realicen un
PREFACIO vii
proyecto semestral que consiste en diseñar, conducir y presentar los resultados de un experimento dise
ñado estadísticamente. Les pido que trabajen en equipos, pues es la manera en que se realiza la mayor
parte de la experimentación industrial. Deben hacer la presentación de los resultados de su proyecto de
manera oral y por escrito.
MATERIAL SUPLEMENTARIO DEL TEXTO
Con esta edición he preparado un suplemento para cada capítulo del libro. En este material suplementa
rio se desarrollan temas que no pudieron tratarse con mayor detalle en el libro. También presento algunos
temas que no aparecen expresamente en el libro, pero que para algunos estudiantes y profesionistas en
ejercicio podría resultar de utilidad una introducción de los mismos. El nivel matemático de parte de este
material es más elevado que el del texto. Estoy consciente de que los profesores usan este libro con una
amplia variedad de audiencias, y es posible que algunos cursos de diseño más avanzados puedan benefi
ciarse al incluir varios de los temas del material suplementario del texto. Este material está en formato
electrónico en el CD/ROM del profesor (disponible sólo en inglés) y se encuentra en el sitio web de este
libro.
SITIO WEB
En el sitio web http://www. wiley.com/legacy/college/engi.n/montgomery316490/student/student.html está

disponible el material de apoyo para profesores y estudiantes. Este sitio se usará para comunicar informa
ción acerca de innovaciones y recomendaciones para el uso eficaz de este texto. El material suplementa
rio del texto puede encontrarse en este sitio, junto con versiones electrónicas de las series de datos
utilizadas en los ejemplos y los problemas de tarea, un plan de estudios del curso y proyectos semestrales
del curso en la Universidad Estatal de Atizona.
RECONOCIMIENTOS
Expreso mi agradecimiento a los muchos estudiantes, profesores y colegas que han usado antes este libro
y quienes me han hecho llegar útiles sugerencias para esta revisión. Las contribuciones de los doctores
Raymond H. Myers, G. Geoffrey Vining, Dennis Lin, John Ramberg, Joseph Pignatiello, Lloyd S. Nelson,
Andre Khuri, Peter Nelson, John A. Cornell, George C. Runger, Bert Keats, Dwayne Rollier, Norma Hu
bele, Cynthia Lowry, Russell G. Heikes, Harrison M. Wadsworth, William W. Hines, Arvind Shah, Jane
Ammons, Diane Schaub, Pat Spagon y William DuMouche, y los señores Mark Anderson y Pat Whitcomb
fueron particularmente invaluables. Mi Jefe de Departamento, el doctor Gary Hogg, ha proporcionado
un ambiente intelectualmente estimulante en el cual trabajar.
Las contribuciones de los profesionistas en activo con quienes he trabajado han sido invaluables. Es
imposible mencionarlos a todos, pero algunos de los principales son Dan McCarville y Lisa Custer de Mo
torola; Richard Post de Intel; Thm Bingham, Dick Vaughn, Julián Anderson, Richard Alkire y Chase
Neilson de Boeing Company; Mike Goza, Don Walton, Karen Madison, Jeff Stevens y Bob Kohm de
Alcoa; Jay Gardiner, John Butora, Dana Lesher, Lolly Marwah, Paul Thbias y Lean Masan de IBM; Eli
zabeth A Peck de The CocaCola Company; Sadri Khalessi y Franz Wagner de Signetics; Robert V. Bax
ley de Monsanto Chemicals; Harry PetersonNedry y Russell Boyles de Precision Castparts Corporation;
Bill New y Randy Schmid de AlliedSignal Aerospace; John M. Fluke, hijo, de John Fluke Manufacturing
viii PREFACIO
Company; Larry Newton y Kip Howlett de GeorgiaPacific, y Ernesto Ramos de BBN Software Products
Corporation.
Me encuentro en deuda con el profesor E.S. Pearson y con Biometrika, John Wiley & Sons, Prenti
ceHall, The American Statistical Association, The Institute of Mathematical Statistics y los editores de
Biometrics por el permiso para usar material protegido por derechos de autor. Lisa Custer realizó un ex
celente trabajo de presentación de las soluciones que aparecen en el CD/ROM del profesor, y la doctora
Cheryl J ennings realizó una corrección de estilo eficaz y de suma utilidad. Estoy agradecido con la Office
of Naval Research, la National Science Foundation, las compañías integrantes de NSF/lndustry/Univer
sity Cooperative Research Center in Quality and Reliability Engineering de la Universidad Estatal de
Arizona, e IBM Corporation por apoyar gran parte de mis investígacíones de estadística y diseño experi
mental de ingeniería.
Douglas C. Montgomery
Tempe, Arizona
Contenido
Capítulo l. Introducción 1
11 Estrategia de experimentación 1
12 Algunas aplicacionestípicas del diseño experimental 8
13 Principiosbásicos 11
14 Pautas generales para diseñar experimentos 13
15 Breve historia del diseño estadístico 17
16 Resumen: uso de técnicas estadísticasen la experimentación 19
Capítulo 2. Experimentos comparativos simples 21

21 Introducción 21
22 Conceptos estadísticosbásicos 22
23 Muestreo y distribucionesde muestreo 26
24 Inferencias acerca de las diferenciasen las medias, diseños aleatorizados 33
24.1 Prueba de hipótesis 33
24.2 Elección del tamaño de la muestra 40
24.3 Intervalos de confianza 42
24.4 Caso en que ai ~a~ 44
24.5 Caso en que se conocen ai y a~ 44
24.6 Comparación de una sola media con un valor especificado 45
24.7 Resumen 46
25 Inferencias acerca de las diferencias en las medias, diseños de comparacionespareadas 47
25.1 El problema de las comparacionespareadas 47
25.2 Ventajas del diseño de comparacionespareadas 50
26 Inferencias acerca de las varianzas de distribucionesnormales 51
2 7 Problemas 54
Capítulo 3. Experimentos con un solo factor: el análisis de varianza 60

3·1 Un ejemplo 60
32 El análisisde varianza 63
33 Análisisdel modelo con efectos fijos 65
33.1 Descomposiciónde la suma de cuadrados total 66
33.2 Análisis estadístico 69
33.3 Estimación de los parámetros del modelo 74
33.4 Datos no balanceados 75
ix
X CONTENIDO
34 Verificación de la adecuación del modelo 76

34.1 El supuesto de normalidad 77
34.2 Gráfica de los residuales en secuencia en el tiempo 79
34.3 Gráfica de los residuales contra los valores ajustados 80
34.4 Gráficas de los residuales contra otras variables 86
35 Interpretación práctica de los resultados 86
35.1 Un modelo de regresión 87
35.2 Comparaciones entre las medias de los tratamientos 88
35.3 Comparaciones gráficas de medias 89
35.4 Contrastes 90
35.5 Contrastes ortogonales 93
35.6 Método de Scheffé para comparar todos los contrastes 95
35.7 Comparación de pares de medias de tratamientos 96
35.8 Comparación de medias de tratamientos con un control 103
36 Muestra de salida de computadora 104
37 Determinación del tamaño de la muestra 107
37.1 Curvas de operación característica 107
37.2 Especificación de un incremento de la desviación estándar 109
37.3 Método para estimar el intervalo de confianza 110
38 Identificación de efectos de dispersión 110
39 El enfoque de regresión para el análisis de varianza 112
39.1 Estimación de núnimos cuadrados de los parámetros del modelo 112
39.2 Prueba general de significación de la regresión 114
310 Métodos no paramétricos en el análisis de varianza 116
310.1 La prueba de KruskalWallis 116
310.2 Comentarios generales sobre la transformación de rangos 118
311 Problemas 119
Capítulo 4. Bloques aleatorizados, cuadrados latinos y diseños relacionados 126
41 Diseño de bloques completos aleatorizados 126

41.1 Análisis estadístico del diseño de bloques completos aleatorizados 127
41.2 Verificación de la adecuación del modelo 135
41.3 Otros aspectos del diseño de bloques completos aleatorizados 136
41.4 Estimación de los parámetros del modelo y la prueba general de
significación de la regresión 141
42 Diseño de cuadrado latino 144
43 Diseño de cuadrado grecolatino 151
44 Diseños de bloques incompletos balanceados 154
44.1 Análisis estadístico del diseño de bloques incompletos balanceados 155
44.2 Estimación de mínimos cuadrados de los parámetros 159
44.3 Recuperación de información interbloques en el diseño de bloques
incompletos balanceados 161
45 Problemas 164
CONTENIDO xi
Capítulo 5. Introducción a los diseños factoriales 170

51 Definiciones y principios básicos 170
52 La ventaja de los diseños factoríales 174
53 Diseño factorial de dos factores 175
53.1 Un ejemplo 175
53.2 Análisis estadístico del modelo con efectos fijos 177
53.3 Verificación de la adecuación del modelo 185
53.4 Estimación de los parámetros del modelo 185
53.5 Elección del tamaño de la muestra 189
53.6 El supuesto de no interacción en un modelo de dos factores 190
53.7 Una observación por celda 191
54 Diseño factorial general 194
55 Ajuste de curvas y superficies de respuesta 201
56 Formación de bloques en un diseño factorial 207
57 Problemas 211
Capítulo 6. Diseño factorial 2" 218

61 Introducción 218
62 El diseño 2i 219
63 El diseño 23 228
64 El diseño general 2k 242
65 Una sola réplica del diseño 2k 244
66 Adición de puntos centrales en el diseño 2k 271
67 Problemas 276
Capítulo 7. Formación de bloques y confusión en el diseño factorial 2" 287

72 Formación de bloques de un diseño factorial 2k con réplicas 287
73 Confusión del diseño factorial 2k 288
74 Confusión del diseño factorial 2" en dos bloques 289
75 Confusión del diseño factorial 2" en cuatro bloques 2%
76 Confusión del diseño factorial 2* en 'JJ' bloques 297
77 Confusión parcial 299
78 Problemas 301
Capítulo 8. Diseños factoriales fraccionados de dos niveles 303

82 La fracción un medio del diseño 2k 304
83 La fracción un cuarto del diseño 2k 317
84 El diseño factorial fraccionado 't'-P general 326
85 Diseños de resolución ID 337
86 Diseños de resolución IV y V 347
87 Resumen 349
88 Problemas 350
xii CONTENIDO
Capítulo 9. Diseños factoriales y factoriales fraccionados con tres niveles y con niveles mixtos 363
91 Diseño factorial 3k 363
91.1 Notación y motivación del diseño 3k 363
91.2 El diseño 32 365
91.3 El diseño 33 367
91.4 El diseño general 3t 372
92 Confusión en el diseño factorial 3t 373
92.1 El diseño factorial 3k en tres bloques 373
92.2 El diseño factorial 3k en nueve bloques 377
92.3 El diseño factorial 3k en Y bloques 378
9-3 Réplicas fraccionadas del diseño factorial 3t 379
93.1 La fracción un tercio del diseño factorial 3t 379
93.2 Otros diseños factoriales fraccionados 3k-p 382
94 Diseños factoriales con niveles mixtos 383
94.1 Factores con dos y tres niveles 384
94.2 Factores con dos y cuatro niveles 385
95 Problemas 387
Capítulo 10. Ajuste de modelos de regresión 392

102 Modelos de regresión lineal 393
103 Estimación de los parámetros en modelos de regresión lineal 394
104 Prueba de hipótesis en la regresión múltiple 409
104.1 Prueba de significación de la regresión 409
104.2 Pruebas de los coeficientes de regresión individuales y de grupos de coeficientes 412
105 Intervalos de confianza en regresiones múltiples 415
105.1 Intervalos de confianza para los coeficientes de regresión individuales 415
105.2 Intervalo de confianza para la respuesta media 416
106 Predicción de nuevas observaciones de la respuesta 416
107 Diagnósticos del modelo de regresión 416
1O7 .1 Residuales escalados y PRESS 417
107 .2 Diagnósticos de influencia 420
108 Prueba de falta de ajuste 421
109 Problemas 422
Capítulo 11. Métodos de superficies de respuesta y otros enfoques para la optimización de

procesos 427
111 Introducción a la metodología de superficies de respuesta 427
112 Método del ascenso más pronunciado 430
113 Análisis de una superficie de respuesta de segundo orden 436
113.l Localización del punto estacionario 436
113.2 Caracterización de la superficie de respuesta 440
113.3 Sistemas de cordilleras 447
CONTENlOO xíií
113.4 Respuestas múltiples 448

114 Diseños experimentales para ajustar superficies de respuesta 455
114.1 Diseños para ajustar el modelo de primer orden 455
114.2 Diseños para ajustar el modelo de segundo orden 456
114.3 Formación de bloques en los diseños de superficie de respuesta 462
114.4 Diseños (óptimos) generados por computadora 466
115 Experimentos con mezclas 472
116 Operación evolutiva 484
11 7 Diseño robusto 488
117.1 Antecedentes 488
11 7 .2 El enfoque de la superficie de respuesta para el diseño robusto 492
118 Problemas 500
Capítulo 12. Experimentos con factores aleatorios 511

121 Modelo con efectos aleatorios 511
122 Diseño factorial de dos factores aleatorios 517
123 Modelo mixto con dos factores 522
124 Determinación del tamaño de la muestra con efectos aleatorios 529
125 Reglas para los cuadrados medios esperados 531
126 Pruebas F aproximadas 535
127 Algunos temas adicionales sobre la estimación de los componentes de la
varianza 543
127.1 Intervalos de confianza aproximados para los componentes de la varianza 543
127.2 Método de grandes muestras modificado 545
127.3 Estimación de máxima verosimilitud de componentes de la varianza 547
128 Problemas 552
Capítulo 13. Diseños anidados y en parcelas subdivididas 557

131 Diseño anidado de dos etapas 557
131.1 Análisis estadístico 558
131.2 Verificación del diagnóstico 563
131.3 Componentes de la varianza 565
131.4 Diseños anidados por etapas 566
132 Diseño anidado general de m etapas 566
133 Diseños con factores anidados y factoriales 569
134 Diseño de parcelas subdivididas 573
135 Otras variantes del diseño de parcelas subdivididas 578
135.1 Diseño de parcelas subdivididas con más de dos factores 578
135.2 Diseño de parcelas con doble subdivisión 580
135.3 Diseño de parcelas subdivididas en franjas 583
136 Problemas 584
Capítulo 14. Otros tópicos de diseño y análisis 590

141 Respuestas y transformaciones no normales 590
xiv CONTENIDO
141.1 Selecciónde una transformación: el método de BoxCox 590

141.2 Modelo lineal generalizado 594
142 Datos no balanceados en un diseño factorial 600
142.1 Datos proporcionales:un caso sencillo 600
142.2 Métodos aproximados 601
142.3 Método exacto 604
143 Análisisde covarianza 604
143.1 Descripcióndel procedimiento 605
143.2 Soluciónpor computadora 614
143.3 Desarrollo mediante la prueba general de significaciónde la regresión 616
143.4 Experimentosfactoriales con covariables 619
144 Medicionesrepetidas 624
145 Problemas 627
Bibliografia 630
Apéndice 637
Tubla l. Distribuciónnormal estándar acumulada 638
Tubla n. Puntos porcentuales de la distribuciónt 640
Tablam. Puntos porcentuales de la distribuciónx2 641
Tabla rv Puntos porcentuales de la distribuciónF 642
Tabla V. Curvas de operación característicapara el análisisde varianza del modelo con efectos fijos 647
Tubla VI. Curvas de operación característicapara el análisisde varianza del modelo con efectos
aleatorios 651
Tabla VII. Rangos significativospara la prueba del rango múltiple de Duncan 655
TablaVIIl. Puntos porcentuales del estadísticodel rango studentizado 656
Tabla IX. Valorescríticospara la prueba de Dunnett para comparar tratamientos con un control 658
Tabla X. Coeficientesde polinomios ortogonales 661
TublaXI. Números aleatorios 662
TablaXIl. Relaciones de alias para diseños factorialesfraccionados 2k - P con k s 15 y n s 64 663
TublaXIll. Glosario para el uso de Design F.xpert 680
Índice 681
Introducción
1 .. 1 ESTRATEGIA DE EXPERIMENTACIÓN
Investigadores de prácticamente todos los campos de estudio llevan a cabo experimentos, por lo general
para descubrir algo acerca de un proceso o sistema particular. En un sentido literal, un experimento es
una prueba. En una perspectiva más formal, un experimento puede definirse como una prueba o serie de
pruebas en las que se hacen cambios deliberados en las variables de entrada de un proceso o sistema para
observar e identificar las razones de los cambios que pudieran observarse en la respuesta de salida.
Este libro trata de la planeación y realización de experimentos y del análisis de los datos resultantes a
fin de obtener conclusiones válidas y objetivas. La atención se centra en los experimentos de ingeniería y
las ciencias físicas y químicas. En ingeniería, la experimentación desempeña un papel importante en el di
seño de productos nuevos, el desarrollo de procesos de manufactura y el mejoramiento de procesos. El
objetivo en muchos casos sería desarrollar un proceso robusto, es decir, un proceso que sea afectado en
forma mínima por fuentes de variabilidad externas.
Como ejemplo de un experimento, suponga que un ingeniero metalúrgico tiene interés en estudiar el
efecto de dos procesos diferentes de endurecimiento, el templado en aceite y el templado en agua salada,
sobre una aleación de aluminio. El objetivo del experimentador es determinar cuál de las dos soluciones
de templado produce la dureza máxima para esta aleación particular. El ingeniero decide someter varios
ejemplares o muestras para ensayo de la aleación a cada medio de templado y medir la dureza de los
ejemplares después del templado. Para determinar cuál de las soluciones es la mejor, se usará la dureza
promedio de los ejemplares tratados en cada solución de templado.
Al examinar este sencillo experimento salen a relucir varias cuestiones importantes:
1. lEstas dos soluciones son los únicos medios de templado de interés potencial?
2. lHay en este experimento otros factores que podrían afectar la dureza y que deberían investigar
se o controlarse?
3. lCuántas muestras para ensayo de la aleación deberán probarse en cada solución de templado?
4. lCómo deberán asignarse las muestras para ensayo de prueba a las soluciones de templado y en
qué orden deberán colectarse los datos?
1
2 CAPÍTULO 1 INTRODUCCIÓN
S. lQué método de análisis de datos deberá usarse?

6. lQué diferencia en la dureza promedio observada entre los dos medios de templado se conside
rará importante?
Tudas estas preguntas, y tal vez muchas más, tendrán que responderse satisfactoriamente antes de llevar a
cabo el experimento.
En cualquier experimento, los resultados y las conclusiones que puedan sacarse dependen en gran
medida de la manera en que se recabaron los datos. Para ilustrar este punto, suponga que el ingeniero
metalúrgico del experimento anterior utilizó ejemplares de una hornada para el templado en aceite y
ejemplares de una segunda hornada para el templado en agua salada. Entonces, cuando compare la dure
za promedio, el ingeniero no podrá saber qué parte de la diferencia observada es resultado de la solución
de templado y qué parte es el resultado de diferencias inherentes entre las hornadas.1 Por lo tanto, el mé
todo utilizado para recabar los datos ha afectado de manera adversa las conclusiones que pueden sacarse
del experimento.
En general, los experimentos se usan para estudiar el desempeño de procesos y sistemas. El proceso o
sistema puede representarse con el modelo ilustrado en la figura 11. El proceso puede por lo general vi
sualizarse como una combinación de máquinas, métodos, personas u otros recursos que transforman cier
ta entrada (con frecuencia un material) en una salida que tiene una o más respuestas observables.
Algunas variables del proceso x1, x2, ... , xP son controlables, mientras que otras Z¡, z2, .•. , zq son no controla
bles (aunque pueden serlo para los fines de una prueba). Los objetivos del experimento podrían com
prender los siguientes:
l. Determinar cuáles son las variables que tienen mayor influencia sobre la respuesta y.
2. Determinar cuál es el ajuste de lasx que tiene mayor influencia para que y esté casi siempre cerca
del valor nominal deseado.
3. Determinar cuál es el ajuste de las x que tiene mayor influencia para que la variabilidad de y sea
reducida.
4. Determinar cuál es el ajuste de lasx que tiene mayor influencia para que los efectos de las varia
bles no controlables Z¡, z2, ... , Zq sean mínimos.
Como se puede ver por el análisis anterior, los experimentos incluyen muchas veces varios factores.
Habitualmente, uno de los objetivos de la persona que realiza un experimento, llamada el experimenta·
dor, es determinar la influencia que tienen estos factores sobre la respuesta de salida del sistema. Al enfo
Factores controlables
.x:, "'2
Entradas Salida
Proceso
y
z1 z2 z4
Figura l·l Modelo general de un pro·
Factores no controlables ceso o sistema.
1 Un especialista en diseño experimental diría que los efectos de los medios de templado y las hornadas se confundieron; es decir, los
efectos de estos dos factores no pueden separarse.
1·1 ESTRATEGIA DE EXPERIMENTACIÓN 3
que general para planear y llevar a cabo el experimento se le llama estrategia de experimentación. Existen
varias estrategias que podría usar un experimentador. Se ilustrarán algunas de ellas con un ejemplo muy
sencillo.
Al autor le gusta mucho jugar golf. Desafortunadamente, no le agrada practicar, por lo que siempre
busca la manera más sencilla para bajar su puntuación. Algunos de los factores que él considera impor
tantes, o que podrían influir en su puntuación, son los siguientes:
l. El tipo de palo usado (grande o normal).

2. El tipo de pelota usada (de goma de balata o de tres piezas).
3. Caminar cargando los palos de golf o hacer el recorrido en un carrito.
4. Beber agua o cerveza durante el juego.
5. Jugar en la mañana o en la tarde.
6. Jugar cuando hace frío o cuando hace calor.
7. El tipo de spikes usados en los zapatos de golf (metálicos o de hule).
8. Jugar en un día con viento o en uno apacible.
Evidentemente, hay muchos otros factores que podrían considerarse, pero supongamos que éstos son los
de interés primario. Además, teniendo en cuenta su larga experiencia en el juego, el autor decide que los
factores 5 al 8 pueden ignorarse; es decir, estos factores no son importantes porque sus efectos son tan pe
queños que carecen de valor práctico. Los ingenieros y los investigadores deben tomar a menudo este tipo
de decisiones acerca de algunos de los factores que examinan en experimentos reales.
Consideremos ahora cómo podrían probarse experimentalmente los factores 1 al 4 para determinar
su efecto sobre la puntuación del autor. Suponga que en el curso del experimento pueden jugarse un má
ximo de ocho rondas de golf. Un enfoque consistiría en seleccionar una combinación arbitraria de estos
factores, probarlos y ver qué ocurre. Por ejemplo, suponga que se selecciona la combinación del palo
grande, la pelota de goma de balata, el carrito y el agua, y que la puntuación resultante es 87. Sin embargo,
durante la ronda el autor notó varios tiros descontrolados con el palo grande (en el golf, grande no siem
pre es sinónimo de bueno) y, en consecuencia, decide jugar otra ronda con el palo normal, manteniendo
los demás factores en los mismos niveles usados anteriormente. Este enfoque podría continuar de mane
ra casi indefinida, cambiando los niveles de uno (o quizá dos) de los factores para la prueba siguiente, con
base en el resultado de la prueba en curso. Esta estrategia de experimentación, conocida como enfoque de
la mejor conjetura, es común entre ingenieros y científicos. Funciona de manera adecuada si los experi
mentadores cuentan con una gran cantidad de conocimientos técnicos o teóricos del sistema que están es
tudiando, así como amplia experiencia práctica. Sin embargo, el enfoque de la mejor conjetura presenta
al menos dos desventajas. Primera, supóngase que la mejor conjetura inicial no produce los resultados de
seados. Entonces el experimentador tiene que hacer otra conjetura acerca de la combinación correcta de
los niveles de los factores. Esto podría continuar por mucho tiempo, sin garantía alguna de éxito. Segun
da, supóngase que la mejor conjetura inicial produce un resultado satisfactorio. Entonces, el experimen
tador se ve tentado a suspender las pruebas, aun cuando no hay ninguna garantía de que se ha encontrado
la mejor solución.
Otra estrategia de experimentación muy común en la práctica es el enfoque de un factor a la vez. Este
método consiste en seleccionar un punto de partida, o línea base de los niveles, para cada factor, para des
pués variar sucesivamente cada factor en su rango, manteniendo constantes los factores restantes en el ni
vel base. Después de haber realizado todas las pruebas, se construye por lo general una serie de gráficas
en las que se muestra la forma en que la variable de respuesta es afectada al variar cada factor mantenien
do los demás factores constantes. En la figura 12 se presenta una serie de gráficas para el experimento
del golf, utilizando como línea base los niveles de los cuatro factores: el palo grande, la pelota de goma de
1[:_
G (grande) N (normal)
Palo
(= 1~
GB (99fTli1
de balata) ~s)
Pelota
TP (tres C (caminando) EC (en
c,1rrito)
Manera de despiazarse
t.A (agua) C (cerveza)
Bebida
Figura 1·2 Resultados de la estrategia de un factor a la vez para el experimento de golf.
balata, caminar y beber agua. La interpretación de esta gráfica es directa; por ejemplo, debido a que la
pendiente de la curva de la manera de desplazarse es negativa, se concluiría que hacer el recorrido en el
carrito mejora la puntuación. Con base en estas gráficas de un factor a la vez, la combinación óptima que
se seleccionaría sería el palo normal, desplazarse en el carrito y beber agua. El tipo de pelota de golf apa
rentemente carece de importancia.
La desventaja principal de Ja estrategia de un factor a la vez es que no puede tomar en consideración
cualquier posible interacciónentre los factores. Hay una interacción cuando uno de los factores no pro
duce el mismo efecto en la respuesta con niveles diferentes de otro factor. En la figura 13 se muestra una
interacción entre los factores del tipo de palo y la bebida para el experimento del golf. Observe que si el
autor utiliza el palo normal, el tipo de bebida consumida prácticamente no tiene efecto alguno sobre su
puntuación, pero si utiliza el palo grande, se obtienen resultados mucho mejores cuando bebe agua en lu
gar de cerveza. Las interacciones entre factores son muy comunes y, en caso de existir, la estrategia de un
factor a la vez casi siempre producirá resultados deficientes. Muchas personas no perciben esto y, en
consecuencia, los experimentos de un factor a la vez son comunes en la práctica. (De hecho, algunas
personas piensan que esta estrategia se relaciona con el método científico o que es un principio "sólido"
de ingeniería.) Los experimentos de un factor a la vez siempre son menos eficientes que otros métodos
basados en un enfoque estadístico del diseño experimental. El tema se analizará con mayor detalle en el
capítulo 5.
El enfoque correcto para trabajar con varios factores es conducir un experimento factorial. Se trata
de una estrategia experimental en la que los factores se hacen variar en conjunto, en Jugar de uno a la vez.
TP(tres
~s)
1~
8.
F
GB
(goma de
balata).____..._ __._ __
A (agua) C (C81WZ8) G (grande) N (normal)
Tipo de bebida Tipo de palo
Figura 13 Interacción entre el Figura 1-4 Experimento factorial de dos

tipo de palo y el tipo de bebida para factores que incluye el tipo de palo y el tipo
el experimento del golf. de pelota.
11 ESTRATEGIA DE EXPERIMENTACIÓN 5
El concepto de diseño experimental factorial es de suma importancia, y varios capítulos de este libro se
dedican a presentar experimentos factoriales básicos, así como algunas variantes y casos especiales útiles.
Para ilustrar la forma en que se lleva a cabo un experimento factorial, considere el experimento de
golf y suponga que sólo dos de los factores son de interés, el tipo de palo y el tipo de pelota. En la figura
14 se muestra un experimento factorial para estudiar los efectos conjuntos de estos dos factores sobre la
puntuación de golf del autor. Observe que en este experimento factorial ambos factores tienen dos nive
les y que en el diseño se usan todas las combinaciones posibles de los niveles de ambos factores. Geomé
tricamente, las cuatro corridas forman los vértices de un cuadrado. A este tipo particular de experimento
factorial se le llama diseño factorial 22 (dos factores, cada uno con dos niveles). Debido a que el autor
considera razonable suponer que jugará ocho rondas de golf para investigar estos factores, un plan facti
ble sería jugar dos rondas de golf con cada combinación de los niveles de los factores, como se muestra en
la figura 14. Un diseñador de experimentos diría que se han hecho dos réplicas del diseño. Este diseño
experimental permitiría al experimentador investigar los efectos individuales (o los efectos principales)
de cada factor y determinar si existe alguna interacción entre los factores.
En la figura 1Sa se presentan los resultados obtenidos al realizar el experimento factorial de Ja figura
14. En los vértices del cuadrado se indican las puntuaciones de cada ronda de golf jugada con las cuatro
combinaciones de prueba. Observe que hay cuatro rondas de golf que proporcionan información acerca
del uso del palo normal y cuatro rondas que proporcionan información sobre el uso del palo grande. Al
encontrar la diferencia promedio de las puntuaciones que están en los lados derecho e izquierdo del
cuadrado (como en la figura 1-Sb ), se tiene una medida del efecto de cambiar del palo grande al palo normal, o
Ef ecto d e l pa l o = 92+94+93+91 88+ 91+88+ 90 = 3.25

4 4
TP (tres
piezas)
88,91
...
92,94
í!
_____
~
.g
s
I=
88,90
,. 93, 91
GB(goma
de balata) .___..__ .....___
G (grande) N (normaO
lipo de p¡ilo
a) Puntuaciones del experimento de golf
D 'U!OI
TP (tres
piezas)
GB(goma GB(goma GB (goma

de balata)
~
de balata)
de balata)
Tipo de palo Tipo de palo Tipo de palo
b) Comparación de las puntuaciones e) Comparación de las puntuaciones d) Comparación de las puntuaciones
que conducen al efecto del palo que conducen al efecto de la pelota que conducen al efecto de la
interacción pelotapalo
Figura 15 Puntuaciones del experimento del golf de la figura 14 y cálculo de los efectos de los factores.
Es decir, en promedio, al cambiar del palo grande al normal la puntuación se incrementa 3.25 golpes por
ronda. De manera similar, la diferencia promedio de las cuatro puntuaciones de la parte superior del cua
drado y de las cuatro puntuaciones de la parte inferior miden el efecto del tipo de pelota usado (ver la fi
gura 15c):
88+91+92+94 88+90+93+91 = 0.75 .

Efecto de la pelota = 4
___ 4
Por último, puede obtenerse uria medida del efecto de la interacción entre el tipo de pelota y el tipo de
palo restando la puntuación promedio en la diagonal de izquierda a derecha del cuadrado de la puntua
ción promedio de la diagonal de derecha a izquierda (ver la figura 15d), cuyo resultado es
: . ~+~+M+W 88+ 91+93+ 91 = 0.25

Efecto de la interacción pelotapalo =
4 4
Los resultados de este experimento factorial indican que el efecto del palo es mayor que el efecto de
la pelota o que el de la interacción. Podrían usarse pruebas estadísticas para determinar si cualquiera
de estos efectos difiere de cero. De hecho, el caso es que hay evidencia estadística razonablemente sólida
de que el efecto del palo difiere de cero y de que no es el caso para los otros dos efectos. Por lo tanto, tal
vez el autor debería jugar siempre con el palo grande.
En este sencillo ejemplo se pone de manifiesto una característica muy importante del experimento
factorial: en los diseños factoriales se hace el uso más eficiente de los datos experimentales. Note que este
experimento incluyó ocho observaciones, y que las ocho observaciones se usan para calcular los efectos
del palo, de la pelota y de la interacción. Ninguna otra estrategia de experimentación hace un uso tan efi
ciente de los datos. Ésta es una característica importante y útil de los diseños factoriales.
El concepto de experimento factorial puede extenderse a tres factores. Suponga que el autor desea
estudiar los efectos del tipo de palo, el tipo de pelota y el tipo de bebida consumida sobre su puntuación
de golf. Suponiendo que los tres factores tienen dos niveles, puede establecerse un diseño factorial como
el que se muestra en la figura 16. Observe que hay ocho combinaciones de prueba de estos tres factores
con los dos niveles de cada uno de ellos y que estos ocho ensayos pueden representarse geométricamente
como los vértices de un cubo. Se trata de un ejemplo de un diseño factorial 23• Como el autor sólo desea
jugar ocho rondas de golf, este experimento requeriría que se juegue una ronda con cada una de las com
binaciones de los factores representadas por los ocho vértices del cubo de la figura 16. Sin embargo, al
comparar esta situación con el diseño factorial de dos factores de la figura 14, el diseño factorial 23 pro
duciría la misma información acerca de los efectos de los factores. Por ejemplo, en ambos diseños hay
cuatro pruebas que proporcionan información acerca del palo normal y cuatro pruebas que proporcionan
l
1
l
______ ... __
1
... Palo
Figura 1·6 Experimento factorial de tres factores que

incluye el tipo de palo, el tipo de pelota y el tipo de bebi
da.
11 ESTRATEGIA DE EXPERIMENTACIÓN 7
Manera de desplazarse
Caminando En carrito
1 1
1
_
1
1
.........
1
,,,._,,,,¿_ _
..."' Palo
Figura 1·7 Experimento factorial de cuatro factores que incluye el tipo de

palo, el tipo de pelota, el tipo de bebida y la manera de desplazarse.
información acerca del palo grande, suponiendo que se repite dos veces cada corrida del diseño de dos
factores de la figura 14.
En la figura 1 7 se ilustra la forma en que podrían investigarse los cuatro factoresel palo, la pelota,
la bebida y la manera de desplazarse (caminando o en carrito) en un diseño factorial 24• Como en cual
quier diseño factorial, se usan todas las combinaciones posibles de los niveles de los factores. Puesto que
los cuatro factores tienen dos niveles, sigue siendo posible hacer la representación geométrica de este di
seño experimental mediante un cubo (en realidad un hipercubo).
En general, si hay k factores, cada uno con dos niveles, el diseño factorial requeriría 2k corridas. Por
ejemplo, el experimento de la figura 1 7 requiere 16 corridas. Evidentemente, cuando el número de facto
res de interés aumenta, el número de corridas requeridas se incrementa con rapidez; por ejemplo, un
experimento con 10 factores en el que todos los factores tienen dos niveles requeriría 1024 corridas. Esto
pronto se vuelve impracticable en lo que se refiere al tiempo y los recursos. En el experimento del golf,
el autor sólo puede jugar ocho rondas, por lo que incluso el experimento de la figura 1 7 resulta demasia
do largo.
Por fortuna, cuando se trabaja con cuatro, cinco o más factores, por lo general no es necesario probar
todas las combinaciones posibles de los niveles de los factores. Un experimento factorial fraccionado es
una variación del diseño factorial básico en.la que sólo se realiza un subconjunto de las corridas. En la fi
gura 18 se ilustra un diseño factorial fraccionado para la versión de cuatro factores del experimento del
golf. Este diseño requiere sólo 8 corridas en lugar de las 16 originales y se llamaría fracción un medio. Si el
autor sólo puede jugar ocho rondas de golf, éste es un excelente diseño en el cual estudiar los cuatro facto
. res. Proporcionará información adecuada acerca de los efectos principales de los cuatro factores, así
como cierta información acerca de la forma en que interactúan estos factores.
Los diseños factoriales fraccionados son muy comunes en la investigación y el desarrollo industrial,
así como en el mejoramiento de procesos. Estos diseños se analizarán en el capítulo 8.
Manera de desplazarse
Caminando En carrito
1
1
1
,/_@-----
Palo
Figura 18 Experimento factorial fraccionado de cuatro factores que incluye

el tipo de palo, el tipo de pelota, el tipo de bebida y la manera de desplazarse.
· ····
1~2 ALGUNAS APLICACIONES TÍPICAS DEL DISEÑO EXPERIMENTAL
Los métodos del diseño experimental han encontrado amplia aplicación en diversas disciplinas. De he
cho, la experimentación puede considerarse parte del proceso científico y uno de los medios para conocer
el funcionamiento de sistemas y procesos. En general, el aprendizaje ocurre a través de una serie de acti
vidades en las que se hacen conjeturas acerca de un proceso, se llevan a cabo experimentos para generar
datos del proceso y después se usa la información del experimento para establecer nuevas conjeturas, lo
que lleva a nuevos experimentos, y así sucesivamente,
El diseño experimental es una herramienta de importancia fundamental en el ámbito de la ingeniería
para mejorar el desempeño de un proceso de manufactura. También tiene múltiples aplicaciones en el de
sarrollo de procesos nuevos. La aplicación de las técnicas del diseño experimental en las fases iniciales del
desarrollo de un proceso puede redundar en
l. Mejoras en el rendimiento del proceso.
2. Variabilidad reducida y conformidad más cercana con los requerimientos nominales o proyectados.
3. Reducción del tiempo de desarrollo.
4. Reducción de los costos globales.
Los métodos del diseño experimental desempeñan también un papel importante en las actividades
del diseño de ingeniería, donde se desarrollan productos nuevos y se hacen mejoramientos en los produc
tos existentes. Entre las aplicaciones del diseño experimental en el diseño de ingeniería se encuentran:
l. La evaluación y comparación de configuraciones de diseños básicos.
2. La evaluación de materiales alternativos.
3. La selección de los parámetros del diseño para que el producto tenga un buen funcionamiento en
una amplia variedad de condiciones de campo, es decir, para que el producto sea robusto,
4. La determinación de los parámetros clave del diseño del producto que afectan el desempeño del
mismo.
El uso del diseño experimental en estas áreas puede redundar en productos cuya fabricación sea más sen
cilla, en productos que tengan un desempeño y confiabilidad de campo mejorados, en costos de produc
ción más bajos y en tiempos más cortos para el diseño y desarrollo del producto. A continuación se
presentan varios ejemplos que ilustran algunas de estas ideas.
EJEMPLO 1~1 ····················•················•······················

Caracterización de un proceso
En el proceso de fabricación de tarjetas de circuitos impresos se utiliza una máquina de soldadura líquida.
La máquina limpia las tarjetas en un fundente, las somete a un proceso de precalentamiento y después las
hace pasar por una onda de soldadura líquida mediante una transportadora. En este proceso de soldadu
ra se hacen las conexiones eléctricas y mecánicas de los componentes recubiertos de plomo en la tarjeta.
El proceso opera actualmente con un nivel de defectos aproximado de 1 %. Es decir, cerca de 1 % de
las juntas de soldadura de una tarjeta son defectuosas y requieren corrección manual. Sin embargo, debi
do a que la tarjeta de circuitos impresos promedio contiene más de 2000 juntas de soldadura, incluso un
nivel de defectos de 1 % representa un número demasiado alto de juntas de soldadura que requieren co
rrección, Al ingeniero responsable del proceso en esta área le gustaría usar un experimento diseñado
para determinar cuáles son los parámetros de la máquina que influyen en la ocurrencia de los defectos de
soldadura y qué ajustes deberían hacerse en dichas variables para reducir los defectos de soldadura.
12 AWUNAS APLICACIONES TÍPICAS DEL DISEÑO EXPERIMENTAL 9
En la máquina de soldadura líquida hay diversas variables que pueden controlarse. Éstas incluyen:
l. La temperatura de la soldadura.
2. La temperatura del precalentamiento.
3. La velocidad de la transportadora.
4. El tipo de fundente.
S. La gravedad específica del fundente.
6. La profundidad de la onda de soldadura.
7. El ángulo de la transportadora.
Además de estos factores controlables, hay otros que no es sencillo manejar durante el proceso de fabri
cación, aunque podrían controlarse para los fines de una prueba. Éstos son:
1. El espesor de la tarjeta de circuitos impresos.

2. El tipo de componentes usados en la tarjeta.
3. La disposición de los componentes en la tarjeta.
4. El operador.
S. La rapidez de producción.
En esta situación, el interés del ingeniero es caracterizar la máquina de soldadura líquida; es decir,
quiere determinar los factores (tanto los controlables como los no controlables) que afectan la ocurrencia
de defectos en las tarjetas de circuitos impresos. Para ello puede diseñar un experimento que le permitirá
estimar la magnitud y dirección de los efectos de los factores; es decir, cuánto cambia la variable de res
puesta (defectos por unidad) cuando se modifica cada factor, y si la modificación de los factores en con
junto produce resultados diferentes que los obtenidos mediante el ajuste individual de los factores; es
decir, lexiste interacción entre los factores? En ocasiones a un experimento como éste se le llama experi
mento tamiz o de exploración exhaustiva. De manera típica, los experimentos tamiz incluyen el uso de di
seños factoriales fraccionados, como en el ejemplo del golf de la figura 18.
La información obtenida de este experimento tamiz se usará para identificar los factores críticos del
proceso y determinar la dirección del ajuste de dichos factores a fin de conseguir una reducción adicional
del número de defectos por unidad. El experimento también puede proporcionar información acerca de
los factores que deberían controlarse con mayor atención durante el proceso de fabricación a fin de evi
tar los niveles elevados de defectos y el desempeño errático del proceso. Por lo tanto, una consecuencia
del experimento podría ser la aplicación de técnicas como las cartas de control a una o más de las varia
bles del proceso (la temperatura de la soldadura, por ejemplo), aunadas a las cartas de control de la pro
ducción del proceso. Con el tiempo, si se consigue una mejoría sensible del proceso, quizá sea posible
basar la mayor parte del programa de control del mismo en el control de las variables de entrada del pro
ceso en lugar de aplicar cartas de control a la producción.
Ej'EMPLO 1-2 ···· · ···· ····· · ··· ··· ···· · ····· · ···· · ····· ···· ·· ··· · ··· · · ·•·
Optimización de un proceso
En un experimento de caracterización, el interés suele centrarse en determinar las variables del proceso
que afectan la respuesta. El siguiente paso lógico es la optimización, es decir, determinar la región de los
factores importantes que conduzca a la mejor respuesta posible. Por ejemplo, si la respuesta es el rendí
10 CAPÍTULOl INTRODUCCIÓN
miento, se buscaría la región del rendimiento máximo, mientras que si la respuesta es la variabilidad de
una dimensión crítica del producto, se buscaría una región de variabilidad mínima.
Supongamos que el interés se centra en mejorar el rendimiento de un proceso químico. Por los resul
tados de un experimento de caracterización se sabe que las dos variables más importantes del proceso que
influyen en el rendimiento son la temperatura de operación y el tiempo de reacción. El proceso opera ac
tualmente a 145ºF y con 2.1 horas de tiempo de reacción, produciendo rendimientos de cerca de 80%. En
la figura 19 se muestra una vista desde arriba de la región tiempotemperatura. En esta gráfica las líneas
de rendimiento constante se unen para formar los contornos de respuesta, y se muestran las líneas de con
torno para rendimientos de 60, 70, 80, 90 y 95 por ciento: Estos contornos son las proyecciones en la re
gión tiempotemperatura de las secciones transversales de la superficie del rendimiento correspondiente
a los rendimientos porcentuales arriba mencionados. A esta superficie se le llama en ocasiones superficie
de respuesta. El personal del proceso no conoce la verdadera superficie de respuesta de la figura 19, por
lo que se necesitarán métodos experimentales para optimizar el rendimiento con respecto al tiempo y la
temperatura.
Para localizar el rendimiento óptimo, es necesario llevar a cabo un experimento en el que se hagan
variar conjuntamente el tiempo y la temperatura, es decir, un experimento factorial. En la figura 19 se
muestran los resultados de un experimento factorial inicial realizado con dos niveles tanto del tiempo
como de la temperatura. Las respuestas que se observan en los cuatro vértices del cuadrado indican que,
para incrementar el rendimiento, los cambios deberían hacerse en la dirección general del aumento de la
SegUlldo experimento de optimización

200
190
180
E.
~ 170
"'E
e,
!!'
160
150
140
0.5 1.0 1.5 2.0 2.5

Tiempo (horas)
Figura 19 Gráfica de contorno del rendimiento como una fun

ción del tiempo de reacción y la temperatura de reacción, la cual
ilustra la experimentación para optimizar un proceso.
13 PRINCIPIOS BÁSICOS 11
temperatura y la reducción del tiempo de reacción. Se realizarían algunas corridas adicionales en esta di
rección, y esta experimentación adicional llevaría a la región del rendimiento máximo.
Una vez que se ha encontrado la región del rendimiento óptimo, el siguiente paso típico sería realizar
un segundo experimento. El objetivo de este segundo experimento es desarrollar un modelo empírico del
proceso y obtener una estimación más precisa de las condiciones de operación óptimas para el tiempo y la
temperatura. A este enfoque para la optimización de un proceso se le llama la metodologfa de superficies
de respuesta, la cual se examina en detalle en el capítulo 11. El segundo diseño ilustrado en la figura 19 es
un diseño central compuesto, uno de los diseños experimentales más importantes que se usan en los estu
dios de optimización de procesos .
.........................................................................
EJEW'LO 1-3 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Ilustración del diseño de un producto
Con frecuencia los métodos de diseño experimental pueden aplicarse en el proceso de diseño de un pro
ducto. Para ilustrar esto, suponga que un grupo de ingenieros está diseñando el gozne de la puerta de un
automóvil. La característica de calidad del producto que les interesa es el esfuerzo amortiguador, es de
cir, la capacidad de retención del tope que impide que la puerta se cierre cuando el vehículo se estaciona
en una pendiente. El mecanismo amortiguador consta de un resorte de hojas y un cilindro. Cuando la
puerta se abre, el cilindro se desplaza por un arco que hace que el resorte de hojas se comprima. Para ce
rrar la puerta es necesario vencer la fuerza del resorte, la cual produce el esfuerzo amortiguador. El equi
po de ingenieros considera que el esfuerzo amortiguador es una función de los siguientes factores:
1. La distancia que se desplaza el cilindro.

2. La altura del resorte del pivote a la base.
3. La distancia horizontal del pivote al resorte.
4. La altura libre del resorte auxiliar.
5. La altura libre del resorte principal. .
Los ingenieros pueden construir un prototipo del mecanismo del gozne en el que es posible variar to
dos estos factores dentro de ciertos rangos. Una vez que se han identificado los niveles apropiados de es
tos cinco factores, puede diseñarse un experimento que conste de varias combinaciones de los niveles de
los factores, y el prototipo del gozne puede probarse con estas combinaciones. Se obtendrá así informa
ción respecto de los factores que tienen una mayor influencia sobre el esfuerzo amortiguador del tope y,
mediante el análisis de esta información, podrá mejorarse el diseño del tope.
1 .. 3 PRINCIPIOSBÁSICOS
Si quiere llevarse a cabo un experimento como los descritos en los ejemplos 11 al 13 con la mayor efi
ciencia posible, es necesario utilizar un enfoque científico para planearlo. El diseño estadístico de experi
mentos se refiere al proceso para planear el experimento de tal forma que se recaben datos adecuados
que puedan analizarse con métodos estadísticos que llevarán a conclusiones válidas y objetivas. El enfo
que estadístico del diseño experimental es necesario si se quieren sacar conclusiones significativas de los
datos. Cuando el problema incluye datos que están sujetos a errores experimentales, la metodología esta
dística es el único enfoque objetivo de análisis. Por lo tanto, cualquier problema experimental incluye dos
aspectos: el diseño del experimento y el análisis estadístico de los datos. Estos dos aspectos se encuentran
íntimamente relacionados porque el método de análisis depende directamente del diseño empleado.
Ambos temas se tratan en este libro.
Los tres principios básicos del diseño experimental son la realización de réplicas, la aleatorización y
la formación de bloques. Por realización de réplicas se entiende la repetición del experimento básico. En
el experimento metalúrgico analizado en la sección 11, una réplica consistiría en el tratamiento de una
muestra con el templado en aceite y el tratamiento de una muestra con el templado en agua salada. Por lo
tanto, si se tratan cinco ejemplares en cada medio de templado, se dice que se han obtenido cinco répli
cas. La realización de réplicas posee dos propiedades importantes. Primera, permite al experimentador
obtener una estimación del error experimental. Esta estimación del error se convierte en una unidad de
medición básica para determinar si las diferencias observadas en los datos son en realidad estadísticamen-
te diferentes. Segunda, si se usa la media muestra! (por ejemplo, Y) para estimar el efecto de un factor en
el experimento, la realización de réplicas permite al experimentador obtener una estimación más precisa
de este efecto. Por ejemplo, si a2 es la varianza de una observación individual y hay n réplicas, la varianza
de la medía muestra] es
La consecuencia práctica de lo anterior es que si se hicieron n = 1 réplicas y se observó y1 = 145 (tem

plado en aceite) y y2 = 14 7 (templado en agua salada), probablemente no podrán hacerse inferencias satis
factorias acerca del efecto del medio de templado; es decir, la diferencia observada podría ser resultado del
error experimental. Por otra parte, sin fue razonablemente grande y el error experimental fue lo suficiente
mente pequeño, y se observó y1 < y2, podría concluirse con una certeza razonable que el templado en agua
salada produce una dureza mayor en esta aleación de aluminio particular que el templado en aceite.
Hay una diferencia importante entre réplicas y mediciones repetidas. Por ejemplo, suponga que una
oblea de silicio se graba con un proceso de grabado químico con plasma para oblea única, y que se hacen
tres mediciones de una dimensión crítica de esta oblea. Estas mediciones no son réplicas; son una forma
de mediciones repetidas y, en este caso, la variabilidad observada en las tres mediciones repetidas es reflejo
directo de la variabilidad inherente del sistema o instrumento de medición. Como otro ejemplo, suponga
que, como parte de un experimento en la manufactura de semiconductores, se procesan simultáneamente
cuatro obleas en un horno de oxidación con una velocidad del flujo de gas y un tiempo particulares y que
se hace después una medición del espesor del óxido en cada oblea. De nueva cuenta, la medición de las
cuatro obleas no son réplicas sino mediciones repetidas. En este caso reflejan las diferencias entre las
obleas y otras fuentes de variabilidad dentro de esa operación de horneado particular. En las réplicas se
reflejan las fuentes de variabilidad tanto entre las corridas como (potencialmente) dentro de las mismas.
La aleatorización es la piedra angular en la que se fundamenta el uso de los métodos estadísticos en
el diseño experimental. Por aleatorización se entiende que tanto la asignación del material experimental
como el orden en que se realizarán las corridas o ensayos individuales del experimento se determinan al
azar. Uno de los requisitos de los métodos estadísticos es que las observaciones (o los errores) sean varia
bles aleatorias con distribuciones independientes. La aleatorízación hace por lo general que este supues
to sea válido. La aleatorización correcta del experimento ayuda también a "sacar del promedio" los
efectos de factores extraños que pudieran estar presentes. Por ejemplo, suponga que los ejemplares del
experimento descrito antes presentan sólo ligeras diferencias en el espesor y que la efectividad del medio
de templado puede ser afectado por el espesor del ejemplar. Si todos los ejemplares sometidos al templa
do en aceite son más gruesos que los sometidos al templado en agua salada, quizá se esté introduciendo
un sesgo sistemático eri los resultados experimentales. Este sesgo estorba en uno de los medios de templa
14 PAUTAS GENERALES PARA DISEÑAR EXPERIMENTOS 13
do y, en consecuencia, invalida los resultados obtenidos. Al hacer laasignación aleatoria de los ejempla
res al medio de templado este problema se aligera en parte.
Es muy común el uso de programas de computadora para auxiliar a los experimentadores a seleccio
nar y construir diseños experimentales. Estos programas presentan a menudo las corridas del diseño ex
perimental de manera aleatoria. Por lo general este modo aleatorio se crea utilizando un generador de
números aleatorios. Incluso con estos programas de computadora, con frecuencia seguirá siendo necesa
rio que el experimentador haga la asignación del material experimental (como las obleas en los ejemplos
de semiconductores mencionados antes), de los operadores, de los instrumentos o herramientas de medi
ción, etc., que se utilizarán en el experimento. Puede recurrirse a tablas de números aleatorios para ase
gurar que las asignaciones se hacen al azar.
En ocasiones los experimentadores se encuentran con situaciones en las que la aleatorización de un
aspecto del experimento es complicada. Por ejemplo, en un proceso químico, la temperatura puede ser
una variable muy difícil de modificar, haciendo casi imposible la aleatorización completa de este factor.
Existen métodos de diseño estadístico para resolver las restricciones sobre la aleatorización. Algunos de
estos enfoques se revisarán en capítulos subsecuentes (ver en particular el capítulo 13).
La formación de bloques es una técnica de diseño que se utiliza para mejorar la precisión de las com
paraciones que se hacen entre los factores de interés. Muchas veces la formación de bloques se emplea
para reducir o eliminar la variabilidad transmitida por factores perturbadores; es decir, aquellos factores
que pueden influir en la respuesta experimental pero en los que no hay un interés específico. Por ejemplo,
en un experimento de un proceso químico pueden requerirse dos lotes de materia prima para realizar to
das las corridas necesarias. Sin embargo, podría haber diferencias entre los lotes debido a la variabilidad
de un proveedor a otro y, en caso de no haber un interés específico en este efecto, los lotes de materia pri
ma se considerarían un factor perturbador. En general, un bloque es un conjunto de condiciones experi
mentales relativamente homogéneas. En el ejemplo del proceso químico, cada lote de materia prima
.formaría un bloque, ya que es de esperarse que la variabilidad dentro de un lote sea menor que la variabi
lidad entre lotes. De manera típica, como en este ejemplo, cada nivel del factor perturbador pasa a ser un
bloque. Entonces el experimentador divide las observaciones del diseño estadístico en grupos que se co
rren en cada bloque. En varias partes del texto se estudia en detalle la formación de bloques, incluyendo
los capítulos 4, 5, 7, 8, 9, 11y13. En el capítulo 2, sección 25.1, se presenta un ejemplo sencillo para ilus
trar la estructura básica de la formación de bloques.
Los tres principios básicos del diseño experimental, la aleatorización, la realización de réplicas y la
formación de bloques son parte de cada uno de los experimentos. Se ilustrarán y resaltarán repetidamen
te a lo largo de este libro.
14 PAUTAS GENERALESPARA DISEÑAR EXPERIMENTOS
Para aplicar el enfoque estadístico en el diseño y análisis de un experimento, es necesario que todos los
que participan en el mismo tengan desde el principio una idea clara de qué es exactamente lo que va a es
tudiarse, cómo van a colectarse los datos, y al menos una comprensión cualitativa de la forma en que van a
analizarse estos datos. En la tabla 11 se muestra un esquema general del procedimiento recomendado. A
continuación se presenta una breve explicación de este esquema y se elaboran algunos de los puntos cla
ve. Para mayores detalles, ver Coleman y Montgomery [27), así como las referencias al final del libro.
Thmbién es útil el material complementario para este capítulo.
l. Identificación y enunciación del problema. Este punto podría parecer muy obvio, pero es común que
en la práctica no sea sencillo darse cuenta de que existe un problema que requiere experimentación, y
Tabla 11 Pautas generales para diseñar un experimento

l. Identificación y exposición del problema. ] Planeación previa
2. Elección de los factores, los niveles y los rangos, al experimento
3. Selección de la variable de respuesta."
4. Elección del diseño experimental.
5. Realización del experimento.
6. Análisis estadístico de los datos.
7. Conclusiones y recomendaciones.
ªEn la práctica, los pasos 2 y 3 suelen hacerse simultáneamente o en el orden inverso.
tampoco es fácil desarrollar una enunciación clara, con la que todos estén de acuerdo, de este problema.
Es necesario desarrollar todas las ideas acerca de los objetivos del experimento. Generalmente, es impor
tante solicitar aportaciones de todas las áreas involucradas: ingeniería, aseguramiento de calidad, manu
factura, mercadotecnia, administración, el cliente y el personal de operación (el cual por lo general
conoce a fondo el proceso y al que con demasiada frecuencia se ignora). Por esta razón, se recomienda un
enfoque de equipo para diseñar experimentos.
En la mayoría de los casos es conveniente hacer una lista de los problemas o las preguntas específicas
que van a abordarse en el experimento. Una enunciación clara del problema contribuye sustancialmente
a menudo para alcanzar una mejor comprensión de los fenómenos bajo estudio y la solución final del pro
blema. También es importante tener presente el objetivo global; por ejemplo, lse trata de un proceso o .
sistema nuevo (en cuyo caso el objetivo inicial posiblemente será la caracterización o tamizado de los fac
tores) o se trata de un sistema maduro que se conoce con profundidad razonable y que se ha caracterizado
con anterioridad (en cuyo caso el objetivo puede ser la optimización)? En un experimento puede haber
muchos objetivos posibles, incluyendo la confirmación ( lel sistema se comporta de la misma manera aho
ra que en el pasado?), el descubrimiento ( Zqué ocurre si se exploran nuevos materiales, variables, condi
ciones de operación, etc.?) y la estabilidad (lbajo qué condiciones las variables de respuesta de interés
sufren una degradación seria?). Obviamente, las cuestiones específicas que habrán de abordarse en el ex
perimento se relacionan de manera directa con los objetivos globales. Con frecuencia en esta etapa de la
formulación del problema muchos ingenieros y científicos se percatan de que no es posible que un experi
mento comprensivo extenso responda las cuestiones clave y de que un enfoque secuencial en el que se uti
lice una serie de experimentos más pequeños es una estrategia más adecuada.
2. Eleccién de los factores, los niveles y los rangos. (Como se indica en la tabla 11, los pasos 2 y 3 mu
chas veces se hacen simultáneamente o en orden inverso.) Cuando se consideran los factores que pueden
influir en el desempeño de un proceso o sistema, el experimentador suele descubrir que estos factores
pueden clasificarse como factores potenciales del diseño o bien como factores perturbadores. Los facto
res potenciales del diseño son aquellos que el experimentador posiblemente quiera hacer variar en el ex
perimento. Es frecuente encontrar que hay muchos factores potenciales del diseño, por lo que es
conveniente contar con alguna clasificación adicional de los mismos. Algunas clasificaciones útiles son
factores del diseño, factores que se mantienen constantes y factores a los que se permite variar. Los facto
res del diseño son los que se seleccionan realmente para estudiarlos en el experimento. Los factores que
se mantienen constantes son variables que pueden tener cierto efecto sobre la respuesta, pero que para
los fines del experimento en curso no son de interés, por lo que se mantendrán fijos en un nivel específico.
Por ejemplo, en un experimento de grabado químico en la industria de los semiconductores puede haber
un efecto, que es único, de la herramienta específica para el grabado químico con plasma que se utiliza en
el experimento. Sin embargo, sería muy difícil variar este factor en un experimento, por lo que el experi
mentador puede decidir llevar a cabo todas las corridas experimentales en un grabador químico particu
lar (idealmente "típico"). De este modo, este factor se mantiene constante. Como un ejemplo de factores
1·4 PAUTAS GENERALES PARA DISEÑAR EXPERIMENTOS 15
a los que se permite variar, las unidades experimentales o los "materiales" a los que se aplican los factores
del diseño no son homogéneos por lo general, no obstante lo cual con frecuencia se ignora esta variabili
dad de una unidad a otra y se confía en la aleatorización para compensar cualquier efecto del material o la
unidad experimental. Muchas veces se trabajará con el supuesto de que los efectos de los factores que se
mantienen constantes y de los factores a los que se permite variar son relativamente pequeños.
Por otra parte, los factores perturbadores pueden tener efectos considerables que deben tomarse en
consideración, a pesar de que no haya interés en ellos en el contexto del experimento en curso. Los factores
perturbadores suelen clasificarse como factores controlables, no controlables o de ruido. Un factor pertur
bador controlable es aquel cuyos niveles pueden ser ajustados por el experimentador. Por ejemplo, el expe
rimentador puede seleccionar lotes diferentes de materia prima o diversos días de la semana para conducir
el experimento. La estructura básica de la formación de bloques, comentada en la sección anterior, suele ser
útil para trabajar con factores perturbadores controlables. Si un factor perturbador no es controlable en el
experimento, pero puede medirse, muchas veces puede usarse el procedimiento de análisis denominado
análisis de covarianza para compensar este efecto. Por ejemplo, la humedad relativa en el medio ambiente
del proceso puede afectar el desempeño del proceso, y si la humedad no puede controlarse, probablemente
podrá medirse y tratarse como una covariable. Cuando un factor que varía de manera natural y no controla
ble en el proceso puede controlarse para los fines de un experimento, con frecuencia se le llama factor de
ruido. En tales situaciones, es común que el objetivo sea encontrar los ajustes de los factores controlables
del diseño que minimicen la variabilidad transmitida por los factores de ruido. En ocasiones a esto se le lla
ma el estudio de robustez del proceso o el problema de robustez del diseño. La formación de bloques, el
análisis de covarianza y los estudios de robustez del proceso se comentan más adelante.
Una vez que el experimentador ha seleccionado los factores del diseño, debe elegir los rangos en los
que hará variar estos factores, así como los niveles específicos con los que se realizarán las corridas. 'Iam
bién deberá pensarse cómo van a controlarse estos factores en los valores deseados y cómo van a medirse.
Por ejemplo, en el experimento de la soldadura líquida, el ingeniero ha definido 12 variables que pueden
afectar la ocurrencia de defectos de soldadura. El ingeniero también tendrá que tomar una decisión en
cuanto a la región de interés para cada variable (es decir, el rango en el que se hará variar cada factor) y
en cuanto al número de niveles de cada variable que usará. Para ello se requiere del conocimiento del proce
so. Este conocimiento del proceso suele ser una combinación de experiencia práctica y conocimientos teóri
cos. Es importante investigar todos los factores que pueden ser de importancia y no dejarse influir
demasiado por la experiencia pasada, en particular cuando uno se encuentra en las fases iniciales de la expe
rimentación o cuando el proceso no está del todo maduro.
Cuando el objetivo del experimento es el tamizado de los factores o caracterización del proceso, por lo
general es mejor mantener reducido el número de niveles de los factores. En general, dos niveles funcionan
bastante bien en los estudios de tamizado de factores. Elegir la región de interés también es importante. En el
tamizado de factores, la región de interés deberá ser relativamente grande; es decir, el rango en el que se ha
cen variar los factores deberá ser amplio. Conforme se sepa más acerca de las variables que son importantes y
de los niveles que producen los mejores resultados, la región de interés se hará por lo general más estrecha.
3. Selección de la variable de respuesta. Para seleccionar la variable de respuesta, el experimentador de
berá tener la certeza de que esta variable proporciona en realidad información útil acerca del proceso bajo
estudio. En la mayoría de los casos, el promedio o la desviación estándar (o ambos) de la característica me
dida será la variable de respuesta. No son la excepción las respuestas múltiples. La eficiencia de los instru
mentos de medición (o error die medición) también es un factor importante. Si la eficiencia de los
instrumentos de medición es inadecuada, el experimentador sólo detectará los efectos relativamente gran
des de los factores o quizá sean necesarias réplicas adicionales. En algunas situaciones en que la eficiencia
de los instrumentos de medición es pobre, el experimentador puede decidir medir varias veces cada unidad
experimental y usar el promedio de las mediciones repetidas como respuesta observada. Suele ser de impor
tancia determinante identificar los aspectos relacionados con la definición de las respuestas de interés y cómo
van a medirse antes de llevar a cabo el experimento. En ocasiones se emplean experimentos diseñados para
estudiar y mejorar el desempeño de los sistemas de medición. Para un ejemplo, ver el capítulo 12.
Se reitera lo crucial que es exponer todos los puntos de vista y la información del proceso en los pasos
1 al 3 anteriores. Se hace referencia a esto como planeación previa al experimento. Coleman y Montgo
mery [27] proporcionan hojas de trabajo que pueden ser útiles en la planeación previa al experimento.
Véase también la información complementaria del texto para más detalles y un ejemplo del uso de estas
hojas de trabajo. En muchas situaciones, no es posible que una sola persona posea todos los conocimien
tos requeridos para hacer esto adecuadamente. Por lo tanto, se hace una amplia recomendación para el
trabajo en equipo durante la planeación del experimento. La mayor parte del éxito gravitará en tomo a
qué tan bien se haya hecho la planeación previa del experimento.
4. Elecci6n del diseño experimental. Si las actividades de planeación previas al experimento se realizan
como es debido, este paso es relativamente sencillo. La elección del diseño implica la consideración del
tamaño de la muestra (número de réplicas), la selección de un orden de corridas adecuado para los ensa
yos experimentales y la determinación de si entran en juego o no la formación de bloques u otras restric
ciones sobre la aleatorización. En este libro se revisan algunos de los tipos más importantes de diseños
experimentales, y puede usarse en última instancia como un catálogo para seleccionar el diseño experi
mental apropiado para una amplia variedad de problemas.
Existen también varios paquetes interactivos de software de estadística que soportan esta fase del di
seño experimental. El experimentador puede introducir la información del número de factores, los nive
les y los rangos, y estos programas presentarán a la consideración del experimentador una selección de
diseños o recomendarán un diseño particular. (Nosotros preferimos ver varias alternativas en lugar de
confiar en la recomendación de la computadora en la mayoría de los casos.) Estos programas proporcio
nan también por lo general una hoja de trabajo (con el orden aleatorizado de las corridas) que se usará en
la conducción del experimento.
Al seleccionar el diseño, es importante tener en mente los objetivos experimentales. En muchos ex
perimentos de ingeniería se sabe de antemano que algunos de los niveles de los factores producirán valo
res diferentes de la respuesta. En consecuencia, el interés se centra en identificar qué factores causan esta
diferencia y en estimar la magnitud del cambio de la respuesta. En otras situaciones podría haber más in
terés en verificar la uniformidad. Por ejemplo, pueden compararse dos condiciones de producción A y B,
donde A es el estándar y B es una alternativa con una eficiencia de costos mayor. El experimentador esta
rá interesado entonces en demostrar que, por ejemplo, no hay ninguna diferencia en el rendimiento entre
las dos condiciones.
5. Reali<.aci6ndel experimento. Cuando se lleva a cabo el experimento es vital monitorear con atención el
proceso a fin de asegurarse de que todo se esté haciendo conforme a la planeación. Los errores en el proce
dimiento experimental en esta etapa destruirán por lo general la validez experimental. Poner en un primer
plano la planeación es crucial para el éxito. Es fácil subestimar los aspectos de logística y planeación cuando
se corre un experimento diseñado en un ambiente complejo de manufactura o de investigación y desarrollo.
Coleman y Montgomery [27] sugieren que antes de llevar a cabo el experimento, es conveniente en
muchas ocasiones realizar algunas corridas piloto o de prueba. Estas corridas proporcionan informa
ción acerca de la consistencia del material experimental, una comprobación del sistema de medición,
una idea aproximada del error experimental y la oportunidad de· poner en práctica la técnica experi
mental global. Esto ofrece también una oportunidad pararevisar, de ser necesario, las decisiones toma
das en los pasos 1 al 4.
15 BREVE HISTORIA DEL DISEÑO ESTADÍSTICO 17
6. Análisis estadistico de los datos. Deberán usarse métodos estadísticos para analizar los datos a fin de
que los resultados y las conclusiones sean objetivos y no de carácter apreciativo. Si el experimento se ha
diseñado correctamente y si se ha llevado a cabo de acuerdo con el diseño, los métodos estadísticos nece
sarios no deben ser complicados. Existen varios paquetes de software excelentes diseñados para auxiliar
en el análisis de datos, y muchos de los programas usados en el paso 4 para seleccionar el diseño cuentan
con una interfase directa para el análisis estadístico. Con frecuencia se encuentra que los métodos gráfi
cos simples desempeñan un papel importante en el análisis e interpretación de datos. Debido a que mu
chas de las preguntas que el experimentador quiere responder pueden insertarse en el marco de la prueba
de hipótesis, los procedimientos para probar hipótesis y estimar intervalos de confianza son muy útiles en
el análisis de datos de un experimento diseñado. Muchas veces es muy útil también presentar los resulta
dos de varios experimentos en términos de un modelo empírico, es decir, mediante una ecuación derivada
de los datos que expresa la relación entre la respuesta y los factores importantes del diseño. El análisis re
sidual y la verificación de la adecuación del modelo son también técnicas de análisis importantes. Más
adelante se revisarán en detalle estos temas.
Recuerde que los métodos estadísticos no pueden demostrar que un factor (o factores) posee un
efecto particular, sólo proporcionan pautas generales en cuanto a la confiabilidad y la validez de los resul
tados. Aplicados en forma correcta, los métodos estadísticos no permiten la demostración experimental
de nada, pero sí sirven para medir el error posible en una conclusión o asignar un nivel de confianza a un
enunciado. La ventaja principal de los métodos estadísticos es que agregan objetividad al proceso de
toma de decisiones. Las técnicas estadísticas, aunadas a una buena ingeniería o conocimiento del proceso
y el sentido común, llevarán por lo general a conclusiones sólidas.
7. Conclusiones y recomendaciones. Una vez que se han analizado los datos, el experimentador debe sacar
conclusiones prácticas acerca de los resultados y recomendar un curso de acción. Los métodos gráficos sue
len ser útiles en esta etapa, en particular para presentar los resultados. También deberán realizarse corridas
de seguimiento o pruebas de confirmación para validar las conclusiones del experimento.
A lo largo del proceso completo es importante tener presente que la experimentación es una parte
esencial del proceso de aprendizaje, en la que se formulan hipótesis tentativas acerca de un sistema, se
realizan experimentos para investigar estas hipótesis y se formulan nuevas hipótesis con base en Jos resul
tados, y así sucesivamente. Esto sugiere que la experimentación es iterativa. Por lo general es un gran
error diseñar un solo experimento comprensivo y extenso al principio de un estudio. Un experimento exi
toso requiere conocer los factores importantes, los rangos en los que deberán hacerse variar estos facto
res, el número apropiado de niveles que deberán usarse y las unidades de medición apropiadas para estas
variables. En general, no se conocen las respuestas precisas de estas cuestiones, pero se aprende acerca de
ellas sobre la marcha. A medida que avanza un programa experimental, es común abandonar algunas va
riables de entrada e incorporar otras, modificar la región de exploración de algunos factores o incorporar
nuevas variables de respuesta. Por consiguiente, generalmente la experimentación se hace en forma se
cuencial y, como regla general, no deberá invertirse más de 25% de los recursos disponibles en el primer
experimento. Con esto se asegurará que se contará con los recursos suficientes para realizar las corridas
de confirmación y que se alcanzará en última instancia el objetivo final del experimento.
1 ..5 BREVE HISTORIA DEL DISEÑO ESTADÍSTICO
Ha habido cuatro eras del desarrollo moderno del diseño experimental estadístico. La era agrícola fue
encabezada por el trabajo pionero de Sir Ronald A. Fisher en los años 1920 y principios de la década de
1930. En este periodo, Fisher fue el responsable de las estadísticas y el análisis de datos en la Estación
18 CAPITuLO 1 INTRODUCCIÓN
Agrícola Experimental de Rothamsted en las cercanías de Londres, Inglaterra. Fisher se percató de que
las fallas en la forma en que se llevaba a cabo el experimento que generaba los datos obstaculizaban con
frecuencia el análisis de los datos de los sistemas (en este caso sistemas agrícolas). Mediante la interac
ción con múltiples científicos e investigadores de diversos campos, Fisher desarrolló las ideas que lleva
ron a los tres principios básicos del diseño experimental que se revisan en la sección 13: la aleatorización,
la realización de réplicas y la formación de bloques. Fisher incorporó de manera sistemática el pensa
miento y los principios estadísticos en el diseño de las investigaciones experimentales, incluyendo el con
cepto de diseño factorial y el análisis de varianza. Sus libros ( 44a, b] tuvieron profunda influencia en el uso
de la estadística, particularmente en la agricultura y las ciencias biológicas relacionadas. Para una exce
lente biografía de Fisher, ver Box [21].
Si bien es cierto que la aplicación del diseño estadístico en ambientes industriales se inició en la déca
da de 1930, el catalizador de la segunda era, o era industrial, fue el desarrollo de la metodología de super
ficies de respuesta (MSR) por parte de Box y Wilson [20]. Estos autores se percataron y explotaron el
hecho de que muchos experimentos industriales son fundamentalmente diferentes de sus contrapartes
agrícolas en dos sentidos: 1) la variable de respuesta puede observarse por lo general (casi) de inmediato,
y 2) el experimentador puede obtener pronto información crucial de un pequeño grupo de corridas que
puede usarse para planear el siguiente experimento, Box [12f] denomina inmediatez y secuencialidad a es
tas dos características de los experimentos industriales. En los 30 años siguientes, la MSR y otras técnicas
de diseño se generalizaron en las industrias química y de proceso, sobre todo en el trabajo de investiga
ción y desarrollo. George Box fue el líder intelectual de este movimiento. Sin embargo, la aplicación del
diseño estadístico a nivel de plantas o procesos de manufactura todavía no estaba muy generalizada.
Algunas de las razones de ello incluyen la capacitación inadecuada de ingenieros y otros especialistas en
procesos en los conceptos y los métodos estadísticos básicos, así como la falta de recursos de computación
y software de estadística que fueran fáciles de usar para apoyar la aplicación de experimentos diseñados
estadísticamente.
El interés creciente de la industria occidental en ~1 mejoramiento de calidad que empezó a fines de la
década de 1970 anunció la tercera era del diseño estadístico. El trabajo de Genichi 'Iaguchi (Thguchi y Wu
[109], Kackar [62] y 'Iaguchi [108a, b]) tuvo un impacto significativo en el aumento del interés y el uso de
los experimentos diseñados. 'Iaguchi propugnaba por el uso de experimentos diseñados para lo que deno
minó el diseño paramétrico robusto, es decir,
l. Hacer procesos insensibles a los factores ambientales o de otra índole que son difíciles de con
trolar.
2. Fabricar productos insensibles a la variación transmitida por los componentes.
3. Encontrar los niveles de la.S variables del proceso que obliguen a la media a un valor deseado
mientras que al mismo tiempo se reduzca la variabilidad en tomo a este valor.
Taguchi propuso diseños factoriales altamente fraccionados y otros arreglos ortogonales junto con algu
nos métodos estadísticos nuevos para resolver estos problemas. La metodología resultante generó mu
chas discusiones y controversias. Parte de la controversia surgió porque en Occidente la metodología de
'Iaguchi fue defendida al principio (y sobre todo) por empresarios, y no se había hecho la revisión escruta
dora adecuada de la ciencia estadística fundamental. Para fines de la década de 1980, los resultados de
esta revisión indicaron que aun cuando los conceptos y los objetivos enfocados en la ingeniería de 'Iaguchi
tenían bases sólidas, existían problemas sustanciales con su estrategia experimental y sus métodos para el
análisis de los datos. Para detalles específicos de estas cuestiones, ver Box [12d], Box, Bisgaard y Fung
[14], Hunter [59a, b], Myers y Montgomery [85a] y Pignatielloy Ramberg [94]. Gran parte de estas preo
16 RESUMEN: USO DE TÉCNICAS ESTADÍSTICAS EN LA EXPERIMENTACIÓN 19
cupaciones se resumen también en el amplio panel de discusión del número de mayo de 1992 de Techno-
metrics (ver Nair, et al. (861).
Hubo al menos tres resultados positivos de la controversia desatada por Thguchi. Primero, el uso de
los experimentos diseñados se hizo más generalizado en las industrias con piezas discretas, incluyendo la
industria de manufacturas automotrices y aeroespaciales, de electrónica y semiconductores, y muchas
otras, que anteriormente hacían poco uso de esta técnica. Segundo, se inició la cuarta era del diseño esta
dístico. Esta era ha incluido un renovado interés general tanto por parte de investigadores como de profe
sionales en ejercicio en el diseño estadístico y el desarrollo de varios enfoques nuevos y útiles para los
problemas experimentales en el mundo industrial, incluyendo alternativas a los métodos técnicos de Tu
guchi que permiten que sus conceptos de ingeniería se lleven a la práctica de manera eficaz y eficiente.
Algunas de estas alternativas se revisarán e ilustrarán en capítulos subsecuentes, en particular en el capí
tulo 11. Tercero, la educación formal en diseño experimental estadístico se está haciendo parte de los pro
gramas de ingeniería en las universidades, tanto a nivel de licenciatura como de posgrado. La integración
exitosa de una buena práctica del diseño experimental en la ingeniería y las ciencias es un factor clave en
la competitividad industrial futura.
16 RESUMEN: USO DE TÉCNICAS ESTADÍSTICAS EN LA

EXPERIMENTACIÓN
Gran parte de la investigación en la ingeniería, las ciencias y la industria es empírica y hace un uso extensi
vo de la experimentación. Los métodos estadísticos pueden incrementar en gran medida la eficiencia de
estos experimentos y con frecuencia pueden fortalecer las conclusiones así obtenidas. El uso correcto de
las técnicas estadísticas en la experimentación requiere que el experimentador tenga presentes los puntos
siguientes:
l. Uso de conocimientos no estadísticos del problema. Los experimentadores suelen poseer amplios co
nocimientos de sus respectivos campos. Por ejemplo, un ingeniero civil que trabaja en un problema de hi
drología cuenta de manera típica con considerable experiencia práctica y capacitación académica formal
en esta área. En algunos campos existe un cuerpo enorme de teoría física en el cual indagar para explicar
las relaciones entre los factores y las respuestas. Este tipo de conocimientos no estadísticos es invaluable
para elegir los factores, determinar los niveles de los factores, decidir cuántas réplicas correr, interpretar
los resultados del análisis, etc. El uso de la estadística no es sustituto de la reflexión sobre el problema.
2. Mantener el diseño y el análisis tan simple como sea posible. Es necesario no exagerar en el uso de
técnicas estadísticas complejas y sofisticadas. Los métodos de diseño y análisis relativamente simples son
siempre los mejores. En este punto cabe hacer hincapié nuevamente en el paso 4 del procedimiento reco
mendado en la sección 14. Si un diseño se hace de manera cuidadosa y correcta, el análisis casi siempre
será relativamente directo. Sin embargo, si el diseño se estropea grandemente por ineptitud, no es posible
que incluso la estadística más compleja y elegante salve la situación.
3. Tener presente la diferencia entre significaci6n práctica y significaci6n estadística. Debido justamen
te a que dos condiciones experimentales producen respuestas medias que son estadísticamente diferen
tes, no existe ninguna seguridad de que esta diferencia sea de la magnitud suficiente como para tener
algún valor práctico. Por ejemplo, un ingeniero puede determinar que una modificación en el sistema de
inyección de combustible de un automóvil puede producir un mejoramiento promedio real en el rendi
miento del combustible de 0.1 mi/gal. Éste es un resultado estadísticamente significativo. Sin embargo, si
el costo de la modificación es de $1000, la diferencia de 0.1 mi/gal probablemente será muy pequeña para
poseer algún valor práctico.
4. Los experimentos son generalmente iterativos. Recuerde que en la mayoría de las situaciones no es
conveniente diseñar un experimento demasiado comprensivo al principio de un estudio. Un diseño exito
so requiere conocer los factores importantes, los rangos en los que estos factores se harán variar, el núme
ro apropiado de niveles para cada factor y los métodos y las unidades de medición adecuados para cada
factor y respuesta. En general, ningún experimentador está en posición de responder estas cuestiones al
principio del experimento, sino que las respuestas aparecen sobre la marcha. Esto habla en favor del en
foque iterativo o secuencial analizado anteriormente. Desde luego, hay situaciones en las que un experi
mento comprensivo es totalmente apropiado pero, como regla general, la mayoría de los experimentos
deberán ser iterativos. Por consiguiente, no deberá invertirse más de 25% de los recursos para la experi
mentación (corridas, presupuesto, tiempo, etc.) en el experimento inicial. Con frecuencia estos esfuerzos
iniciales constituyen sólo experiencias de aprendizaje, y es necesario contar con recursos suficientes para
alcanzar los objetivos finales del experimento.
Experimentos
comparativos simples
En este capítulo se examinan los experimentos para comparar dos condiciones (llamadas en ocasiones
tratamientos), a las cuales es común denominar experimentos comparativos simples. Se empieza con el
ejemplo de un experimento que se realiza para determinar si dos formulaciones diferentes de un produc
to producen resultados equivalentes. El estudio lleva a revisar varios conceptos básicos de la estadística,
como variables aleatorias, distribuciones de probabilidad, muestras aleatorias, distribuciones de mues
treo y pruebas de hipótesis.
2 .. 1 INTRODUCCIÓN
La fuerza de la tensión de adhesión del mortero de cemento portland es una característica importante del
producto. Un ingeniero está interesado en comparar la fuerza de una formulación modificada en la que se han
agregado emulsiones de látex de polímeros durante el mezclado, con la fuerza del mortero sin modificar. El
experimentador ha reunido 10 observaciones de la fuerza de la formulación modificada y otras 10 observacio
nes de la formulación sin modificar. Los datos se muestran en la tabla 21. Podría hacerse referencia a las dos
formulaciones diferentes como dos tratamientos o como dos niveles del factor formulaciones.
En la figura 21 se grafican los datos de este experimento. A esta representación se le llama diagrama
de puntos. Del examen visual de estos datos se obtiene la impresión inmediata de que la fuerza del morte
ro sin modificar es mayor que la fuerza del mortero modificado. Esta impresión se confirma al comparar
las fuerzas de la tensión de adhesión promedio.y¡ = 16. 76 kgf/cm2 para el mortero modificado y y2 = 17 .92
kgf/cm2 para el mortero sin modificar. Las fuerzas de la tensión de adhesión promedio de estas dos mues
tras difieren en lo que parece ser una cantidad no trivial. Sin embargo, no es evidente que esta diferencia
sea de la magnitud suficiente para implicar que las dos formulaciones son en realidad diferentes. Quizás
esta diferencia observada en fas fuerzas promedio sea el resultado de fluctuaciones del muestreo y las dos
formulaciones sean idénticas en realidad. Posiblemente otras dos muestras produzcan el resultado con
trario, con la fuerza del mortero modificado excediendo la de la formulación sin modificar.
Puede usarse una técnica de la inferencia estadística llamada prueba de hipótesis (algunos autores
prefieren el término prueba de significación) para auxiliar al experimentador en la comparación de estas
21
22 CAPÍTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES
Tabla 2 1 Datos de la fuerza de la tensión de

adhesión del experimento de la
formulación del cemento portland
Mortero Mortero sin
modificado modificar
j Y1í
1 16.85 17.50
2 16.40 17.63
3 17.21 18.25
4 16.35 18.00
5 16.52 17.86
6 17.04 17.75
7 16.96 18.22
8 17.15 17.90
9 16.59 17.96
10 16.57 18.15
dos formulaciones. La prueba de hipótesis permite que la comparación de las dos formulaciones se haga
en términos objetivos, con el conocimiento de los riesgos asociados si se llega a una conclusión equivoca
da. Antes de presentar los procedimientos de la prueba de hipótesis en experimentos comparativos sim
ples, se hará una breve revisión de algunos conceptos elementales de la estadística.
22 CONCEPTOS ESTADÍSTICOS BÁSICOS
A cada una de las observaciones del experimento del cemento portland citado anteriormente se le llama
ría una corrida. Observe que las corridas individuales difieren, por lo que existen fluctuaciones, o ruido,
en los resultados. Es común llamar a este ruido el error experimental o simplemente el error. Se trata de
un error estadístico, lo cual significa que se origina por la variación que no está bajo control y que gene
ralmente es inevitable. La presencia del error o ruido implica que la variable de respuesta, la fuerza de la
tensión de adhesión, es una variable aleatoria. Una variable aleatoria puede ser discreta o continua. Si el
conjunto de todos los valores posibles de la variable aleatoria es finito o contablemente infinito, entonces
la variable aleatoria es discreta, mientras que si el conjunto de todos los valores posibles de la variable
aleatoria es un intervalo, entonces la variable aleatoria es continua.
Descripción gráfica de la variabilidad

Es frecuente usar métodos gráficos simples como ayuda para analizar los datos de un experimento. El
diagrama de puntos, ilustrado en la figura 21, es un recurso muy útil para representar un cuerpo reduci
do de datos (digamos hasta unas 20 observaciones). El diagrama de puntos le permite al experimentador
ver de inmediato la localización o tendencia central de las observaciones y su dispersión. Por ejemplo, en
el experimento de la fuerza de tensión de adhesión del cemento portland, el diagrama de puntos revela
••- eel••• o OQoai!OCO
l
15 16 19 20
17
Fueria
118
(kgf/cm2) • ~ Mortero modificado
.Y1 '"' 16.76 .Y2"' 17.92 o " Mortero sin modificar
Figura 2·1 Diagrama de puntos de los datos de la fuerza de la tensión de adhesión de la tabla 21.
22 CONCEPTOS ESTADÍSTICOS BÁSICOS 23
0.16 30
!? 0.10 20
.,
·¡:¡
e ..
..
·¡;
e
·~..
....e
::1
~
u.. 0.05 10
0.00
60 70 76 80 85
Recuperaciónde metal (rendimiento)
Figura 22 Histograma de 200 observacionesde la recuperación de metal (rendimiento) en

un proceso de fundición.
que probablemente las dos formulaciones difieran en la fuerza promedio, pero que ambas producen
aproximadamente la misma variación en la fuerza.
Cuando los datos son muy numerosos, es difícil distinguir las observaciones graficadas en un diagra
ma de puntos, y en tal caso sería preferible un histograma. En la figura 22 se presenta el histograma de
200 observaciones de la recuperación de metal (o rendimiento) en un proceso de fundición. El histogra
ma muestra la tendencia central, la dispersión y la forma general de la distribución de los datos. Recuerde
que un histograma se construye dividiendo el eje horizontal en intervalos (generalmente de longitud
igual) y trazando un rectángulo sobre el intervalo jésimo con el área del rectángulo proporcional a ni, el
número de observaciones incluidas en ese intervalo.
El diagrama de caja (o diagrama de caja y bigotes) es una manera muy útil de representar gráfica
mente los datos. En un diagrama de caja se muestra el mínimo, el máximo, los cuartiles inferior y superior
(el percentil 25 y el percentil 75, respectivamente) y la mediana (el percentil 50) en una caja rectangular
alineada horizontal o verticalmente. La caja se extiende del cuartil inferior al cuartil superior y se traza
una línea por la mediana que atraviesa la caja. Se trazan dos líneas (o bigotes) que se extienden de los ex
tremos de la caja hasta (de manera típica) los valores mínimo y máximo. (Existen diversas variantes de los
diagramas de caja que tienen reglas diferentes para denotar los puntos muestrales extremos. Ver Montgo
mery y Runger [83d] para más detalles.) ·
En la figura 23 se muestran los diagramas de caja de las dos muestras de la fuerza de la tensión de
adhesión en el experimento del mortero de cemento portland. En esta representación se revela con toda
claridad la diferencia en la fuerza promedio entre las dos formulaciones. Indica asimismo que ambas for
mulaciones producen distribuciones de la fuerza razonablemente simétricas con una variabilidad o dis
persión similar.
Los diagramas de puntos, los histogramas y los diagramas de caja son útiles para resumir la informa
ción de una muestra de datos. Para describir con mayor detalle las observaciones que podrían presentarse
en una muestra, se usa el concepto de distribución de probabilidad.
Distribuciones de probabilidad
La estructura de la probabilidad de una variable aleatoria, por ejemplo y, se describe mediante su distri
bución de probabilidad. Cuando y es discreta, es común hacer referencia a su distribución de probabili
Diagramas de caja y bigotes

~
E
u 18.4
$
'E;
~ 18
e:
:'2
:¡¡
.,..
s: 17.6
"C
"O 17.2
e:
o
·¡¡;
e: 16.8
l!!
..'!!
O)
"O 16.4
"'!::!.,
::i 16
u.
Modificado Sin modificar
Formulación del mortero
Figura 2·3 Diagramas de caja del experimento de la fuerza de la ten·

sión de adhesión del cemento portland.
dad, por ejemplo p(y), como la función de probabilidad de y. Cuando y es continua, es común hacer
referencia a su distribución de probabilidad, por ejemplo f(y ), como la función de densidad de probabili
dad de y.
En la figura 24 se ilustran dos distribuciones de probabilidad hipotéticas, una discreta y la otra conti
nua. Observe que en la distribución de probabilidad discreta es la altura de la función p(y¡) la que repre
senta la probabilidad, mientras que en el caso continuo, es el área bajo la curva f(y) asociada con un
....___._·'....L.......L..~___.___.__._.....__..l__.__1 _ Yj
Y1 Y3 Y5 Y1 Y9 Y11 Y13
Y2 Y4 Ys Ya Y10 Y12 Y14
a) Una distribución discreta
(l
b) Una distribución continua
Figura 24 Distribuciones de probabilidad discreta y continua.

22 CONCEPTOS ESTADÍSTICOS BÁSICOS 25
intervalo dado la que representa la probabilidad. Un resumen cuantitativo de las propiedades de las dis
tribuciones de probabilidad sería el siguiente:
y discreta: O:S P(Y¡ ):s; 1 todos los valores de Y¡

P(y= Y¡)= P(YJ todos los valores de Y¡
L
todos los
P(Y¡)=l
valoree de y;
y continua: O:S f(y)
P(a s y:s; b)= J: f(y)dy

J:., f(y)dy= 1
Media, varianza y valores esperados
La media,µ, de una distribución de probabilidad es una medida de su tendencia central o localización.
Matemáticamente, la media se define como
J:"' yf(y)dy y continua

µ- (2-1)
{
- LYP(Y)
toda y
y discreta
La media también puede expresarse en términos del valor esperado o valor promedio a la larga de la va
riable aleatoria y como
J:., yf(y)dy y continua

µ= E(y)= ~ (2-2)
{ L,,,YP(Y)
toda y
y discreta
donde E denota el operador del valor esperado.

La variabilidad o dispersión de una distribución de probabilidad puede medirse con la varianza, la
cual se define como
J:. (y- µ)2 f(y)dy y continua

02 (23)
- { L<y-µ)2 p(y) y discreta
toda y
Observe que la varianza puede expresarse exclusivamente en términos del valor esperado debido a que
(24)
Por último, el uso de la varianza es tan frecuente que resulta conveniente definir un operador de la va·
rianza V tal que
V(y) = El(y- µ )2] = ai (25)

26 CAPÍTIJLO 2 EXPERIMENTOS COMPARATIVOS SIMPLES
Los conceptos de valor esperado y varianza se usan constantemente a lo largo de este libro, y puede
ser útil revisar varios resultados elementales relacionados con estos operadores. Si y es una variable alea
toria con media µ y varianza a2 y e es una constante, entonces
l. E(c)= e
2. E(y)= µ
3. E( cy) = cE(y) = eµ
4. V(c)= O
5. V(y)= a2
6. V(cy)= c2V(y)= c'o?
Si hay dos variables aleatorias, por ejemplo.y¡ conE(Y1) == µ1 y V(Y1) =a; yy2 conE(Y2) = µzy V(Yz) =
a;, se tiene
7. E(Y1 +yz)= E(yl)+E(Y2)= µ1 +µ2
Es posible demostrar que
8. V(y1 +y2)=V(y1)+V(y2)+2 Cov(yp Y2)
donde
(26)
es la covaríanza de las variables aleatoriasy, yy2• La covarianza es una medida de la asociación lineal en
tre y1 y y2• Más específicamente, puede demostrarse que si y1 y y2 son independientes, 1 entonces
Cov(Y1, y2) = O. 'Iambién puede demostrarse que
9. V(y1 - y2) = V(y1 )+ V(y2 )- 2 Cov (y1, y2)
Si y1 y y2 son independientes, se tiene
10. V(Y1 ±yz )= V(Y1)+V(Y2 )=a¡ +ai
y
11. E(Y1 'Y2)=E(Y1)·E(Y2)=µ1 ·µ2
Sin embargo, observe que, en general,
12. E(l!_) ~ E(Y1)
Yz E(yz)
sin importar si y1 y y2 son independientes o no.
2 .. 3 MUESTREO Y DISTRIBUCIONES DE MUESTREO
Muestras aleatorias, media muestra! y varianza muestra!

El objetivo de la inferencia estadística es sacar conclusiones acerca de una población utilizando una
muestra de la misma. La mayoría de los métodos que se estudiarán aquí incluyen el supuesto de que se
1 Observe que el recíproco no es necesariamente verdadero; es decir, puede tenerse Cov (y¡,y2) = O y no obstante esto no implica que
las variables sean independientes. Para un ejemplo, ver Hines y Montgomery ([55] pp. 128·129).
23 MUESTREO Y DISTRIBUCIONES DE MUESTREO 27
usan muestras aleatorias. Es decir, si la población contiene N elementos y va a seleccionarse una muestra
den de ellos, y si cada una de las N!/(N - n )!n ! muestras posibles tiene una probabilidad igual de ser esco
gida, entonces al procedimiento empleado se le llama muestreo aleatorio. En la práctica, en ocasiones es
difícil obtener muestras aleatorias, para lo cual pueden ser útiles las tablas de números aleatorios, como
la tabla XI del apéndice.
En la inferencia estadística se utilizan profusamente cantidades calculadas a partir de las observacio
nes de la muestra. Un estadístico se define como cualquier función de las observaciones de una muestra
que no contiene parámetros desconocidos. Por ejemplo, suponga que y1'y2, ••• ,yn representa una muestra.
Entonces la media muestral
(27)
y la varianza muestra)
si =
!
_i=~1
(Y; ~y)2
_
(28)
n-1
son estadísticos. Estas cantidades son medidas de la tendencia central y la dispersión de la muestra, res
pectivamente. En ocasiones se usa S = .JSZ,
llamada la desviación estándar muestra), como medida de
dispersión. Los ingenieros suelen preferir el uso de la desviación estándar para medir la dispersión debi
do a que se expresa en las mismas unidades que la variable de interés y.
Propiedades de la media y la varianza muestrales

La media muestralj' es un estimador puntual de la media poblacionalµ, y la varianza muestra! S2 es un es
timador puntual de la varianza poblacional a2. En general, un estimador de un parámetro desconocido es
un estadístico que corresponde con dicho parámetro. Observe que un estimador puntual es una variable
aleatoria. Al valor numérico particular de un estimador, calculado a partir de los datos muestrales, se le
llama una estimación. Por ejemplo, suponga que quiere estimarse la media y la varianza de la resistencia a
=
la ruptura de un tipo particular de fibra textil. Se prueba una muestra aleatoria de n 25 ejemplares de
prueba de la fibra y se registra la resistencia de cada uno de ellos. La media y la varianza muestrales se cal
culan de acuerdo con las ecuaciones 27 y 28, respectivamente, obteniéndose y = 18.6 y S2 = 1.20. Por lo
tanto, la estimación de µ es y = 18.6 y la estimación de a2 es S2 = 1.20.
Un buen estimador puntual debe tener varias propiedades. Dos de las más importantes son las si
guientes:
l. El estimador puntual deberá ser insesgado. Es decir, el parámetro que se está estimando deberá
ser el promedio o valor esperado a la larga del estimador puntual. Aun cuando la ausencia de ses
go es deseable, esta propiedad por sí sola no siempre hace que un estimador sea adecuado.
2. Un estimador insesgado deberá tener la varianza mínima. Esta propiedad establece que el esti
mador puntual de varianza mínima tiene una varianza que es menor que la varianza de cualquier
· otro estimador del parámetro en cuestión.
y
Es sencillo demostrar que y si son estimadores insesgados de µ y a2, respectivamente. Considere ·
primero ji. Al utilizar las propiedades del valor esperado, se tiene
l
porque el valor esperado de cada observación y, esµ. Parlo tanto.j es un estimador insesgado deµ.
Considere ahora la varianza muestral S2• Se tiene
I
! (y, -y)2
E(S2 )=E ""'-'~"'"""1
n-1
=~E[!n 1 iml
(y;)i)2]
1
::: nl E(SS)
donde SS= l:7~i (y, y)2 es la soma de cuadrados corregida de las observaciones y,. Entonces
E(SS)= E[~ (Y; y)2 J (29)
= J! J?-ny2]
~L,1
= !
;~1
(µ2 +a2)-n(µ2 +a2 In)
= (nl)a 2 (210)
Por lo tanto,
E(S2 )= 1-E(SS)
n-1
=u2
y se observa que S2 es un estimador insesgado de a2.
23 MUESTREO Y DISTRIBUCIONES DE MUESTREO 29
Grados de libertad
A la cantidad n 1 de la ecuación 2 10 se le llama el número de grados de libertad de la suma de cuadra
dos SS. Se trata de un resultado muy general; es decir, siy es una variable aleatoria con varianza a2 y
SS = l:( y, - y) 2 tiene v grados de libertad, entonces
(211)
El número de grados de libertad de una suma de cuadrados es igual al número de elementos independien
tes en dicha suma de cuadrados. Por ejemplo, SS= l:~g1 (y1 - y)2 en la ecuación 29 consiste en la suma de
los cuadrados de los n elementos y1 y, y2 - y, ... , Yn - y. No todos estos elementos son independientes
porque l:~.. 1 (y1 - y)= O; de hecho, sólo n1 de ellos son independientes, lo cual implica que SS tiene n1
grados de libertad.
La distribución normal y otras distribuciones de muestreo

En muchas ocasiones la distribución de probabilidad de un estadístico particular puede determinarse si se
conoce la distribución de probabilidad de la población de la que se tomó la muestra. A la distribución de
probabilidad de un estadístico se le llama la distribución de muestreo. A continuación se revisan breve
mente varias distribuciones de muestreo útiles.
Una de las distribuciones de muestreo más importantes es la distribución normal. Siy es una variable
aleatoria normal, la distribución de probabilidad de y es
f(y) = _1_ e(1/2)[(yµ)/a]' oo<y<oo (212)

aJ2i
donde oo < µ < oo es la media die la distribución y a2 > O es la varianza. En la figura 25 se ilustra la distri
bución normal.
Debido a que las corridas muestrales que difieren como resultado del error experimental a menudo
se encuentran descritas adecuadamente en la distribución normal, ésta desempeña un papel fundamental
en el análisis de los datos de experimentos diseñados. También es posible definir muchas distribuciones
de muestreo importantes en términos de variables aleatorias normales. Con frecuencia se usa la notación
y - N(µ, a2) para denotar que y sigue una distribución normal con mediaµ y varianza a2.
Un caso especial importante de la distribución normal es la distribución normal estándar; es decir,
µ = O y a2 = l. Se observa que si y - N(µ, a2), la variable aleatoria
y-µ
z= (213)
a
"
Figura 25 La distribución normal.
30 CAPÍ1ULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES
sigue la distribución normal estándar, denotadaz N(O, 1). A la operación ilustrada en la ecuación 213
suele llamársele la estandarización de la variable aleatoria normal y. En la tabla 1 del apéndice se presen
ta la distribución normal estándar acumulada.
En muchas técnicas estadísticas se supone que la variable aleatoria sigue una distribución normal. El
teorema del límite central es con frecuencia una justificación de la normalidad aproximada.
TEOREMA 2-1 · · · · · · · · · · · · · · · · · · · · · · · · · · · • · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
El teorema del límite central
Si y¡,y2, ••• ,yn es una sucesión den variables aleatorias independientes que tienen una distribución idéntica
con E(y;) =µy V(y1) = a2 (ambas finitas) y x = y1 + y2 + ... + Yn, entonces
x+nu
z =
" ,Jna2
tiene una distribución N(O, 1) aproximada en el sentido de que, si Fn(z) es la función de la distribu
ción de z; y <fJ(z) es la función de la distribución de la variable aleatoria N(O, 1 ), entonces lím, ... .,[Fn(z)/
<fJ(z)] = l.
Este resultado establece en esencia que la suma de n variables aleatorias independientes que tienen una
distribución idéntica sigue una distribución aproximadamente normal. En muchos casos esta aproxima
ción es adecuada para valores muy pequeños den, digamos n < 10, mientras que en otros casos se necesi
ta un valor grande den, digamos n > 100. Frecuentemente se considera que el error de un experimento
surge de una manera aditiva de varias fuentes independientes; por consiguiente, la distribución normal se
convierte en un modelo recomendable para el error experimental combinado.
Una importante distribución de muestreo que puede definirse en términos de variables aleatorias
normales es la distribuciónx2 o jicuadrada. Si z., z2, ... ,zk son variables aleatorias que tienen una distri
bución normal e independiente con media O y varianza 1, cuya abreviatura es NID(O, 1 ), entonces la varia
ble aleatoria
sigue la distribución jicuadrada con k grados de libertad. La función de densidad de la distribución

jicuadrada es
x>O (214)
En la figura 26 se ilustran varias distribuciones jicuadrada. La distribución es asimétrica, o sesgada,

con media y varianza
µ=k
ª2 = 2k
respectivamente. En la tabla III del apéndice se presentan los puntos porcentuales de la distribución
jicuadrada.
23 MUESTREO Y DISTRIBUCIONES DE MUESTRÉO 31
Figura 26 Varias distribuciones jicuadrada.
Como un ejemplo de una variable aleatoria que sigue la distribución jicuadrada, suponga que y1,
y2, y,, es una muestra aleatoria de una distribución N(µ, a2). Entonces
••• ,
L (Y; - ji)2
11
SS
-;;:¡ =
1~1 2
ª2 - X11-I
Es decir, SS!a2 sigue una distribución jicuadrada con n - 1 grados de libertad.

Muchas de las técnicas utilizadas en este libro requieren el cálculo y la manipulación de sumas de
cuadrados. El resultado dado en la ecuación 215 es de suma importancia y aparece en múltiples ocasio
nes; cuando una suma de cuadrados de variables aleatorias normales se divide por a2 sigue la distribución
jicuadrada.
Al examinar la ecuación 28, se observa que la varianza muestral puede escribirse como
s2 = SS
n1
Si las observaciones de la muestra son NID(µ, a2), entonces la distribución de S2 es [a2/(n l)]x!_1. Por lo
tanto, la distribución de muestreo de la varianza muestral es una constante multiplicada por la distribu
ción jicuadrada si la población tiene una distribución normal.
Si z y x;
son variables aleatorias independientes normal estándar y jicuadrada, respectivamente, la
variable aleatoria
t =~z (217)
k ~xUk
sigue la distribución t con k grados de libertad, denotada t11: La función de densidad de t es
f[(k+l)/ 2] 1
-oo<t<oo (218)
f(t)= ..fbir(k/2) [(t2/k)+l](k+l)/2
=
yla media y la varianza de tsonµ = Oya2 k!(k-2) parak > 2, respectivamente. En la figura27 se ilus
tran varias distribuciones t. Observe que si k = oo, la distribución t se convierte en la distribución normal
32 CAPÍTUW 2 EXPERIMENTOS COMPARATIVOS SIMPLES
Figura 27 Varias distribuciones t.
estándar. En la tabla 11 del apéndice se presentan los puntos porcentuales de la distribución t. Siy1,y0 ... ,
Yn es una muestra aleatoria de una distribución N(µ, a2), entonces la cantidad
t = y-µ (219)
Sl.Jñ
se distribuye como t con n - 1 grados de libertad.
La última distribución de muestreo que consideraremos es la distribución F. Si y x~ x~
son dos varia
bles aleatorias jicuadrada independientes con u y v grados de libertad, respectivamente, entonces el co
ciente
x2/u
F,,,v = X~/ V (220)
sigue la distribución F con u grados de libertad en el numerador y v grados de libertad en el denominador.

Six es una variable aleatoria F con u grados de libertad en el numerador y v grados de libertad en el deno
minador, entonces la dístríbucíónde probabilidad de x es
h X - r(T)(;f2 x<u12)1
O<x<oo (221)
( ) r(~f(~X(;;}+1r"'"
u4.11=10
0.8 u~4,11·30
,, -••••• U• 10,V• 10
l!"' -- u~10,v-30
~ 0.6
.a!!
Q.
-8
,,,,., 0.4
..
~ 0.2
e
o 2 4 6 8
x
Figura 2·8 Varias distribuciones F.
24 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, DISEÑOS ALEATORIZADOS 33
En la figura 28 se ilustran varias distribuciones R Esta distribución es muy importante en el análisis esta
dístico de experimentos diseñados. En la tabla IV del apéndice se presentan los puntos porcentuales de la
distribución R
Como un ejemplo de un estadístico que sigue una distribución F, suponga que se tienen dos poblacio
nes normales independientes con varianza común a2. SiYwYi2' ... , Yin, es una muestra aleatoria de n1 ob
servaciones de la primera población y si Yzi. y22, ••• , Yz.,, es una muestra aleatoria de n2 observaciones de la
segunda, entonces
s2
_i __ F
S2 n1l,n21
(222)
2
donde S12 y Si son las dos varianzas muestrales. Este resultado se sigue directamente de las ecuaciones
215 y 220.
z. 4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS,

DISEÑOS ALEATORIZADOS
Estamos preparados ahora para volver al problema del mortero de cemento portland de la sección 21.
Recuerde que se estaban investigando dos formulaciones diferentes para determinar si difieren en la
fuerza de la tensión de adhesión. En esta sección se examina cómo pueden analizarse los datos de este ex
perimento comparativo simple utilizando procedimientos de prueba de hipótesis e inte"alos de confian
za para comparar las medias de dos tratamientos.
A lo largo de esta sección se supone que se usa un diseño experimental completamente aleatorizado.
En este diseño, los datos se consideran como si fueran una muestra aleatoria de una distribución normal.
z ..4.1 Prueba de hipótesis

Se retoma ahora el experimento del cemento portland introducido en la sección 21. Recuerde que el in
terés se encuentra en comparar la fuerza de dos formulaciones diferentes: una del mortero sin modificar y
una del mortero modificado. En general, estas dos formulaciones pueden considerarse como dos niveles
del factor "formulaciones". Sea que Yw y12, ••• , Yin, represente las n1 observaciones del primer nivel del
factor y que YwY22, ••• , y2,,, represente las n2 observaciones del segundo nivel del factor. Se supone que
las muestras se sacan al azar de dos poblaciones normales independientes. En la figura 29 se ilustra la
situación.
Nl11,. a,2)
11, l.li
Muestra 1: y11,y1v .. ·• .)11.,1 Mul:ISlra 2: 121• Yu····· Y2n,
Nivel 1 del factor Nivel 2 del factor

Figura 2!> La situación del muestreo para la prueba t de dos muestras.
Un modelo de los datos

Con frecuencia los resultados de un experimento se describen con un modelo. Un modelo estadístico sim
ple que describe los datos de un experimento como el que acaba de describirse es
i =1 2
Y¡¡=µ;+e¡¡ {1·=1'' 2, n (223)
••• , i
donde Yii es la observaciónjésima del nivel i del factor.zz, es la media de la respuesta para el nivel íésimo
del factor, y e¡¡ es una variable aleatoria normal asociada con la observación ijésima. Se supone que las e¡¡
=
son NID(O, a¡), i 1, 2. Se acostumbra hacer referencia a e¡¡ como el componente del error aleatorio del
modelo. Puesto que las medias µ1 y µ2 son constantes, se observa directamente a partir del modelo que las
Y¡¡ son NID(u;, a¡), i = 1, 2, como se acaba de suponer arriba. Para más información acerca de los modelos
de los datos, referirse al material suplementario del texto.
Hipótesis estadísticas
Una hipótesis estadística es un enunciado o afirmación ya sea acerca de los parámetros de una distribu
ción de probabilidad o de los parámetros de un modelo. La hipótesis refleja alguna conjetura acerca de la
situación del problema. Por ejemplo, en el experimento del cemento portland, puede pensarse que las
fuerzas de la tensión de adhesión promedio de las dos formulaciones del mortero son iguales. Esto puede
enunciarse formalmente como
Ho:µ1 = µ2
H1:µ1 ;1:. µ2
donde µ1 es la fuerza de la tensión de adhesión promedio del mortero modificado y µ2 es la fuerza de ten
sión de enlace promedio del mortero sin modificar. Al enunciado H0:µ1 = µ2 se le llama la hipótesis nula y
aH1:µ1 ;1:. µ2 se le llama la hipótesis alternativa. A la hipótesis alternativa que se especifica aquí se le llama
hipótesis alternativa de dos colas porque sería verdadera si µ1 < µ2 o si µ1 > µ2•
Para probar una hipótesis se proyecta un procedimiento para tomar una muestra aleatoria, calcular
un estadístico de prueba apropiado para después rechazar o no estar en posición de rechazar la hipótesis
nula H0• Parte de este procedimiento consiste en especificar el conjunto de valores del estadístico de
prueba que llevan al rechazo de H0• A este conjunto de valores se le llama la región critica o región de re·
chazo de la prueba.
Pueden cometerse dos tipos de errores cuando se prueban hipótesis. Si la hipótesis nula se rechaza
cuando es verdadera, ha ocurrido un error tipo l. Si la hipótesis nula no se rechaza cuando es falsa, se ha
cometido un error tipo 11. Las probabilidades de estos dos errores se expresan con símbolos especiales:
a = P( error tipo 1) = P( rechazar H01 H0 es verdadera)

P = P( error tipo 11) = P( dejar de rechazar H01 H0 es falsa)
En ocasiones es más conveniente trabajar con la potencia de la prueba, donde
Potencia = 1 p = P( rechazar H0 H 0 1 es falsa)
El procedimiento general en la prueba de hipótesis es especificar un valor de la probabilidad a del error

tipo I, llamada con frecuencia el nivel de significación de la prueba, y después diseñar el procedimiento
de prueba de tal modo que la probabilidad p del error tipo 11 tenga un valor convenientemente pequeño.
La prueba t de dos muestras
Considere que puede suponerse que las varianzas de las fuerzas de la tensión de adhesión fueron idénti
cas para ambas formulaciones del mortero. Entonces el estadístico de prueba que deberá usarse para
comparar las medias de dos tratamientos en el diseño completamente aleatorizado es
(224)
donde y1 y y2 son las medias muestrales, n1 y n2 son los tamaños de las muestras, S ~ es una estimación de la
varianza común a¡ =a; = a2 calculada a partir de
l)S{ +(n2 l)Si
s = (n¡
2
P n1 +n2 2
(225)
y S12 y Si son las dos varianzas muestrales individuales. Para determinar si deberá rechazarse H0:µ1 µ2, =
se compararía t0 con la distribución t con n1 + n2 - 2 grados de libertad. Si 1t01 > t ª12,111 +,,2 _2, donde
t ª12,111 +,,2 _2 es el punto porcentual a/2 superior de la distribución t con n1 + n2 - 2 grados de libertad, en
tonces se rechazaría H0 y se concluiría que las fuerzas promedio de las dos formulaciones del mortero de
cemento portland difieren. A este procedimiento de prueba se le llama generalmente la prueba t de dos
muestras.
Este procedimiento puede justificarse de la siguiente manera. Si el muestreo se está haciendo de dis
tribuciones normales independientes, entonces la distribución de y1 y2 es N[µ1 µ2, a2(1/n1 + lln2) ]. Por
lo tanto, si se conociera a2, y si H0:µ1 = µ2 fuera verdadera, la distribución de
(226)
seríaN(O, 1). Sin embargo, al sustituir a con SP en la ecuación 226, la distribución de Z0 cambia de la nor
mal estándar a la distribución t con n1 + n2 2 grados de libertad. Ahora bien, si H0 es verdadera, t0 de la
ecuación 224 se distribuye como t "• +112_2 y, por consiguiente, se esperaría que 100(1a) por ciento de los
valores de t0 estén entretª12,,, + 2 y tª12, +n,-i. Una muestra que produjera un valor de t0 que estuviera
1 112_ 111
fuera de estos límites sería inusual si la hipótesis nula fuera verdadera y es evidencia de que H0 deberá re
chazarse. Por lo tanto, la distribución t con n1 + n2 - 2 grados de libertad es la distribución de referencia
apropiada para el estadístico de prueba t0• Es decir, describe el comportamiento de t0 cuando la hipótesis
nula es verdadera. Observe que a es la probabilidad del error tipo 1 de la prueba.
En algunos problemas quizá quiera rechazarse H0 únicamente si una de las medias es mayor que la
otra. Por lo tanto, se especificaría una hipótesis alternativa de una cola H1 :µ1 > µ2 y H0 sólo se rechazaría
si t0 > t ª·"' +112 _2• Si se desea rechazar H0 sólo si µ1 es menor que µ2, entonces la hipótesis alternativa es
H1:µ1 < µ2, y H0 se rechazada si t0 < -ta, ,+ 2• 11 112_
Para ilustrar el procedimiento, considere los datos del cemento portland de la tabla 21. Para estos
datos, se encuentra que
Mortero modificado Mortero sin modificar
ji1 = 16.76 kgf / cm' y2= 17.92 kgf / cm"
S,.2 = 0.100 Si =0.061
S¡ = 0.316 S2 =0.247
11¡=10 n2 =10
Puesto que las desviaciones estándar muestrales son razonablemente similares, no es improcedente con
cluir que las desviaciones estándar (o las varianzas) poblacionales son iguales. Por lo tanto, puede usarse
la ecuación 224 para probar las hipótesis
Ho:µ1 =µz
H¡:µI ;to µ2
Además, n1 + n22 = 10 + 102 = 18, y si se elige a = 0.05, entonces H0:µ1 = µ2 se rechazaría si el valor
numérico del estadístico de prueba t0 > t0.025, 18 = 2.101, o si t0 < 10.025, 18 = 2.101. Estos límites de la re
gión crítica se ilustran en la distribución de referencia (t con 18 grados de libertad) de la figura 210.
Al utilizar la ecuación 225 se encuentra que
52 = (n1 l)S12 +(n2 l)Si

P n1 +n2 2
9(0.100) + 9(0.061)
10+102
= 0.081
sp = o.284
y el estadístico de prueba es
t =
o JR:l
Y1 y2
sp +
n, n1
16.7617.92
0.284~fc¡+fo
= 9.13
Puesto que t0 = 9 .13 < t0.025, 18 = 2.101, se rechazaría H0 y se concluiría que las fuerzas de la tensión de
adhesión promedio de las dos formulaciones del mortero de cemento portland son diferentes.
"O
~ 0.3
~..
..e
o
~ 0.2
..
"O
"O
":¡¡ 0.1
·¡¡;
o Región
critica
oLJ.__._...........i_...~;llll.l-'---'-..i._J1........1..--'-......_um--..._............_.__J.......J
6 4 2 o 2 4 6
'º
Figura 210 La distribución t con 18 grados de libertad con Ja región crítica
::!:to.02s, " = ::!:2.101.
24 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, DISEÑOS ALEA TORIZADOS 37
El uso de valores P en la prueba de hipótesis

Una manera de reportar los resultados de una prueba de hipótesis es estableciendo que la hipótesis nula
fue rechazada o no para un valor de a o nivel de significación específico. Por ejemplo, en el experimento
del mortero de cemento portland anterior puede decirse que H0:µ1 = µ2 se rechazó con el nivel de signifi
cación 0.05. Esta enunciación de las conclusiones es con frecuencia inadecuada porque no le ofrece al res
ponsable de la toma de decisiones idea alguna de si el valor calculado del estadístico de prueba apenas
rebasó la región de rechazo o si se adentró bastante en la misma. Además, al darse los resultados de esta
manera se les impone a otros usuarios de la información el nivel de significación predefinido. Este enfo
que puede ser insatisfactorio porque algunos responsables de la toma de decisiones podrían sentirse incó
modos con los riesgos que implica el valor a = 0.05.
Para evitar estas dificultades, en la práctica se ha adoptado extensivamente el enfoque del valor P. El
valor P es la probabilidad de que el estadístico de prueba asuma un valor que sea al menos tan extremo
como el valor observado del estadístico cuando la hipótesis nula H0 es verdadera. Por lo tanto, un valor P
transmite mucha información acerca del peso de la evidencia en contra de H0 y, por consiguiente, el res
ponsable de la toma de decisiones puede llegar a una conclusión con cualquier nivel de significación espe
cificado. En términos más formales, el valor P se define como el nivel de significación menor que llevaría
a rechazar la hipótesis nula H0.
Se acostumbra decir que el estadístico de prueba (y los datos) es significativo cuando se rechaza la hi
pótesis nula; por lo tanto, el valor P puede considerarse como el menor nivel a en el que los datos son sig
nificativos. Una vez que se conoce el valor P, el responsable de la toma de decisiones puede determinar la
medida en que los datos son significativos sin que el analista de los datos imponga formalmente un nivel
de significación preseleccionado.
No siempre es sencillo calcular el valor P exacto de una prueba. Sin embargo la mayoría de los progra
mas de computación modernos para realizar análisis estadísticos reportan valores P, y pueden obtenerse
también en algunas calculadoras portátiles. A continuación se indicará cómo obtener una aproximación
del valor P para el experimento del mortero de cemento portland. Por la tabla II del apéndice, para una
distribución t con 18 grados de libertad, la probabilidad menor en el área de la cola es 0.0005, para la cual
t0.0005, 18 = 3.922. Ahora bien, lto 1 = 9.13 > 3.922, de donde, ya que la hipótesis alternativa es de dos colas,
se sabe que el valor P debe ser menor que 2(0.0005) = 0.001. Algunas calculadoras portátiles tienen la ca
pacidad para calcular valores P. Una de ellas es la HP48. Utilizando esta calculadora se obtiene el valor P
para el valor t0 = 9.13 del experimento de la formulación del mortero de cemento portland como
P = 3.68 X 108. Por lo tanto, la hipótesis nulaH0:µ1 = µ2 se rechazaría con cualquier nivel de significación
a ~ 3.68 X 108.
Solución por computadora

Hay muchos paquetes de software de estadística que cuentan con la capacidad para probar hipótesis esta
dísticas. En la tabla 22 se presenta la salida del procedimiento para la prueba t de dos muestras de Mini
tab aplicado al experimento de la formulación del mortero de cemento portland. Observe que la salida
incluye algunos estadísticos concisos acerca de las dos muestras (la abreviatura "SE Mean" ["SE media"]
se refiere al error estándar de la media, s / ..fñ ), así como alguna información sobre los intervalos de con
fianza para la diferencia en las dos medias (los cuales se revisan en las secciones 24.3 y 26). El programa
también prueba la hipótesis de interés, permitiendo que el analista especifique la naturaleza de la hipóte
sis alternativa ("not =" ["no ="] significa H1:µ1 ~ µ2) y la elección de a (a = 0.05 en este caso).
La salida incluye el valor calculado de t0, el valor P (llamado el nivel de significación) y la decisión que
debería tomarse dado el valor especificado de a. Observe que el valor calculado del estadístico t difiere li
geramente del valor que se calculó manualmente aquí y que el valor P que se reporta es P = 0.0000. Mu
38 CAPÍTIJLO Z EXPERIMENTOS COMPARATIVOS SIMPLES
Tubla 22 Prueba t de dos muestras usando Minitab para el experimentodel mortero de cemento portland
Prueba t de dos muestras e intervalo de confianza
Two sample T for Modified vs Unmod
N Mean StDev SE Mean
Modified 10 16.774 0.309 0.098
Unmod 10 17.922 0.248 0.078
95% Cl for mu Modified mu Unmod: C -1.411, -0.885)
t-Test mu Modified =mu Unmod Cvs not =>: T = -9.16
P = 0.0000 DF = 18
Both use Pooled StDev = 0.280
chos paquetes de software no reportarán un valor P real menor que 0.0001y en su lugar presentan un
valor "por omisión". Éste es el caso aquí.
Verificación de los supuestos en la prueba t

Para utilizar el procedimiento de la prueba t se establecen los supuestos de que ambas muestras se toman
de poblaciones independientes que pueden describirse con una distribución normal, que las desviaciones
estándar o las varianzas de ambas poblaciones son iguales, y que las observaciones son variables aleato
rias independientes. El supuesto de independencia es crítico, pero si el orden de las corridas está aleatori
zado (y, de ser apropiado, se seleccionan al azar otras unidades y materiales experimentales), este
supuesto por lo general se satisfará. Los supuestos de la igualdad de las varianzas y la normalidad son fáci
les de verificar utilizando una gráfica de probabilidad normal.
En general, la graficación de probabilidades es una técnica para determinar si los datos muestrales se
ajustan a una distribución hipotetizada con base en un examen visual subjetivo de los datos. El procedi
miento general es muy simple y puede realizarse rápidamente con la mayoría de los paquetes de software
de estadística. En el material suplementario del texto se analiza la construcción manual de las gráficas de
probabilidad normal.
Para construir una gráfica de probabilidad, primero se ordenan de menor a mayor las observaciones
de la muestra. Es decir, la muestray1,y2, ••• ,yn se ordena como Y(t)>Y(l)' ••• ,y(n)• donde Y(l) es la observación
menor,y(Z) es la segunda observación menor, y así sucesivamente, cony(n) la mayor. Las observaciones or
denadas y <i) se grafican entonces contra sus respectivas frecuencias acumuladas observadas (j - 0.5)/n. La
escala de la frecuencia acumulada se ha dispuesto de tal modo que si la distribución hipotetizada describe
de manera adecuada los datos, los puntos graficados estarán aproximadamente sobre una línea recta; si
los puntos graficados muestran una desviación significativa de una recta, el modelo hipotetizado no es
apropiado. Generalmente, determinar si los datos grafícados pertenecen o no a una recta es una decisión
subjetiva.
Para ilustrar el procedimiento, suponga que quiere verificarse el supuesto de que la fuerza de la ten
sión de adhesión en el experimento de la formulación del mortero de cemento portland sigue una distri
bución normal. Inicialmente sólo se consideran las observaciones de la formulación del mortero sin
modificar. En la figura 2lla se ilustra una gráfica de probabilidad normal generada por computadora. La
mayoría de las gráficas de probabilidad normal muestran lOO(i-0.5)/n en la escala vertical izquierda (y en
ocasiones se muestra 100[1 (j 0.5)/n] en la escala vertical derecha), con el valor de la variable graficado
en la escala horizontal. Algunas gráficas de probabilidad normal convierten la frecuencia acumulada en
un valor z normalizado. Una línea recta, elegida de manera subjetiva, se ha trazado en medio de los pun
24 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, DISEÑOS ALEATORIZAOOS 39
º·1 17.6 17.7 17.9 18.1 18.3

Fuerza de la tensión de adhesión
al Mortero sin modificar

99.9 ,....._,......,...._,.... __ ..,......,..........,......, .............. ....~. ....... ...,........,..."T"""I
8
..
al 96
..
~
u
80
e. 1 16.3 16.6 16.7 16.9 17.1 17.3

Fuerza de la tensión de adhesión
bl Mortero modificado
Figura 2·11 Gráficas de probabilidad normal de la fuerza de la tensión de

adhesión en el experimento del cemento portland.
tos graficados. Al trazar la línea recta, uno deberá guiarse más por Jos puntos de la parte media de la gráfi
ca que por los puntos extremos. Una buena regla empírica es trazar la recta aproximadamente entre los
puntos de los cuartiles 25 y 75. Así se determinó la recta de la figura 2lla. Para evaluar la "proximidad"
de los puntos a la línea recta, imagine un lápiz grueso colocado sobre la recta. Si este lápiz imaginario cu
bre todos los puntos, entonces una distribución normal describe de manera adecuada los datos. Puesto
que los puntos de la figura 2 lla pasarían la prueba del lápiz grueso, se concluye que la distribución nor
mal es un modelo apropiado para la fuerza de la tensión de adhesión del mortero sin modificar. En la fi
gura 2-llb se presenta la gráfica de probabilidad normal para las 10 observaciones de la fuerza de la
tensión de adhesión del mortero modificado. De nueva cuenta, se concluiría que es razonable el supuesto
de una distribución normal.
Es posible obtener una estimación de la media y la desviación estándar directamente de la gráfica de
probabilidad normal. La media se estima como el percentil 50 de la gráfica de probabilidad y la desviación
estándar se estima como la diferencia entre los percentiles 84 y 50. Esto significa que el supuesto de la
igualdad de las varianzas poblacionales en el experimento del cemento portland puede verificarse compa
rando las pendientes de las dos rectas de las figuras 2lla y 2llb. Ambas rectas tienen pendientes muy si
milares, por lo que el supuesto de la igualdad de las varianzas es razonable. Si se viola este supuesto,
deberá usarse la versión de la prueba t que se describe en la sección 24.4. En el material suplementario
del texto hay más información acerca de la verificación de los supuestos de la prueba t.
Cuando ocurren violaciones importantes de los supuestos, se afectará el desempeño de la prueba t.
En general, las violaciones de pequeñas a moderadas no son motivo de preocupación particular, pero no
deberá ignorarse cualquier falla del supuesto de independencia, así como los indicios claros de que no se
satisface el supuesto de normalidad. Tanto el nivel de significación de la prueba como la capacidad para
detectar diferencias entre las medias serán afectados adversamente por el incumplimiento de estos su
puestos. Un recurso para resolver este problema son las transformaciones. Este tema se analiza con ma
yor detalle en el capítulo 3. También es posible utilizar procedimientos no paramétricos para la prueba de
hipótesis cuando las observaciones provienen de poblaciones no normales. Referirse a Montgomery y
Runger [83d] para más detalles.
Una justificación alternativa de la prueba t

La prueba t de dos muestras que acaba de presentarse depende en teoría del supuesto fundamental de
que las dos poblaciones de las que se seleccionaron las muestras al azar son normales. Aun cuando el su
puesto de normalidad es necesario para desarrollar formalmente el procedimiento de prueba, como ya
se mencionó, las desviaciones moderadas de la normalidad no afectarán seriamente los resultados. Puede
argumentarse (por ejemplo, ver Box, Hunter y Hunter [18]) que el uso de un diseño aleatorizado
permite probar hipótesis sin ningún supuesto respecto de la forma de la distribución. En resumen, el razo
namiento es el siguiente, Si los tratamientos no tienen ningún efecto, todas las [20!/(10!10!)] = 184,756
formas posibles en que podrían ocurrir las 20 observaciones son igualmente posibles. Hay un valor de t0
para cada uno de estos 184,756 posibles arreglos. Si el valor de t0 que se obtiene en realidad de los datos es
inusualmente grande o in usualmente pequeño con referencia al conjunto de los 184,756 valores posibles,
es una indicación de que µ1 :;é µ2•
A este tipo de procedimiento se le llama prueba de aleatorizaci6n. Puede demostrarse que la prueba
t es una buena aproximación de la prueba de aleatorización. Por lo tanto, se usarán aquí pruebas t (y otros
procedimientos que pueden considerarse aproximaciones de pruebas de aleatorización) sin prestar de
masiada atención al supuesto de normalidad. Ésta es una de las razones por las que un procedimiento
simple, como las gráficas de probabilidad normal, es adecuado para verificar el supuesto de normalidad.
24.2 Elección del tamaño de la muestra

La elección de un tamaño de la muestra apropiado es uno de los aspectos más importantes de cualquier
problema de diseño experimental. La elección del tamaño de la muestra y la probabilidad f3 del error tipo
II guardan una estrecha relación. Suponga que se están probando las hipótesis
Ha:µ1 = µ2
H1 :µ1 :;é µ2
o
y que las medias no son iguales, por lo que = µ1 µ2. Puesto que H0:µ1 = µ2 no es verdadera, la preocupa
ción principal es cometer la equivocación de no rechazar Ha. La probabilidad del error tipo II depende de
la verdadera diferencia en las medias o. A una gráfica de f3 contra o para un tamaño particular de la mues
tra se le llama la curva de operación característica, o curva OC, de la prueba. El error f3 también es una
función del tamaño de la muestra. En general, para un valor dado de o, el error f3 se reduce cuando el ta
maño de la muestra se incrementa. Es decir, es más fácil detectar una diferencia especificada en las me
dias para tamaños grandes de la muestra que para los tamaños pequeños.
En la figura 212 se muestra un juego de curvas de operación característica para las hipótesis
Ho:µ1 = µ2
H1:µ1 ~ µ2
para el caso en que las dos varianzas poblacionales a¡ y a; son desconocidas pero iguales (a; =a; = a2)
y para un nivel de significación de a = 0.05. Las curvas también parten del supuesto de que los tamaños de
las muestras de las dos poblaciones son iguales; es decir, n1 = n2 = n. El parámetro del eje horizontal de la
figura 212 es
d)µ1-µ2I lól
2a 2a
La división de 1 d 1 por 2a permite al experimentador usar el mismo juego de curvas, independientemente
del valor de la varianza (la diferencia en las medias se expresa en unidades de desviación estándar). Por
otra parte, el tamaño de la muestra usado para construir las curvas es en realidad n" = 2n - 1.
Al examinar estas curvas, se observa lo siguiente:
l. Entre más grande sea la diferencia en las medias, µ1 µ2, menor será la probabilidad del error tipo 11
para un tamaño de la muestra y un valor de a dados. Es decir, para un tamaño de la muestra y un valor
de a especificados, la prueba detectará con mayor facilidad las diferencias grandes que las pequeñas.
2. Cuando el tamaño de fa muestra se hace más grande, la probabilidad del error tipo 11 se hace más pe
queña para una diferencia en las medias y un valor de a dados. Es decir, para detectar una diferencia
ó especificada, puede aumentarse la potencia de la prueba incrementando el tamaño de la muestra
Las curvas de operación característica son con frecuencia útiles para seleccionar el tamaño de la
muestra que debe usarse en un experimento. Por ejemplo, considere el problema del mortero de cemento
portland comentado antes. Suponga que si las dos formulaciones difieren en la fuerza promedio hasta en
0.5 kgf/cm2, sería deseable detectarlo con una probabilidad alta. Por lo tanto, puesto que µ1 µ2 =
0.8
2 3
d
Figura 2·12 Curvas de operación característica para la prueba t de dos
colas con a = 0.05. (Reproducida con permiso de "Operatíng Characte
rístics Curves for the Common Statistical 'Iests of Significance", C.L. Fe
rris, P.E. Grubbs y C.L. Weaver, Annals of Mathematical Statistics.)
0.5 kgf/cm2 es la diferencia "crítica" en las medias que quiere detectarse, se encuentra que d, el parámetro
del eje horizontal de la curva de operación característica de la figura 212, es
0.5 0.25
~=
2a a
Desafortunadamente, d incluye al parámetro desconocido a. Sin embargo, suponga que con base en la ex
periencia previa se piensa que es altamente improbable que la desviación estándar de cualquiera de las
observaciones de la fuerza exceda 0.25 kgf/cm2• Entonces al usar a= 0.25 en la expresión anterior parad
= =
se obtiene d l. Si quiere rechazarse la hipótesis nula 95% de las veces cuando µ1 µ2 0.5, entonces ,8 =
0.05, y en la figura 212 con,8 = 0.05 y d = 1 se obtienen* = 16, aproximadamente. Por lo tanto, puesto
que n * = 2n - 1, el tamaño de la muestra requerido es
n= n*+l = 16+1 = &5=9

2 2
y se usarían los tamaños de las muestras n1 = n2 = n = 9.

En el ejemplo que se ha venido considerando, el experimentador utilizó en realidad un tamaño de la
muestra de 10. Quizás el experimentador decidió incrementar ligeramente el tamaño de la muestra a fin
de prevenir la posibilidad de que la estimación previa de la desviación estándar común a haya sido dema
siado conservadora y quizá fuera un poco mayor que 0.25.
Las curvas de operación característica desempeñan con frecuencia un papel importante en la elec
ción del tamaño de la muestra en los problemas de diseño experimental. Su utilización a este respecto se
revisa en capítulos subsecuentes. Para un análisis de los usos de las curvas de operación característica en
otros experimentos comparativos simples similares a la prueba t de dos muestras, véase Montgomery y
Runger [83d].
24.3 Intervalos de confianza

Aun cuando la prueba de hipótesis es un procedimiento útil, en ocasiones no cuenta la historia completa.
Muchas veces es preferible proporcionar un intervalo dentro del cual cabría esperar que estaría incluido
el valor del parámetro o los parámetros en cuestión. A las declaraciones de estos intervalos se les llama in
tervalos de confianza. En muchos experimentos de ingeniería e industriales, el experimentador sabe de
antemano que las medias µ1 y µ2 difieren; por consiguiente, la prueba de la hipótesis µ1 = µ2 es de escaso
interés. Por lo general el experimentador estaría más interesado en un intervalo de confianza para la dife
rencia en las medias µ1 - µ2•
Para definir un intervalo de confianza, suponga que (} es un parámetro desconocido. Para obtener
e,
una estimación del intervalo de es necesario encontrar dos estadísticosL y U tales que la declaración de
probabilidad
P(L s 9 s U)= 1 a (227)
sea verdadera. Al intervalo
Ls9sU (228)
se le llama intervalo de confianza de 100(1a) por ciento para el parámetro e. La interpretación de este
intervalo es que si, en muestreos aleatorios repetidos, se construye gran número de estos intervalos, 100(1
-a) por ciento de ellos contendrán el verdadero valor de 8.Alos estadísticosL y Use les llama los límites
de confianza inferior y superior, respectivamente, y a 1 a se le llama el coeficiente de confianza. Si a =
0.05, a la ecuación 228 se le llama intervalo de confianza de 95% para 8. Observe que los intervalos de
confianza tienen una interpretación de frecuencia; es decir, no se sabe si la declaración es verdadera para
esta muestra específica, pero sí se sabe que el método usado para generar el intervalo de confianza produ
ce declaraciones correctas en 100(1 a) por ciento de las veces.
Suponga que quiere encontrarse un intervalo de confianza de 100(1a) por ciento para la verdadera
diferencia de las medias µ1 µ2 en el problema del cemento portland. El intervalo puede deducirse de la
siguiente manera. El estadístico
se distribuye como tn,+n,-2• Por lo tanto,
=1a
(229)
sJHl
Al comparar las ecuaciones 229 y 227, se observa que
y-yz-ta/2,n1+n2-2 p +Sµ1µ2
n1 n2
s Y1 Y2 +t .. 12", 1
+n -2Sp
2 vn:·;;
~ (230)
es un intervalo de confianza de 100(1 a) por ciento para µ1 µ2•

La estimación real del intervalo de confianza de 95% para la diferencia en la fuerza de la tensión de
adhesión promedio de las formulaciones del mortero de cemento portland se encuentra haciendo la si
guiente sustitución en la ecuación 230:
16.7617.92(2101)0.284~fo+rlr s µl µl
s 16. 7617.92+(2101)0.284~fo+rlr
l.160.27sµ1 -µ2 s1.16+0.27
1.43sµ1µ2 :s0.89
Por lo tanto, el intervalo de confianza de 95% estimado para la diferencia en las medias se extiende de
1.43 kgf/cm2 a0.89 kgf/cm2• Expresado en otros términos, el intervalo de confianza es µ1 µ2 1.16=
kgf/cm2 ± 0.27 kgf/cm2, o la diferencia en las fuerzas promedio es1.16 kgf/cm2, y la precisión de esta esti
=
mación es de ±0.27 kgf/cm2• Observe que como µ1 -µ2 O no está incluida en este intervalo, los datos no
apoyan la hipótesis de que µ1 = µ2 con el nivel de significación de 5%. Es probable que la fuerza media de
la formulación sin modificar exceda la fuerza media de la formulación modificada. Observe que en la ta
44 CAPÍ"1ULO 2 EXPERIMENTOSCOMPARATIVOS SIMPLES
bla 22 Minitab también reportó este intervalo de confianza cuando se llevó a cabo el procedimiento de la
prueba de hipótesis.
2 ..4.4 Caso en que a; ~ ai

Si se está probando
Ho:µ1 = µ2
H1:µ1 ;rte. µz
y no hay bases para suponer que las varianzas yai a;
son iguales, entonces es necesario hacer ligeras mo
dificaciones en la prueba t de dos muestras. En este caso el estadístico de prueba es
Y1 -y2
(231)
52 52
_l+2
n1 n2
Este estadístico no se distribuye exactamente como t. No obstante, tes una buena aproximación de la dis
tribución de t0 si se usa
(232)
para los grados de libertad. Una indicación clara de la desigualdad de las varianzas en una gráfica de pro
babilidad normal sería una situación que requeriría esta versión de la prueba t. El lector no deberá encon
trar problemas para desarrollar una ecuación para encontrar ese intervalo de confianza para la diferencia
en las medias en el caso de varianzas· desiguales.
2 .. 4.S Caso en que se conocen a; y ai

Si las varianzas de ambas poblaciones se conocen, entonces las hipótesis
Ha:µi = µi
H1:µ1;rtc.µ2
pueden probarse utilizando el estadístico
(233)
Si ambas poblaciones son normales, o si los tamaños de las muestras son lo suficientemente grandes para
aplicar el teorema del límite central, la distribución de Z0 es N(O, 1) si la hipótesis nula es verdadera. Por
lo tanto, la región crítica se encontraría utilizando la distribución normal en lugar de la distribución t.
Específicamente, H0 se rechazaría si 1Z01 > Zª12' donde Za12 es el punto porcentual a/2 superior de la dis
tribución normal estándar.
A diferencia de la prueba t de las secciones anteriores, en la prueba de las medias con varianzas cono
cidas no se requiere el supuesto de que el muestreo se haga de poblaciones normales, Puede aplicarse el
teorema del límite central para justificar una distribución normal aproximada para la diferencia en las
medias muestrales )i1 - )i2•
El intervalo de confianza de 100(1a) por ciento paran, -µ2 cuando las varianzas se conocen es
(234)
Como ya se señaló, el intervalo de confianza es con frecuencia un complemento útil del procedimiento de
prueba de hipótesis.
2 ..4.6 Comparación de una sola media con un valor especificado

Algunos experimentos incluyen la comparación de la mediaµ de una sola población con un valor especifi
cado, por ejemplo µ0• Las hipótesis son
Ho:µ =»;
H1:µ-.t< µo
Si la población es normal con varianza conocida, o si la población no es normal pero el tamaño de la mues
tra es lo suficientemente grande para aplicar el teorema del límite central, entonces la hipótesis puede
probarse utilizando una aplicación directa de la distribución normal. El estadístico de prueba es
z =y-µº (235)
o a/..fñ
Si H0:µ = µ0 es verdadera, entonces la distribución de Z0 es N(O, 1 ). Por lo tanto, la regla de decisión para
H0:µ = µ0 es rechazar la hipótesis nula si 1Z01 > Zan· El valor de la media µ0 especificado en la hipótesis
nula se determina por lo general mediante una de las tres formas siguientes. Puede ser resultado de evi
dencia, conocimientos o experimentación previos. Puede ser resultado de alguna teoría o modelo que
describe la situación bajo estudio. Por último, puede ser resultado de especificaciones contractuales.
El intervalo de confianza de 100(1 a) por ciento para la verdadera media poblacional es
(236)
EJEMPLO 2, 1 · · · · · · · · · · " · · · · · · · · • • · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · • · · · · · · ·
Un proveedor ofrece lotes de tela a un fabricante de textiles. El fabricante desea saber si la resistencia a la
ruptura promedio excede 200 psi. De ser así, el fabricante aceptará el lote. La experiencia pasada indica
que un valor razonable para la varianza de la resistencia a la ruptura es 100(psi)2• Las hipótesis que debe
rán probarse son
H0:µ=200
H1:µ>200
Observe que se trata de una hipótesis alternativa de una cola. Por lo tanto, el lote se aceptaría sólo si la hi
pótesis nula H0:'µ = 200 pudiera rechazarse (es decir, si Z0 > Za)·
46 CAPÍTIJLO 2 EXPERIMENTOS COMPARATIVOS SIMPLES
Se seleccionan cuatro ejemplares aleatoriamente, y la resistencia a la ruptura promedio observada es

y = 214 psi. El valor del estadístico de prueba es
z =y-µº= 214200 280
0
a/ ./ñ, 10/.J4 ·
Si se especifica un error tipo 1 de a = 0.05, en la tabla 1 del apéndice se encuentra que Zª = Z0_05 = 1.645.
Por lo tanto, H0 se rechaza y se concluye que la resistencia a la ruptura promedio del lote excede 200 psi.
Cuando no se conoce la varianza de la población, es necesario establecer el supuesto adicional de que

la población sigue una distribución normal, aunque las desviaciones moderadas de la normalidad no afec
tarán seriamente los resultados.
Para probar H0:µ = µ0 en el caso de la varianza desconocida, se usa la varianza muestral S2 para esti
mar a2. Al sustituir a con S en la ecuación 235, se obtiene el estadístico de prueba
t =y-µº (237)
º s;Jñ
La hipótesis nula H 0: µ = µ 0 se rechazaría si 1101 > ta12, n _ 1, donde tan., n _ 1 denota el punto porcentual a/2
superior de la distribución t con n - 1 grados de libertad. El intervalo de confianza de 100(1a) por ciento
es en este caso
(238)
2 ..4. 7 Resumen
En las tablas 23 y 24 se resumen los procedimientos de prueba estudiados aquí para las medias muestra
les. Se muestran las regiones críticas para hipótesis alternativa tanto de una como de dos colas.
'Thbla23 Pruebas para medias con varianza conocida

Hipótesis Estadísticode prueba Criteriosde rechazo
Ho:µ =»,
H1:µ ~µo
Ho:µ =u,
H,:µ< µo
Ho:µ =r«
H1:µ> µº
z, > z,
Ho:µ, =µ2
H1:µ2 ""µ2
Ho:µ, =µ2
H¡:µ¡ < µ2 Z0<Z"
u,», =»,
H¡:µ¡ > µ2
25 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, DISEÑOS DE COMPARACIONES PAREADAS 47
Tabla 24 Pruebas para medias de distribuciones normales,
varianza desconocida
Hipótesis Estadístico de prueba Criterios de rechazo
Ho:µ =µo
H¡:µ'!'!µo
Ho:µ =»,
t¿ < -t,,,,,_¡
H1:µ< µº
Ho:µ =»,
H1:µ> µo
siat =a~
Ho:/li. =µ2
H1:µ1 ""µz
Ho:µ, =µz
H1:µ1 < µz
Ho:µ¡ =µz
H1:µ1 > µz
V
( S,.2/ n,.)2 + (Si/ ni)2
n¡1 n2l
2..5 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS,

DISEÑOS DE COMPARACIONES PAREADAS
25.1 El problema de las comparaciones pareadas

En algunos experimentos comparativos simples puede conseguirse un mejoramiento significativo de la
precisión haciendo comparaciones de observaciones pareadas del material experimental. Por ejemplo,
considere una máquina para probar la dureza que presiona una barra con una punta afilada sobre un
ejemplar de prueba de metal con una fuerza conocida. Al medir la profundidad de la depresión producida
por la punta, se determina la dureza del ejemplar de prueba. En esta máquina pueden instalarse dos pun
tas diferentes y aun cuando la precisión (la variabilidad) de las mediciones hechas con las dos puntas pa
rece ser la misma, se sospecha que una de las puntas produce diferentes lecturas de la dureza que la otra.
Sería posible realizar un experimento de la siguiente manera. Podrían seleccionarse al azar varios
ejemplares de prueba del metal (por ejemplo, 20). La mitad de estos ejemplares de prueba podrían pro
barse con la punta 1 y la otra mitad con la punta 2. La asignación exacta de los ejemplares a las puntas se
determinaría de manera aleatoria. Puesto que se trata de un diseño completamente aleatorizado, la dure
za promedio de las dos muestras podría compararse utilizando la prueba t descrita en la sección 24.
Al reflexionar un poco al respecto, se descubriría una seria desventaja del diseño completamente
aleatorizado en este problema. Suponga que los ejemplares de prueba del metal se cortaron de barras di
ferentes que se fabricaron a temperaturas diferentes o que no fueran exactamente homogéneos en cual
quier otra forma que pudiera afectar la dureza. Esta falta de homogeneidad entre los ejemplares
contribuirá a la variabilidad de las mediciones de la dureza y tenderá a inflar el error experimental, ha
ciendo más difícil detectar una diferencia real entre las puntas.
Para protegerse de esta posibilidad, considere un diseño experimental alternativo. Suponga que cada
ejemplar de prueba tiene el tamaño suficiente para que puedan hacerse en él dos determinaciones de la
dureza. Este diseño alternativo consistiría en dividir cada ejemplar de prueba en dos secciones, para des
pués asignar de manera aleatoria una punta a una mitad de cada ejemplar de prueba y la otra punta a la
otra mitad. El orden en que se prueban las puntas en un ejemplar de prueba particular se seleccionaría al
azar. El experimento, cuando se llevó a cabo de acuerdo con este diseño con 10 ejemplares de prueba,
produjo los datos (codificados) que se muestran en la tabla 25.
Un modelo estadístico que describe los datos de este experimento puede expresarse como
i=1 2
Yii =s.+I', +eiJ {j= 1: 2, ... , 10 (239)
donde yiJ es la observación de la dureza para la punta i en el ejemplar de pruebaj, u, es la verdadera dureza
promedio de la punta iésima, pj es un efecto sobre la dureza debido al ejemplar de pruebajésimo, y eiJ es
el error experimental aleatorio con media cero y varianza a¡.
Es decir, a¡
es la varianza de las mediciones
de la dureza hechas con la punta 1 y a; es la varianza de las mediciones de la dureza hechas con la punta 2.
Observe que si se calcula la diferencia pareada jésíma ·
d, = Y1j Y2j j = 1, 2, ... , 10 (240)
el valor esperado de esta diferencia es
µd = E(di)
= E(Y1i - Y2j)
= E(Y1¡ )- E(Y2j)
= µ1 +/3j -(µ2 +/3J
= µ¡ µ2
Es decir, pueden hacerse inferencias acerca de la diferencia en las lecturas de la dureza promedio de las
dos puntas µ1 µ2 haciendo inferencias acerca de la media de las diferencias µd. Observe que el efecto adi
Tabla 25 Datos del experimento de

la prueba de la dureza
Ejemplar de prueba Punta 1 Punta 2
1 7 6
2 3 3
3 3 5
4 4 3
5 8 8
6 3 2
7 2 4
8 9 9
9 5 4
10 4 5
25 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, DISEÑOS DE COMPARACIONES PAREADAS 49
tivo de las {3¡ de los ejemplares de prueba se cancela cuando las observaciones están pareadas de esta ma
nera.
Probar H0:µ1 = µ2 es equivalente a probar
Ho:µd =O
Hi:µd -:;t:. O
El estadístico de prueba para esta hipótesis es
(241)
donde
1 n
d=-¿d. (242)
n ¡1 '
es la media muestral de las diferencias y
t (d¡ J)2]1/2 [}: d:-~(t d¡l2]1/2

sd = [
J1 ¡•1 1=1 (243)
n1 = n1
es la desviación estándar muestral de las diferencias. H0: µd = O se rechazaría si l t01 > tan, n _ 1. Debido a
que las observaciones de los niveles del factor están "pareadas" en cada unidad experimental, a este pro
cedimiento suele llamársele prueba t pareada.
Por los datos de la tabla 25, se encuentra
d¡:::76=1 d6=32=1
d2 = 33= o d7=24=2
d3=35=2 d8 = 99= O
d4=43=1 d9=54=1
d5 = 88=0 d10 =45=1
Por lo tanto,

d =
n
1
::¿ d¡ = (1)=0.10
n
i=l
1
10
sd = [t
1=1
df--nl (t -, )
n1
¡=1
2]112
_

[13 fcr (1 )
101
2 ]l/l _
1.20
Suponga que se elige a = 0.05. Entonces, para tomar una decisión se calcularía t0 y H0 se rechazaría si 1t 1
0
> lo.025, 9 = 2.262.

El valor calculado del estadístico de prueba t pareada es
d
t =---==
º sd¡Jn
0.10
- t.201JW
=0.26
1::1
~ 0.3
:iS
11
g_
~0.2
..
,,
,,
~ 0.1
o
4 2 o 2 4 6
to
Figura 213 La distribución de referencia (t con 9 grados de libertad)
para el problema de la prueba de la dureza.
y como 1t01 = 0.2~ '? t0_025• 9 = 2.262, la hipótesis H0:µd = O no puede rechazarse. Es decir, no hay evidencia
que indique que las dos puntas producen lecturas de la dureza diferentes. En la figura 213 se muestra la
distribución de t0 con 9 grados de libertad, la distribución de referencia para esta prueba, con el valor de t0
indicado en relación con la región crítica.
En la tabla 26 se muestra la salida de computadora del procedimiento para la prueba t pareada de
Minitab para este problema. Observe que el valor P para esta prueba es P = 0.80, lo cual implica que no
puede rechazarse la hipótesis nula con ningún nivel de significación razonable.
z ..5.2 Ventajas del diseño de comparaciones pareadas

Al diseño que se utilizó en realidad para este experimento se le llama diseño de comparaciones pareadas,
el cual ilustra el principio de la formación de bloques comentado en la sección 13. De hecho, es un caso
especial de un tipo de diseño más general llamado diseño de bloques aleatorizados. El término bloque se
refiere a una unidad experimental relativamente homogénea (en el caso tratado aquí, los ejemplares
de prueba del metal son los bloques), y el bloque representa una restricción sobre la aleatorización com
pleta debido a que las combinaciones de los tratamientos sólo se aleatorizan dentro del bloque. En el ca
pítulo 4 se examina este tipo de diseños. En dicho capítulo el modelo matemático del diseño, la ecuación
239, se escribe en una forma ligeramente diferente.
Tabla 2-6 Resultados de Minitab de la prueba t pareada para el ejemplo de la prueba de la dureza
Prueba t pareada e intervalo de confianza
Paired T for Tip 1 - Tip 2
N Mean StDev SE Mean
Tip 1 10 4.800 2.394 0.757
Tip 2 10 4.900 2.234 0.706
Difference 10 o .100 1.197 0.379
95% CI for mean difference: C-0.956, 0.756)
t-Test of mean difference =O Cvs not = 0):
T-Value = -0.26 P-Value = 0.798
2·6 INFERENCIAS ACERCA DE LAS VARIANZAS DE DISTRIBUCIONES NORMALES 51
Antes de dejar este experimento, es necesario destacar varios puntos. Observe que, aun cuando se
han hecho 2n = 2(10) = 20 observaciones, se cuenta únicamente con n - 1 = 9 grados de libertad para el
estadístico t. (Se sabe que conforme se incrementan los grados de libertad para t, la prueba se hace más
sensible.) Al hacer la formación de bloques o pareo, se han "perdido" en realidad n 1 grados de libertad,
pero se espera haber ganado un mejor conocimiento de la situación al eliminar una fuente adicional de
variabilidad (la diferencia entre los ejemplares de prueba). Puede obtenerse una indicación de la calidad
de la información producida por el diseño pareado comparando la desviación estándar Sd de las diferen
cias con la desviación estándar combinada SP que habría resultado si el experimento se hubiera conducido
de manera completamente aleatorizada y se hubieran obtenido los datos de la tabla 25. Al utilizar los da
tos de la tabla 25 como dos muestras independientes, la desviación estándar combinada que se calcula
=
con la ecuación 225 es SP 2.32. Al comparar este valor con Sd = 1.20, se observa que la formación de
bloques o pareo ha reducido la estimación de la variabilidad en cerca de 50%. Esta información también
puede expresarse en términos de un intervalo de confianza paraµ1µ2• Utilizando los datos pareados, un
intervalo de confianza de 95% para µ1 µ2 es
d ±to.ozs.9Sd 1 .Jñ
0.10±(2.262)(1.20)/ .JIO
0.10±0.86
Recíprocamente, al utilizar el análisis combinado o independiente, un intervalo de confianza de 95%

para µ1 µ2 es
4.804.90±(2101)(232)~rli+rli
0.10±2.18
El intervalo de confianza basado en el análisis pareado tiene una anchura sensiblemente menor que el in
tervalo de confianza del análisis independiente. Esto ilustra la propiedad de reducción del ruido de la for
mación de bloques.
La formación de bloques no es siempre la mejor estrategia de diseño. Si la variabilidad dentro de los
-y
bloques es la misma que la variabilidad entre los bloques, la varianza de y1 2 será la misma independien
temente del diseño que se use. De hecho, la formación de bloques en esta situación sería una elección de
diseño pobre porque la formación de bloques produce la pérdida de n - 1 grados de libertad y llevará en
realidad a un intervalo de confianza con una anchura mayor paran¡ µ2• En el capítulo 4 se ofrece una re
visión más amplia de la formación de bloques.
26 INFERENCIAS ACERCA DE LAS VARIANZAS

DE DISTRIBUCIONES NORMALES
En muchos experimentos, el interés se encuentra en las posibles diferencias en la respuesta media de dos
tratamientos. Sin embargo, en algunos experimentos es la comparación de la variabilidad en los datos lo
que es importante. En la industria de alimentos y bebidas, por ejemplo, es importante que la variabilidad
del equipo de llenado sea pequeña para que todos los empaques estén cerca del peso neto nominal o el
52 CAPÍlULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES
volumen del contenido neto nominal. En los laboratorios químicos, tal vez quiera compararse la variabili
dad de dos métodos de análisis. A continuación se examinan brevemente las pruebas de hipótesis y los in
tervalos de confianza para las varianzas de distribuciones normales. A diferencia de las pruebas para las
medias, los procedimientos para las pruebas de varianzas son bastante más sensibles al supuesto de nor
malidad. En el apéndice 2A de Davies [36] hay un buen análisis del supuesto de normalidad.
Suponga que quiere probarse la hipótesis de que la varianza de una población normal es igual a una
constante, por ejemplo, a~. Expresado en términos formales, quiere probarse
H0:a2=a~ (244)
H1:a2 ~a~
El estadístico de prueba para la ecuación 244 es
SS (n l)S2
= ¡;r =
2
Xo 02o
o
donde SS= .'2.:7~1 (Y¡ y)2 es la suma de cuadrados corregida de las observaciones muestrales. La distribu
ción de referencia apropiada para x ~ es la distribución jicuadrada con n 1 grados de libertad. La hipóte
. nu l ase rec h aza SI•2X o >X a/2,n_1
sis 2
oSIX·20 < Xi(a/2),n1'
2 donde z ' 2,n-t y Xi-(a/Z),n-l
on e Xai 2
son 1 os puntos porcentua
les a/2 superior y 1 (a/2) inferior de la distribución jicuadrada con n -· 1 grados de libertad,
respectivamente. En la tabla 27 se presentan las regiones críticas para las hipótesis alternativas de una
cola. El intervalo de confianza de 100(1 a) por ciento para a2 es
(nl)S2 (nl)S2
2 s a2 <2~ (246)
x a/2,n1 X 1(a/2),nl
Considere ahora la prueba de la igualdad de las varianzas de dos poblaciones normales. Si se toman
muestras aleatorias independientes de tamaño n1 y n2 de las poblaciones 1 y 2, respectivamente, el estadís
tico de prueba para
H0 :a¡ =a; (247)

H1:a¡;.i:ai
es el cociente de las varianzas muestrales
(2A8)
La distribución de referencia apropiada para F, es la distribuciónF con a¡ 1 grados de libertad en el nu

merador y n2 l grados de libertad en el denominador. La hipótesis nula se rechazaría si F0 > Fan,.,1,,. 1 2_
o si F0 < Fi(a/2),n, l,n,l .donde Fª12,n, i,n,I y Fi-(a/2),n, l,n,l denotan los puntos porcentuales a/2 superior
y 1 (a/2) inferior de la distribución F con n1 - 1 y n2 - 1 grados de libertad. En la tabla IV del apéndice
sólo aparecen los puntos porcentuales para la cola superior de F; sin embargo, los puntos de las colas su
perior e inferior se relacionan por
(249)
26 INFERENCIAS ACERCA DE LAS VARIANZAS DE DISTRIBUCIONES NORMALES 53
Tabla 2· 7 Pruebas para las varianzas de distribuciones normales
Hipótesis Estadísticode prueba Criteriosde rechazo
H0:a2 =a~ X~ > x!12.n-1 o
H1:a2 ~a~ X~ < x:-,,12.n-1
Ho:a2 =a6 (nl)S2
H1:a2 <a~ a6 X~< xLa,n-1
Ho:a2 =a6
X~> X!.n-1
H1:a2 >a~
H0:a¡ =a~ Fa > F;,12,,.,1,,.,1 o
H1:af ~a; Fo < Fia/2.n l.n l
1 2
H0 :a; =ai Fa> F,,,.,1,.,1

H1:ai <a~
H0:ai =a~
H1:ai >a~
En el capítulo 3, sección 34.3, se analizan los procedimientos de prueba para más de dos varianzas. Se re
visará también el uso de la varianza o la desviación estándar como variable de respuesta en situaciones ex
perimentales más generales.
'EJE~LO2.,,2 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Un ingeniero químico investiga la variabilidad inherente de dos tipos de equipo de prueba que pueden
usarse para monitorear la producción de un proceso. El ingeniero sospecha que el equipo antiguo, tipo 1,
tiene una varianza mayor que la del equipo nuevo. Por lo tanto, quiere probar las hipótesis
Ho.·021 = 022
H1:a¡ >a~
Se toman dos muestras aleatorias de n1 = 12 y n2 = 10 observaciones, y las varianzas muestrales son s; =
14.5 y s; =
10.8. El estadístico de prueba es
F. = = 14.5 = 1.34
s;
s12
0
10.8
En la tabla IV del apéndice se encuentra que Fo.os, 11• 9 = 3.10, por lo que no puede rechazarse la hipótesis
nula. Es decir, se ha encontrado evidencia estadística insuficiente para concluir que la varianza del equipo
antiguo sea mayor que la varianza del equipo nuevo.
El intervalo de confianza de 100(1 a) por ciento para el cociente de las varianzas poblacionales
a;/ a; es
si 02 52
_1_F. <1 <1F
2 lati,n2l,n1 1 2 """si a/2,n1l,111l
(250)
Si a2 2
Para ilustrar el uso de la ecuación 250, el intervalo de confianza de 95% para el cociente de las varianzas
del ejemplo 22 es, utilizando F0025, 9,11 = 3.59 y F0.975,9,11 = 1/F0.025,u,9 = 1/3.92 = 0.255,
CJ¡ / CJ~
14.5 (0.255) S a~ s 14.5 (3.59)
10.8 ª2 10.8
0.34
ª2 :s; 4.81
:s;+
ª2
27 PROBLEMAS
21. Se requiere que la resistencia a la ruptura de una fibra sea de por lo menos 150 psi. La experiencia pasada in
dica que la desviación estándar de la resistencia a la ruptura es a = 3 psi. Se prueba una muestra aleatoria de
cuatro ejemplares de prueba, y los resultados son y1 = 14S, y2 = 1S3, y3 = lSO y y4 = 147.
a) Enunciar las hipótesis que el lector considere que deberían probarse en este experimento.
b) Probar estas hipótesis utilizando a = O.OS. ¿A qué conclusiones se llega?
e) Encontrar el valor P para la prueba del inciso b,
d) Construir un intervalo de confianza de 95% para la resistencia a la ruptura promedio.
22~ Supuestamente, la viscosidad de un detergente líquido debe promediar 800 centistokes a 25ºC. Se colecta
una muestra aleatoria de 16 lotes del detergente, y la viscosidad promedio es 812. Suponga que se sabe que la
desviación estándar de la viscosidad es a = 2S centistokes.
a) Enunciar las hipótesis que deberán probarse.
e) ¿Cuál es el valor P para la prueba?
d) Encontrar un intervalo de confianza de 9S% para la media.
23. Los diámetros de las flechas de acero producidas en cierto proceso de manufactura deberán tener un prome
dio de 0.2SS pulgadas. Se sabe que el diámetro tiene una desviación estándar de a = 0.0001 pulgadas. Una
muestra aleatoria de 10 flechas tiene un diámetro promedio de 0.2S4S pulgadas.
a) Establecer las hipótesis apropiadas para la mediaµ.
e) Encontrar el valor P para esta prueba.
d) Construir un intervalo de confianza de 95% para el diámetro promedio de las flechas.
24. Una variable aleatoria con una distribución normal tiene una media desconocidaµ y varianza a2 = 9. Encon
trar el tamaño de la muestra que se necesita para construir un intervalo de confianza de 9S% para la media,
cuya anchura total sea de 1.0.
2S. La vida de anaquel de una bebida carbonatada es motivo de interés. Se seleccionan 10 botellas al azar y se
prueban, obteniéndose los siguientes resultados:
Días
108 138
124 163
124 159
106 134
115 139
a) Quiere demostrarse que la vida media de anaquel excede los 120 días. Establecer las hipótesis apropia
das para investigar esta afirmación.
b) Probar estas hipótesis utilizando a = 0.01. ¿A qué conclusiones se llega?
Z7 PROBLEMAS 55
e) Encontrar el valor P para la prueba del inciso b.
d) Construir un intervalo de confianza de 99% para la vida media de anaquel.
26. Considere los datos de la vida de anaquel del problema 25, ¿La vida de anaquel puede describirse o mode
larse adecuadamente con una distribución normal? ¿Qué efecto tendría la violación de este supuesto sobre
el procedimiento de prueba usado para resolver el problema 25?
27. El tiempo para reparar un instrumento electrónico es una variable aleatoria medida en horas que sigue una
distribuciónnormal. El tiempo de reparación de 16 de estos instrumentos elegidosal azar es el siguiente:
Horas
159 280 101 212
224 379 179 264
222 362 168 250
149 260 485 170
a) Quiere saberse si el tiempo de reparación promedio excede 225 horas. Establecer las hipótesis apropia
das para investigar esta cuestión.
b) Probar las hipótesis que se formularon en el incisoa. ¿A qué conclusionesse llega? Utilizar a = 0.05.
e) Encontrar el valor P para la prueba.
d) Construir un intervalo de confianza de 95% para el tiempo de reparación promedio.
28. Considere nuevamente los datos del tiempo de reparación del problema 2 7. En opinión del lector, ¿el tiem
po de reparación puede modelarse de manera adecuada con una distribución normal?
29. Se utilizan dos máquinas para llenar botellas de plástico con un volumen neto de 16.0 onzas. Puede suponer
se que el proceso de llenado es normal, con desviacionesestándar de a1 = 0.015y a2 = 0.018. El departamen
to de ingeniería de calidad sospecha que ambas máquinas llenan el mismovolumen neto, sin importar si este
volumen es 16.0onzas o no. Se realiza un experimento tomando una muestra aleatoria de la producción de
cada máquina.
Máquina 1 Máquina2
16.03 16.01 16.02 16.03
16.04 15.96 15.97 16.04
16.05 15.98 15.96 16.02
16.05 16.02 16.01 16.01
16.02 15.99 15.99 16.00
a) Enunciar las hipótesis que deberán probarse en este experimento.

b) Probar estas hipótesis utilizando a = 0.05. ¿A qué conclusiones se llega?
e) Encontrar el valor P para esta prueba.
d) Encontrar un intervalo de confianza de 95% para la diferencia en el volumen de llenado promedio de las
dos máquinas.
210. Un fabricante de calculadoras electrónicas puede usar dos tipos de plástico. La resistencia a la ruptura de
este plástico es importante. Se sabe que o¡ = a2 = 1.0psi. Demuestras aleatorias den1=10yn2 = 12seobtie
ne y1 = 162.5 y y2 = 155.0. La compañía no empleará el plástico 1 a menos que su resistencia a la ruptura ex
ceda la del plástico 2 por al menos 10 psi. Con base en la información muestral, Zdeberá usarse el plástico 1?
Para responder esta pregunta se deben establecer y probar las hipótesis apropiadas utilizando a = 0.01.
Construir un intervalo de confianza de 99% para la verdadera diferencia media en la resistencia a la ruptura.
211. A continuación se presenta el tiempo de combustión de dos cohetes químicoscon formulacionesdiferentes.

Los ingenieros de diseño se interesan tanto en la media como en la varianza del tiempo de combustión.
Tipo 1 Tipo2
6S 82 64 S6
81 67 71 69
S7 59 83 74
66 7S 59 82
82 70 6S 79
a) Probar la hipótesis de que las dos varianzas son iguales. Utilizar a = 0.05.
b) Utilizando los resultados del inciso a, probar la hipótesis de que los tiempos de combustión promedio
son iguales. Utilizar a = O.OS. lCuál es el valor P para esta prueba?
e) Comentar el papel del supuesto de normalidad en este problema. Verificar el supuesto de normalidad
para ambos tipos de cohetes.
212. En un artículo de Solid State Technology, "Diseño ortogonal para optimizaciónde procesos y su aplicaciónen
el grabado químico con plasma" de G.Z. Yin y D.W. Jillie, se describe un experimento para determinar el
efecto de la velocidad del flujo de C2F6 sobre la uniformidad del grabado en una oblea de siliciousada en la
fabricación de circuitos integrados. Los datos de la velocidad del flujo son los siguientes:
Observaciónde la uniformidad
Flujo de
CiF6 1 2 3 4 s 6
12S 2.7 4.6 2.6 3.0 3.2 3.8
200 4.6 3.4 2.9 3.5 4.1 S.1
a) lLa velocidad del flujo de C2F6 afecta la uniformidad del grabado promedio? Utilizar a = O.OS.
b) lCuál es el valor P para la prueba del inciso a?
e) lLa velocidad del flujo de CiF6 afecta la variabilidad de una oblea a otra en la uniformidad del grabado?
Utilizar a = 0.05.
d) Trazar diagramas de caja que ayuden a interpretar los datos de este experimento.
213. Se instala un nuevo dispositivode filtrado en una unidad química. Antes de instalarlo, de una muestra alea
toria se obtuvo la siguiente información sobre el porcentaje de impurezas: y1 = 12.5, s¡ = 101.17y n1 = 8.
Después de instalarlo, de una muestra aleatoria se obtuvo y2 = 10.2, Si = 94.73, n2 = 9.
a) lPuede concluirse que las dos varianzas son iguales? Utilizar a = 0.05.
b) lEl dispositivode filtrado ha reducido de manera significativael porcentaje de impurezas? Utilizar a =
0.05.
214. Se hacen 20 observaciones de la uniformidad del grabado en obleas de siliciodurante un experimento de eva
luación de un grabador de plasma. Los datos son los siguientes:
5.34 6.6S 4.76 5.98 7.25

6.00 7.5S 5.54 S.62 6.21
5.97 7.3S S.44 4.39 4.98
s.zs 6.35 4.61 6.00 5.32
a) Construir una estimación con un intervalo de confianza de 95% de a2•

b) Probar la hipótesis de que a2 = 1.0. Utilizar a = 0.05. lA qué conclusiones se llega?
2 7 PROBLEMAS 57
e) Comentar el supuesto de normalidad y su papel en este problema.

d) Verificar la normalidad construyendo una gráfica de probabilidad normal. lA qué conclusiones se
llega?
215. Doce inspectores midieron el diámetro de un cojinete de bolas, utilizando cada uno dos tipos diferentes de
calibradores. Los resultados fueron
Inspector Calibrador 1 Calibrador 2

1 0.265 0.264
2 0.265 0.265
3 0.266 0.264
4 0.267 0.266
5 0.267 0.267
6 0.265 0.268
7 0.267 0.264
8 0.267 0.265
9 0.265 0.265
10 0.268 0.267
11 0.268 0.268
12 0.265 0.269
a) lExiste una diferencia significativa entre las medias de la población de mediciones de las que se seleccío
naron las dos muestras? Utilizar a = 0.05.
b) Encontrar el valor P para la prueba del inciso a.
e) Construir un intervalo de confianza de 95 % para la diferencia en las mediciones de los diámetros prome
dio para los dos tipos de calibradores.
216. En un artículo deloumal of Strain Analysis (vol. 18, no. 2) se comparan varios procedimientos para predecir
la resistencia al corte de vigas de placas de acero. Los datos para nueve vigas en la forma del cociente de la
carga predicha y la observada para dos de estos procedimientos, los métodos Karlsruhe y Lehigh, son los si·
guientes
Viga Método Karlsruhe Método Lehígh

Sl/l 1.186 1.061
S2/1 1.151 0.992
S3/l 1.322 1.063
S4/l 1.339 1.062
S5/1 1.200 1.065
S2/l 1.402 1.178
S2/2 1.365 1.037
S2/3 1.537 1.086
S2/4 1.559 1.052
a) ¿Existe alguna evidencia que apoye la afirmación de que hay una diferencia en el desempeño promedio
entre los dos métodos? Utilizar a = 0.05.
b) lCuál es el valor P para la prueba del inciso a?
e) Construir un intervalo de confianza de 95 % para la diferencia en la carga promedio predicha y la obser
vada.
d) Investigar el supuesto de normalidad en ambas muestras.
e) Investigar el supuesto de normalidad para la diferencia en los cocientes para los dos métodos.
f) Comentar el papel del supuesto de normalidad en la prueba t pareada.
217. Se estudia la temperatura de deflexión bajo carga de dos formulaciones diferentes de un tubo de plástico
ABS. Dos muestras de 12 observaciones cada una, se preparan utilizando cada formulación y las temperatu
ras de deflexión (en ºF) se presentan abajo:
Formulación 1 Formulación 2
206 193 192 177 176 198
188 207 210 197 185 188
205 185 194 206 200 189
187 189 178 201 197 203
a) Construir las gráficas de probabilidad normal para ambas muestras. lEstas gráficas apoyan los supuestos
de normalidad y de la igualdad de la varianza de ambas muestras?
b) lLos datos apoyan la afirmación de que la temperatura promedio de deflexión bajo carga de la formula
ción 1 excede la de la formulación 2? Utilizar a = 0.05.
e) lCuál es el valor P para la prueba del inciso a?
218. Referirse a los datos del problema 217. lLos datos apoyan la afirmación de que la temperatura promedio de
deflexión bajo carga de la formulación 1 excede la de la formulación 2 en al menos 3ºF?
219. En la fabricación de semiconductores es común el uso del grabado químico húmedo para eliminar el silicio
de la parte posterior de las obleas antes de la metalización. La rapidez del grabado es una característica im
portante de este proceso. Se están evaluando dos soluciones de grabado diferentes. Se grabaron ocho obleas
seleccionadas al azar en cada solución, y las cifras de la rapidez del grabado observada (en milésimas de pul
gada/min) se muestran abajo
Solución 1 Solución 2
9.9 10.6 10.2 10.6
9.4 10.3 10.0 10.2
10.0 9.3 10.7 10.4
10.3 9.8 10.5 10.3
a) lLos datos indican que la afirmación de que ambas soluciones tienen la misma rapidez de grabado pro
medio es verdadera? Utilizar a = 0.05 y suponer la igualdad de las varianzas.
b) Encontrar un intervalo de confianza de 95% para la diferencia en la rapidez de grabado promedio.
e) Usar gráficas de probabilidad normal para investigar la adecuación de los supuestos de normalidad e
igualdad de las varianzas.
220. Se están comparando dos populares analgésicos con base en la rapidez de absorción del cuerpo. Específica
a¡ a;
mente, se afirma que la tableta 1 se absorbe con el doble de rapidez que la tableta 2. Suponer que y se
conocen. Desarrollar un estadístico de prueba para
Ho:2µ1 =µ2
H1:2~ ~µ2
221. Suponga que se está probando
Ho:µ1 =µ2
H1:µ1 ~µ2
donde a~ y a; se conocen. Los recursos para hacer el muestreo son limitados, por lo que n1 + n2 = N. lCómo
deberán asignarse las N observaciones entre las dos poblaciones para obtener la prueba con la potencia más
alta?
222. Desarrollar la ecuación 246 para un intervalo de confianza de 100(1a) por ciento para la varianza de una
distribución normal.
27 PROBLEMAS 59
223. Desarrollar la ecuación 250 para un intervalo de confianza de 100(1a) por ciento para el cociente a;/ a;,
donde ai y a~ son las varianzas de dos distribuciones normales.
224. Desarrollar una ecuación para encontrar un intervalo de confianza de 100(1a) por ciento para la diferen
a; a~.
cia en las medias de dos distribuciones normales donde ;* Aplicar la ecuación desarrollada a los datos
del experimento del cemento portland, y encontrar un intervalo de confianza de 95%.
225. Construir un conjunto de datos para los que el estadístico de prueba t pareada sea muy grande, pero para el
cual el estadístico de prueba t de dos muestras o combinadausual sea pequefio. En general, describir cómo se
crearon los datos. lLe da esto al lector alguna idea respecto de cómo funciona la prueba t pareada?
Experimentos con un solo
factor: el análisis de varianza
En el capítulo 2 se analizaron los métodos para comparar dos condiciones o tratamientos. Por ejemplo, el
experimento de la fuerza de la tensión de adhesión del cemento portland incluyó dos formulaciones dife
rentes del mortero. Otra forma de describir este experimento es como un experimento con un solo factor,
con dos niveles del factor, donde el factor es la formulación del mortero y los dos niveles son los dos méto
dos diferentes para hacer la formulación. Muchos experimentos de este tipo involucran más de dos nive
les del factor. En este capítulo se presentan los métodos para el diseño y el análisis de los experimentos
con un solo factor con a niveles del mismo (o a tratamientos). Se supondrá que el experimento se ha alea
torizado completamente.
3 .. 1 UN EJEMPLO
Un ingeniero de desarrollo de productos tiene interés en investigar la resistencia a la tensión de una fibra
sintética nueva que se usará para hacer tela de camisas para caballero. El ingeniero sabe por experiencia
previa que la resistencia a la tensión se afecta por el peso porcentual del algodón utilizado en la mezcla de
materiales de la fibra. Además, sospecha que al aumentar el contenido de algodón se incrementará la re
sistencia, al menos en un principio. Sabe asimismo que el contenido de algodón deberá variar entre 10 y
40 por ciento para que el producto final tenga otras características de calidad que se desean (como la
capacidad de ser sometido a un tratamiento de planchado permanente). El ingeniero decide probar ejem
plares en cinco niveles del peso porcentual del algodón: 15, 20, 25, 30 y 35 por ciento. 'Iambién decide pro
bar cinco ejemplares en cada nivel del contenido de algodón.
=
Se trata de un ejemplo de un experimento con un solo factor con a 5 niveles del factor y n = 5 répli-
cas. Las 25 corridas deberán realizarse de manera aleatoria. Para ilustrar cómo puede aleatorizarse el or
den de las corridas, suponga que las corridas se numeran de la siguiente manera:
60
31 UN EJEMPLO 61
Peso
porcentual
del algodón Número de corrida experimental
15 1 2 3 4 5
20 6 7 8 9 10
25 11 12 13 14 15
30 16 17 18 19 20
35 21 22 23 24 25
Ahora se selecciona un número aleatorio entre 1y25. Suponga que este número es 8. Entonces la obser
vación número 8 (20% de algodón) se corre primero. Este proceso se repetiría hasta que las 25 observa
ciones tengan asignada una posición en la secuencia de prueba.1 Muchos paquetes de software de
computadora para ayudar a los experimentadores a seleccionar y construir un diseño, aleatorízan el or'
den de las corridas utilizando números aleatorios de esta manera.
Suponga que la secuencia de prueba obtenida es
Secuencia de prueba Número de corrida Peso porcentual del algodón

1 8 20
2 18 30
3 10 20
4 23 35
5 17 30
6 5 15
7 14 25
8 6 20
9 15 25
10 20 30
11 9 20
12 4 15
13 12 25
14 7 20
15 1 15
16 24 35
17 21 35
18 11 25
19 2 15
20 13 25
21 22 35
22 16 30
23 25 35
24 19 30
25 3 15
Esta secuencia de prueba aleatorizada es necesaria para evitar que los efectos de variables perturbadoras
desconocidaslas cuales quizá varíen fuera de control durante el experimentocontaminen los resulta
dos. Para ilustrar esto, suponga que las 25 corridas de prueba tuvieran que realizarse en el orden original
no aleatorizado (es decir, primero se prueban los cinco ejemplares con 15% de algodón, después se prue
1 La única restricción sobre la aleatorizacíón en este caso, es que si se saca de nuevo el mismo número (es decir, 8), se descarta. Se tra
ta de una restricción secundaria y se ignora.

62 CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA
Tabla 3-1 Datos (en lb/pulgada') del experimento de la resistencia a la tensión

Peso porcentual Observaciones
del algodón 1 2 3 4 5 Total Promedio
15 7 7 15 11 9 49 9.8
20 12 17 12 18 18 77 15.4
25 14 18 18 19 19 88 17.6
30 19 25 22 19 23 108 21.6
35 7 10 11 15 11 54 10.8

376 15.04
ban los cinco ejemplares con 20% de algodón, etc.), Si la máquina empleada para probar la resistencia a la
tensión presenta un efecto de calentamiento tal que entre más tiempo esté funcionando sean menores las
lecturas de la resistencia a la tensión observadas, el efecto del calentamiento contaminará potencialmen
te los datos de la resistencia a la tensión y destruirá la validez del experimento.
Suponga que el ingeniero corre la prueba en el orden aleatorio que se ha determinado. En la tabla 31
se muestran las observaciones que obtiene para la resistencia a la tensión.
Siempre es una buena idea examinar gráficamente los datos experimentales. En la figura 31 se mues
tran los diagramas de caja para la resistencia a la tensión con cada nivel del peso porcentual de algodón, y
en la figura 32 se ilustra un diagrama de dispersión de la resistencia a la tensión contra el peso porcen
tual del algodón. En la figura 32, los puntos rellenos son las observaciones individuales y los círculos hue
cos son los promedios de la resistencia a la tensión observada. Ambas gráficas indican que la resistencia a
la tensión se incrementa cuando el contenido de algodón se incrementa, hasta cerca de 30% de algodón.
Después de 30% de algodón, hay un marcado descenso de la resistencia a la tensión. No hay evidencia só
lida que sugiera que la variabilidad de la resistencia a la tensión alrededor del promedio dependa del peso
porcentual del algodón. Con base en este análisis gráfico simple, se tienen firmes sospechas de que 1) el
contenido de algodón afecta la resistencia a la tensión y 2) alrededor de 30% de algodón produce la resis
tencia máxima.
Suponga que se quiere ser más objetivo en el análisis de los datos. Específicamente, imagine que
quieren probarse las diferencias entre las resistencias a la tensión promedio con todos los niveles a = 5 del
30
e: 20
:2
!
s
.!!!
.,
'"
·¡:;
~ 10
.i
.,
"'
a:
0'-----,·5----~20----~25 3L0----3·5----'40
Peso porcentual del algodón
Figura 31 Diagramas de caja <le la resistencia a la tensión

contra el peso porcentual del algodón.
3·2 ELANÁUSISDEVARIANZA 63
30
•
'&
3
••
o
~ 20
••• ••
•o•
••
·~"
e
! • o
• •
s
.. o•
•• V
·~ 10
•
.i111 •• •
a:
o 15 20 25 30 35
Peso oorcentual del aloodón
Figura3·2 Diagrama de dispersión de la resistencia

a la tensión contra el peso porcentual del algodón.
peso porcentual del algodón. Por lo tanto, el interés se centra en probar la igualdad de las cinco medias. Pu
diera parecer que este problema se resolvería realizando una prueba t para todos los pares de medias
posibles. Sin embargo, no es ésta la mejor solución de este problema, porque llevaría a una distorsión con
siderable en el error tipo l. Por ejemplo, suponga que quiere probarse la igualdad de las cinco medias
usando comparaciones por pares. Hay 10 pares posibles, y si la probabilidad de aceptar correctamente la
hipótesis nula en cada prueba individual es de 1 a = 0.95, la probabilidad de aceptar correctamente la
º
hipótesis nula en las 10 pruebas es de (0.95)1 = 0.60 si las pruebas son independientes. Por lo tanto, ha
ocurrido un incremento sustancial en el error tipo l.
El procedimiento correcto para probar la igualdad de varias medias es el análisis de varianza. Sin
embargo, el análisis de varianza tiene un rango de aplicaciones mucho más amplio que el problema ante
rior. Probablemente sea la técnica más útil en el campo de la inferencia estadística.
3 .. 2 EL ANÁLISIS DE VARIANZA
Suponga que se tienen a tratamientos o niveles diferentes de un solo factor que quieren compararse. La
respuesta observada de cada uno de los a tratamientos es una variable aleatoria. Los datos aparecerían
como en la tabla 32. Una entrada de la tabla 32 (por ejemplo,y;1) representa la observaciónjésima to
Tubla 3·2 Datos típicos de un experimento de un solo factor

Tratamiento
(nivel) Observaciones Tutales Promedios
1 fu fu ~ h ~.
2 k fu h h h
a Y.1 Y.2 y ...

Y.. Y.
mada bajo el nivel del factor o tratamiento i. Habrá, en general, n observaciones bajo el tratamiento iési
mo. Observe que la tabla 32 es el caso general de los datos del experimento de la resistencia a la tensión
de la tabla 31.
Modelos para los datos

Se encontrará útil describir las observaciones de un experimento con un modelo. Una manera de escribir
este modelo es
i=l, 2, ... , a
s.=r.r»,
.
{ ¡'=1 ' 2, ... , n (31)
donde Y;j es la observación ijésima,µ; es la media del nivel del factor o tratamiento iésimo, y E;j es un com
ponente del error aleatorio que incorpora todas las demás fuentes de variabilidad del experimento, inclu
yendo las mediciones, la variabilidad que surge de factores no controlados, las diferencias entre las
unidades experimentales (como los materiales de prueba, etc.) a las que se aplican los tratamientos, y el
ruido de fondo general en el proceso (ya sean la variabilidad con el tiempo, los efectos de variables am
bientales, etc.). Es conveniente considerar que los errores tienen media cero, de tal modo que E(y;j) = µ¡.
A la ecuación 31 se le llama el modelo de las medias. Una forma alternativa de escribir un modelo de
los datos es definiendo
i = 1, 2, ... , a
de tal modo que la ecuación 31 se convierte en
i =l, 2, ... , a
Y;;=µ+r;+e,1{ ._ (32)
J1, 2, ... , n
En esta forma del modelo,µ es un parámetro común a todos los tratamientos al que se llama la media glo
bal, y "C; es un parámetro único del tratamiento íésimo al que se le llama el efecto del tratamiento iésimo.
A la ecuación 32 se le llama por lo general el modelo de los efectos.
Tanto el modelo de las medias como el de los efectos son modelos estadísticos lineales; es decir, la va
riable de respuesta Yij es una función lineal de los parámetros del modelo. Aun cuando ambas formas del
modelo son útiles, el modelo de los efectos se encuentra con mayor frecuencia en la literatura del diseño
experimental. Tiene cierto atractivo intuitivo por cuantoµ es una constante y los efectos de los tratamien
tos t, representan desviaciones de esta constante cuando se aplican los tratamientos específicos.
A la ecuación 32 (o a la 31) se le llama también el modelo del análisis de varianza simple o de un
solo factor (o dirección), porque únicamente se investiga un factor. Además, será un requisito que el ex
perimento se lleve a cabo en orden aleatorio para que el ambiente en el que se apliquen los tratamientos
(llamados con frecuencia unidades experimentales) sea lo más uniforme posible. Por lo tanto, el diseño
experimental es un diseño completamente aleatorizado. Los objetivos serán probar las hipótesis apropia
das acerca de las medias de los tratamientos y estimarlas. Para probar las hipótesis, se supone que los
errores del modelo son variables aleatorias que siguen una distribución normal e independiente con me
dia cero y varianza a2. Se supone asimismo que la varianzaa2 es constante para todos los niveles del factor.
Esto implica que las observaciones
Y;; -N(µ+-r;o a2)

y que las observaciones son mutuamente independientes.
33 ANÁLISIS DEL MODEW CON EFECTOS FIJOS 65
lFactor fijo o aleatorio?
El modelo estadístico (ecuación 32) describe dos situaciones diferentes con respecto a los efectos de los
tratamientos. Primera, los a tratamientos pudieron ser elegidos expresamente por el experimentador. En
esta situación quieren probarse hipótesis acerca de las medias de los tratamientos, y las conclusiones se
aplicarán únicamente a los niveles del factor considerados en el análisis. Las conclusiones no pueden ex
tenderse a tratamientos similares que no fueron considerados explícitamente. También se podría querer
estimar los parámetros del modelo (µ, r1, cr). A éste se le llama el modelo con efectos fijos. De manera al
ternativa, los a tratamientos podrían ser una muestra aleatoria de una población más grande de trata
mientos. En esta situación sería deseable poder extender las conclusiones (las cuales se basan en la
muestra de los tratamientos) a la totalidad de los tratamientos de la población, sea que se hayan conside
rado explícitamente en el análisis o no. Aquí las r1 son variables aleatorias, y el conocimiento de las r¡ par
ticulares que se investigaron es relativamente inútil. Más bien, se prueban hipótesis acerca de la
variabilidad de las t, y se intenta estimar su variabilidad. A éste se le llama el modelo con efectos aleatorios
o modelo de los componentes de la varianza. La revisión de experimentos con factores aleatorios se pos
pondrá hasta el capitulo 12.
3 .. 3 ANÁLISIS DEL MODELO CON EFECTOS FIJOS
En esta sección se desarrolla el análisis de varianza de un solo factor para el modelo con efectos fijos. Re
cuerde que Yi. representa el total de las observaciones bajo el tratamiento iésimo. Sea que Yi. represente el
promedio de las observaciones bajo el tratamiento íésimo. De manera similar, sea que Y.. represente el
Y.
gran total de todas las observaciones y que represente el gran promedio de todas las observaciones.
Expresado simbólicamente,
Y·=~
r, ,¿,,, y.9, i = 1, 2, ... , a
j;l
(33)
y__ = !Í
/;l j;l
Y¡¡ Y. = Y.. IN
=
donde N an es el número totall de observaciones. Se nota que el subíndice "punto" implica la operación
suma sobre el subíndice que reemplaza.
El interés se encuentra en probar la igualdad de las a medias de los tratamientos; es decir, E(y,1) µ + =
r1 = µ1, i = 1, 2, ... , a. Las hipótesis apropiadas son
Ho:µ1 =µ2 = ... =µ.
H1: µ 1 ~ µ ¡ para al menos un par ( i, j)
En el modelo de los efectos, la median, del tratamiento íésimo se descompone en dos componentes tales
que µ¡ = µ + t; Por lo general, µ se considera como una media global, de tal modo que
!µ,
i•l
--=µ
a
Esta definición implica que
Es decir, los efectos del tratamiento o factor pueden considerarse como desviaciones de la media global.2
Por consiguiente, una forma equivalente de escribir las hipótesis anteriores es en términos de los efectos
de los tratamientos r1, por ejemplo
H¿ : 1:' =r 2= ... 1: • O =
H1: T: 1 # O para al menos una i
Por lo tanto, se habla de probar la igualdad de las medias de los tratamientos o de probar que los efectos
de los tratamientos (las r;) son cero. El procedimiento apropiado para probar la igualdad de las medias de
los a tratamientos es el análisis de varianza.
3 .. 3,1 Descomposición de la suma de cuadrados total

El nombre análisis de varianza se deriva de la partición de la variabilidad total en sus partes componen
tes. La suma de cuadrados total corregida
SST = !!
i•l j•l
(yij:Y .. )2
se usa como una medida de la variabilidad global de los datos. Intuitivamente, esto es razonable porque,
si SST tuviera que dividirse por el número apropiado de grados de libertad (en este caso, an - l = N - l ),se
obtendría la varianza muestral de las y. La varianza muestra} es, desde luego, una medida estándar de va
riabilidad.
Observe que la suma de cuadrados total corregida SST se puede escribir como
¿¿ ¿¿
a n a n
(yij:Y .. ) = 2 ru1. :Y .. )+(yij:Yi. )12 (34)
iml jml /;l j;l
(35)
oY1. _Y.. )( v, Y1. )
a n
+2~~
L.,¡~
Sin embargo, el término del producto cruzado de la ecuación 35 es cero, ya que
!
j;)
(yil-Y1.)= Y1. n:Y1. = Y1• -n(Y1• In)= O
Se tiene, por lo tanto,
~ ~ ( Y . _ Y..
L.,¡ L.,¡
9
)2 = nL.,¡
~ (-. - . )2 + e:
Y.. _ Y.. ~ L.,¡
~ ( Y,,. _ Y.r. )2
i1 j=l i~l iml j•l
La ecuación 36 establece que puede hacerse la partición de la variabilidad total de los datos, medida por
la suma de cuadrados total corregida, en una suma de cuadrados de las diferencias entre los promedios de
los tratamientos y el gran promedio, más una suma de cuadrados de las diferencias de las observaciones
dentro de los tratamientos y el promedio de los tratamientos. Entonces, la diferencia entre los promedios
2 Para más información sobre este tema, referirse al material suplementario del texto del capítulo 3.
33 ANÁLISIS DEL MODELO CON EFECTOS FIJOS 67
de los tratamientos observados y el gran promedio es una medida de las diferencias entre las medias de
los tratamientos, mientras que las diferencias de las observaciones dentro de un tratamiento y el prome
dio del tratamiento, pueden deberse únicamente al error aleatorio. Por lo tanto, la ecuación 36 puede es
cribirse simbólicamente como
SST = SS Tratamientos +SS E

donde a SSnatami•n•os se le llama la suma de cuadrados debida a los tratamientos (es decir, entre los trata
mientos), y a SSE se le llama la suma de cuadrados debida al error (es decir, dentro de los tratamientos).
Hayan = N observaciones en total; por lo tanto, SS r tiene N - 1 grados de libertad. Hay a niveles del fac
tor (y medias de a tratamientos), de donde SS'll"atamientos tiene a - 1 grados de libertad. Por último, dentro de
cualquier tratamiento hay n réplicas que proporcionan n - 1 grados de libertad con los cuales estimar el
error experimental. Puesto que hay a tratamientos, se tienen a(n 1) = an - a = N - a grados de libertad
para el error.
Es útil examinar explícitamente los dos términos del lado derecho de la identidad fundamental del
análisis de varianza (ecuación 36). Considere la suma de cuadrados del error
En esta forma es fácil ver que el término entre corchetes, si se divide por n 1, es la varianza muestra! del
tratamiento iésimo, o
sz =
_! (yij -Yi. )
_j;_1 _
2
i = 1, 2, ... , a
' n1
Ahora pueden combinarse a varianzas muestrales para obtener una sola estimación de la varianza pobla
cional común de la siguiente manera:
2
(n- l)S1 +(n- l)S2 +
2
+ (nl)S.
2 !
¡;1
[! j;1
(Y¡¡ - J; )2]
(nl)+(n1) + + (n1) =L.(nl)~
i~t
SSE
(N-a)
Por lo tanto, SSE/(N-a) es una estimación combinada de la varianza común dentro de cada uno de los a
tratamientos.
De manera similar, si no hubiera diferencias entre las medias de los a tratamientos, podría usarse la
variación de los promedios de los tratamientos y el gran promedio para estimar o'. Específicamente
SS Tratamientos
n _! (Y;. - Y.. )
iial
2
a-1 a-1
es una estimación de u2 si las medias de los tratamientos son iguales. La razón de esto puede verse de ma
nera intuitiva de la siguiente manera. La cantidad l:~;1 (Y;. -y..)1/(a 1) estima a2/n, la varianza de los pro
68 CAPÍTIJLO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA
medios de los tratamientos, de donde n.2:7;1 (Yi. y..)2/(a 1) debe estimar a2 si no hay diferencias en las
medias de los tratamientos.
Se observa que la identidad del análisis de varianza (ecuación 36) nos proporciona dos estimaciones
de a2: una basada en la variabilidad inherente dentro de los tratamientos y una basada en la variabilidad
entre los tratamientos. Si no hay diferencias en las medias de los tratamientos, estas dos estimaciones de
berán ser muy similares, y si no lo son, se sospecha que la diferencia observada puede ser causada por di
ferencias en las medias de los tratamientos. Aun cuando se ha usado un razonamiento intuitivo para
desarrollar este resultado, puede adoptarse un enfoque un tanto más formal.
A las cantidades
MS . = SSTratamiento•
Tratallllentos Q_ 1
y
SSE
MS =
E N-a
se les llama cuadrados medios. Se examinarán ahora los valores esperados de estos cuadrados medios.
Considere
Al sustituir el modelo (ecuación 31) en esta ecuación se obtiene
Entonces, al elevar al cuadrado y tomar el valor esperado de la cantidad entre corchetes, se observa que
los términos que incluyen ae~ y e;. son reemplazados pora2yna2, respectivamente, debido a queE(eif) =
O. Además, todos los productos cruzados que incluyen a e¡¡ tienen valor esperado cero. Por lo tanto, des·
pués de elevar al cuadrado y tomar el valor esperado, la última ecuación se convierte en
1 [ a a ]
E(MSE)= N-a Nµ2 +nt; r¡ +Na2 -Nµ2 -nt; -r7-aa2
o
Aplicando un enfoque similar puede demostrarse también que3
2
n~
1~1
r;
E(M.s Tratamientos ) = a +a1
Por lo tanto, como se argumentó heurístícamente.éféj, = SSE/(N-a) estimaa2y, si no hay diferencias en

las medias de los tratamientos (lo cual implica que T:¡ = O), MSnatamientos = SSTtatamienioJ(a 1) también esti
ma a2. Sin embargo, observe que si las medias de los tratamientos difieren, el valor esperado del cuadrado
medio de los tratamientos es mayor que a2.
Parece claro que es posible realizar una prueba de la hipótesis de que no hay diferencias en las medias
de los tratamientos comparando MSnatamientos y MS E· Se considera ahora cómo puede hacerse esta compa
ración.
J .. 3.2 Análisis estadístico

Se investiga ahora cómo puede llevarse a cabo una prueba formal de la hipótesis de que no hay diferen
cias en las medias de los tratamientos (H0:µ1 = µ2 =···=µ.,o de manera equivalente, H0:r1 = r2 = · ··r. =
O). Puesto que se ha supuesto que los errores e11 siguen una distribución normal e independiente con me
dia cero y varianza a2, las observaciones y1i tienen una distribución normal e independiente con mediaµ +
t, y varianza a', Por lo tanto, SSr es una suma de cuadrados de variables aleatorias con una distribución
normal; por consiguiente, puede demostrarse que SS .,la2 tiene una distribución jicuadrada con N - 1 gra
dos de libertad. Además, puede demostrarse que SSE/a2 es una variable jicuadrada conN -a grados de li
bertad y que SSnaiamienioJa2 es una variable jicuadrada con a - l grados de libertad si la hipótesis nula H0:r1
= O es verdadera. Sin embargo, las tres sumas de cuadrados no son necesariamente independientes, ya
que la suma de ssltatamicntos y SSE es SSp El siguiente teorema, que es una forma especial de un teorema
atribuido a William Cochran, es útil para establecer la independencia de SSE y SSnatamientor
TEOREMA 3-1 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Teorema de Cocbrao
Sea Z; igual a NID(O, 1) paira i = 1, 2, ... , v y
~ z12 = Q1 + Q2 + ... + Q,
/;l
dondes :S v, y Q; tiene v; grados de libertad (i = 1, 2, ... , s). Entonces Q¡, Q2, ••• , Q, son variables aleatorias
jicuadrada independientes con v1, v:z, ... , v, grados de libertad, respectivamente, si y sólo si
v=v1+v2+ ... +v,
Puesto que los grados de libertad de SSnatamientos y SSE sumanN 1, el número total de grados de liber
tad, el teorema de Cochran implica que SSnatamienioJa2 y SSE!a2 son variables aleatorias jicuadrada con
3 Referirse al material suplementario del texto del capítulo 3.

70 CAPÍTIJLO 3 EXPERIMENTOSCON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA
Tabla 3.3 Tabla de análisis de varianza para el modelo con un solo factor y efectos fijos
Suma de Grados de Cuadrado
Fuente de variación cuadrados libertad medio
L
a
Entre los tratamientos SSTratamientoe =n (ji¡. Y . )2 a-1

i~l
Error (dentro de Jos
tratamientos) SSE = SSr - SSTratamientos N-a
Thtal N1
una distribución independiente. Por lo tanto, si la hipótesis nula de que no hay diferencias en las medias
de los tratamientos es verdadera, el cociente
F = SSTratamientos /(a1) MSTratomíentos
(37)
0
SSE /(N-a) MSE
se distribuye como F con a - 1 y N - a grados de libertad. La ecuación 37 es el estadístico de prueba para
la hipótesis de que no hay diferencias en las medias de los tratamientos.
Por los cuadrados medios esperados se observa que, en general, MS E es un estimador insesgado de <l-.
Asimismo, bajo la hipótesis nula, MSnatamientos es un estimador insesgado de o'. Sin embargo, si la hipótesis
nula es falsa, el valor esperado de MSnatamientos es mayor que <l-. Por lo tanto, bajo la hipótesis alternativa, el
valor esperado del numerador del estadístico de prueba (ecuación 37) es mayor que el valor esperado del
denominador, y H0 deberá rechazarse para valores del estadístico de prueba que son muy grandes. Esto
implica una región crítica de una sola cola superior. Por lo tanto, H0 deberá rechazarse y concluirse que
hay diferencias en las medias de los tratamientos si
Fo > Fa,a-1,N-a
donde F¿ se calcula con la ecuación 37. De manera alternativa, podría usarse el enfoque del valor Ppara
tomar una decisión.
Es posible obtener fórmulas para calcular estas sumas de cuadrados reescribiendo y simplificando las
definiciones de ss'Il:atamientos y SST en la ecuación 36. Se obtiene así
(38)
y
. 1 a 2
SS Tratamientos =;; ,L.J
"
i1
Y;.2 - Y.N (39)
La suma de cuadrados del error se obtiene por sustracción como

SS E = SST - SS Tratamientos (310)
El procedimiento de prueba se resume en la tabla 33. Se le conoce como tabla del análisis de varianza.
EJEMPLO 3,. ¡ · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · . · · · · · · · · · · · · · · · · · · · · · · · · · ·
El experimento de la resistencia a la tensión
Para ilustrar el análisis de varianza, se retoma al ejemplo que empezó a comentarse en Ja sección 31. Re
cuerde que al ingeniero de desarrollo de productos le interesa determinar si el peso porcentual del algo
dón en una fibra sintética afecta la resistencia a la tensión, y ha llevado a cabo un experimento
completamente aleatorizado con cinco niveles del peso porcentual del algodón y cinco réplicas. Por con
veniencia, a continuación se repiten los datos de la tabla 31:
Peso Resistencia a la tensión observada

porcentual (lb/pulg2) Tutales Promedios

del algodón 1 2 3 4 5 y, y,
15 7 7 15 11 9 49 9.8
20 12 17 12 18 18 77 15.4
25 14 18 18 19 19 88 17.6
30 19 25 22 19 23 108 21.6
35 7 10 11 15 11 54 10.8
Y .. = 376 Y. = 15.04
Se usará el análisis de varianza para probar H0:µ1 = µ2 = µ3 = µ4 = µ5 contra la hipótesis alternativa
H1:algunas medias son diferentes. Las sumas de cuadrados requeridas se calculan como sigue:
L2: Y~ _L_N
5 5 2
SSr =
j;J ¡;1
(376)2
= (7)2 +(7)2 +(15)2 + ... +(15)2 +(11)2 ~= 636.96
1 2
SS ~ z Y..
Tratamientos = n L.J ¡;¡
Yi. - N
= ![( 49)2 + ... +(54)2

5
] (376)2
25
= 475.76
SSE = SSr - SSTratamientos
= 636.96 475. 76 = 161.20

Generalmente estos cálculos se realizarían en una computadora, utilizando paquetes de software con la
capacidad de analizar datos de experimentos diseñados.
En la tabla 34 se resume el análisis de varianza. Observe que el cuadrado medio entre los tratamien
tos (118.94) es varias veces mayor que el cuadrado medio dentro de los tratamientos o cuadrado medio
del error (8.06). Esto indica que no es posible que las medias de los tratamientos sean iguales. En térmi
nos más formales, puede calcularse el cociente F, F0 = 118.94/8.06 = 14.76, y comparar este valor con un
punto porcentual apropiado de la cola superior de la distribución F4, 20• Suponga que el experimentador
=
ha seleccionado a 0.05. En la tabla IV del apéndice se encuentra que Fo.os, 4, 20 = 2.87. Puesto que F0 =
14. 76 > 2.87, se rechaza H, y se concluye que las medias de los tratamientos difieren; es decir, el peso por
centual del algodón en la fibra afecta de manera significativa la resistencia a la tensión media. También
Tabla 3·4 Análisis de varianza de los datos de la resistencia a la tensión

Fuente de variación cuadrados libertad medio ValorP
Peso porcentual del algodón 475.76 4 118.94 F0=14.76 <0.01
Error 161.20 20 8.06
Tutal 636.96 24
72 CAPÍTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARJANZA
!'!
"t:J
0.6
:s
~
e
.,c. 0.4
"t:J
"t:J
~
~ 0.2
o
Fo Fo~ 14.76
Figura 33 La distribución de referencia (F4, 20) para el estadístico de

prueba F0 en el ejemplo 31.
podría calcularse un valor P para este estadístico de prueba. En la figura 33 se muestra la distribución de
referencia (F4,20) para el estadístico de prueba F¿ Evidentemente, el valor Pes muy pequeño en este caso.
Puesto que F0_01,4• 20 = 4.43 y F0 > 4.43, puede concluirse que un límite superior del valor Pes 0.01; es decir,
P < 0.01 (el valor P exacto es P = 9.11 x 6). rn
Cálculos manuales
Posiblemente el lector haya notado que la suma de cuadrados se definió en términos de promedios; es de
cir, por la ecuación 36,
SSn•t•mien•os = n !
i~l
(Y;_ Y. ) 2
pero las fórmulas de cálculo se desarrollaron utilizando los totales. Por ejemplo, para calcular SSnatamiento.,
se usaría la ecuación 39:
1 a 2
SS = ~ 2_L
Tratamientos n L.J Y;. N
1~1
La razón principal de esto es por conveniencia; además, los totales Y;. y Y.. están menos sujetos al error de
redondeo que los promedios y y; y_ .
En general, no deberá prestarse demasiada atención a los cálculos, ya que se cuenta con una amplia
variedad de programas de computadora para realizarlos. Estos programas de computadora son también
útiles para realizar muchos otros análisis asociados con el diseño experimental (como el análisis residual y
la verificación de la adecuación del modelo). En muchos casos, estos programas también ayudarán al ex
perimentador a establecer el diseño.
Cuando es necesario realizar los cálculos manualmente, en ocasiones es útil codificar las observacio
nes. Esto se ilustra en el ejemplo siguiente.
EJEMPLO 32 · · · · · · · · · · · · • • • · · · · · · · · · · · · · · · · · · · · · • • · · · · · · · · · · · · · · · · · · · · · • ·
Codificación de observaciones
Los cálculos del análisis de varianza pueden hacerse con frecuencia de manera más precisa o simplificada
codificando las observaciones. Por ejemplo, considere los datos de la resistencia a la tensión del ejemplo
3.3 ANÁLISIS DEL MODELO CON EFECTOS FIJOS 73
Tabla 3.5 Datos codificados de la resistencia a la tensión del ejemplo 32
Peso Observaciones
porcentual Tu tales
del algodón 1 2 3 4 5 y¡
15 8 8 o 4 6 -26
20 -3 2 -3 3 3 2
25 -1 3 3 4 4 13
30 4 10 7 4 8 33
35 8 -5 4 o 4 -21
31. Suponga que se resta 15 de cada observación. Los datos codificados se muestran en la tabla 35. Es
sencillo verificar que
SST = (8)2 +(8)2 + +(4)2 (~ = 636.96
(26)2 +(2)2 + +(21)2 (1)2 475.76

SS Tratamicncos = 5 25
y
SSE = 161.20
Al comparar estas sumas de cuadrados con las que se obtuvieron en el ejemplo 31, se observa que al res
tar una constante de los datos originales las sumas de cuadrados no se modifican.
Suponga ahora que cada una de las observaciones del ejemplo 31 se multiplica por 2. Es sencillo veri
=
ficar que las sumas de cuadrados de los datos transformados son SSr 2547.84, SSnatanricnto• 1903.04 y =
SSE = 644.80. Estas sumas de cuadrados parecen diferir considerablemente de las que se obtuvieron en el
ejemplo 31. Sin embargo, si se dividen por 4 (es decir, 22), los resultados son idénticos. Por ejemplo, para
la suma de cuadrados de los tratamientos, 1903.04/4 = 475.76. Asimismo, para los datos codificados, el
cociente Fes F =
(1903.04/4)/(644.80/20) =
14.76, que es idéntico al cociente F de los datos originales.
Por lo tanto, los análisis de varianza son equivalentes.
Pruebas de aleatorización y análisis de varianza

En el desarrollo del análisis de varianza con la prueba F, se ha utilizado el supuesto de que los errores
aleatorios eij son variables aleatorias que siguen una distribución normal e independiente. También es po
sible justificar la prueba F como la aproximación de una prueba de aleatorización. Para ilustrar esto, su
ponga que se tienen cinco observaciones de cada uno de dos tratamientos y que quiere probarse la
igualdad de las medias de los tratamientos. Los datos aparecerían así:
'Ihltamiento 1 'Ihltamiento 2
Yu Y21
Y12 Yzi
Yu Y23
Y14 Y24
Yis Yzs
=
Podría usarse el análisis de varianza con la prueba F para probar H0:µ1 µ2• De manera alternativa, po
dría recurrirse a un enfoque un tanto diferente. Suponga que se consideran todas las formas posibles de
asignar los 10 números de la muestra anterior a los dos tratamientos. Hay 10!/5!5! = 252 arreglos posibles
de las 10 observaciones, Si no hay ninguna diferencia en las medias de los tratamientos, los 252 arreglos
son igualmente posibles. Para cada uno de los 252 arreglos, se calcula el valor del estadístico F usando la
ecuación 37. A la distribución de estos valores F se le llama distribución de aleatorización, y un valor
grande de F indica que los datos no son consistentes con la hipótesis H0:µ1 = µ2• Por ejemplo, si el valor de
F que se observó realmente fue excedido sólo por 5 de los valores de la distribución de aleatorización, esto
correspondería con el rechazo de H0:µ1 = µ2 con un nivel de significación de a = 5/252 = 0.0198 (o
1.98% ). Observe que no es necesario ningún supuesto de normalidad en este enfoque.
La dificultad con este enfoque es que, incluso en problemas relativamente pequeños, los cálculos re
queridos hacen inviable la enumeración de la distribución de aleatorización exacta. Sin embargo, nume
rosos estudios han demostrado que la distribución F común de la teoría normal es una buena
aproximación de la distribución de aleatorización exacta. Por lo tanto, incluso sin el supuesto de normali
dad, la prueba F puede considerarse como una aproximación de la prueba de aleatorización. Para más de
talles sobre las pruebas de aleatorización en el análisis de varianza, ver Box, Hunter y Hunter [18].
33.3 Estimación de los parámetros del modelo

Se presentan ahora los estimadores de los parámetros del modelo con un solo factor
y los intervalos de confianza para las medias de los tratamientos. Más adelante se demostrará que estima
dores razonables de la media global y de los efectos de los tratamientos están dados por
fe=Y . (311)
f; =Y;. -Y ... i = 1, 2, ... , a
Estos estimadores poseen un considerable atractivo intuitivo; observe que la media global se estima con
el gran promedio de las observaciones y que el efecto de cualquier tratamiento no es sino la diferencia en
tre el promedio del tratamiento y el gran promedio.
Es posible determinar con facilidad una estimación del intervalo de confianza de la media del trata
miento iésimo. La media del tratamiento zésímc es
u, =u+t ¡
Un estimador puntual deµ¡ sería ñ, = µ + f; = Y;.. Ahora bien, si se supone que los errores siguen una dis
tribución normal, cadaj, es unaNID(u;, a2/n). Por lo tanto, si a2 fuera conocida, podría usarse la distribu
ción normal para definir el intervalo de confianza. Al utilizar MSE como estimador de a2, el intervalo de
confianza se basaría en la distribución t. Por lo tanto, un intervalo de confianza de 100(1:
J
a) por ciento
para la media u, del tratamiento iésimo es
(312)
Un intervalo de confianza de 100(1a) por ciento para la diferencia en las medias de dos tratamientos
cualesquiera, por ejemplo u, - µ;, sería
_ _ ~2MSE _ _ +t ~2MSE
Y;. Y¡. t «n.s-« <n - µ i µ i < Y;. Y¡. «n.s-» -- n (313)
EJE~LO 3 . . 3 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·· · · · · · · · · · · · · · · · · · · · · · · · ·
Utilizando los datos del ejemplo 31 pueden encontrarse las estimaciones de la media global y de los efec
tos de los tratamientos como µ. = 376/25 = 15.04 y
f1 = J¡_ - .Y.. = 9.8015.04 = 5.24
i 2 = Yz. .Y.. = 15.4015.04 = +0.36
i 3 = Ji3. .Y. = 17.6015.04 = 2.56
i 4 = .Y4. - .Y. = 21.6015.04 = +6.56
is = Ys. - .Y.. = 10.8015.04 = 4.24
Un intervalo de confianza de 95% para la media del tratamiento 4 (30% de algodón) se calcula con la
ecuación 312 como
(8.06 {8.06
2Jl.60 2.os6Vs :S µ4 :S 2i.60+ 2os6 115 5
o
21.602.65:Sµ4 :S21.60+265
Por Jo tanto, el intervalo de confianza de 95% deseado es 18.95 :S µ4 :S 24.25 .

• • • • • • • • • • • • • • • • • • • • • o •••••••••••••••••••••••••••••••••••.••••••••••••••••
Intervalos de confianza simultáneos

Las expresiones para los intervalos de confianza dados en las ecuaciones 312 y 313 son intervalos de con
fianza uno a la vez. Es decir, el nivel de confianza 1 a sólo se aplica a una estimación particular. Sin em
bargo, en muchos problemas, el experimentador tal vez quiera calcular varios intervalos de confianza,
uno para cada una de varias medias o diferencias entre medias. Si hay interés en r de estos intervalos de
confianza de 100(1a) por ciento, la probabilidad de que los r intervalos sean correctos simultáneamen
te es al menos 1-ra. A la probabilidad ra se le llama con frecuencia índice de error en el modo del experí
mento o coeficiente de confianza global. El número de intervalos r no tiene que ser muy grande antes de
que el conjunto de intervalos de confianza se vuelva relativamente falto de información. Por ejemplo, si
hay r = 5 intervalos y a = 0.05 (una elección típica), el nivel de confianza simultáneo para el conjunto de
los cinco intervalos de confianza es de al menos 0.75, y sir= 10 y a = 0.05, el nivel de confianza simultá
neo es de al menos 0.50.
Un enfoque para asegurarse de que el nivel de confianza simultáneo no sea demasiado pequeño es
sustituir a/2 con a/(2r) en las ecuaciones 312y3·13 del intervalo de confianza uno a la vez. A éste se le lla
ma el método de Bonferroni, y le permite al experimentador construir un conjunto de r intervalos de con
fianza simultáneos para las medias de los tratamientos o las diferencias en las medias de los tratamientos
para los que el nivel de confianza global es de al menos 100(1a) por ciento. Cuando r no es muy grande,
éste es un método muy atinado que produce intervalos de confianza razonablemente cortos. Para más in
formación, referirse al material suplementario del texto del capítulo 3.
3 .. 3.4 Datos no balanceados

En algunos experimentos con un solo factor, puede ser diferente el número de observaciones que se ha
cen dentro de cada tratamiento. Se dice entonces que el diseño es no balanceado. Sigue siendo posible
aplicar el análisis de varianza descrito arriba, pero deben hacerse ligeras modificaciones en las fórmulas
76 CAPÍTULO 3 EXPERIMENTOSCON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA
de las sumas de cuadrados. Sea que se hagan n, observaciones bajo el tratamiento i (i = 1, 2, ... ,a) y que
N = l:~~1n;. Las fórmulas para calcular manualmente SST y SSTratamiento• quedan como
(3-14)
y
• 2 2
SS ~ Y;. .!,__ (3-15)
Tratamientos = ..L.J N
;~1 n;
No se requieren más cambios en el análisis de varianza.
Hay dos ventajas al elegir un diseño balanceado. Primera, el estadístico de prueba es relativamente
insensible a las desviaciones pequeñas del supuesto de la igualdad de las varianzas de los a tratamientos
cuando los tamaftos de las muestras son iguales. No es éste el caso cuando los tamaftos de las muestras son
diferentes. Segunda, la potencia de la prueba se maximiza cuando las muestras tienen el mismo tamaño. .
3 ..4 VERIFICACIÓN DE LA ADECUACIÓN DEL MODELO
La descomposición de la variabilidad presente en las observaciones mediante la identidad del análisis de

varianza (ecuación 36) es una relación puramente algebraica. Sin embargo, el uso de la partición para
probar formalmente que no hay diferencias en las medias de los tratamientos requiere que se satisfagan
ciertos supuestos. Específicamente, estos supuestos son que el modelo
yíi = µ+r; +e;¡
describe de manera adecuada las observaciones, y que los errores siguen una distribución normal e inde
pendiente con media cero y varianza a2 constante pero desconocida. Si estos supuestos se satisfacen, el
procedimiento del análisis de varianza es una prueba exacta de la hipótesis de que no hay diferencias en
las medias de los tratamientos.
Sin embargo, es común que en la práctica estos supuestos no se satisfagan exactamente, Por consi
guiente, en general no es prudente confiar en el análisis de varianza hasta haber verificado estos supues
tos. Las violaciones de los supuestos básicos y la adecuación del modelo pueden investigarse con facilidad
mediante el examen de los residuales. El residual de la observaciónjésima en el tratamiento íésímo se
define como
(316)
donde )\ es una estimación de la observación J;¡ correspondiente que se obtiene como sigue:
s, = µ+:r;
+(Y;. -Y..
=Y.. )
=Y,. (3-17)
La ecuación 317 da el resultado intuitivamente claro de que la estimación de cualquier observación en el
tratamiento résímo no es sino el promedio del tratamiento correspondiente.
El examen de los residuales deberá ser una parte automática de cualquier análisis de varianza. Si el
modelo es adecuado, los residuales deberán estar sin estructura; es decir, no deberán contener patrones
obvios. A través de un estudio de los residuales, pueden descubrirse muchos tipos de inadecuaciones del
modelo y violaciones de los supuestos subyacentes. En esta sección se indica cómo puede hacerse con fa
cilidad la verificación de diagnóstico del modelo mediante el análisis gráfico de los residuales y cómo re
solver varias anormalidades que ocurren comúnmente.
34 VERJFICACIÓN DE LA ADECUACIÓN DEL MODELO 77
3 ..4.1 El supuesto de nonnallidad

La verificación del supuesto de normalidad podría hacerse graficando un histograma de los residuales. Si
se satisface el supuesto de NID(O, a2) para los errores, esta gráfica deberá aparecer como una muestra de
una distribución normal con centro en cero. Desafortunadamente, cuando se trabaja con muestras pe
queñas, suelen ocurrir fluctuaciones significativas, por lo que la aparición de una desviación moderada de
la normalidad no implica necesariamente una violación seria de los supuestos. Las desviaciones marcadas
de la normalidad son potencialmente serias y requieren análisis adicional.
Un procedimiento en extremo útil es construir una gráfica de probabilidad normal de los residuales.
Recuerde que en el capítulo 2 se utilizó una gráfica de probabilidad normal de los datos originales para
verificar el supuesto de normalidad cuando se usó la prueba t. En el análisis de varianza, por lo general es
más eficaz (y directo) hacer lo mismo con los residuales. Si la distribución fundamental de los errores es
normal, esta gráfica tendrá la apariencia de una línea recta. Para visualizar la línea recta, deberá prestarse
más atención a los valores centrales de la gráfica que a los valores extremos.
En la tabla 36 se muestran los datos originales y los residuales de los datos de la resistencia a la ten
sión del ejemplo 31. La gráfica de probabilidad normal se muestra en la figura 34. La impresión general
que surge al examinar esta representación es que la distribución de los errores puede tener un ligero ses
go, con la cola derecha siendo más larga que la izquierda. La tendencia de la gráfica de probabilidad nor
mal a curvarse hacia abajo ligeramente del lado izquierdo, implica que la cola izquierda de la distribución
de los errores sea un tanto más delgada de lo que se anticiparía con una distribución normal; es decir, los
residuales negativos no son tan grandes (en valor absoluto) como se esperaba. Sin embargo, esta gráfica
no muestra una desviación marcada de la distribución normal.
En general, las desviaciones moderadas de la normalidad no son motivo de gran preocupación en el
análisis de varianza de efectos fijos (recuerde el análisis de las pruebas de aleatorización de la sección 33.2).
Una distribución de los errores que tiene colas considerablemente más gruesas o delgadas que la distribu
ción normal es motivo de mayor preocupación que una distribución sesgada. Puesto que la prueba F sólo se
afecta ligeramente, se dice que el análisis de varianza (y los procedimientos relacionados como las compa
raciones múltiples) es robusto con respecto al supuesto de normalidad. Las desviaciones de la normalidad
hacen por lo general que tanto el verdadero nivel de significación como la verdadera potencia difieran lige
ramente de los valores anunciados, con la potencia siendo generalmente más baja. El modelo de los efectos
aleatorios que se revisará en el capítulo 12 se afecta en forma más severa por la no normalidad.
Tabla J,6 Datos y residuales del ejemplo 31•

Peso
porcentual Observaciones (j)
del algodón 2 3 4 5
l2.8 l2.8 1 5.2 1 1.2 1o.8
15 7 (15) 7 (19) 15 (25) 11 (12) 9 (6) 9.8
l3.4 1 1.6 l3.4 1 2.6 1 2.6
20 12 (8) 17 (14) 12 (1) 18 (11) 19 (3) 15.4
l3.6 1 0.4 1 0.4 1 1.4 1 1.4
25 14 (18) 18 (13) 18 (20) 19 (7) 19 (9) 17.6
l2.6 1 3.4 1 0.4 l2.6 1 1.4
30 19 (22) 25 (5) 22 (2) 19 (24) 23 (10) 21.6
l3.8 l·0.8 1 0.2 1 4.2 1 0.2
35 7 (17) 10 (21) 11 (4) 15 (16) 11 (23) 10.8
. .
=Los residuales se índícan en el recuadro de cada celda. Los números entre
. . .
paréntesis indican el orden en que se recolectaron los datos .
99
96
90
80
¡¡¡
E
oe: 70
.,
"'C
~ 60
:e
13
ec. 30
~
~ 20
10
3.8 1.56 0.7

Residual
Figura 34 Gráfica de probabilidad normal de los residuales del ejemplo 31.
Una anomalía muy común que suele ponerse de manifiesto en tas gráficas de probabilidad normal es
un residual que es mucho más grande que cualquier otro. A un residual así se le llama con frecuencia pun
to atípico. La presencia de uno o más puntos atípicos puede introducir serias distorsiones en el análisis de
varianza, por lo que cuando se localiza un punto atípico potencial, se requiere una investigación atenta.
En muchas ocasiones, la causa del punto atípico es un error en los cálculos o un error al codificar o copiar
los datos. Si no es ésta la causa, las circunstancias experimentales que rodean esta corrida particular de
ben estudiarse con atención. Si la respuesta atípica ocurre en un valor particularmente deseable (alta re
sistencia, costo bajo, etc.), el punto atípico puede ser más informativo que el resto de los datos. Deberá
tenerse cuidado de no rechazar o descartar una observación atípica a menos que se tengan razones no es
tadísticas de peso para hacerlo. En el peor de los casos, puede terminarse con dos análisis; uno con el pun
to atípico y uno sin él.
Existen varios procedimientos estadísticos formales para detectar puntos atípicos (por ejemplo, ver
Bamett y Lewis [8], J ohn y Prescott [60] y Stefansky [107]). Puede hacerse una verificación aproximada de
los puntos atípicos examinando los residuales estandarizados
eij
d .. = (318)
•1 .JMSE
34 VERIFICACIÓN DE LA ADECUACIÓN DEL MODELO 79
Si los errores Eii son N(O, a2), los residuales estandarizados deberán ser aproximadamente normales con
media cero y varianza unitaria. Por lo tanto, cerca de 68% de los residuales estandarizados deberán estar
incluidos dentro de los límites ± 1, cerca de 95% de ellos deberán estar incluidos dentro de ±2 y virtual
mente todos ellos deberán estar incluidos dentro de ±3. Un residual mayor que 3 o 4 desviaciones están
dar a partir de cero es un punto atípico potencial.
Para los datos de la resistencia a la tensión del ejemplo 31, la gráfica de probabilidad normal no pro
duce indicio alguno de puntos atípicos. Además, el residual estandarizado mayor es
5·2
d13 =~ = __2¿_ = = 1.83
.JMSE .jS.06 2.84
el cual no deberá ser motivo de preocupación.
34.2 Gráfica de los residuales en secuencia en el tiempo

La graficación de los residuales en el orden temporal de la recolección de los datos es útil para detectar
correlaciones entre los residuales. Una tendencia a tener corridas de residuales positivos y negativos indi
ca una correlación positiva. Esto implicaría que el supuesto de independencia de los errores ha sido viola
do. Se trata de un problema potencialmente serio y cuya solución es difícil, por lo que de ser posible es
importante evitar el problema cuando se colecten los datos. La aleatorización adecuada del experimento
es un paso importante para conseguir la independencia.
En ocasiones las habilidades del experimentador (o los sujetos) pueden cambiar conforme el experi
mento avanza, o el proceso bajo estudio puede "vagar sin rumbo" o volverse más errático. Esto producirá
con frecuencia un cambio en la varianza del error con el tiempo. Esta condición suele llevar a una gráfica
de los residuales contra el tiempo que muestra una dispersión mayor en uno de sus extremos que en el
otro. Una varianza no constante es un problema potencialmente serio. En las secciones 34.3 y 34.4 se
abundará sobre el tema.
En la tabla 36 se muestran nos residuales y la secuencia en el tiempo de la recolección de los datos
para el experimento de la resistencia a la tensión. En la figura 35 se presenta una gráfica de estos residua
5 •
4 •
•
3
2
• •
..,,,. 1 • •• • •
¡¡;
:J
o· • • •
""ii 5 10 15 20 25
a: 1
• Tiempo •
2
3 • • • •
4
• • ••
5
e
Figura 3S Gráfica de los residuales contra el tiempo.
80 CAPITuLO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA
les contra el tiempo. No hay razón para sospechar cualquier violación de los supuestos de independencia
o de una varianza constante.
3..4.J Gráfica de los residuales contra los valores ajustados
Si el modelo es correcto y se satisfacen los supuestos, los residuales deberán estar sin estructura; en par
ticular, no deberán estar relacionados con ninguna otra variable, incluyendo la respuesta predicha. Una
verificación simple es graficar los residuales contra los valores ajustados Y¡¡. (Para el modelo de un experi
mento con un solo factor, recuerde que Y¡¡ =y¡_, el promedio del tratamiento iésimo.) Esta gráfica no de
berá mostrar ningún patrón obvio. En la figura 36 se grafican los residuales contra los valores ajustados
para los datos de la resistencia a la tensión del ejemplo 31. No es evidente ninguna estructura inusual.
Un defecto que sale a relucir en ocasiones en esta gráfica es una varianza no constante. En ocasiones la
varianza de las observaciones se incrementa cuando la magnitud de la observación se incrementa. Éste sería
el caso si el error o ruido de fondo del experimento fuera un porcentaje constante de la magnitud de la ob
servación. (Esto ocurre comúnmente con muchos instrumentos de medición; el error es un porcentaje de la
escala de medición.) Si éste fuera el caso, los residuales se harían mayores conforme Y;¡ se hiciera más gran
de, y la gráfica de los residuales contra Y;¡ se vería como un embudo o un megáfono con la boca hacia afuera.
Una varianza no constante también surge en los casos en que los datos siguen una distribución no normal,
sesgada, porque en las distribuciones sesgadas la varianza tiende a ser una función de la media.
Si se viola el supuesto de la homogeneidad de las varianzas, la prueba F sólo resulta afectada ligera
mente en el modelo balanceado (el mismo tamaño de la muestra en todos los tratamientos) con efectos fi
jos. Sin embargo, en diseños no balanceados o en casos en que una de las varianzas es considerablemente
más grande que las demás, el problema es más grave. Específicamente, si los niveles del factor que tienen
las varianzas mayores corresponden también con los tamaños de las muestras más pequeños, el índice de
error tipo I real es mayor que lo previsto (o los intervalos de confianza tienen niveles de confianza reales
más bajos que los que fueron especificados). Recíprocamente, si los niveles del factor con las varianzas
mayores tienen también los tamaños de las muestras mayores, los niveles de significación son mucho me
nores que lo anticipado (los niveles de confianza son más altos). Ésta es una buena razón para escoger ta
maños de las muestras iguales siempre que sea posible. Para los modelos con efectos aleatorios, las
5 •

4 •
3
•

2
.,o:, 1 • • • •
~ o~~~
31
.......~~--'=-~~ ......~~ •
........~~---~
5 15 20 25
••
11 _, 10
a:
Y¡¡
2
-3 • •
4 • • •
5
6
Figura 36 Gráfica de los residuales contra los valores ajustados.

H VERIFICACIÓN DE LA ADECUACIÓN DEL MODEW 81
varianzas del error diferentes pueden introducir alteraciones significativas en las inferencias sobre los
componentes de la varianza, incluso cuando se usan diseños balanceados.
El enfoque usual para abordar el problema de una varianza no constante que ocurre por las razones
expuestas antes consiste en aplicar una transformación para estabilizar la varianza para correr después
el análisis de varianza en los datos transformados. En este enfoque, deberá tenerse presente que las con
clusiones del análisis de varianza se aplican a las poblaciones transformadas.
Se han dedicado considerables esfuerzos de investigación a la selección de una transformación ade
cuada. Si los experimentadores conocen la distribución teórica de las observaciones, pueden hacer uso de
esta información para elegir la transformación. Por ejemplo, si las observaciones siguen la distribución de
Poisson, se usaría la transformación de la raíz cuadrada yij = ¡y; =
o y~ ~1 +y lf • Si los datos siguen la
distribución lognormal, la transformación logarítmica yij = log y;¡ es adecuada. Para datos binomiales ex
presados como fracciones, la transformación arcsen yij = arcsenJY: es útil. Cuando no hay una transfor
mación obvia, el experimentador realizará por lo general la búsqueda empfrica de una transformación
que iguale la varianza independientemente del valor de la media. Al final de esta sección se ofrecen algu
nos consejos al respecto. En los experimentos factoriales, los cuales se introducen en el capítulo 5, otro
enfoque es seleccionar una transformación que minimice el cuadrado medio de las interacciones, siendo
el resultado un experimento cuya interpretación es más sencilla. En el capítulo 14 se revisan con mayor
detalle los métodos para seleccionar analíticamente la forma de la transformación. Las transformaciones
que se hacen para la desigualdad de la varianza afectan también la forma de la distribución del error. En
la mayoría de los casos, la transformación hace que la distribución del error esté más cerca de la distribu
ción normal. Para más detalles sobre las transformaciones, referirse a Bartlett [7], Box y Cox [15], Dolby
[38] y Draper y Hunter {39].
Pruebas estadísticas para la igualdad de la varianza

Aun cuando es frecuente el uso de las gráficas residuales para diagnosticar la desigualdad de la varianza,
se han propuesto también varias pruebas estadísticas. Estas pruebas pueden considerarse como pruebas
formales de las hipótesis
H0: at =a~ = .. · =a;
H1: el enunciado anterior no es verdadero para al menos una a;
Un procedimiento muy utilizado es la prueba de Bartlett. El procedimiento incluye el cálculo de un
estadístico cuya distribución de muestreo está aproximada muy de cerca por la distribución jicuadrada
con a - 1 grados de libertad cuando las a muestras aleatorias son de poblaciones normales independien
tes. El estadístico de prueba es
X~ = 23026!!.e (319)
donde
q= (Na)log10 s;- ! (n¡ l)log10 S;2
(!
¡,,,¡
1
c=l+ (n;lf1(Na)1)
3(a1) ¡,,,¡
L (n; l)S;
a
2
52 =~'"'~l _
P N-a
y S12 es la varianza muestra! de la población iésima.
La cantidad q es grande cuando la diferencia entre las varianzas muestrales S;2 es considerablemente
grande, y es igual a cero cuando todas las S;2 son iguales. Por lo tanto, H0 deberá rechazarse para los valo
res de x~que sean muy grandes; es decir, se rechaza H0 sólo cuando
XO
2 > X a,a-1
2
donde x!,al es el punto porcentual a superior de la distribución jicuadrada con a 1 grados de libertad.
También podría usarse el enfoque del valor P para tomar una decisión.
La prueba de Bartlett es muy sensible al supuesto de normalidad. Por consiguiente, cuando la validez
de este supuesto está en duda, no deberá usarse la prueba de Bartlett.
EJEMPLO 3 . .4 · · · · · .· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Ya que el supuesto de normalidad no está en entredicho, la prueba de Bartlett puede aplicarse a los datos
de la resistencia a la tensión del experimento del peso porcentual de algodón del ejemplo 31. Se calculan
primero las varianzas muestrales de cada tratamiento y se encuentra que S12 = 11.2, = 9.8, = 4.3, s; s; s;
= 6.8 y Sff = 8.2. Entonces
52 = 4(11.2)+4(9.8)+ 4( 4.3)+ 4( 6.8)+ 4(8.2)
p 20 8.06
q = 20 Iog., (8.06) 4[1og10 11.2+ log., 9.8+ log.¿ 4.3+ log., 6.8+ log., 8.2] = 0.45
c=1+3(4)
1 (5 1)
¡20 =1.10
2 = 23026 (0.45) = 0.93

Xo (1.lO)
x~.
Puesto que 05• 4 = 9.49, no puede rechazarse la hipótesis nula y se concluye que las cinco varianzas son
iguales. Se trata de la misma conclusión a la que se llegó al analizar la gráfica de los residuales contra los
valores ajustados.
Debido a que la prueba de Bartlett es sensible al supuesto de normalidad, puede haber situaciones en
las que sería útil un procedimiento alternativo. Anderson y McLean [2] presentan una atinada revisión de
algunas pruebas estadísticas de la igualdad de la varianza. La prueba de Levene modificada (ver Levene
[72] y Conover, Johnson y Johnson [31]) es un procedimiento muy útil que es robusto en cuanto a las des
viaciones de la normalidad. Para probar la hipótesis de que las varianzas son iguales en todos los trata
mientos, la prueba de Levene modificada utiliza la desviación absoluta de las observaciones yii de cada
tratamiento de la mediana de los tratamientos, por ejemplo y;. Sea que estas desviaciones se denoten por
i = 1, 2, ... , a
d¡¡ =lyijy;¡ {1·= 1 ' 2, ••• , n i
La prueba de Levene modificada evalúa entonces si la media de estas desviaciones es igual o no para to
dos los tratamientos. Cuando las desviaciones medias son iguales, las varianzas de las observaciones de
34 VERIFICACIÓN DE LA ADECUACIÓN DEL MODELO 83
Tabla 3 7 Datos de la descarga pico
Método de
estimación Observaciones Yi. y; S;
1 0.34 0.12 1.23 0.70 1.75 0.12 0.71 0.520 0.66
2 0.91 2.94 2.14 2.36 2.86 4.55 2.63 2.610 1.09
3 6.31 8.37 9.75 6.09 9.82 7.24 7.93 7.805 1.66
4 17.15 11.82 10.95 17.20 14.35 16.82 14.72 15.59 2.77
Método de
estimación Desviacionesdij para la prueba de Levene modificada
1 0.18 0.40 0.71 0.18 1.23 0.40
2 1.70 0.33 0.47 0.25 0.25 1.94
3 1.495 0.565 1.945 l. 715 2.015 0.565
4 1.56 3.77 4.64 1.61 1.24 1.23
todos los tratamientos serán iguales. El estadístico de prueba para la prueba de Levene es simplemente el
estadístico F ANOV A usual para probar la igualdad de las medias que se aplica a las desviaciones absolutas.
EJEMPLO 3.,,5 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Un ingeniero civil está interesado en determinar si cuatro métodos diferentes para estimar la frecuencia
de las inundaciones producen estimaciones equivalentes de la descarga pico cuando se aplican a la misma
cuenca. Cada procedimiento se usa seis veces en la cuenca, y los datos de las descargas resultantes (en
pies cúbicos por segundo) se muestran en la parte superior de la tabla 37. El análisis de varianza de los
datos, el cual se resume en la tabla 38, implica que hay una diferencia en las estimaciones de la descarga
pico promedio obtenidas en los cuatro procedimientos. La gráfica de los residuales contra los valores
ajustados, la cual se muestra en la figura 37, es preocupante porque la forma de embudo con la boca ha
cia afuera indica que no se satisface el supuesto de una varianza constante.
Se aplicará la prueba de Levene modificada a los datos de la descarga pico. La parte superior de la ta
bla 37 contiene las medianas de los tratamientos y; y la parte inferior contiene las desviaciones d11 alrede
dor de las medianas. La prueba de Levene consiste en realizar un análisis de varianza estándar en las d1¡.
=
El estadístico de pruebaF que resulta en este caso esF0 4.55, para el cual el valor P esP 0.0137. Por lo =
tanto, la prueba de Levene rechaza la hipótesis nula de que las varianzas son iguales, coincidiendo en
esencia con el diagnóstico que se hizo a partir del examen visual de la figura 37. Los datos de la descarga
pico son un buen candidato para una transformación de datos.
Selección empírica de una transformación

Se señaló ya que si los experimentadores conocieran la relación entre la varianza de las observaciones y la
media, podrían usar esta información como guía para la selección de la forma de la transformación. Se
Tabla 38 Análisis de varianza de los datos de la descarga pico

Fuente de Suma de Grados de Cuadrado
variación cuadrados libertad medio ValorP
Métodos 708.3471 3 236.1157 76.07 <0.001
Error 62.0811 20 3.1041
Tu tal 770.4282 23
••
3
2
• •
..
::;:.
o
1
•
••
•
1
•
• •
2 • 1
3 •
4 •
o 5 10 15 20
Y;;
F~gul"a 37 Gráfica de los residuales contra Y;; para el
ejemplo 35.
desarrolla ahora este punto y se presenta un método para seleccionar empíricamente la forma de la trans
formación requerida de los datos.
SeaE(Y) =µla media de y, y suponga que la desviación estándar de y es proporcional a una potencia
de la media de y tal que
Quiere encontrarse una transformación de y que produzca una varianza constante. Suponga que la trans
formación es una potencia de los datos originales, por ejemplo
(320)
Puede demostrarse entonces que

a ec µ-'+a-1 (321)
y•
Evidentemente, si se hace ). = 1 a, la varianza de los datos transformados y* es constante.

En la tabla 39 se resumen varias de las transformaciones comunes analizadas anteriormente. Obser
ve que ). = O implica la transformación logarítmica. Estas transformaciones se enlistan en el orden de
fuerza creciente. Por fuerza de una transformación se entiende la cantidad de curvatura que induce. Una
transformación suave aplicada a datos que se extienden en un rango estrecho tiene escaso efecto sobre el
'Iabla 39 Transformaciones para estabilizar la varianza

Relación entre
a yµ a A.=1-a 'Iransformación Comentario
aY ex: constante o 1 Sin transformación
ay cx:µ112 1/2 1/2 Raíz cuadrada Datos (números) de Poisson
ay ex:µ 1 o Log
ay ex: µ312 3/2 1/2 Raíz cuadrada recíproca
a cx:µ2 2 1 Recíproco
3.4 VERIFICACIÓN DE LA ADECUACIÓN DEL MODELO 85
1.5
1.0 •
0.5
•
"'
O>
.2
o •
0.5 •
1
1 o 2 3
log.Y,.
Figura 3·8 Gráfica de log S, contra logy,, para los datos de

la descarga pico del ejemplo 35.
análisis, mientras que una transformación fuerte aplicada en un rango amplio puede tener resultados dra
máticos. Con frecuencia las transformaciones tienen escaso efecto a menos que el cociente YmrdYmrn sea
mayor que 2 o 3.
En muchas situaciones de diseño experimental en las que se usan réplicas, a puede estimarse empíri
camente a partir de los datos. Puesto que la combinación zésímo de los tratamientos a y, oc µ ~ = fJµ ~,
donde fJ es una constante de proporcionalidad, pueden tomarse logaritmos para obtener
lago y, = logfJ+a lag p; (322)
Por lo tanto, una gráfica de log a Y; contra logµ¡ sería una línea recta con pendiente a. Puesto que no seco
nocen a y, yµ;, pueden sustituirse estimaciones razonables de ellos en la ecuación 322 y usar la pendiente
del ajuste de la línea recta resultante como estimación de a. De manera típica, se usaría la desviación es
tándar S; y el promedio Y;. del tratamiento iésimo (o, en términos más generales, la combinación iésima
cíe los tratamientos o conjunto de condiciones experimentales) para estimar a y, y µ;.
Para investigar la posibilidad de usar una transformación para estabilizar la varianza en los datos de
la descarga pico del ejemplo 35, en la figura 38 se grafica log S; contra logy;.· La pendiente de la recta que
pasa por estos cuatro puntos está cerca de 1/2 y, por la tabla 39, esto implica que la transformación de la
raíz cuadrada puede ser apropiada. El análisis de varianza de los datos transformados y* = Vy se presenta
en la tabla 310, y en la figura 39 se muestra una gráfica de los residuales contra la respuesta predicha.
Esta gráfica residual muestra una mejoría sensible en comparación con la figura 3 7, por lo que se conclu
Tabla 310 Análisis de varianza de los datos transformados de la descarga pico, Y* = Vy

Métodos 32.6842 3 10.8947 76.99 <0.001
Error 2.6884 19 0.1415
Total 35.3726 22
1.00
0.75
0.50 • •
• •• 1
•
0.25
.,,, o • •
• •• •
0.25
0.50 • • :
•
•
0.75
1.00
•
o
·
2 3 4 5
Yv
Figura 3·9 Gráfica de los residuales de los datos transfor
mados contra y;
para los datos de la descarga pico del ejem
plo 35.
ye que la transformación de la raíz cuadrada ha sido útil. Observe que en la tabla 310 se han reducido los
grados de libertad del error en 1 para tomar en consideración el uso de los datos para estimar el paráme
tro de la transformación a.
En la práctica, muchos experimentadores seleccionan la forma de la transformación probando varias
alternativas y observando el efecto de cada transformación en la gráfica de los residuales contra la res
puesta predicha. Entonces se selecciona la transformación que produjo la gráfica residual más satisfactoria.
3-4.4 Gráficas de los residuales contra otras variables

Si se han recolectado datos de cualesquiera otras variables que posiblemente pudieran afectar la respues
ta, los residuales deberán graficarse contra estas variables. Por ejemplo, en el experimento de la resisten
cia a la tensión del ejemplo 31, la resistencia puede ser afectada de manera significativa por el espesor de
la fibra, por lo que los residuales deberán graficarse contra el espesor de la fibra. Si se usaron diferentes
máquinas de prueba para recolectar los datos, los residuales deberán graficarse contra las máquinas. Los
patrones en tales gráficas residuales implican que la variable afecta la respuesta. Esto sugiere que la varia
ble debería controlarse con mayor atención en experimentos futuros o que debería incluirse en el análisis.
3-5 INTERPRETACIÓN PRÁCTICA DE LOS RESULTADOS
Después de realizar el experimento, llevar a cabo el análisis estadístico e investigar los supuestos funda
mentales, el experimentador está listo para sacar conclusiones prácticas acerca del problema bajo estu
dio. Muchas veces esto es relativamente fácil, y ciertamente en los experimentos sencillos que se han
considerado hasta este punto, esto podría hacerse de manera un tanto informal, tal vez mediante la ins
pección de las representaciones gráficas, como los diagramas de caja y el diagrama de dispersión de las fi
guras 31y32. Sin embargo, en algunos casos es necesario aplicar técnicas más formales. En esta sección
se presentarán algunas de ellas.
35 INTERPRETACIÓN PRÁCTICA DE LOS RESULTADOS 87
J ..5.1 Un modelo de regresión

Los factores que intervienen en un experimento pueden ser cuantitativos o cualitativos. Un factor cuan
titativo es aquel cuyos niveles pueden asociarse con puntos en una escala numérica, como la temperatura,
la presión o el tiempo. Los factores cualitativos, por otra parte, son aquellos cuyos niveles no pueden or
denarse por magnitud. Los operadores, los lotes de materia prima y los cambios de tumo son factores
cualitativos típicos, ya que no existe ninguna razón para ordenarlos bajo algún criterio numérico particular.
En lo que se refiere al diseño inicial y al análisis del experimento, ambos tipos de factores se tratan de
manera idéntica. El experimentador está interesado en determinar las diferencias, en caso de haberlas,
entre los niveles de los factores. Si el factor es cualitativo, como los operadores, no tiene sentido conside
rar la respuesta de una corrida subsecuente en un nivel intermedio del factor. Sin embargo, con un factor
cuantitativo como el tiempo, el experimentador tiene interés por lo general en el rango completo de los
valores usados, particularmente la respuesta de una corrida subsecuente con un nivel intermedio del fac
tor. Es decir, si se usan los niveles 1.0, 2.0 y 3.0 en el experimento, tal vez quiera predecir la respuesta de
2.5 horas. Por lo tanto, el experimentador tiene con frecuencia interés en desarrollar una ecuación de in
terpolación para la variable de respuesta del experimento. Esta ecuación es un modelo empírico del pro
ceso que se ha estudiado.
Al enfoque general para ajustar modelos empíricos se le llama análisis de regresión, el cual se analiza
en detalle en el capítulo 10. Véase también el material suplementario del texto para este capítulo. En esta
sección se ilustra brevemente la técnica utilizando los datos de la resistencia a la tensión del ejemplo 31.
En la figura 310 se presenta el diagrama de dispersión de la resistencia a la tensión y contra el peso
porcentual del algodónx en la tela para el experimento del ejemplo 31. Los círculos huecos de la gráfica
son las resistencias de tensión promedio para cada valor x del peso porcentual del algodón. A partir del
examen del diagrama de dispersión, es evidente que la relación entre la resistencia a la tensión y el peso
25 •
•
20
...
..
¿
:2 15
e
s
....
.l!!
·¡::;
e 10

cD
.i
$
a:
•
5 •
ºo 10 20 30 40
Figura 310 Diagrama de dispersión para los datos

de la resistencia a la tensión del ejemplo 31.
porcentual del algodón no es lineal. Como una primera aproximación, podría intentarse ajustar un mode
lo cuadrático para los datos, por ejemplo
donde {30, {31 y {32 son parámetros desconocidos que deberán estimarse y e es un término del error aleatorio.
El método que se usa con mayor frecuencia para estimar los parámetros en un modelo como éste es el mé
todo de mínimos cuadrados. Éste consiste en elegir estimaciones de las f3 tales que minimicen la suma de
cuadrados de los errores (las e). El ajuste de mínimos cuadrados en el ejemplo que se considera aquí es
y= 39.9886+4.596x 0.0886x2
(Si el lector no está familiarizado con los métodos de regresión, vea el capítulo 10 y el material suplemen
tario del texto para este capítulo.)
En la figura 310 se muestra este modelo cuadrático. No parece muy satisfactorio, ya que subestima
de manera drástica las respuestas para x = 30% de algodón y sobrestima las respuestas para x = 25%.
Quizá pueda lograrse un mejoramiento agregando un término cúbico enx. El ajuste con el modelo cúbico
resultante es
y= 62.6114 9.0114x+0.4814x2 0.0076x3
Este ajuste cúbico se ilustra también en la figura 310. El modelo cúbico parece mejor que el cuadrático
porque proporciona un ajuste mejor para x = 25 y x = 30% de algodón.
En general, sería preferible hacer el ajuste con el polinomio de orden menor que describa adecuada
mente el sistema o proceso. En este ejemplo, el polinomio cúbico parece un mejor ajuste que el cuadráti
co, por lo que la complejidad adicional del modelo cúbico se justifica. Sin embargo, seleccionar el orden
del polinomio de aproximación no siempre es fácil, y es relativamente sencillo excederse en el ajuste, es
decir, agregar polinomios de orden superior que no mejoran en realidad el ajuste pero que incrementan
la complejidad del modelo y con frecuencia demeritan su utilidad como predictor o ecuación de interpo
lación.
En este ejemplo, el modelo empírico podría usarse para predecir la resistencia a la tensión media
para los valores del peso porcentual del algodón dentro de la región de experimentación. En otros casos,
el modelo empírico podría usarse para la optimización del proceso, es decir, para encontrar los niveles de
las variables del diseño que dan como resultado los mejores valores de la respuesta. Más adelante se ana
lizarán e ilustrarán en detalle estos problemas.
35.2 Comparaciones entre las medias de los tratamientos

Suponga que al hacer el análisis de varianza en el modelo con efectos fijos se rechaza la hipótesis nula. Por
lo tanto, hay diferencias entre las medias de los tratamientos, pero no se especifica exactamente cuáles
medias difieren. En ocasiones pueden ser de utilidad en esta situación las comparaciones y los análisis
. adicionales entre grupos de las medias de los tratamientos. La media del tratamiento iésimo se define
comoµ; = µ + r;, yµ; se estima con Y;.· Las comparaciones entre las medias de los tratamientos se hacen ya
sea en términos de los totales de los tratamientos {y;,} o bien de los promedios de los tratamientos {Y¡_}. Es
común llamar a los procedimientos para hacer estas comparaciones métodos de comparaciones múlti
ples. En varias de las secciones siguientes se analizan los métodos para hacer comparaciones entre las me
dias de los tratamientos individuales o de grupos de estas medias.
3-5.3 Comparaciones gráficas de medias

Es muy sencillo desarrollar un procedimiento gráfico para la comparación de las medias después de un
,y
análisis de varianza. Suponga que el factor de interés tiene a niveles y que .Yi.,Yv ... a. son los promedios
de los tratamientos. Si se conoce a, el promedio de cualquier tratamiento tendría una desviación estándar
a/../ñ. Por consiguiente, si todas las medias de los niveles del factor son idénticas, las medias muestrales
observadas Yi. se comportarían como un conjunto de observaciones tomadas al azar de una distribución
normal con medíaj .. y desviación estándar a/../ñ. Visualice una distribución normal con la capacidad de ser
deslizada sobre un eje abajo del cual están graficadas y¡_,J2., ... ,J•.. Si todas las medias de los tratamientos
J;.
son iguales, deberá haber una posición de esta distribución que haga evidente que los valores se sacaron
de la misma distribución. Si no es éste el caso, los valores y¡_ que no parecen haberse sacado de esta distri
bución se asocian con los niveles del factor que producen respuestas medias diferentes.
La única falla en esta lógica es que a es desconocida. Sin embargo, puede sustituirse a con .j MS E del
análisis de varianza y usar una distribución t con un factor de escalación .j MS E / n en lugar de la distribu
ción normal. En la figura 311 se muestra este arreglo para los datos de la resistencia a la tensión del ejem
plo 31.
Para trazar la distribución t de la figura 311, simplemente se multiplica el valor de la abscisa t por el
factor de escalación
.jMSE / n = ..j8.06/ 5=1.27

y se grafica contra la ordenada de t en ese punto. Dada la gran similitud entre la distribución t y la normal,
excepto porque la primera es un poco más plana cerca del centro y tiene colas más largas, por lo general
este trazo se construye fácilmente a ojo. Sí quiere obtenerse mayor precisión, en Box, Hunter y Hunter
[18] se incluye una tabla de los valores de las abscisas t y las ordenadas correspondientes. La distribución
puede tener un origen arbitrario, aun cuando por lo general es mejor uno que esté en la región de los valo
res Yi. que van a compararse. En la figura 311, el origen es 15 lb/pulg2.
Visualice ahora el desplazamiento de la distribución t de la figura 311 sobre el eje horizontal y exami
ne las cinco medias graficadas en la figura, Observe que no hay ninguna posición de la distribución tal que
los cinco promedios puedan considerarse como observaciones típicas seleccionadas al azar de la distribu
ción. Esto implica que las cinco medias no son iguales; por lo tanto, la figura es una representación gráfica
de los resultados del análisis de varianza. La figura indica que 30% de algodón produce resistencias a la
tensión mucho más altas que 20 o 25 por ciento de algodón (las cuales son aproximadamente iguales), y
que 15 o 35 por ciento de algodón (las cuales son aproximadamente iguales) producirían resistencias a la
tensión aún más bajas.
25 30
5 10 15 • 20 • 25
Resistenciaa la tensión promedio
(lb/pulg2)
Figura 3· 11 Promedio de la resistencia a la tensión del experimento del peso

porcentual del algodón en relación con una distribución t con un factor de es
calación ../MS,, / n ==J8.06 / 5 =127.
Este procedimiento simple es una técnica aproximada pero eficaz en muchos problemas de compara
ciones múltiples. Sin embargo, existen métodos más formales. A continuación se presenta una breve revi
sión de algunos de estos procedimientos.
35.4 Contrastes
Muchos métodos de comparaciones múltiples utilizan el concepto de contraste. Considere el problema
de la prueba de la fibra sintética del ejemplo 31. Puesto que se rechazó la hipótesis nula, se sabe que algu
nos pesos porcentuales del algodón producen resistencias a la tensión diferentes que otros, pero, Zcuáles
son los que causan en realidad esta diferencia? Al principio del experimento podría sospecharse que los
niveles 4 y 5 del peso porcentual del algodón (30 y 35 por ciento) producen la misma resistencia a la ten
sión, lo cual implicaría que la hipótesis por probar sería ·
Ho:µ4 =u ,
H1:µ4 :¡é µs
o, de manera equivalente,
Ha:µ4-µs=O (323)
H1:µ4 µs :¡é O
Si desde el principio del experimento se hubiera sospechado que el promedio de los niveles más bajos del
peso porcentual del algodón (1y2) no difería del promedio de los niveles más altos del peso porcentual
del algodón (4 y 5), entonces la hipótesis habría sido
Ho:µ1 +µ2 = µ4 +µs
H1:µ1 +µ2 :¡é µ4 +µs
o
Ha:µ1+µ2-µ4-µs =0 (324)
H1: µ1 + µ 2 µ 4 µ s = O
En general, un contraste es una combinación lineal de parámetros de la forma
donde las constantes de los contrastes c1, c2, ... , c0 suman cero; es decir, ¿;;1c; =O. Las dos hipótesis ante
riores pueden expresarse en términos de contrastes:
H0:! ;~1
c;µ,=0
(325)
H¡: ! C¡µ¡ :¡é o
i=l
Las constantes de los contrastes para las hipótesis de la ecuación 323 son c1 c2 = = c3 = O, c4 = + 1 y c5 =
1, mientras que para las hipótesis de la ecuación 324 son c1 = c2 = + 1, c3 = O, y c4 = c5 = l.
3,5 INTERPRETACIÓN PRÁCTICA DE LOS RESULTADOS 91
Las pruebas de hipótesis que incluyen contrastes pueden hacerse de dos maneras básicas. En el pri
mer método se utiliza la prueba t. El contraste de interés se escribe en términos de los totales de los trata·
mientos, obteniéndose
C= ~e.y.
,L,.¡ ' '·
La varianza de C es
V(C)= na? !
j;l
e; (326)
cuando los tamaños de las muestras de cada tratamiento son iguales. Si la hipótesis nula de la ecuación
325 es verdadera, el cociente
~e.y.
,,L.¡ 1 '·
tiene la distribución N(O, 1 ). Entonces se sustituiría la varianza desconocida a2 con su estimación, el error
cuadrático medio MSE, y se utilizaría el estadístico
(327)
para probar las hipótesis de la ecuación 325. La hipótesis nula se rechazaría si 1t01 de la ecuación 327 ex
cede tan. N-o·
En el segundo enfoque se utiliza la prueba F. Entonces, el cuadrado de una variable aleatoria t con v
grados de libertad es una variable aleatoria F con un grado de libertad en el numerador y v grados de li
bertad en el denominador. Por lo tanto, puede obtenerse
F.O = t O2
(!
~·;_l~~
c,Y;.) 2
(328)
a
nMSEL e;
j;l
como un estadístico F para probar la ecuación 325. La hipótesis nula se rechazaría si F0 > Fa,l,N-a· Este es
tadístico de prueba de la ecuación 328 puede escribirse como
MSc SSc /1
F.=--=--
o MSE MSE
donde la suma de cuadrados de los contrastes con un solo grado de libertad es
SS
e
(= ....;.'t; c,y1_)2
1'
a (329)
nL e¡
j;¡
Intervalo de confianza para un contraste

En lugar de probar hipótesis acerca de un contraste, puede ser más útil construir un intervalo de confian
za. Entonces el contraste suele expresarse en términos de los promedios de los tratamientos Y;· Suponga
que el contraste de interés es
Al sustituir las medias de los tratamientos con los promedios de los tratamientos se obtiene
C= !
i=l
C¡Y;.
cuando los tamaños de las muestras son iguales. Si se usaMS E para estimar a2, el intervalo de confianza de
100(1 a) por ciento para el contraste 'L7=1c;µ; es
(330)
Evidentemente, si este intervalo de confianza incluye al cero, no podría rechazarse la hipótesis nula en la
ecuación 325.
Contraste estandarizado
Cuando hay interés en más de un contraste, con frecuencia es útil evaluarlos en la misma escala. Una for
ma de hacer esto es estandarizando el contraste para que su varianza sea o'. Si el contraste 'L7.1c,µ; se
c;
expresa en términos de los totales de los tratamientos como l::=1c;Y;., al dividirlo por Jn"L:=1 se obtendrá
un contraste estandarizado con varianza a2. Entonces el contraste estandarizado es en realidad
donde
Tamaños de las muestras desiguales

Cuando los tamaños de las muestras de cada tratamiento son diferentes, se introducen modificaciones
menores en los resultados anteriores. Primero, observe que la definición de un contraste requiere ahora
que
!i:w1
n;C¡ =0
3-5 INTERPRETACIÓN PRÁCTICA DE LOS RESULTADOS 93
Otros cambios requeridos son directos. Por ejemplo, el estadístico t de la ecuación 327 queda como
'{-, e.y .
..L,,.¡ t l.
to = ..,...,::::::::':::::·=¡ ===
MsE! n¡c;
;~1
y la suma de cuadrados de los contrastes de la ecuación 329 queda como
J .. 5.5 Contrastes ortogonales

Un caso especial útil del procedimiento de la sección 35.4 es el de los contrastes ortogonales. Dos con
trastes con coeficientes {e¡} y {d¡} son ortogonales si
o, para un diseño no balanceado, si
!
i~l
n.c.d, =O
Para a tratamientos, el conjunto de a - 1 contrastes ortogonales hace la partición de la suma de cuadrados

debida a los tratamientos en a 1 componentes independientes con un solo grado de libertad. Por lo tan
to, las pruebas que se realizan en los contrastes ortogonales son independientes.
Existen varias maneras de elegir los coeficientes de los contrastes ortogonales para un conjunto de
tratamientos. En general, algún elemento en la naturaleza del experimento deberá sugerir las compara
ciones que son de interés. Por ejemplo, si hay a = 3 tratamientos, donde el tratamiento 1 es de control y
donde los niveles del factor en los tratamientos 2 y 3 son de interés para el experimentador, los contrastes
ortogonales apropiados podrían ser los siguientes:
Coeficientes de los
TIatamiento contrastes ortogonales
1 (control) -2 o
2 (nivel 1) 1 1
3 (nivel 2) 1 1
Observe que el contraste 1 con e; = 2, 1, 1 compara el efecto promedio del factor con el control, mientras
que el contraste 2 con d, = O, 1, 1 compara los dos niveles del factor de interés.
En general, el método de contrastes (o de contrastes ortogonales) es útil para lo que se llama compa
raciones preplaneadas. Es decir, los contrastes se especifican antes de llevar a cabo el experimento y de
examinar los datos. La razón de esto es que, si las comparaciones se seleccionan después de examinar los
datos, la mayoría de los experimentadores construirían pruebas que corresponderían con las diferencias
grandes observadas en las medias. Estas diferencias grandes podrían ser el resultado de la presencia de
efectos reales o podrían ser el resultado del error aleatorio. Si los experimentadores se inclinan consisten
temente a escoger las diferencias más grandes para hacer las comparaciones, inflarán el error tipo I de la
prueba porque es probable que, en un porcentaje inusualmente elevado de las comparaciones selecciona
das, las diferencias observadas serán el resultado del error. Al examen de los datos para seleccionar las
comparaciones de interés potencial se le llama con frecuencia curioseo o sondeo de datos. El método de
Scheffé para todas las comparaciones, el cual se comenta en la sección siguiente, permite el curioseo o
sondeo de datos.
EJEMPLO 3 ~6 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Considere los datos del ejemplo 31. Hay cinco medias de los tratamientos y cuatro grados de libertad en
tre estos tratamientos. Suponga que antes de correr el experimento se· especificó la siguiente serie de
comparaciones entre las medias de los tratamientos (y sus contrastes asociados):
Hipótesis Contraste
Ho:µ4 =µs Ci = y4. + Ys.
Ho:µ1 + µ3 = µ4 + µs C2 = Yi. + h -Y4. -Ys.
Ho:µ1 =µ3 C3 = Y1. y3.
Ho:4µ2 = µ1 + µ3 + µ4 + µs C4 =y1.+4Y2. y3. Y4. -Ys.
Observe que los coeficientes de los contrastes son ortogonales. Utilizando los datos de la tabla 34, se en
cuentra que los valores numéricos de los contrastes y de las sumas de cuadrados son los siguientes:
(54)2
C=
1 1(108)+1(54) = 54 SSc, = 291.60
5(2)
(25)2
C2 =+1(49) + 1(88)1(108)1(54) = 25 SS e, = 31.25
5( 4)
C3 =+1(49) 1(88) =39 SS = (39) 2 152.10

e, 5(2)
C4 = 1( 49)+4(77)1(88)1(108)1(54) = 9 SS = (9)2 = 0.81

C4 5(20)
Tabla 311 Análisis de varianza de los datos de la resistencia a la tensión

variación cuadrados libertad medio Fo Valor P
Peso porcentual del algodón 475.76 4 118.94 14.76 <0.001
contrastes ortogonales
Ci:µ4 = µs (291.60) 1 291.60 36.18 <0.001
C2:µ1 + µ3 = µ4 + µs (31.25) 1 31.25 3.88 0.06
C3:µ1 =µ3 (152.10) 1 152.10 18.87 <0.001
C4:4µ2 =µ1+µ3+µ4+µs (0.81) 1 0.81 0.10 0.76
Error 161.20 20 8.06
Total 636.96 24
35 INTERPRETACIÓN PRÁCTICA DE WS RESULTAOOS 95
Estas sumas de cuadrados de los contrastes hacen la partición completa de la suma de cuadrados de los
tratamientos. Las pruebas de estos contrastes ortogonales se incorporan por lo general en el análisis de
varianza, como se muestra en la tabla 311. Por los valores P se concluye que hay diferencias significativas
entre los niveles 4 y 5 y 1 y 3 del peso porcentual del algodón, pero que el promedio de los niveles 1y3 no
difiere del promedio de los niveles 4 y 5 con el nivel a = 0.05, y que el nivel 2 no difiere del promedio de los
otros cuatro niveles .
.........................................................................
J ..5.6 Método de Scheffé para comparar todos los contrastes
En muchas situaciones, los experimentadores pueden no conocer de antemano cuáles son los contrastes
que quieren comparar, o pueden tener interés en más de a 1 posibles comparaciones. En muchos experi
mentos de exploración, las comparaciones de interés sólo se descubren después del examen preliminar de
los datos. Scheffé [98a] ha propuesto un método para comparar todos y cada uno de los contrastes posi
bles entre las medias de los tratamientos. En el método de Scheffé, el error tipo 1 es a lo sumo a para cual
quiera de las comparaciones posibles.
Suponga que se ha determinado un conjunto de m contrastes
ru = uµI +r,»,
C1 + ••• +c.,,µ
0 U= 1, 2, ... , m (331)
en las medias de los tratamientos de interés. El contraste correspondiente de los promedios de los trata
mientos Y;. es
Cu= C1uY1 +c2uY2. + ··· +c.,,.Ya. u= 1, 2, ... , m (332)
y el error estándar de este contraste es
Se.= MsE! (e! In;) (333)
donde n; es el número de observaciones en el tratamiento zésímo. Puede demostrarse que el valor crítico
contra el que deberá compararse Cu es
sa.u =Se • .J(a-l)Fa,a-1,N-a (334)
Para probar la hipótesis de que el contraste T, difiere de manera significativa de cero, se compara Cu con
el valor crítico. Si 1C"1 > S¿ "' se rechaza la hipótesis de que el contraste T, es igual a cero.
El procedimiento de Scheffé puede usarse también para formar intervalos de confianza para todos
los contrastes posibles entre las medias de los tratamientos. Los intervalos resultantes, por ejemplo C"
Sª"' s rus Cu+ Sa,u• son intervalos de confianza simultáneos por cuanto la probabilidad de que todos
ellos sean verdaderos simultáneamente es al menos 1 a.
Para ilustrar el procedimiento, considere los datos del ejemplo 31 y suponga que los contrastes de in
terés son
y
r2 = µ1 µ4
Los valores numéricos de estos contrastes son
c = Y1 +Y3. - Y4.
1
- Y5.
~
= 9.80+ 17.60 21.6010.80
=5.00
y
Cz = Y1 .Y4.
= 9.80 21.60
=11.80
y los errores estándar se encuentran con la ecuación 333 como
5
Se, = MSEL (e~/ n.) = .J8.06(1+1+1+1)/ 5 = 2.54

i:i¡¡¡l
y
5
Sc2 = MSEL (ct2 /n;)=.J8.06(1+1)/5=1.80

;~1
Por la ecuación 334, los valores críticos de 1 % son
SO.Ol,l = Sc 1 .J(a-1)Fo.ol,a-l,N-a = 2.54.J4( 4.43) = 10.69

y
s0.01,2 = SC2 .J(a- l)Fo.01,a1,Na = 1.80.J4( 4.43) = 7.58
Puesto que 1C11 < S0.01,1, se concluye que el contraste I', = µ1 + µ3 - µ4 µ5 es igual a cero; es decir, no
existe evidencia sólida para concluir que las medias de los tratamientos 1 y 3 como grupo difieren de las
medias de los tratamientos 4 y 5 como grupo. Sin embargo, como 1 C2 I > S0_01,2, se concluye que el contras
te r2:::: µ1 -µ4 no es igual a cero; es decir, las resistencias medias de los tratamientos 1y4 difieren signifi
cativamente.
En muchas situaciones prácticas, querrán compararse sólo pares de medias. Frecuentemente, es po
sible determinar cuáles son las medias que difieren probando las diferencias entre todos los pares de me
dias de los tratamientos. Por lo tanto, el interés se encuentra en los contrastes de la forma r = µ¡ - µj para·
toda i :;t: j. Aun cuando el método de Scheffé podría aplicarse fácilmente a este problema, no es el procedi
miento más sensible para tales comparaciones. Se pasa ahora a la consideración de los métodos diseñados
específicamente para las comparaciones por pares entre todas las a medias poblacionales.
35.7 Comparación de pares de medias de tratamientos

Suponga que el interés se encuentra en comparar todos los pares de a medias de tratamientos y que las hi
pótesis nulas que quieren probarse son H0:µ; = µj para toda i :;t: j. A continuación se presentan cuatro mé
todos para hacer estas comparaciones.
Prueba de Tukey
Suponga que, después de un análisis de varianza en el que se ha rechazado la hipótesis nula de la igualdad
de las medias de los tratamientos, quieren probarse todas las comparaciones de las medias por pares:
Ho:µ.=µ. J . 1
para toda i :;t: j. Thkey [llld] propuso un procedimiento para probar hipótesis para las que el nivel de sig
nificación global es exactamente a cuando los tamaños de las muestras son iguales y es a lo sumo a cuando
los tamaños de las muestras no son iguales. Este procedimiento puede usarse también para contraer los
intervalos de confianza para las diferencias en todos los pares de medias. Para estos intervalos, el nivel de
confianza simultáneo es de 100(1a) por ciento cuando los tamaños de las muestras son iguales y de al
menos 100(1 a) por ciento cuando los tamaños de las muestras no SO? iguales. Se trata de un procedi
miento excelente para curiosear sobre los datos cuando el interés se centra en pares de medias.
El procedimiento de Tukey hace uso de la distribución del estadístico del rango studentizado
donde YmáxYYm1n son las medias muestrales mayor y menor, respectivamente, sacadas de un grupo de p me
dias muestrales. La tabla VIII del apéndice contiene los valores de qª(p,f), los puntos porcentuales a su
periores de q, donde fes el número de grados de libertad asociados con MSe- Para tamaños de las
muestras iguales, la prueba de Tukey declara que dos medias son significativamente diferentes si el valor
absoluto de sus diferencias muestrales excede
{MS-;
t; = q,,(a,nv---;;- (335)
De manera equivalente, podría construirse una serie de intervalos de confianza de 100(1 a) por ciento
para todos los pares de medias de la siguiente manera:
(336)
Cuando los tamaños de las muestras no son iguales, las ecuaciones 335 y 336 quedan como
(337)
- _
Y;. -Y¡. -
q"(a,f)Fs
,.,,
-n E
¡1+ 1)
n. n¡
__
'5.µ¡ -µj '5.Y;. - Y¡.+
q,,(a,f)
,.,,
-n ME
¡1· 1) ..
S +
n. n¡
,l :¡e J (338)
respectivamente. A la versión para tamaños de las muestras diferentes se le llama en ocasiones el procedi
miento TukeyKramer.
EJEMPLO 3- 7 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Para ilustrar la prueba de Tukey, se usan los datos del experimento del peso porcentual del algodón del
ejemplo 31. Con a = 0.05 y f = 20 grados de libertad para el error, en la tabla VIII del apéndice se obtie
ne q0.05(5, 20) = 4.23. Por lo tanto, por la ecuación 335,
fMS:
I'ii.os =%.os (5, 20)v;; = 4.23v
[8.06
5=55.37

Y5. Yz. Y4.

10.8 15.4 21.6
Figura 312 Resultados de la prueba de Tukey.
Por lo tanto, cualquier par de promedios de los tratamientos que difieran en valor absoluto por más de
5.37 implicaría que el par correspondiente de medias poblacionales son significativamente diferentes.
Los cinco promedios de los tratamientos son
YL = 9.8 y2_ = 15.4 }\ = 17.6 .Y4. = 21.6 Ys. = 10.8

y las diferencias en los promedios son
.Y1 .Y2. = 9.815.4= 5.6*
JL -.Y3. = 9.817.6= 7.8*
.Y1 .Y4. = 9.821.6= 11.8*
Y1 .Ys. = 9.810.8= 1.0
Y2. - Y3. = 15.417.6= 2.2
.Y2. y4_ = 15.421.6= 6.2*
.Y2. - Ys. = 15.410.8= 4.6
Y3. .Y4. =17.621.6= 4.0
Y3. - .Ys. = 17.610.8= 6.8*
Y4. - .Ys. = 21.610.8= 10.8*
Los valores marcados con asterisco indican pares de medias que son significativamente diferentes. Suele
ser útil trazar una gráfica, como la de la figura 312, donde se subraya a los pares de medias que no difie
ren significativamente. Esta gráfica da una indicación de que las medias de los tratamientos forman tres
grupos: µ1 y µ5, µ2 y µ3, y µ4• Sin embargo, la pertenencia a estos grupos no es del todo clara. ·
Cuando se utiliza cualquiera de los procedimientos para probar las medias por pares, ocasionalmen
te se encuentra que la prueba F global del análisis de varianza es significativa, pero la comparación de las
medias por pares falla para revelar cualquier diferencia significativa. Esta situación ocurre porque la
prueba F considera simultáneamente todos los contrastes posibles en los que intervienen las medias de
los tratamientos, no sólo las comparaciones por pares. Es decir, en los datos a la mano, quizá no todos los
contrastes significativos sean de la forma µ; µ¡.
Algunos paquetes de software de computadora presentan comparaciones por pares con intervalos de
confianza. Para el procedimiento de Tukey, estos intervalos se calcularían con la ecuación 336o la 338,
dependiendo de si los tamaños de las muestras son iguales o no.
La deducción del intervalo de confianza de Tukey de la ecuación 336para tamaños de las muestras
iguales es directa. Para el estadístico del rango studentizado q se tiene
P(máx(Y;, µ, )mín(.Y;. µ,)

.JMSE In
-s q
a
(a
'
t))= 1a
Simáx{V¡. µ¡)~mín(Y¡. µ¡)es menor o igual queqª(a,f).JMSE In, debe ser verdadero que 1 {V¡. -µ¡)-(Vi. -
µ¡) 1 s qª(a, f) MS E / n para cada par de medias. Por lo tanto,
{MS; s Yi. - Ji¡.-(µ; -
P (-q,,(a,f}v---;;--n- µ¡
{MS;) = 1a
)sqª(a,f)..¡---;;--n-
Al reordenar esta expresión para aislar µ1 - µ¡ entre las desigualdades se llegará al conjunto de intervalos
de confianza simultáneos de 100(1 a) por ciento dado en la ecuación 338.
El método de la diferencia significativa mínima (LSD) de Fisher
En este procedimiento se utiliza el estadístico F para probar H0:µ¡ = µ¡
Y;. -.Y¡.
(339)
Suponiendo una hipótesis alternativa de dos colas, los pares de medíasu, yµ¡ se declararían significativa
mente diferentes si IYi. - Y¡.
I > tan. N_,,~ MS E (1 J n¡ + 1 J ni ). A la cantidad
LSD = t «n.s-« MS E ( ~¡ + :j ) (340)
se le llama diferencia significativa mínima. Si el diseño es balanceado, n1 = n2 = ··· = n, = n, y

f2MS; (341)
LSo = ta12.N-•v---;;-
Para usar el procedimiento LSD de Fisher, simplemente se compara la diferencia observada entre
cada par de promedios con la LSD correspondiente. Si IJ¡_ -Y¡.
I > LSD, se concluye que las medias pobla
cionales µ¡ y µ¡ difieren.
E)'EMPLO 3 .-8 · · · '! • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • •

Para ilustrar el procedimiento, si se usan los datos del experimento del ejemplo 31, la LSDcon a = 0.05 es
LSD = t ~2MSE = 2.086~2(8.06) = 3. 75

.02S,20 n 5
Por lo tanto, cualquier par de promedios de los tratamientos que difiera del valor absoluto por más de
3.75implicaría que el par correspondiente de medias poblacionales es significativamente diferente. Las
diferencias en los promedios son
Y1-Y2.= 9.815.4= 5.6*
Ji1Ji3_= 9.817.6= 7.8*
Y1 )i4_ = 9.8 21.6 = 11.8*
Y1 Ys. = 9.810.8= 1.0
Y2. - Ji3. = 15.417.6 = 22
Y2. - Ji4. = 15.421.6 = 6.2*
Y2. - Jis. = 15.410.8= 4.6*
Ji3. y4_ = 17.621.6= 4.0*
Y3. - Ys. = 17.610.8= 6.8*
.Y4• Ys. = 21.610.8= 10.8*
Y,. Ya.
9.8 17.6
Figura 313 Resultadosdel procedimientoLSD.
Los valores marcados con asterisco indican pares de medias que son significativamente diferentes.
En la figura 313 se resumen los resultados. Evidentemente, los únicos pares de medias que no difieren
.
significativamente son 1 y 5 y 2 y 3, y el tratamiento 4 produce una resistencia a la tensión significativa
mente mayor que los otros tratamientos .
...................................... ..................................
Observe que el riesgo global a puede inflarse de manera considerable al utilizar este método. Especí
ficamente, cuando a se hace más grande, el error tipo 1 del experimento (el cociente del número de expe
rimentos en los que se comete al menos un error tipo 1 y el número total de experimentos) se hace grande.
Prueba del rango múltiple de Duncan

Un procedimiento muy utilizado para comparar todos los pares de medias es la prueba del rango múltiple
desarrollada por Duncan [ 41]. Para aplicar la prueba del rango múltiple de Duncan cuando los tamaños
de las muestras son iguales, los a promedios de los tratamientos se arreglan en orden ascendente, y el
error estándar de cada promedio se determina como
s Y;. - (342)
Para tamaños de las muestras desiguales, se sustituyen en la ecuación 342 con la media armónica nh del
{n¡}, donde
a
nh = (3~43)
¿
a
(l/n¡)
j;l
= = ··· =
Observe que si n1 n2 nª' nh = n. En la tabla de Duncan de los rangos significativos (tabla VII
del apéndice) se obtienen los valoresra(p,f) parap = 2, 3, ... ,a, donde a es el nivel de significación y/ es el
número de grados de libertad del error. Estos rangos se convierten en un conjunto de a 1 rangos míni
mos de significación (por ejemplo, RP) para p = 2, 3, ... , a calculando
parap = 2, 3, ... , a (344)
Entonces, se prueban las diferencias observadas entre las medias, empezando con la más grande contra la
menor, la cual se compararía con el rango mínimo de significación Re Después se calcula la diferencia de
la mayor y la segunda menor y se compara con el rango mínimo de significación R._ 1. Estas comparacio
nes se continúan hasta que todas las medias se han comparado con la media mayor. Por último, se calcula
la diferencia entre la segunda media mayor y la menor y se compara con el rango mínimo de significación
R._1• Este proceso se continúa hasta que se han considerado las diferencias entre todos los a(a ~ 1)/2 pa
res de medias posibles. Si una diferencia observada es mayor que el rango de significación mínima corres
pondiente, se concluye que el par de medias en cuestión es significativamente diferente. Para evitar
contradicciones, ninguna de las diferencias entre un par de medias se considera significativa si las dos me
dias en cuestión se localizan entre otras dos medias que no difieren significativamente.
EJEMPLO 3 . . 9 · · · · · · · · -. · · · · · · · · · · · · · · · · · · · · · · · · · · • · · · · · · · · · · · · · · · · · · · · · · · · ·
La prueba del rango múltiple de Duncan puede aplicarse al experimento del ejemplo 3 l. Recuerde que
= =
MSE = 8.06, N 25, n 5, y hay 20 grados de libertad del error. Al arreglar los promedios de los trata
mientos en orden ascendente, se tiene
Y1 = 9.8
Ys. = 10.8
Y2. = 15.4
.Y3. = 17.6
Ji4. = 21.6
El error estándar de cada promedio es SY•. = v8.06/5 = 1.27. En el conjunto de rangos significativos de la .
tabla VII del apéndice para 20 grados de libertad y a "" O.OS, se obtiene r0.05(2, 20) = 2.95, r0.05(3, 20) =
3.10, r0.05(4, 20) = 3.18 y r0.05(5, 20) = 3.25. Por lo tanto, los rangos de significación mínima son
R2 = r0.05 (2, 20)S y, = (2. 95)(1.27) = 175
R3 =r0.05(3, 20)S.;;, =(110)(1.27)=3.94
R4 = r0.05 ( 4, 20)S y, = (118)(1.27) = 4.04
R5 =r005(5, 20)S;,, =(3.25)(1.27)=4.13
Los resultados de las comparaciones serían

4 vs, 1: 21.6 9.8 = 11.8 > 4.13 (R5)
4 vs. 5: 21.6 10.8 = 10.8 > 4.04 (R4)
4 vs. 2: 21.6 15.4 = 6.2 > 3.94 (R3)
4 vs. 3: 21.6 17.6 = 4.0 > 3.75 (R2)
3 vs. 1: 17.6 9.8 = 7.8 > 4.04 (R4)
3 vs. 5: 17.6 10.8 = 6.8 > 3.95 (R3)
3 vs. 2: 17.6 15.4 = 2.2 < 3.75 (R2)
2 vs. 1: 15.4 9.8 = 5.6 > 3.94 (R3)
2 vs. 5: 15.4 10.8 = 4.6 > 3.75 (R2)
5 vs. 1: 10.8 9.8 = 1.0 < 3.75 (R2)
Por el análisis se observa que hay diferencias significativas entre todos los pares de medias con excepción
de la 3 y la 2 y la5y la l. En lafigura314 se muestra una gráfica en la que esas medias que no son significa
tivamente diferentes aparecen subrayadas. Observe que en este ejemplo la prueba del rango múltiple de
Duncan y el método LSD llevan a conclusiones idénticas.
.Y,. Ys. Yz. J •.

9.8 10.8 16.4 21.6
Figura 314 Resultados de la prueba de rango múltiple de Duncan.

En la prueba del rango múltiple de Duncan se requiere una diferencia observada más grande para de
tectar pares significativamente diferentes de medias, cuando el número de medias incluidas en el grupo
aumenta. De esta forma, en el ejemplo anterior R2 = 3.75 (dos medias) mientras que R, = 3.94 (tres me
dias). Para dos medias, el valor crítico R2 será exactamente igual al valor LSD de la prueba t. Los valores
r0(p,f) de la tabla VII del apéndice se eligen de tal modo que se obtenga un nivel de protección especifi
cado. Es decir, cuando se comparan dos medias que están p pasos aparte, el nivel de protección es
· (1 ay1, donde a es el nivel de significación especificado para dos medias adyacentes. Por lo tanto, el ín
dice de error de reportar al menos una diferencia significativa incorrecta entre dos medias es 1 (1 a y1,
cuando el tamaño del grupo esp. Por ejemplo, si a= 0.05, entonces 1 (10.05)1 = 0.05 es el nivel de sig
nificación para comparar el par de medias adyacentes, 1 (1 0.05)2 = 0.10 es el nivel de significación
para medias que están un paso aparte, y así sucesivamente.
En general, si el nivel de protección es a, las pruebas de las medias tienen un nivel de significación
que es mayor o igual que a. Por consiguiente, el procedimiento de Duncan tiene una gran potencia; es de
cir, es muy eficaz para detectar diferencias entre medias cuando existen diferencias reales. Por esta razón,
la prueba del rango múltiple de Duncan es muy popular.
La prueba de NewmanKeuls
Esta prueba fue creada por Newman [90]. Debido a que un interés renovado en la prueba de Newman fue
generado por Keuls [64], al procedimiento se le llama la prueba de NewmanKeuls, Operacionalmente, el
procedimiento es similar a la prueba del rango múltiple de Duncan, salvo porque las diferencias críticas
entre las medias se calculan en una forma un tanto diferente. Específicamente, se calcula una serie de va
lores críticos
p=2, 3, ... ,a
donde qª(p,f) es el punto porcentual a superior del rango studentizado para grupos de medias de tamaño
p y conf grados de libertad del error. Una vez que se calculan los valoresx, con la ecuación 345, los pares
de medias extremos en los grupos de tamaño p se comparan conKP exactamente igual que en la prueba del
rango múltiple de Duncan.
lQué método de comparación por pares debe usarse?
Ciertamente, una pregunta lógica en este punto es qué método de comparación por pares debe usarse.
Desafortunadamente, no hay una respuesta precisa para esta pregunta, y los especialistas en estadística
están con frecuencia en desacuerdo en cuanto a la utilidad de los diferentes procedimientos. Carmer y
Swanson [24) han realizado estudios de simulación Montecarlo con varios procedimientos de compara
ciones múltiples, incluyendo algunos que no se han considerado aquí. Estos autores reportan que el mé
todo de la diferencia significativa mínima es una prueba muy eficaz para detectar diferencias reales en las
medias si se aplica sólo después de que la prueba F en el análisis de varianza sea significativa en 5%. Re
portan asimismo un buen desempeño en la detección de diferencias reales con la prueba del rango múlti
ple de Duncan. Esto no es motivo de sorpresa, ya que estos dos métodos son los más poderosos de los que
se han comentado aquí. Sin embargo, estos métodos no incluyen el índice de error en el modo del experi
mento. Debido a que el método de Tukey efectúa un control sobre el índice de error global, muchos expe
rimentadores prefieren su uso.
La prueba de NewmanKeuls es más conservadora que la prueba del rango múltiple de Duncan por
cuanto a que el índice de error tipo 1 es menor. Específicamente, el error tipo 1 del experimento es a para
todas las pruebas que incluyen el mismo número de medias. Por consiguiente, debido a que a es por lo ge
neral bajo, la potencia de la prueba de NewmanKeuls casi siempre es menor que la de la prueba del ran
go múltiple de Duncan. Para demostrar que el procedimiento de NewmanKeuls lleva a una prueba con
menor potencia que la prueba del rango múltiple de Duncan, se observa por una comparación de las ta
3.5 INTERPRETACIÓN PRÁCTICA DE LOS RESULTADOS 103
bias VII y VIII del apéndice que parap > 2 se tiene qª(pJ) > rª(p,f). Es decir, es "más dificil" declarar que
un par de medias es significativamente diferente al utilizar la prueba de NewmanKeuls que cuando se
usa el procedimiento de Duncan, Esto se ilustra a continuación para el caso en que a = 0.01, a = 8 yf = 20:
p 2 3 4 5 7 8
4.02 4.22 4.33 4.40 4.47 4.53 4.58
4.02 4.64 5.02 5.29 5.51 5.69 5.84
Como se señaló antes, existen otros procedimientos de comparaciones múltiples. Algunos artículos
que describen estos métodos son los de Miller (78], O'Neill y Wetherill [91] y Nelson [89]. Tumbién se re
comienda el libro de Miller [77].
35.8 Comparación de medias de tratamientos con un control
En muchos experimentos, uno de los tratamientos es un control, y el analista se interesa en comparar
cada una de las medias de losa 1 tratamientos restantes con el control. Por lo tanto, sólo es necesario ha
cer a - 1 comparaciones. Un procedimiento para hacer estas comparaciones ha sido desarrollado por
Dunnett [42]. Suponga que el tratamiento a es el control y que quieren probarse las hipótesis
Ho:µ¡ = u,
H1:µ; ;t: µª
para i = 1, 2, ... , a - l. El procedimiento de Dunnett es una modificación de la prueba t común. Para cada
hipótesis se calculan las diferencias observadas en las medias muestrales
i = 1, 2, ... , a 1
La hipótesis nula H0-.µ; = µ. se rechaza utilizando un índice a de error tipo 1 si
(346)
donde la constante da(a 1,f) se da en la tabla IX del apéndice. (Pueden hacerse pruebas tanto de una
como de dos colas.) Observe que a es el nivel de significación conjunto asociado con las a 1 pruebas.
EJEMPLO 3-10 · · · · "· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · • · · ·

Para ilustrar la prueba de Dunnett, considere el experimento del ejemplo 31, asumiendo que el trata
miento 5 es el control. En este ejemplo, a = 5, a 1 = 4,f = 20 y n¡ = n = 5. Con el nivel de 5%, en la tabla
IX del apéndice se encuentra que d0.05(4, 20) = 2.65. Por lo tanto, la diferencia crítica es
d (4, 20)~ZMSE = 265~2.(,8.06) = 4.76

~~ n 5
(Observe que se trata de una simplificación de la ecuación 346 que resulta de un diseño balanceado.) Por
lo tanto, cualquier media de los tratamientos que difiera del control por más de 4.76 se declararía signifi
cativamente diferente. Las diferencias observadas son
1 vs. 5: .Yi. .Ys. = 9.8 10.8= t.o

2 vs. s: .Y2 Ys. = 15.4 10.8= 4.6
3 vs. S: Y3. Y5. = 17.6 10.8= 6.8
4 vs. 5: .Y4. Ys = 21.6 10.8= 10.8
Sólo las diferencias ji3_ ji5_ y ji4. -.Ys. indican alguna diferencia significativa cuando se comparan con el con
trol; por lo tanto, se concluye que µ3 *- µ5 y µ4 *- µ5.
Cuando se hace la comparación de los tratamientos con un control, una buena idea es usar más obser
vaciones para el tratamiento de control (por ejemplo, na) que para los demás tratamientos (por ejemplo,
n ), suponiendo un número igual de observaciones para los a - 1 tratamientos restantes. El cociente n0/n
deberá elegirse de tal modo que sea aproximadamente igual a la raíz cuadrada del número total de trata
mientos. Es decir, se elige n.ln = Ya.
............................................................. ~ .
J.. 6 MUESTRA DE SALIDA DE COMPUTADORA
Hay una gran cantidad de programas de computadora para apoyar el diseño experimental y la realización
de análisis de varianza. En la figura 315 se muestra la salida de uno de estos programas, Design-Expert,
utilizando los datos del experimento con un solo factor del ejemplo 31. La suma de cuadrados correspondien
te al "Modelo" ("Model") es la SS.natamienros usual de un diseño con un solo factor. Esa fuente se identifica adi
cionalmente como ''A". Cuando hay más de un factor en el experimento, la suma de cuadrados ("Sum of
Squares") del modelo se descompondrá en varias fuentes (A,B, etc.). Observe que el resumen del análisis
de varianza de la parte superior de la salida de computadora contiene las sumas de cuadrados, los grados de
libertad ("DF", degrees of freedom), los cuadrados medios ("Mean Square") y el estadístico de prueba F¿
("F Value") acostumbrados. La columna "Prob > F" es el valor P (de hecho, el límite superior del valor P,
ya que a las probabilidades menores que 0.0001 se les asigna el valor por omisión 0.0001).
Además del análisis de varianza básico, el programa presenta información adicional útil. La cantidad
"R cuadrada" ("RSquared") se define como
R2 = SSModelo = 475.76 =
0_746923
SS Total 636.96
y se interpreta en términos generales como la proporción de la variabilidad en los datos "explicada" por el
modelo del análisis de varianza. Por lo tanto, en los datos para probar la resistencia de la fibra sintética, el
factor "peso porcentual del algodón" explica cerca de 74.69% de la variabilidad en la resistencia a la ten
sión. Evidentemente, debe tenerse O s R2 s 1, siendo más deseables los valores más grandes. En la salida
se presentan también otros estadísticos en R2• R2 "ajustada" (''Adj RSquared") es una variante del esta
dístico R2 común que refleja el número de factores presentes en el modelo. Puede ser un estadístico útil
en experimentos más complejos en los que intervienen varios factores en el diseño, cuando quiere eva
luarse el impacto de aumentar o disminuir el número de términos del modelo. "Desviación estándar"
("Std. Dev.") es la raíz cuadrada del cuadrado medio del error, v'S.060 = 2.839, y "C.V" es el coeficiente
.J
de variación, definido como ( MS E / y)lOO. El coeficiente de variación mide la variabilidad no explicada
o residual de los datos como un porcentaje de la media ("Mean") de la variable de respuesta. "PRESS"
son las siglas de Prediction Error Sum of Squares (suma de cuadrados del error de predicción) y es una me·
dida de la adecuación con que es posible que el modelo del experimento predecirá las respuestas en un
nuevo experimento. Son deseables valores pequeños de PRESS. Alternativamente, puede calcularse una
R2 para predicciones con base en PRESS (más adelante se indicará cómo hacer esto). Esta R~.d ("Pred
RSquared") para el problema tratado aquí es 0.6046, el cual no es irrazonable, considerando que el mo
delo explica cerca de 75% de la variabilidad del experiinento en curso. El estadístico "Predicción adecua
da" (''Adeq Precision") se calcula dividiendo la diferencia entre la respuesta predicha máxima y la
respuesta predicha mínima por la desviación estándar promedio de todas las respuestas predichas. Son
deseables valores grandes de esta cantidad, y los valores que exceden cuatro indican por lo general que el
modelo tendrá un desempeño razonable en la predicción.
Utilice el mouse para posicionarse en una celda y su definición.
Response: Strength in psi

ANOVA for Selected Factorial Model
Analysis of varlance table [Par1tial sum of squares]
Sumof Mean F
So urce Squares DF Square Value Prob > F
Model 475.76 4 118.94 14.76 <0.0001 significativo
A 475.76 4 118.94 14.76 <0.0001
Residual 161.20 20 8.06
Lackof Fit 0.000 o
Pure Error 161.20 20 8.06
Cor Total 636.96 24
El valor F del Modelo de 14.76 implica que el modelo es significativo. Sólo hay una probabilidad de
001 % de que un "Valor F del Modelo" de esta magnitud pudiera ocurrir debido a ruido.
Los valores de "Prob > P' menores que 0.0500 indican que los términos del modelo son significativos.
En este caso A son términos significativos del modelo.
Los valores mayores que 0.1000 indican que los términos del modelo no son significativos.
Si hay muchos términos del modelo no significativos (sin contar los que se necesitan para apoyar
la jerarquización), la reducción del modelo puede mejorarlo.
Std. Dev. 2.84 RSquared 0.7469

Mean 15.04 Adj RSquared 0.6963
c.v. 18.88 Pred RSquared 0.6046
PRESS 251.88 Adeq Precision 9.294
La "R cuadrada predicha" de 0.6046 concuerda razonablemente con la "R cuadrada aíustada" de
0.6983. Una diferencia mayor que 0.20 entre la "R cuadrada predicha" y la "R cuadrada ajustada"
indica un posible problema con el modelo y/o los datos.
"Precisión adecuada" mide la relación de la señal a ruido. Es deseable una relación mayor que 4.
La relación de 9.294 indica una señal adecuada para usar este modelo para navegar el espacio
del diseño.
Treatment Means (Adjustecl. lf Necasaaryl

Estlmated Standard
Mean Error
115 9.80 1.27
220 15.40 1.27
326 17.60 1.27
430 21.60 1.27
535 10.80 1.27
Mean Standard tfor Ha

Treatment Difference DF Error Coeff=O Prob > [t]
1VS2 5.60 1 1.80 3.12 0.0054
1VS3 7.80 1 1.80 4.34 0.0003
1vs4 11.80 1 1.80 6.67 <0.0001
1vs5 1.00 1 1.80 0.56 0.68~
2 VS 3 2.20 1 1.80 1.23 0.2347
2 vs4 6.20 1 1.80 3.45 0.0025
2 VS 5 4.60 1 1.80 2.56 0.0186
3 vs4 4.00 1 1.80 2.23 0.0375
3 vs 5 6.80 1 1.80 3.79 0.0012
4vs 5 10.80 1 1.80 6.01 <0.0001
Los valores de "Prob > 1 t I" menores que 0.0500 indican que la diferencia en las medias de los
dos tratamientos es significativa.
Los valores de "Prob > ltl" mayores que 0.1000 indican que la diferencia en las medias de los
dos tratamientos no es significativa.
Figura 315 Salida de computadora de Design-Expert para el ejemplo 31.
Diagnostic Case Statistlcs

Standard Actual Predicted Student Cook's
Order Value Value Residual Leverage Residual Distan ce Outlier t
1 7.00 9.80 2.80 0.200 1.103 0.061 .,...1.109
2 7.00 9.80 2.80 0.200 1.103 0.061 1.109
3 15.00 9.80 5.20 0.200 2.048 0.210 2.245
4 11.00 9.80 1.20 0.200 0.473 0.011 0.463
5 9.00 9.80 0.80 0.200 0.315 0.005 0.308
6 12.00 15.40 3.40 0.200 1.339 0.090 1.368
7 17.00 15.40 1.60 0.200 0.630 0.020 0.620
8 12.00 15.40 3.40 0.200 1.339 0.090 1.368
9 18.00 15.40 2.60 0.200 1.024 0.052 1.025
10 18.00 15.40 2.60 0.200 1.024 0.052 1.025
11 14.00 17.60 3.60 0.200 1.418 0.100 1.457
12 18.00 17.60 0.40 0.200 0.158 0.001 0.154
13 18.00 17.60 0.40 0.200 0.158 0.001 0.154
14 19.00 17.60 1.40 0.200 0.551 0.015 0.542
15 19.00 17.60 1.40 0.200 0.551 0.015 0.542
16 19.00 21.60 2.60 0.200 1.024 0.052 1.025
17 25.00 21.60 3.40 0.200 1.339 0.090 1.368
18 22.00 21.60 0.40 0.200 0.158 0.001 0.154
19 19.00 21.60 2.60 0.200 1.024 0.052 1.025
20 23.00 21.60 1.40 0.200 0.551 0.015 0.542
21 7.00 10.80 3.80 0.200 1.496 0.112 1.548
22 10.00 10.80 0.80 0.200 0.315 0.005 0.308
23 11.00 10.80 0.20 0.200 0.079 0.000 0.077
24 15.00 10.80 4.20 0.200 1.654 0.137 1.735
25 11.00 10.80 0.20 0.200 0.079 0.000 0.077
Proceder con las gráficas de diatinóstico (el icono siguiente en progresión). Asegurarse de examinar:
1) La gráfica de probabilidad normal de los residuales studentizados para verificar la normalidad
de los residuales.
2) Los residuales studentizados contra los valores predichos para verificar la constante del error.
3) Los puntos atípicos t contra el orden de las corridas para buscar puntos atípicos,
es decir, valores influyentes o importantes
4) La gráfica de BoxCox para las transformaciones de potencia.
Si todos los estadísticos del modelo y las gráficas de diagnóstico están correctos, finalizar con el icono
Model Graphs (Gráficas del Modelo).
Figui:a 315 (Continuación.)
Se hace la estimación de las medias ("Estimated Mean") de los tratamientos y se muestra el error es
tándar ("Standard Error") (o desviación estándar muestra! de la media de cada tratamiento, MS E / n). .J
Las diferencias entre pares de medias ("Mean Difference") de los tratamientos se investigan utilizando el
método LSD de Fisher descrito en la sección 35.7.
El programa de computadora también calcula y despliega los residuales, según se definen en la ecua
ción 316. El programa producirá también todas las gráficas de los residuales que se comentaron en la sec
ción 34. En la salida se muestran asimismo varios diagnósticos residuales más. Algunos de ellos se
revisarán más adelante.
Por último, observe que el programa de computadora incluye también algunas guías para hacer la in
terpretación. Esta información "aconsejable" es muy común en muchos paquetes de estadística para
computadoras personales. Al leer estas guías, recuerde que están escritas en términos muy generales, y
quizá no se ajusten exactamente a los requerimientos de redacción del reporte de un experimentador par
ticular. Esta salida aconsejable puede ser eliminada por el usuario.
3 7 DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA 107
3 .. 7 DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA
En cualquier problema de disefi.o experimental, una decisión crítica es la elección del tamafi.o de la mues
tra; es decir, determinar el número de réplicas que deben correrse. En general, si el experimentador tiene
interés en detectar efectos pequeños, se necesitan más réplicas que cuando el experimentador seinteresa
en detectar efectos grandes. En esta sección se analizan varios enfoques para determinar el tamaño de la
muestra. Aun cuando la revisión se centra en un diseño con un solo factor, la mayoría de los métodos pue
den usarse en situaciones experimentales más complejas.
3.. 7 .1 Curvas de operación característica

Recuerde que una curva de operación característica es una gráfica de la probabilidad del error tipo II de
una prueba estadística para un tamaño de la muestra particular contra un parámetro que refleja la medi
da en que la hipótesis nula es falsa. El experimentador puede usar estas curvas como guía en la selección
del número de réplicas para que el diseño sea sensible a diferencias potenciales importantes en los trata
mientos.
Se considera la probabilidad del error tipo II del modelo con efectos fijos para el caso en que se usa el
mismo tamaño de las muestras en cada tratamiento, por ejemplo
P= 1P{Rechazar H IH es falsa}
0 0
(347)
= 1 P{ F > Fa,a-i,N-•I H es falsa}
0 0
Para evaluar el enunciado de probabilidad de la ecuación 347, es necesario conocer cuál es la distribu
ción del estadístico de pruebaF, si la hipótesis nula es falsa. Puede demostrarse que, si H0 es falsa, el esta
=
dístico F0 MSn.wme11ioJMSE se distribuye como una variable aleatoria F no central con a - 1 y N - a
grados de libertad y parámetro de no centralidad o. Si o = O, la distribución F no central se convierte en la
distribución F (central) común.
Las curvas de operación característica que se presentan en la parte V del apéndice se usan para eva
luar el enunciado de probabilidad de la ecuación 347. En estas curvas se grafica la probabilidad del error
tipo II (/J) contra un parámetro , donde
n~ ri
<1>2 = '1==· (348)
ªª2
La cantidad <1>2 está relacionada con el parámetro de no centralidad o. Se cuenta con curvas para a = 0.05
y a = 0.01 y un rango de grados de libertad para el numerador y el denominador.
Al usar las curvas de operación característica, el experimentador debe especificar el parámetro .
Con frecuencia es difícil hacer esto en la práctica. Una manera de determinar es elegir los valores reales
de las medias de los tratamientos para los que querría rechazarse la hipótesis nula con una alta probabili
dad. Por lo tanto, siµ1,µ2, ... ,µ0 son las medias de los tratamientos especificadas, la T:¡ de la ecuación 348
se encuentra como t¡ =µ¡-"ji, donde ji = (1/a )I~=l =¡µ¡es el promedio de las medias de los tratamientos
individuales. Se requiere asimismo una estimación de a2. En ocasiones se cuenta con este valor por expe
riencia previa, un experimento anterior o una prueba preliminar (como se sugirió en el capítulo 1 ), o por
una estimación discrecional. Cuando no se tiene la seguridad acerca del valor de a', los tamaños de las
muestras podrían determinarse para un rango de valores posibles de a2, a fin de estudiar el efecto de este
parámetro sobre el tamaño de la muestra requerido, antes de hacer la elección final.
EJEMPLO 3-11 · · · · · · · · · · · · · · · · · · · · · • · · • · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Considere el experimento de la resistencia a la tensión descrito en el ejemplo 31. Suponga que el experi
mentador está interesado en rechazar la hipótesis nula con una probabilidad de al menos 0.90 si las me
dias de .Ios cinco tratamientos son
y
Planea utilizar a = 0.01. En este caso, puesto que I:.~.,1µ1 = 75, se tiene ji = (1/5)75 = 15 y
1'1=µ1µ=1115=4
1'2 =µ2µ=1215=3
'l' 3 = µ3 µ = 1515 = o
r 4 = µ4 µ = 1815 = 3
1'5 =µ5-µ=19-15= 4
Por lo tanto, I:. ~.. 11'; = 50. Suponga que el experimentador piensa que la desviación estándar de la resis
tencia a la tensión con cualquier nivel particular del peso porcentual del algodón no será mayor que a=3
psi. Entonces, al utilizar la ecuación 348, se tiene
s
n~ t'2
~ ' n(50)
cf>2 = iml = = l.lln
ªª2 5(3)2
Se usa la curva de operación característica para a - 1 = 5 1 = 4 con N - a = a(n - 1) = 5(n 1) grados de

libertad del error y a = 0.01 (ver la parte V del apéndice). Como primera conjetura para el tamaño de la
muestra requerido, se prueba con n = 4 réplicas. Esto produce cf>2 = 1.11(4) = 4.44, et> = 2.11y5(3) = 15
grados de libertad del error. Por consiguiente, en la parte V se encuentra que p =0.30. Por lo tanto, lapo
tencia de la prueba es aproximadamente 1-P = 10.30 = 0.70, que es menor que el 0.90 requerido, por
lo que se concluye que n = 4 réplicas no son suficientes. Procediendo de manera similar, puede construir
se la siguiente tabla:
n a(n 1) /3 Potencia (1 /3)

4 4.44 2.11 15 0.30 0.70
5 5.55 2.36 20 0.15 0.85
6 6.66 2.58 25 0.04 0.96
Por lo tanto, deben realizarse al menos n = 6 réplicas para ootener una prueba con la potencia requerida.
El único problema con este enfoque para usar las curvas de operación característica es que por lo general
es difícil seleccionar el conjunto de las medias de los tratamientos en el que se basará la decisión del tama
ño de la muestra. Un enfoque alternativo es seleccionar un tamaño de la muestra tal que si la diferencia
entre las medias de dos tratamientos cualesquiera excede un valor especificado, la hipótesis nula deberá
rechazarse. Si la diferencia entre las medias de dos tratamientos cualesquiera es tan grande como D, pue
de demostrarse que el valor mínimo de ct>2 es
ct>2 = nD2
2aa2
3 7 DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA 109
Puesto que éste es un valor mínimo de cI>2, el tamaño de la muestra correspondiente que se obtiene de la
curva de operación característica es un valor conservador; es decir, proporciona una potencia al menos
tan grande como la que especificó el experimentador.
Para ilustrar este enfoque, suponga que en el experimento de la resistencia a la tensión del ejemplo
31, el experimentador quisiera rechazar la hipótesis nula con una probabilidad de al menos 0.90 si las me
dias de dos tratamientos cualesquiera difieren hasta en 10 psi. Entonces, suponiendo que a 3 psi, se en =
cuentra que el valor mínimo de cI>2 es
cI>2 = n(10)2
l.lln
2(5)(32)
y, por el análisis del ejemplo 3U, se concluye que se necesitan n = 6 réplicas para obtener la sensibilidad
deseada cuando a = 0.01.
3 .. 7 .2 Especificación de un incremento de la desviación estándar

Este enfoque es útil en ocasiones para elegir el tamaño de la muestra. Si las medias de los tratamientos no
difieren, la desviación estándar de una observación elegida al azar es a. Sin embargo, si las medias de los
tratamientos son diferentes, la desviación estándar de una observación elegida al azar es
a 2 +(! r; ¡a)
.~1
Si se escoge un porcentaje P para el incremento de la desviación estándar de una observación, más allá del
cual quiera rechazarse la hipótesis de que las medias de todos los tratamientos son iguales, esto es equiva
lente a escoger
a2 +(! r? ¡a)
'"'1 =1+0.0lP (P=porciento)
a
o
de donde
el>= (350)
Por lo tanto, para un valor especificado de P, cI> puede calcularse con la ecuación 350 y después usar las
curvas de operación característica de la parte V del apéndice para determinar el tamafio de la muestra re
querido.
Por ejemplo, en el experimento de la resistencia a la tensión del ejemplo 31, suponga que se desea
detectar un incremento de la desviación estándar de 20% con una probabilidad de al menos 0.90 y a =
0.05. Entonces
= ~(1.2)2 1( Frz) = 0.66,./Tz
La referencia a las curvas de operación característica indica que se necesitan = 9 para obtener la sensibi
lidad deseada.
3 .. 7 .3 Método para estimar el intervalo de confianza

En este enfoque se supone que el experimentador quiere expresar los resultados finales en términos de
intervalos de confianza y que está dispuesto a especificar por anticipado cuál es el ancho que desea para
estos intervalos de confianza. Por ejemplo, suponga que en el experimento de la resistencia a la tensión
del ejemplo 31 se quiere que un intervalo de confianza de 95% para la diferencia en la resistencia a la
tensión media de dos pesos porcentuales del algodón cualesquiera sea ± 5 psi y una estimación previa de a
es 3. Entonces, al utilizar la ecuación 313, se encuentra que la precisión del intervalo de confianza es
±t «n.s-«
Suponga que se prueba con n = 5 réplicas. Entonces, al usar a2 = 32 = 9 como una estimación de MSE• la
precisión del intervalo de confianza es
±2.086~~) ""'±3.96
que es más preciso que el requerimiento. Al probar con n = 4 se obtiene
±2132~2::) = ±4.52
Al probar con n = 3 se obtiene
±2.22~=±5.46
Evidentemente, n = 4 es el tamaño de la muestra menor que llevará a la precisión deseada.

El nivel de significación consignado en el ejemplo anterior se aplica a un solo intervalo de confianza.
Sin embargo, puede usarse el mismo enfoque general si el experimentador desea especificar de antemano
un conjunto de intervalos de confianza acerca del cual se hace un enunciado de confianza simultáneo o
conjunto (ver los comentarios acerca de los intervalos de confianza simultáneos de la sección 33.3). Ade
más, los intervalos de confianza podrían construirse con respecto a contrastes más generales en las me
dias de los tratamientos, que la comparación por pares ilustrada antes.
3 .. a IDENTIFICACIÓN DE EFECTOS DE DISPERSIÓN
Nos hemos enfocado aquí en el uso del análisis de varianza y de otros métodos relacionados para determi
nar los niveles del factor que resultan en diferencias entre las medias de los tratamientos o los niveles del
factor. Se acostumbra referirse a estos efectos como efectos de localización. Cuando ocurrió la desigual
38 IDENTIFICACIÓN DE EFECTOS DE DISPERSIÓN 111
Tabla 312 Datos del experimento de fundición
Algoritmo para Observaciones
controlar la 1 2 3 4 5 6
proporción
1 4.93(0.05) 4.86(0.04) 4.75(0.05) 4.95(0.06) 4.79(0.03) 4.88(0.05)
2 4.85(0.04) 4.91(0.02) 4.79(0.03) 4.85(0.05) 4.75(0.03) 4.85(0.02)
3 4.83(0.09) 4.88(0.13) 4.90(0.11) 4.75(0.15) 4.82(0.08) 4.90(0.12)
4 4.89(0.03) 4.77(0.04) 4.94(0.05) 4.86(0.05) 4.79(0.03) 4.76(0.02)
dad de la varianza con los diferentes niveles del factor, se utilizaron transformaciones para estabilizar la
varianza y mejorar así las inferencias hechas sobre los efectos de localización. Sin embargo, en algunos
problemas el interés se centra en descubrir si los diferentes niveles del factor afectan la variabilidad; es
decir, el interés está en descubrir efectos de dispersión potenciales. Esto ocurrirá siempre que la desvia
ción estándar, la varianza o cualquier otra medida de la variabilidad se use como variable de respuesta:
Para ilustrar estos conceptos, considere los datos de la tabla 312, los cuales se obtuvieron de un expe
rimento diseñado en una fundición de aluminio. El aluminio se produce combinando alúmina con otros
ingredientes en una celda de reacción y aplicando calor al hacer pasar una corriente eléctrica a través de
la celda. La alúmina se agrega de manera continua a la celda para mantener la proporción apropiada de la
misma con respecto a los otros ingredientes. En este experimento se investigaron cuatro algoritmos para
controlar la proporción. Las variables de respuesta estudiadas se relacionaron con el voltaje de la celda.
Específicamente, un sensor registra el voltaje de la celda varias veces cada segundo, produciendo miles de
mediciones del voltaje durante cada corrida del experimento. Los ingenieros del proceso decidieron usar
como variables de respuesta el voltaje promedio y la desviación estándar del voltaje de la celda (indicado
entre paréntesis) en la corrida experimental. El voltaje promedio es importante porque afecta la tempe
ratura de la celda, y la desviación estándar del voltaje (llamada "ruido del crisol" por los ingenieros del
proceso) es importante porque afecta la eficiencia global de la celda.
Se llevó a cabo un análisis de varianza para determinar si los diferentes algoritmos para controlar la
proporción afectan el voltaje promedio de la celda. Éste reveló que el algoritmo para controlar la propor
ción no tuvo ningún efecto de localización; es decir, al cambiar los algoritmos para controlar la propor
ción no hubo ningún cambio en el voltaje promedio de la celda. (Referirse al problema 328.)
Para investigar los efectos de dispersión, lo mejor suele ser utilizar
log(s) o log(s 2)
como variable de respuesta, ya que la transformación logarítmica es eficaz para estabilizar la variabilidad
en la distribución de la desviación estándar muestral, Puesto que todas las desviaciones estándar del vol
taje del crisol son menores que la unidad, se usará
y= ln(s)
como la variable de respuesta. En la tabla 313 se presenta el análisis de varianza para esta respuesta, el
logaritmo natural del "ruido del crisol". Observe que la elección de un algoritmo para controlar la pro
porción afecta el ruido del crisol; es decir, el algoritmo para controlar la proporción tiene un ef~cto de dis·
Tabla 3.13 Análisis de varianza del logaritmo natural del ruido del crisol
Fuente de variación cuadrados libertad medio Valor P
Algoritmo para controlar la proporción 6.166 3 2.055 21.96 <0.001
Error 1.872 20 0.094
Tu tal 8.038 23
3 4 2
2.00 3.00 4.00
Ruido del crlsol logaritmico promedio [1n (Sil
Figura 316 Ruido del crisol logarítmico promedio [ln(s)J de

cuatro algoritmos para controlar la proporción en relación con una
distribución t escalada con factor de escalamiento MS B / n J =
J0.094 / 6 = 0.125.
persión. Las pruebas estándares de la adecuación del modelo, incluyendo las gráficas de probabilidad
normal de los residuales, indican que no hay problemas con la validez del experimento. (Referirse al pro
blema 329.)
En la figura 316 se grafica el logaritmo promedio del ruido del crisol de cada algoritmo para controlar
la proporción y se presenta también una distribución t escalada que se usa como distribución de referencia
para discriminar entre los algoritmos de la proporción. Esta gráfica revela con toda clarid_ad que el algorit
mo 3 para controlar la proporción produce más ruido del crisol o una desviación estándar del voltaje de la
celda mayor que los otros algoritmos. No parece haber gran diferencia entre los algoritmos 1, 2 y 4.
3.. 9 EL ENFOQUE DE REGRESIÓN PARA EL ANÁLISIS DE VARIANZA
Se ha ofrecido un desarrollo intuitivo o heurístico del análisis de varianza. Sin embargo, es posible pre
sentar un desarrollo más formal. El método será de utilidad más adelante para entender los fundamentos
del análisis estadístico de diseños más complejos. Llamada la prueba general de significación de la regre
sión, el procedimiento consiste en esencia en encontrar la reducción en la suma de cuadrados total para
ajustar el modelo con todos los parámetros incluidos y la reducción en la suma de cuadrados cuando el
modelo se restringe a la hipótesis nula. La diferencia entre estas dos sumas de cuadrados es la suma de
cuadrados de los tratamientos con la que puede realizarse la prueba de la hipótesis nula. El procedimien
to requiere los estimadores de mínimos cuadrados de los parámetros en el modelo del análisis de varian
za. Se dieron ya (en la sección 33.3) las estimaciones de estos parámetros; sin embargo, ahora se presenta
un desarrollo formal.
3~9.1 Estimación de mínimos cuadrados de los parámetros del modelo

Se desarrollan ahora los estimadores de los parámetros en el modelo con un solo factor
utilizando el método de mínimos cuadrados. Para encontrar los estimadores de mínimos cuadrados deµ y
t¡, primero se forma la suma de cuadrados de los errores
(351)
39 EL ENFOQUE DE REGRESIÓN PARA EL ANÁLISIS DE VARIANZA 113
y se eligen después los valores deµ y r1, por ejemplo y f;, que minimicen L. Los valores adecuados serían
ü
las soluciones de las a + 1 ecuaciones simultáneas
aLI o
aµ;..•,
i = 1, 2, ... , a
Al derivar la ecuación 351 con respecto a µ y f¡ y al igualar con cero se obtiene
2!! (yijP,f1)=0
;~1 j~l
2! (yqP,í\)=0 i = 1, 2, ... , a

i'"l
de la que, después de simplificar, se obtiene

Nis+ni ; +nf2 + ... +nfª =Y..
(352)
np,
A las a + 1 ecuaciones (ecuación 352) con a + 1 incógnitas se les llama las ecuaciones normales de
mínimos cuadrados. Observe que si se suman la últimas a ecuaciones normales, se obtiene la primera
ecuación normal. Por lo tanto, las ecuaciones normales no son linealmente independientes, y no existe una
solución única paraµ, r1, ••• , r0• Esta dificultad puede superarse mediante varios métodos. Puesto que los
efectos de los tratamientos se han definido como desviaciones de la media global, parece razonable apli
car la restricción
(353)
Utilizando esta restricción, se obtiene como solución de las ecuaciones normales

ft=Y . (354)
f¡ =Y;_ --Y. i=l,2, ...,a
Evidentemente, esta solución no es única y depende de la restricción (ecuación 353) que se ha elegi
do. Al principio esto puede parecer desafortunado porque dos experimentadores diferentes podrían ana
lizar los mismos datos y obtener resultados diferentes si aplican restricciones diferentes. Sin embargo,
ciertas funciones del parámetro del modelo son estimadas de manera única, independientemente de la
=
restricción. Algunos ejemplos son e¡ - r¡. que se estimaría con i'; - f i Yi. - y1 .: , y la media del tratamien
=
to iésimo µ¡ µ + 't;, que se estimaría con fi.1 Ji.+ i'; Y; .: = =
Puesto que el interés se encuentra generalmente en las diferencias entre los efectos de los tratamien
tos y no en sus valores reales, no produce preocupación alguna que r; no pueda estimarse de manera üní
114 CAPÍTULO 3 EXPERlMENTOS CON UN SOLO FACTOR: EL ANÁLISIS DE VARIANZA
ca. En general, cualquier función de los parámetros del modelo que sea una combinación lineal del
miembro del lado izquierdo de las ecuaciones normales (ecuaciones 352) puede estimarse de manera
única. A las funciones que se estiman de manera única independientemente de la restricción que se use se
les llama funciones estimables. Para más información, ver el material suplementario del texto de este ca
pítulo.' Nos encontramos listos para usar estas estimaciones de los parámetros en un desarrollo general
del análisis de varianza.
J.. 9.2 Prueba general de significación de la regresión

Una parte fundamental de este procedimiento es escribir las ecuaciones normales del modelo. Estas
ecuaciones siempre podrán obtenerse formando la función de mínimos cuadrados y derivándola con res
pecto a cada parámetro desconocido, como se hizo en la sección 39 .1. Sin embargo, se cuenta con un mé
todo más sencillo. Las reglas siguientes permiten escribir directamente las ecuaciones normales del
modelo de cualquier diseño experimental:
REGLA l. Hay una ecuación normal para cada parámetro del modelo que va a estimarse.
REGLA 2. El miembro derecho de cualquier ecuación normal es sólo la suma de todas las observa
ciones que contienen el parámetro asociado con esa ecuación normal particular.
Para ilustrar esta regla, considere el modelo con un solo factor. La primera ecuación normal
corresponde al parámetroµ; por lo tanto, el miembro derecho es Y ... ya que todas las observacio
nes incluyen a µ.
REGLA 3. El miembro izquierdo de cualquier ecuación normal es la suma de todos los parámetros
del modelo, donde cada parámetro está multiplicado por el número de veces que aparece en el
total del miembro derecho. Los parámetros se escriben con un acento circunflejo (A) para indicar
que son estimadores y no los verdaderos valores de los parámetros.
Por ejemplo, considere la primera ecuación normal en un experimento con un solo factor. De acuer
do con las reglas anteriores, ésta sería
porqueµ aparece en las N observaciones, 'l'1 sólo aparece en las n observaciones hechas bajo el primer tra
tamiento, 'l'2 aparece sólo en las n observaciones tomadas bajo el segundo tratamiento, etc. Por la ecua
ción 352 se verifica que la ecuación presentada arriba es correcta. La segunda ecuación normal
correspondería a 'l'1 y es
njt,+nt1 = y1
porque sólo las observaciones del primer tratamiento contienen a ?'1 (esto day¡ como miembro derecho),
µy 'l'1 aparecen exactamente n veces eny., y todas las demás t, aparecen cero veces. En general, el miem
bro izquierdo de cualquier ecuación normal es el valor esperado del miembro derecho.
Ahora bien, considere encontrar la reducción en la suma de cuadrados ajustando un modelo particu
lar a los datos. Al ajustar un modelo a los datos se "explica" parte de la variabilidad; es decir, la variabili
dad no explicada se reduce en cierta cantidad. La reducción en la variabilidad no explicada es siempre la
suma de las estimaciones de los parámetros, cada una de ellas multiplicada por el segundo miembro de la
39 EL ENFOQUE DE REGRESIÓN PARA EL ANÁLISIS DE VARIANZA 115
ecuación normal que corresponde al parámetro específico. Por ejemplo, en un experimento con un solo
factor, la reducción debida al ajuste del modelo completo Y;¡ = µ + t¡ + E;¡ es
R("µ, r)= f.'Y.. +i1Y1 +i2Y2. + ··· +i.Ya.

(355)
=µ~y+~ t.y .
.• ~ ll.
1=1
La notaciónR(µ, r) significa la reducción en la suma de cuadrados a partir del ajuste del modelo que con
tiene aµ y { r;}. AR(µ, r) se le llama en ocasiones la suma de cuadrados "de regresión" del modelo com
pleto Y;¡= µ + t, + e;¡· El número de grados de libertad asociado con una reducción en la suma de
cuadrados, tal como R(µ, r), siempre es igual al número de ecuaciones normales linealmente indepen
dientes. El resto de la variabilidad no explicada por el modelo se encuentra con
SSE = 2:2:
. "
y:-R(µ, r) (356)
i=l j=l
Esta cantidad se usa en el denominador del estadístico de prueba de H0:r1 ""' r2 = ··· = r. = O.
A continuación se ilustra la prueba general de significación de la regresión para un experimento con
un solo factor y se demuestra que produce el análisis de varianza de un solo factor común. El modelo es
Y;¡ = µ + t, + e;¡, y las ecuaci.ones normales se encuentran con las reglas anteriores como
Nft + nt 1 + nt 2 + · · · + nt. = y__

nli+ni; = Y1
nfl +ni2 = Yi.
nft
Compare estas ecuaciones normales con las que se obtuvieron en la ecuación 352.
Al aplicar la restricción .I~=1t1 = O, los estimadores de µ y t¡ son
/l='Y . i=l,2, ...,a
La reducción en la suma de cuadrados debida al ajuste de este modelo completo se encuentra con la ecua
ción 355 como
R(µ, •)= flY.. + ! i;Y;_
=(Y . )Y. + L• (Y;. Y. )Y;.

y2 • •
= N + ¿ Y;. Y1. - Y.¿
l~l inl
Y;.
=! n
que tiene a grados de libertad porque hay a ecuaciones normales linealmente independientes. La suma de
cuadrados del error es, por la ecuación 356,
y tiene N - a grados de libertad.

Para encontrar la suma de cuadrados que resulta de los efectos de los tratamientos (el {'r¡}), se consi
dera que el modelo se restringe a la hipótesis nula; es decir, r¡ = O para toda i. El modelo reducido es Yii =
µ + sii. Hay una sola ecuación normal para este modelo:
N{l=y
=
y el estimador deµ es µ y_. Por lo tanto, la reducción en la suma de cuadrados que resulta de ajustar el
modelo reducido que sólo contiene a µ es
o )( Y..-)N L._
2
R( µ-y.
)-
Puesto que hay una sola ecuación normal para este modelo reducido, R(µ) tiene un grado de libertad. La
suma de cuadrados debida al {r¡}, dado queµ ya está incluida en el modelo, es la diferenciaentreR(µ, r)y
R(µ), que es
R(rlµ)= R(µ, r)-R(µ)
= R(Modelo Completo) R(Modelo Reducido)
=¿
l
n
y2_L_
a
N
;1 '·
2
con a - 1 grados de libertad, que por la ecuación 39 se identifica como SSnatamientos· Estableciendo el su
puesto de normalidad usual, el estadístico apropiado para probar H0: r1 = r2 = ··· = rª = O es
F.
O
::ic
~#
[ a n
R(rjµ)/(a1)
l
y~ -R(µ, r) /(N-a)
que se distribuye como r.:»; bajo la hipótesis nula. Se trata, desde luego, del estadístico de prueba para
el análisis de varianza de un solo factor.
3 .. 10 MÉTODOS NO PARAMÉTRICOS EN EL ANÁLISIS DE VARIANZA
310.1 La prueba de KruskalWallis

En situaciones en las que el supuesto de normalidad no está justificado, el experimentador quizá quiera
usar un procedimiento alternativo del análisis de varianza con la prueba F que no dependa de este su
310 MÉTODOS NO P ARAMÉTRICOS EN EL ANÁLISIS DE VARIANZA 11 7
puesto. Kruskal y Wallis [68] han desarrollado este procedimiento. La prueba de KruskalWallis se usa
para probar la hipótesis nula die que los a tratamientos son idénticos contra la hipótesis alternativa de que
algunos de los tratamientos generan observaciones que son mayores que otras. Debido a que el procedi
miento está diseñado para ser sensible al probar las diferencias en las medias, en ocasiones es conveniente
considerar la prueba de KruskalWallis como una prueba de la igualdad de las medias de los tratamientos.
La prueba de KruskalWallis es una alternativano paramétricadel análisis de varianza usual.
Para realizar la prueba de K.ruskalWallis, primero se hace la clasificación en rangos de lasy, observa
ciones en orden ascendente y cada observación se reemplaza con su rango, por ejemplo Rii• asignándole a
la observación menor el rango l. En el caso de empates (observaciones que tienen el mismo valor), se
asigna el rango promedio a cada una de las observaciones empatadas. Sea R;. la suma de los rangos del tra
tamiento iésimo. El estadístico de prueba es
(357)
donde n¡ es el número de observaciones del tratamiento iésimo, N es el número total de observaciones y
(358)
Observe que S2 es sólo la varianza de los rangos. Si no hay empates, S2 = N(N + 1 )/12, y el estadístico de
prueba se simplifica a
H=
12
N(N+l)
L
;.1
-'·n, 3(N+l)
ª R'!
(359)
Cuando el número de empates es moderado, habrá pequeñas diferencias entre las ecuaciones 357 y 359,
y puede usarse la forma más simple (ecuación 359). Si las n, son razonablemente grandes, por ejemplo
n, ~ 5, H se distribuye aproximadamente como x;_
1 bajo la hipótesis nula. Por lo tanto, si
H> X~ .• 1
la hipótesis nula se rechaza. También podría usarse el enfoque del valor P.
EJEMPLO 3-12 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
En la tabla 314 se muestran los datos del ejemplo 31 y sus rangos correspondientes. Puesto que hay un
número bastante grande de empates, la ecuación 357 se usa como el estadístico de prueba. Por la ecua
ción 358 se encuentra
si= ~[!I
N 1 i~1 ¡~1
Rt- N(N+1)2]
4
25(26)2]
= _!_[5497
24 .
79
4
= 53.03
Tabla 314 Datos y rangos para el experimento de la resistencia a la tensión del ejemplo 31
15 20 25 30 35
y¡. R1- Yi¡ Ri¡ Y3¡ R3¡ Y4i R4i Ys¡ s;
7 2.0 12 9.5 14 11.0 19 20.5 7 2.0
7 2.0 17 14.0 18 16.5 25 25.0 10 5.0
15 12.5 12 9.5 18 16.5 22 23.0 11 7.0
11 7.0 18 16.5 19 20.5 19 20.5 15 12.5
9 4.0 18 16.5 19 20.5 23 24.0 11 7.0
R;. 27.5 66.0 85.0 113.0 33.5
l[ªR;~ N(N+l)
H-=-2:--~~ 2]
S 2n¡ 4;~i
= 1[5245.0 25(26 )2]

53.03 4
= 19.25
Puesto que H > x ~.ou, 4 = 13.28, se rechazaría la hipótesis nula y se concluiría que los tratamientos difie
ren. (El valor PparaH = 19.25 esP = 0.0002.) Se trata de la misma conclusión obtenida por el análisis de
varianza usual con la prueba F.
3~10.2 Comentarios generales sobre la transformación de rangos

Al procedimiento utilizado en la sección anterior de reemplazar las observaciones con sus rangos se le lla
ma la transformación de rangos. Es una técnica muy poderosa y útil. Si se aplicara la prueba F común a
los rangos en lugar de a los datos originales, se obtendría
Fo= H/(a-1)
(360)
(N-1-H)J(N-a)
como el estadístico de prueba (ver Conover (20], p. 337). Observe que cuando el estadístico H de Krus
kalWallis se incrementa o decrementa, F0 también se incrementa o decrementa, por lo que la prueba de
KruskalWallis es equivalente a aplicar el análisis de varianza común a los rangos.
La transformación de rangos tiene una amplia aplicabilidad en los problemas de diseño experimental
para los que no existe ninguna alternativa no paramétrica para el análisis de varianza. Esto incluye mu
chos de los diseños de capítulos subsecuentes de este libro. Si los datos están en rangos y se aplica la prue
baF común, el resultado es un procedimiento aproximado que tiene buenas propiedades estadísticas (ver
Conover e Iman [30a, b ]). Cuando existe preocupación acerca del supuesto de normalidad o por el efecto
de puntos atípicos o valores "absurdos", se recomienda que el análisis de varianza común se realice tanto
en los datos originales como en los rangos. Cuando ambos procedimientos producen resultados similares,
probablemente los supuestos del análisis de varianza se satisfacen razonablemente, y el análisis estándar
es satisfactorio. Cuando los dos procedimientos difieren, deberá darse preferencia a la transformación de
rangos, ya que es menos posible que sea distorsionada por una condición de no normalidad o la presencia
de observaciones inusuales. En tales casos, tal vez el experimentador quiera investigar el uso de transfor
311 PROBLEMAS 119
maciones para la falta de normalidad y examinar los datos y el procedimiento experimental a fin de deter
minar si hay puntos atípicos y por qué han ocurrido.
3-11 PROBLEMAS
31. Se estudia Ja resistencia a la tensión del cemento portland. Pueden usarse económicamente cuatro diferentes
técnicas de mezclado. Se han colectado los siguientes datos:
Técnica de mezclado Resistencia a la tensión (lb/pulg2)

1 3129 3000 2865 2890
2 3200 3300 2975 3150
3 2800 2900 2985 3050
4 2600 2700 2600 2765
a) Probar la hipótesis de que las técnicas de mezclado afectan la resistencia del cemento. Utilizar a = 0.05.
b) Construir una representación gráfica como se describió en la sección 35 .3 para comparar las resistencias
a la tensión promedio de las cuatro técnicas de mezclado. lA qué conclusiones se llega?
e) Usar el método LSD de Fisher con a = 0.05 para hacer comparaciones entre pares de medias.
d) Construir una gráfica de probabilidad normal de los residuales. lQué conclusiones se sacarían acerca de
la validez del supuesto de normalidad?
e) Graficar los residuales contra la resistencia a la tensión predicha. Comentar la gráfica.
f) Hacer un diagrama de dispersión de los resultados como ayuda para la interpretación de los resultados
de este experimento.
32. a) Resolver de nuevo el inciso b del problema 31 utilizando la prueba del rango múltiple de Duncan con a
= 0.05. lHay alguna diferencia en las conclusiones?
b) Resolver de nuevo el inciso b del problema 31 utilizando la prueba de Tukey con a = 0.05. lSe llega a las
mismas conclusiones con la prueba de Tukey que las obtenidas con el procedimiento gráfico y/o con la
prueba del rango múltiple de Duncan?
e) Explicar la diferencia entre los procedimientos de Duncan y de Tukey.
33. Considere nuevamente el problema 31. Encontrar un intervalo de confianza de 95% para la resistencia a la
tensión media del cemento portland que produce cada una de las cuatro técnicas de mezclado. Encontrar
también un intervalo de confianza de 95% para la diferencia en las medias de las técnicas 1y3. lSirve esto de
ayuda para interpretar los resultados del experimento?
34. Se llevó a cabo un experimento a fin de determinar si cuatro temperaturas de cocción específicas afectan la
densidad de cierto tipo de ladrillo. El experimento produjo los siguientes datos:
Temperatura Densidad
100 21.8 21.9 21.7 21.6 21.7
125 21.7 21.4 21.5 21.4
150 21.9 21.8 21.8 21.6 21.5
175 21.9 21.7 21.8 21.4
a) lLa temperatura de cocción afecta la densidad de los ladrillos? Utilizar a = 0.05.

b) lEs apropiado comparar las medias utilizando la prueba del rango múltiple de Duncan (por ejemplo) en
este experimento?
e) Analizar los residuales de este experimento. lSe satisfacen los supuestos del análisis de varianza?
d) Construir una representación gráfica de los tratamientos como se describió en la sección 35.3. lEsta
gráfica resume adecuadamente los resultados del análisis de varianza del inciso a?
35. Resolver de nuevo el inciso d del problema 34 utilizando el método LSD de Fisher. ¿A qué conclusiones se
llega? Explicar en detalle cómo se modificó la técnica para tomar en cuenta los tamaños de las muestras desi
guales.
36. Un fabricante de televisores está interesado en el efecto de cuatro tipos diferentes de recubrimientos para cines
copios de color sobre la conductividad de un cinescopio. Se obtienen los siguientes datos de la conductividad:
Tipo de recubrimiento Conductividad

1 143 141 150 146
2 152 149 137 143
3 134 136 132 127
4 129 127 132 129
a) lHay alguna diferencia en la conductividad debida al tipo de recubrimiento? Utilizar a = 0.05.

b) Estimar la media global y los efectos de los tratamientos.
e) Calcular la estimación de un intervalo de confianza de 95% para la media del tipo de recubrimiento 4.
Calcular la estimación de un intervalo de confianza de 99% para la diferencia media entre los tipos de re
cubrimiento 1 y 4.
d) Probar todos los pares de medias utilizando el método LSD de Fisher con a == 0.05.
e) Usar el método gráfico comentado en la sección 35.3 para comparar las medias. ¿Cuál es el tipo de recu
brimiento que produce la conductividad más alta?
f) Suponiendo que el recubrimiento tipo 4 es el que se está usando actualmente, ¿qué se recomendaría al
fabricante? Quiere minimizarse la conductividad.
3 7. Considere nuevamente el experimento del problema 36. Analizar los residuales y sacar conclusiones acerca
de la adecuación del modelo.
38. En un artículo deAC/ Materials Joumal (vol. 84, pp. 213216) se describen varios experimentos para investi
gar el varillado del concreto para eliminar el aire atrapado. Se usó un cilindro de 3 X 6 pulgadas; y el número
de veces que esta barra se utilizó es la variable del diseño. La resistencia a la compresión resultante de la
muestra de concreto es la respuesta. Los datos se muestran en la tabla siguiente:
Nivel de varillado Resistencia a la compresión

10 1530 1530 1440
15 1610 1650 1500
20 1560 1730 1530
25 1500 1490 1510
a) lHay alguna diferencia en la resistencia a la compresión debida al nivel de varillado? Utilizar a = 0.05.
b) Encontrar el valor P para el estadístico F del inciso a.
e) Analizar los residuales de este experimento. lQué conclusiones pueden sacarse acerca de los supuestos
fundamentales del modelo?
d) Construir una representación gráfica para comparar las medias de los tratamientos, como se describió
en la sección 35.3.
39. En un artículo deEnvironment International (vol. 18, no. 4) se describe un experimento en el que se investigó
la cantidad de radón liberado en las duchas. Se usó agua enriquecida con radón en el experimento, y se pro
baron seis diámetros diferentes de los orificios de las regaderas. Los datos del experimento se muestran en la
siguiente tabla:
311 PROBLEMAS 121
Diámetro de
los orificios Radón liberado (%)
0.37 80 83 83 85
0.51 75 75 79 79
0.71 74 73 76 77
1.02 67 72 74 74
1.40 62 62 67 69
1.99 60 61 64 66
a) ¿El tamaño de los orificios afecta el porcentaje promedio del radón liberado? Utilizar a = 0.05.
b) Encontrar el valor P para el estadístico F del inciso a.
e) Analizar los residuales de este experimento.
d) Encontrar un intervalo de confianza de 95% para el porcentaje promedio de radón liberado cuando el
diámetro de los orificios es 1.40.
e) Construir una representación gráfica para comparar las medias de los tratamientos, como se describió
en la sección 35.3. ¿Qué conclusiones pueden sacarse?
310. Se determinó el tiempo de respuesta en milisegundos para tres diferentes tipos de circuitos quepo
drían usarse en un mecanismo de desconexión automática. Los resultados se muestran en la siguiente
tabla:
Tipo de circuito Tiempo de respuesta

1 9 12 10 8 15
2 20 21 23 17 30
3 6 5 8 16 7
a) Probar la hipótesis de que los tres tipos de circuitos tienen el mismo tiempo de respuesta. Utilizar
a = 0.01.
b) Usar la prueba de Tukey para comparar pares de medias de los tratamientos. Utilizar a = 0.01.
e) Usar el procedimiento gráfico de la sección 35.3 para comparar las medias de los tratamientos. lQué
conclusiones pueden sacarse? ¿cómo se comparan con las conclusiones del inciso b?
d) Construir un conjunto de contrastes ortogonales, suponiendo que al principio del experimento se sospe
chaba que el tiempo de respuesta del circuito tipo 2 era diferente del de los otros dos.
e) Si el lector fuera el ingeniero de diseño y quisiera minimizar el tiempo de respuesta, Zqué tipo de circuito
seleccionaría?
f) Analizar los residuales de este experimento. lSe satisfacen los supuestos del análisis de varianza bá
sico?
311. Se estudia la vida efectiva de los fluidos aislantes en una carga acelerada de 35 kV. Se han obtenido datos de
una prueba para cuatro tipos de fluidos. Los resultados fueron los siguientes:
Tipo de fluido Vida (en horas) con 35 kV de carga

1 17.6 18.9 16.3 17.4 20.1 21.6
2 16.9 15.3 18.6 17.1 19.5 20.3
3 21.4 23.6 19.4 18.5 20.5 22.3
4 19.3 21.1 16.9 17.5 18.3 19.8
a) ¿Hay algún indicio de que los fluidos difieran? Utilizar a = 0.05.

b) ¿cuál fluido seleccionaría el lector, dado que el objetivo es conseguir la vida efectiva más larga?
e) Analizar los residuales de este experimento. ¿se satisfacenlos supuestos del análisisde varianza básico?
312. Se estudian cuatro diferentes tipos de diseiiosde un circuito digital de computadora para comparar la canti
dad de ruido presente. Se obtienen los siguientes datos:
Diseño del circuito Ruido observado

1 19 20 19 30 8
2 80 61 73 56 80
3 47 26 25 35 50
4 95 46 83 78 97
a) ¿La cantidad de ruido presente es la misma para los cuatro diseños? Utilizar a = 0.05.
b) Analizar los residuales de este experimento. ¿se satisfacen los supuestos del análisis de varianza?
e) ¿Qué diseño del circuito se seleccionaría para usarlo? El ruido bajo es mejor.
313. Se pide a cuatro químicos que determinen el porcentaje de alcohol metílico en cierto compuesto químico.
Cada químico hace tres determinaciones, y los resultados son los siguientes:
Químico Porcentaje de alcohol metílico

1 84.99 84.04 84.38
2 85.15 85.13 84.88
3 84.72 84.48 85.16
4 84.20 84.10 84.55
a) ¿Los químicos difieren significativamente? Utilizar a = 0.05.

b) Analizar los residuales de este experimento.
e) Si el químico 2 es un empleado nuevo, construir un conjunto razonable de contrastes ortogonales que
podría haberse usado al principio del experimento.
314. Se someten a estudio tres marcas de baterías. Se sospecha que las vidas (en semanas) de las tres marcas son
diferentes. Se prueban cinco baterías de cada marca con los resultados siguientes:
Semanasde vida
Marca 1 Marca2 Marca3
100 76 108
96 80 100
92 75 96
96 84 98
92 82 100
a) lLas vidas de estas tres marcas son diferentes?

e) Construir la estimación de un intervalo de confianza de 95% para la vida media de la batería marca 2.
Construir la estimación del intervalo de confianza de 99% para la diferencia media entre las vidas de las ·
baterías marcas 2 y 3.
311 PROBLEMAS 123
d) ¿Qué marca seleccionaría el lector para usarla? Si el fabricante reemplazara sin cargo cualquier batería
que dure menos de 85 semanas, lqué porcentaje esperaría reemplazar la compañía?
315. Se están investigando cuatro catalizadores que pueden afectar la·concentración de un componente en una
mezcla líquida de tres componentes. Se obtienen lassiguientes concentraciones:
Catalizador
1 2 3 4
58.2 56.3 50.1 52.9
57.2 54.5 54.2 49.9
58.4 57.0 55.4 50.0
55.8 55.3 51.7
54.9
a) ¿Los cuatro catalizadores tienen el mismo efecto sobre la concentración?

e) Construir la estimación de un intervalo de confianza de 99% para la respuesta media del catalizador l.
316. Se llevó a cabo un experimento para investigar la eficacia de cinco materiales aislantes. Se probaron cuatro
muestras de cada material con un nivel elevado de voltaje para acelerar el tiempo de falla. Los tiempos de fa
lla (en minutos) se muestran abajo:
Material Tiempo de falla (minutos)

1 110 157 194 178
2 1 2 4 18
3 880 1256 5276 4355
4 495 7040 5307 10,050
5 7 5 29 2
a) ¿Los cinco materiales tienen el mismo efecto sobre el tiempo de falla?

b) Graficar los residuales contra la respuesta predicha. Construir una gráfica de probabilidad normal de los
residuales. ¿Qué información transmiten estas gráficas?
e) Con base en la respuesta del inciso b, realizar otro análisis de los datos del tiempo de falla y sacar las con
clusiones apropiadas.
317. Un fabricante de semiconductores ha desarrollado tres métodos diferentes para reducir el conteo de partícu
las en las obleas. Los tres métodos se prueban en cinco obleas y se obtiene el conteo de partículas después del
tratamiento. Los datos se muestran abajo:
Método Conteo
1 31 10 21 4 1
2 62 40 24 30 35
3 53 27 120 97 68
a) ¿Todos los métodos tienen el mismo efecto sobre el conteo promedio de partículas?
b) Graficar los residuales contra la respuesta predicha. Construir una gráfica de probabilidad normal de los
residuales. ¿Hay motivo de preocupación potencial acerca de la validez de los supuestos?
e) Con base en la respuesta del inciso b, realizar otro análisis de los datos del conteo de partículas y sacar las
conclusiones apropiadas.
318. Considere la prueba de la igualdad de las medias de dos poblaciones normales, donde las varianzas son des
conocidas pero se suponen iguales. El procedimiento de prueba apropiado es la prueba t agrupada o combi
nada. Demostrar que la prueba t combinada es equivalente al análisis de varianza de un solo factor.
319. Demostrar que la varianza de la combinación lineal '1::=1c1yi. es a1J:.~=1n1c¡.
320. En un experimento con efectos fijos, suponga que hay n observacionespara cada uno de cuatro tratamientos.
Sean {f, (Ji, (Ji los componentes con un solo grado de libertad de los contrastes ortogonales. Demostrar que
SS'Il'alamienlos = {f + (Ji + {Jf •
321. Utilizar la prueba de Bartlett para determinar si el supuesto de la igualdad de las varianzas se satisface en el
problema 314. Utilizar a = 0.05. lSe llegó a la misma conclusiónrespecto de la igualdad de las varianzas con
el examen de las gráficas de los residuales?
322. Utilizar la prueba de Levene modificada para determinar si el supuesto de las varianzas iguales se satisface
en el problema 314. Utilizar a= 0.05. lSe llegó a la misma conclusiónrespecto de la igualdad de las varian
zas con el examen de las gráficas de los residuales?
323. Referirse al problema 310.Si quiere detectarse una diferencia máxima en los tiempos de respuesta prome
dio de 10 milisegundoscon una probabilidad de al menos 0.90, Zqué tamaño de la muestra deberá usarse?
lCómo se obtendría una estimación preliminar de a1?
324. Referirse al problema 314.
a) Si quiere detectarse una diferencia máximaen la vida de las baterías de 10 horas con una probabilidad de
al menos 0.90, Zqué tamaño de la muestra deberá usarse? Comentar cómo se obtendría una estimación
preliminar de a2 para responder esta pregunta.
b) Si la diferencia entre las marcas es lo suficientemente grande para que la desviaciónestándar de una ob
servación se incremente en 25%, lqué tamaño de la muestra deberá usarse si quiere detectarse esto con
una probabilidad de al menos 0.90?
325. Considere el experimento del problema 314. Si quiere construirse un intervalo de confianza de 95% para la
diferencia en las vidas medias de dos baterías que tenga una precisión de ±2 semanas, Zcuántas baterías de
cada marca deben probarse?
326. Suponga que cuatro poblacionesnormales tienen mediasµ1 = 50,µ2 = 60,µ3 = 50 y µ4 = 60. lCuántas obser
vaciones deberán hacerse en cada población para que la probabilidad de rechazar la hipótesis nula de la
igualdad de las medias poblacionales sea al menos 0.90? Suponer que a = 0.05y que una estimación razona
ble de la varianza de error es a2 = 25.
a) lEn qué forma cambiaría la respuesta si una estimación razonable de la varianza del error experimental
fuera a1 = 36?
b) lEn qué forma cambiaría la respuesta si una estimaciónrazonable de la varianza del error experimental
fuera a2 = 49?
e) lPuede sacarse alguna conclusión acerca de la sensibilidad de la respuesta dada en esta situación
particular acerca de cómo afecta la estimación de a la decisiónreferente al tamaño de la muestra?
d) lPuede hacerse alguna recomendación acerca de cómo debería usarse este enfoque general para elegir n
en la práctica?
328. Referirse al experimento de la fundición de aluminio descrito en la sección 38. Verificar que los métodos
para controlar la proporción de alúmina no afectan el voltaje promedio de la celda. Construir una gráfica de
probabilidad normal de los residuales. Graficar los residuales contra los valores predichos. lExiste algún in
dicio de que se violan algunos de los supuestos fundamentales?
329. Referirse al experimento de la fundición de aluminio de la sección 38. Verificar el análisis de varianza del
ruido del crisol que se resume en la tabla 313.Examinar las gráficas de los residuales usuales y comentar la
validez del experimento.
330. Se investigaroncuatro diferentes velocidadesde alimentación en un experimento con una máquina CNC que
produce una pieza que se usa en la unidad de potencia auxiliar de un avión. El ingeniero de manufactura a
cargo del experimento sabe que una dimensión crítica de la pieza de interés puede ser afectada por la veloci
dad de alimentación. Sin embargo, la experiencia previa indica que es probable que sólo estén presentes
311 PROBLEMAS 125
efectos de dispersión. Es decir, al cambiarse la velocidad de alimentación no se afecta la dimensión prome-
dio, pero podría afectarse la variabilidad dimensional. El ingeniero realiza cinco corridas de producción con
cada velocidad de alimentación y obtiene la desviación estándar de la dimensión crítica (en 103 mm). Los da
tos se muestran abajo. Suponer que todas las corridas se hicieron en orden aleatorio.
Velocidad de alimentación Corrida de producción

(pulgadas/minuto) 1 2 3 4 5
10 0.09 0.10 0.13 0.08 0.07
12 0.06 0.09 0.12 0.07 0.12
14 0.11 0.08 0.08 0.05 0.06
16 0.19 0.13 0.15 0.20 0.11
a) lLa velocidad de alimentación tiene algún efecto sobre la desviación estándar de esta dimensión crítica?
b) Usar los residuales de este experimento para investigar la adecuación del modelo. lHay algún problema
con la validez experimental?
331. Considere los datos del problema 310.
a) Escribir las ecuaciones normales de mínimos cuadrados para este problema y resolverlas paraµ y i;, uti
lizando la restricción usual (~:.1i; =O). Estimar i1 r2•
b) Resolver las ecuaciones del inciso a utilizando la restricción i 3 = O. lLos estimadores i 1 y µ son los mis
mos que se encontraron en el inciso a? lPor qué? Estimar ahora i-1 i-2 y comparar la respuesta con la del
inciso a. lQué afirmación puede hacerse respecto de estimar los contrastes en las r,?
e) Estimarµ+?'¡, 2i-1-i-2-i-3, yµ+ i-1 + r2 utilizando las dos soluciones delas ecuaciones normales. Com
parar los resultados obtenidos en cada caso.
332. Aplicar la prueba general de significación de la regresión en el experimento del ejemplo 31. Demostrar que
el procedimiento produce los mismos resultados que el análisis de varianza usual.
333. Usar la prueba de KruskalWallis en el experimento del problema 311. Comparar las conclusiones obtenidas
con las del análisis de varianza usual.
334. Usar la prueba de KruskalWallis en el experimento del problema 312. lLos resultados son comparables con
los encontrados por el análisis de varianza usual?
335. Considere el experimento del ejemplo 31. Suponga que la observación mayor de la resistencia a la tensión se
registró incorrectamente como 50. lQué efecto tiene esto sobre el análisis de varianza usual? lQué efecto
tiene sobre la prueba de KruskalWallis?
Bloques aleatorizados,
cuadrados latinos y diseños
relacionados
4 .. 1 DISEÑO DE BLOQUES COMPLETOS ALEATORIZAOOS
En cualquier experimento, la variabilidad que surge de un factor perturbador puede afectar los resulta
dos. En general, un factor perturbador puede definirse como un factor del diseño que probablemente
tenga un efecto sobre la respuesta, pero en el que no existe un interés específico. En ocasiones un factor
perturbador es desconocido y no controlable; es decir, se desconoce la existencia de ese factor e incluso
puede tener niveles variables mientras se está realizando el experimento. La aleatorización es la técnica
de diseño que se utiliza para: protegerse contra estos factores perturbadores "que están al acecho". En
otros casos, el factor perturbador es conocido pero no controlable. Si por lo menos puede observarse el
valor que asume el factor perturbador en cada corrida del experimento, es posible hacer la compensación
correspondiente en el análisis estadístico mediante el uso del análisis de covarianza, una técnica que se
revisará en el capítulo 14. Cuando la fuente de variabilidad perturbadora es conocida y controlable, pue
de usarse una técnica de diseño llamada formación de bloques para eliminar de manera sistemática su
efecto sobre las comparaciones estadísticas entre los tratamientos. La formación de bloques es una técni
ca de diseño en extremo importante que se utiliza ampliamente en la experimentación industrial, y es la
materia de este capítulo.
Para ilustrar la idea general, suponga que quiere determinarse si cuatro puntas diferentes producen o
no lecturas diferentes en una máquina para probar la dureza. Un experimento como éste podría ser parte
de un estudio de la aptitud en la calibración de los instrumentos. La máquina funciona presionando la
punta en un ejemplar de prueba de metal, y por la profundidad de la depresión resultante puede determi
narse la dureza del ejemplar. El experimentador ha decidido obtener cuatro observaciones para cada
punta. Hay un solo factorel tipo de punta, y un diseño completamente aleatorizado de un solo factor
consistiría en asignar al azar cada una de las 4 x 4 = 16 corridas a una unidad experimental, es decir, a un
ejemplar de prueba de metal, y observar qué resulta de la lectura de la dureza. Por lo tanto, se necesita
rían 16 ejemplares de prueba de metal en este experimento, uno por cada corrida del diseño.
Existe un problema potencialmente serio con un experimento por completo aleatorizado en esta si
tuación de diseño. Si los ejemplares de prueba de metal difieren ligeramente en sus durezas, como podría
126
41 DISEÑO DE BLOQUES COMPLETOS ALEA TORIZADOS 12 7
Tabla 41 Diseño de bloques completos aleatorizados para el
experimento de la prueba de la dureza
Ejemplar de prueba
Tipo de punta 1 2 3 4
1 9.3 9.4 9.6 10.0
2 9.4 9.3 9.8 9.9
3 9.2 9.4 9.5 9.7
4 9.7 9.6 10.0 10.2
ocurrir si se tomaran de lingotes que se produjeron con temperaturas diferentes, las unidades experimen
tales (los ejemplares de prueba) contribuirán a la variabilidad observada en los datos de la dureza. Como
resultado, el error experimental reflejará tanto el error aleatorio como la variabilidad entre los ejempla
res de prueba.
El objetivo sería hacer el error experimental tan pequeño como fuera posible; es decir, querría elimi
narse del error experimental la variabilidad entre los ejemplares de prueba. Un diseño para lograr esto
requiere que el experimentador pruebe cada punta una vez en cada uno de los cuatro ejemplares de prue
ba. A este diseño, que se muestra en la tabla 41, se le llama diseño de bloques completos aleatorizados
(RCBD, randomized complete block design ). La respuesta observada es la dureza en la escala C de Rockwell
menos 40. La palabra "completos" indica que cada bloque (ejemplar de prueba) contiene todos los tratamien
tos (puntas). Al utilizar este diseño, los bloques o ejemplares de prueba forman una unidad experimental
más homogénea en la cual comparar las puntas. De hecho, esta estrategia de diseño mejora la precisión
de las comparaciones entre las puntas al eliminar la variabilidad entre los ejemplares de prueba. Dentro de
un bloque, el orden en que se prueban las cuatro puntas se determina aleatoriamente. Observe la simili
tud de este problema de diseño con el de la sección 25, donde se analizó la prueba t pareada. El diseño de
bloques completos aleatorizados es una generalización de ese concepto.
El RCBD es uno de los diseños experimentales más utilizados. Son numerosas las situaciones en las
que el RCBD es apropiado. Las unidades de equipo o maquinaria de prueba son con frecuencia diferen
tes en sus características de operación y serían un factor de formación de bloques típico. Lotes de materia
prima, personas y el tiempo también son fuentes de variabilidad perturbadora comunes en un experimen
to que pueden controlarse de manera sistemática mediante la formación de bloques.
La formación de bloques también puede ser útil en situaciones que no incluyen necesariamente fac
tores perturbadores. Por ejemplo, suponga que un ingeniero químico está interesado en el efecto de la ve
locidad de alimentación del catalizador sobre la viscosidad de un polímero. Sabe que hay varios factores,
como la fuente de la materia prima, la temperatura, el operador y la pureza de la materia prima, que son
muy difíciles de controlar en proceso en gran escala. Por lo tanto, decide probar en bloques la velocidad
de alimentación del catalizador, donde cada bloque consiste en alguna combinación de estos factores no
controlables. De hecho, está utilizando los bloques para probar la robustez de su variable de proceso (la
velocidad de alimentación) para las condiciones que no puede controlar con facilidad. Para un análisis
más amplio de este punto, ver Coleman y Montgomery [27].
4.. 1.1 Análisis estadístico del diseño de bloques completos aleatorizados

Suponga que se tienen, en general, a tratamientos que van a compararse y b bloques. El diseño de bloques
completos aleatorizados se muestra en la figura 41. Hay una observación por tratamiento en cada blo
que, y el orden en que se corren los tratamientos dentro de cada bloque se determina al azar. Debido a
128 CAPÍTULO 4 BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEÑOS RELACIONADOS
Bloque 1 Bloque2 Bloque b
Y.,
Figura 41 El diseño de bloques completos aleatorizados.
que la única aleatorización de los tratamientos se hace dentro de los bloques, con frecuencia se dice que
los bloques representan una restricción sobre la aleatorización.
El modelo estadístico del RCBD puede escribirse de varias maneras. El tradicional es el modelo de
los efectos:
i = 1, z ... , a (41)
Y;¡=µ+r;+/3¡+E;¡ {] ·=l,,' ....... , b
dondeµ es la media global, t, es el efecto del tratamiento iésimo, fJ; es el efecto del bloque jésimo, y E;¡ es
el término del error NID(O, cr) usual. Se considerará inicialmente que los tratamientos y los bloques son
factores fijos. Como en el modelo del diseño experimental con un solo factor del capítulo 3, el modelo de
los efectos para el RCBD es un modelo sobreespecificado. En consecuencia, los efectos de los tratamien
tos y los bloques se consideran por lo general como desviaciones de la media global, por lo que
'Iambién es posible usar un modelo de las medias para el RCBD, por ejemplo
i=l,Z ,a
Yq = µ1; +tq {l= 1, z ,b
dondezz, = µ + t, + f3t Sin embargo, en este capítulo se usará el modelo de los efectos de la ecuación 41.
En un experimento en el que se use el RCBD, el interés se encuentra en probar la igualdad de las me
dias de los tratamientos. Por lo tanto, las hipótesis de interés son
Ho:µ1 =µ2 = -:>»,
H1: al menos una s, ;f:. µ;
Puesto que la media del tratamiento iésimo es µ1 = (1/b p:: ~;1 (µ + t, + /3;) = µ + r1, una manera equivalen
te de escribir las hipótesis anteriores es en términos de los efectos de los tratamientos, por ejemplo
Ho:r1='l'2=···=ra=O
H1: r 1 ;t:. O para al menos una i
Seay, el total de observaciones hechas bajo el tratamiento i.», el total de observaciones del bloquej,y __
=
el gran total de las observaciones y N ab el número total de observaciones. Expresado matemáticamente,
41 DISEÑO DE BLOQUES COMPLETOS ALEATORIZAOOS 129
i = 1, 2, ... , a
Y.¡=! YIJ i= 1, 2, ... , b

¡,,,¡
y
a b a b
Y.= LL Y¡¡= L Y;.= L Y¡

1~1 j~I ¡,,,¡ jml
De manera símílar.j¿ es el promedio de las observaciones hechas bajo el tratamiento i,yJ es el promedio
de las observaciones del bloque j, Y . es el gran promedio de todas las observaciones, Es decir,
Y.¡= Y.1 I a y_! N

La suma de cuadrados total corregida puede expresarse como
b b
LL LL
a a
(Yq - Y. )2 = [(Y;, Y. )+(Y.¡ Y. )+(Y¡¡ - Y1. - Y.¡ +Y. )]2 (46)

í=l ¡ ..¡
AJ desarrollar el miembro del lado derecho de la ecuación 46 se obtiene

a b
L.,¡ e
a
Y;. Y.
)2 + a L.,¡
"' eY.1 Y.. )2
b
)2 = b"'
"'"'L.,¡ < Y¡¡ Y..
L.,¡
¡,,,¡ jml i•l j•I
oY;. Y.. )(Y.¡ Y. )

a b a b
L.,¡ L.,¡ ( Y¡¡ Y;. Y.1 +

+~~ Y.. )2+2~"'
L.,¡ L.i
;1 j~l i=l j•l
a b
L.,¡ e: Y.¡
+2"'~ e)<Y.. Y;¡ Y1. Y.1 +)Y..
191 ¡.. 1
e Y.. )< Y;¡ Y;. Y. ¡ + Y. )

a b
+ 2L.i
~ L.,¡
~ Y1.
Mediante procedimientos algebraicos simples, pero laboriosos, se prueba que los tres productos cruzados
son cero. Por lo tanto,
LL L (Y;. Y. ) +aL (Y.¡ - Y.. )

a b a b
(Y¡¡ - Y. )2 = b 2 2
/ml Í"l ¡,,,¡ J"I
a b
+"' ~ ( Yii Y. 1 Y1.
L.i L.,¡ + Y.. )2 (47)
l=l Í"l
representa una partición de la suma de cuadrados total. AJ expresar simbólicamente las sumas de cuadra
dos de la ecuación 47, se tiene
(48)
Puesto que hay N observaciones, SSr tiene N - 1 grados de libertad. Hay a tratamientos y b bloques,
de donde SSnaiamientos y SSBloqu•• tienen a 1 y b1 grados de libertad, respectivamente. La suma de cuadra
dos del error es sólo la suma de cuadrados entre las celdas menos la suma de cuadrados de los tratamien
tos y los bloques. Hay ab celdas con ab-1 grados de libertad entre ellas, de donde SS E tiene ab - 1 (a 1)
(b1) =(a l)(b1) grados de libertad. Además, la suma delos grados de libertad del lado derecho de
la ecuación 48 es igual al total del lado izquierdo; por lo tanto, al establecer los supuestos de normalidad
usuales para los errores, puede usarse el teorema 31 para demostrar que SSnatamientoJa2, SS810<JueJa2 y
SSE!<r son variables aleatorias jicuadrada con distribuciones independientes. Cada suma de cuadrados
dividida por sus grados de libertad es un cuadrado medio. Puede demostrarse que el valor esperado de los
cuadrados medios, si los tratamientos y los bloques son fijos, es
AIS Tratamientos ) =
b! r;
+-;~_1
-
E( JYl' a 2
a-1
b
2
ªL
j~l
P~
E(MSBloque,)=a + b1
E(MSE)= a2
Por lo tanto, para probar la igualdad de las medias de los tratamientos, se usaría el estadístico de prueba
F. = MS Trotamientos
0
MS E
que se distribuye como Fa-i, (al)(bl) si la hipótesis nula es verdadera. La región crítica es la cola superior de
la distribución F, y H0 se rechazaría si F0 > Fa, al, (al)(bl)·
También podría haber interés en comparar las medias de los bloques porque, en caso de que la dife
rencia entre estas medias no sea considerable, quizá no sea necesaria la formación de bloques en experi
mentos futuros. Por los cuadrados medios esperados, aparentemente la hipótesis H0:fJi = O puede
probarse comparando el estadístico F0 = MSBicx¡ueJMSe con Fa, bl, (al)(bl)· Sin embargo, recuerde que la
aleatorización sólo se ha aplicado a los tratamientos dentro de los bloques; es decir, los bloques represen
tan una restricción sobre la aleatorización. ¿Qué efecto tiene esto sobre el estadístico F0 = MS810•
queJMS E? Existen diferentes puntos de vista para abordar esta cuestión. Por ejemplo, Box, Hunter y Hun
ter [18] señalan que la pruebaF del análisis de varianza común puede justificarse exclusivamente con base
en la aleatorización, 1 sin el uso directo del supuesto de normalidad. Agregan que en la prueba para com
parar las medias de los bloques no puede recurrirse a dicha justificación debido a la restricción sobre la
aleatorización; pero si los.errores son NID(O, a2), puede usarse el estadístico F0 = MSmoqucJMSE para
comparar las medias de los bloques. Por otra parte, Anderson y McLean [2] argumentan que la restric
ción sobre la aleatorización impide que este estadístico sea una prueba significativa para comparar las
medias de los bloques y que este cociente Fes en realidad una prueba de la igualdad de las medias de los
bloques más la restricción sobre la aleatorización (a la que llaman el error de la restricción; ver Anderson
y McLean [2] para detalles adicionales). ·
Entonces, Zqué se hace en la práctica? Debido a que con frecuencia el supuesto de normalidad es
cuestionable, considerar F0 = MS q ,/MS E como una prueba F exacta para la igualdad de las medias de
810 00
los bloques no es una buena práctica general. Por esa razón, esta prueba F no se incluye en la tabla del
análisis de varianza. Sin embargo, como un procedimiento aproximado para investigar el efecto de la va
riable formación de bloques, examinar el cociente MS81cx¡ueJMS E es muy razonable. Si este cociente es muy
1 De hecho, la distribuciónF de la teoría normal es una aproximación de la distribución de aleatorización generada al calcular F0 a
partir de cada asignación posible de las respuestas a los tratamientos.

41 DISEÑO DE BLOQUES COMPLETOS ALEATORIZADOS 131
Tabla 42 Análisis de varianza de un diseño de bloques completos aleatorizados
Fuente de Grados de
variación Suma de cuadrados libertad Cuadrado medio
'Iratamientos sslbwnientos a1 SSTratamientoo MSTratamient01!
a-l MSE
Bloques SS Bloques b-l SSii1oques
b-l
Error SSE (al)(b1) SSE
(al)(b1)
Tutal SST N1
grande, implica que el factor formación de bloques tiene un efecto considerable y que la reducción del
ruido obtenida por la formación de bloques probablemente fue útil para mejorar la precisión de la com
paración de las medias de los tratamientos.
El procedimiento suele resumirse en un esquema de análisis de varianza, como el que se muestra en
la tabla 42. En general, los cálculos se realizarían con un paquete de software de estadística. Sin embar
go, es posible obtener fórmulas de cálculo manual de las sumas de cuadrados para los elementos de la
ecuación 4 7 expresándolos en términos de los totales de los tratamientos y los bloques. Estas fórmulas de
cálculo son
a b 2
SSr= LL y~-~
i=l j=J
(49)
1 Y2
= bL l - N
a
SSTratamientos (410)
1=1
1 b y2
SS = ~ y2·· (411)
Bloques a LJ .t N
J=l
y la suma de cuadrados del error se obtiene por sustracción como
SSE = SST - SSTratamientos SS Bloques (412)
E)"EMPLO 4 .. 1 · · · · · · · · · · · · · · · • · · · · · • · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Considere el experimento de la prueba de la dureza de la sección 41. Hay cuatro puntas y cuatro ejempla
res de prueba de metal. Cada punta se prueba una vez en cada ejemplar, resultando un diseño de bloques
completos aleatorizados. Los datos obtenidos se repiten por conveniencia en la tabla 43. Recuerde que
el orden en que se probaron las puntas en un ejemplar particular se determinó al azar. Para simplificar los
Tabla 4.3 Diseño de bloques completos aleatorizados para el

experimento de la prueba de la dureza
Ejemplar de prueba (bloque)
~~~~ 1 2 3 4
1 9.3 9.4 9.6 10.0
2 9.4 9.3 9.8 9.9
3 9.2 9.4 9.5 9.7
4 9.7 9.6 10.0 10.2
13 2 CAPÍTULO 4 BLOQUESALEATORIZADOS, CUADRADOS LATINOS Y DISEÑOS RELACIONADOS
Tabla 44 Datoscodificados del experimentode la pruebade la dureza

Tipo de punta 1 2 3 4 Y;.
1 2 1 1 5 3
2 1 2 3 4 4
3 3 1 o 2 2
4 2 1 5 7 15
Y¡ 4 3 9 18 20 =Y..
cálculos, los datos originales se codifican restando 9.5 de cada observación y multiplicando el resultado
por 10. Se obtienen así los datos de la tabla 44. Las sumas de cuadrados se obtienen de la siguiente manera:
4 4 2
SSr = LL Y;~ - ~
;~1 j•l
( 20)2
= 154.0016 = 129.00
ss, tatamlentos = 'b? yz - iv
1 4 y2
.~1
= ¡[(3) 2 +(4)2 +(2)2 +(15)2] (Z~t = 38.50

SS Bloques
1
= ;; ,~1 .? Y.¡ - Y.~N
4 2
= ¡[(4) +(3) +(9) +(18)

2 2 2 2 ] <21ºt = 82.50
SS E = SST - SS Tratamientos ssllloques
= 129.00 38.50 82.50= 8.00

En la tabla 45 se presenta el análisis de varianza. Utilizando a = 0.05, el valor crítico de F es F0.05,3,9 =
3.86. Puesto que 14.44 > 3.86, se concluye que el tipo de punta afecta la lectura de la dureza media. El va
lor P para la prueba también es muy pequeño. Además, al parecer los ejemplares (bloques) difieren de
manera significativa, ya que el cuadrado medio de los bloques es grande en relación con el error.
Es interesante observar los resultados que se habrían obtenido si no se hubiera tenido conocimiento
de los diseños de bloques aleatorizados. Suponga que se usaran cuatro ejemplares, asignando al azar las
puntas a cada uno de ellos, y que resultara (por casualidad) el mismo diseño que el de la tabla 43. El aná
lisis incorrecto de estos datos como un diseño completamente.aleatorizado de un solo factor se presenta
en la tabla 46.
Tabla 45 Análisis de varianza del experimentode la pruebade la dureza

Tratamientos (tipo
de punta) 38.50 3 12.83 14.44 0.0009
Bloques (ejemplares) 82.50 3 27.50
Error 8.00 9 0.89
Tutal 129.00 15
41 DISEÑO DE BLOQUF.S COMPLETOS ALEATORIZADOS 133
Tabla 46 Análisis incorrecto del experimento de la prueba de la dureza
como un diseño completamente aleatorizado
variación cuadrados libertad medio
Tipo de punta 38.50 3 12.83 1.70
Error 90.50 12 7.54
Total 129.00 15
Puesto que Fo.os,3,12 = 3.49, no puede rechazarse la hipótesis de la igualdad de las mediciones de la dureza
media de las cuatro puntas. Por lo tanto, el diseño de bloques aleatorizados reduce Jo suficiente la canti
dad de ruido en los datos para que las diferencias entre las cuatro puntas sean detectadas. Esto ilustra un
punto muy importante. Si un experimentador no recurre a la formación de bloques cuando debería ha
berlo hecho, el efecto puede ser inflar el error experimental a tal grado que las diferencias importantes
entre las medias de los tratamientos sean indetectables.
Muestra de salida de computadora

En la figura 42 se muestra la salida de computadora condensada obtenida con Design-Expert para los da
tos de la prueba de la dureza del ejemplo 41. Recuerde que en el análisis original de la tabla 45 se utiliza
ron datos codificados. (Las respuestas originales se codificaron restando 9.5 y multiplicando el resultado
por 10.) El análisis de computadora utilizó las respuestas originales. Por consiguiente, las sumas de cua
drados de la figura 42 son iguales a las de la tabla 45 divididas entre 100 (observe que Design-Expert ha
redondeado las sumas de cuadrados con dos cifras decimales).
Los residuales se enlistan en la parte inferior de la salida de computadora. Éstos se calculan como
eij = Y;j -yij
y, como se demostrará más adelante, los valores ajustados son Yii = Y;. + YJ - y , de donde
e¡¡ = Y;¡ - Y; - Y.¡+ Y. (413)
En la sección siguiente se indicará cómo se usan los residuales en la verificación de la adecuación del modelo.
Comparaciones múltiples
Si los tratamientos en un RCBD son fijos, y el análisis indica una diferencia significativa en las medias de
los tratamientos, al experimentador le interesarán por lo general comparaciones múltiples para descubrir
cuáles son los tratamientos cuyas medias difieren. Para ello puede utilizarse cualquiera de los procedi
mientos de comparaciones múltiples del capítulo 3 (sección 35). Simplemente se sustituye en las fórmu
las de la sección 35 el número de réplicas (n) en el diseño completamente aleatorizado de un solo factor
con el número de bloques (b). Asimismo, es necesario recordar usar el número de grados de libertad del
error para el bloque aleatorizado [(a - l)(b 1)) en lugar de los grados de libertad del diseño completa
mente aleatorizado [a(n - 1)].
En la salida de Design-Expert de la figura 42 se ilustra el procedimiento LSD de Fisher. Observe que
si se usa a = 0.05, se concluiría que µ2 = µ3• Ahora bien, puesto que j/3. s; Yi. s; .Y2. (es decir, las medias .Y2. y
j/3. abarcan algunas de las medias restantes), una conclusión inmediata sería que a, = µ2 = µ3• Además.u,
es diferente de las otras tres medias. Se concluye por lo tanto que la punta tipo 4 produce una dureza me
dia que es significativamente más alta que las lecturas de la dureza media de los otros tres tipos de puntas.
Response: Hardness in Rockwell C

ANOVAfor Selected Factoñal Model
Analysis of variance table [Partlal sum of squares)
Sum of Mean F
Source Squares DF Square Value Prob > F
Block 0.82 3 0.27
Model 0.38 3 0.13 14.44 0.0009 significant
A 0.38 3 0.13 14.44 0.0009
Residual o.oso 9 8.889E003
Cor 1.29 15
Total
Treatment Means (Adjusted, lf Necessary)
Estimated Standard
Mean Error
1A 1 9.57 0.47
2A2 9.60 0.47
3A3 9.45 0.47
4A4 9.88 0.47
Mean Standard tfor H0
Treatment Difference DF Error Coeff:O Prob > [t]
1vs2 0.025 1 0.067 0.38 0.7163
1vs3 0.13 1 0.067 1.87 0.0935
1vs4 0.30 1 0.067 4.50 0.0015
2 vs 3 0.15 1 0.067 2.25 0.0510
2 vs 4 0.27 1 0.067 4.12 0.0026
3 vs 4 0.43 0.067 6.37 0.0001
Diagnostics Case Statistics

Standard Actual .Predicted Student Cook's Outlier
Order Value Value Residual Leverage Residual Dlstance t
1 9.30 9.35 0.050 0.438 0.707 0.056 0.686
2 9.40 9.38 0.025 0.438 0.354 0.014 0.336
3 9.60 9.67 0.075 0.437 1.061 0.125 1.069
4 10.00 9.90 0.100 0.438 1.414 0.222 1.512
5 9.40 9.38 0.025 0.438 0.354. 0.014 0.336
6 9.30 9.40 0.100 0.437 1.414 0.222 1.512
7 9.80 9.70 0.100 0.437 1.414 0.222 1.512
8 9.90 9.93 0.025 0.437 0.354 0.014 0.336
9 9.20 9.22 0.025 0.438 0.354 0.014 0.336
10 9.40 9.25 0.150 0.437 2.121 0.500 2.828
11 9.50 9.55 0.050 0.437 0.707 0.056 0.686
12 9.70 9.78 0.075 0.437 1.061 0.125 1.069
13 9.70 9.65 0.050 0.438 0.707 0.056 0.686
14 9.60 9.68 0.075 0.437 1.061 0.125 1.069
15 10.00 9.97 0.025 0.437 0.354 0.014 0.336
16 10.20 10.20 0.000 0.437 0.000 0.000 0.000
Fir,un1 42 Salida de Design-Expert (condensada) para el ejernnlo 41.
Punta Punta Punta Punta

3 1 2 4
_, o 2 3 4
Dureza promedio (codificada)
Figura 43 Las medias del tipo de punta en relación con una distribución t esca
lada con un factor de escalación JMSE / b ==./0.89 / 4 =0.47.
'Iambién puede usarse el procedimiento gráfico del capítulo 3 (sección 35.1) para comparar las me
dias del tipo de punta. En la figura 43 se grafican las cuatro medias del tipo de punta del ejemplo 41 en
.J = =
relación con una distribución t escalada con un factor de escalación MS E / b .J0.89 / 4 0.47. Esta grá
fica indica que las puntas 1, 2 y 3 producen probablemente mediciones de la dureza promedio idénticas,
pero que la punta 4 produce una dureza media mucho más alta. Esta figura confirma los resultados de la
prueba l.SD de Fisher incluida en la salida de Design-Expert de la figura 42.
4.. 1.2 Verificación de la adecuación del modelo
Se ha comentado ya la importancia de verificar la adecuación del modelo supuesto. En general, deberá
estarse alerta a los problemas potenciales con el supuesto de normalidad, con la desigualdad de la varian
za por tratamiento o bloque, y con la interacción bloquetratamiento. Como en el diseño completamente
aleatorízado, el análisis residual es la herramienta principal que se utiliza en estos diagnósticos de verifi
cación. En la parte inferior de la salida deDesign-Expert de la figura 42 se enlistan los residuales del dise
ño de bloques aleatorizados, Los residuales codificados se encontrarían multiplicando estos residuales
por 10. Las observaciones, los valores ajustados y los residuales de los datos codificados de la prueba de la
dureza del ejemplo 41 son los siguientes:
Yq ;P;¡ eij
2.00 1.50 0.50

1.00 1.25 0.25
1.00 1.75 0.75
5.00 4.00 1.00
1.00 1.25 0.25
2.00 1.00 1.00
3.00 2.00 1.00
4.00 4.25 0.25
3.00 2.75 0.25
1.00 2.50 1.50
0.00 0.50 0.50
2.00 2.75 0.75
2.00 1.50 0.50
1.00 1.75 0.75
5.00 4.75 0.25
7.00 7.00 0.00
En la figura 44 se muestra la gráfica de probabilidad normal y el diagrama de puntos de estos resi
duales. No hay indicios marcados de no normalidad y tampoco hay evidencia que apunte a la posible pre
sencia de puntos atípicos. En la figura 45 se muestran las gráficas de los residuales por tipo de punta o
=
bloque 1 en conjunto esE(y11) = µ + r1 + {:31 µ + 5 + 2 = µ + 7. En general, el tratamiento 1 incrementa
siempre la respuesta esperada 5 unidades sobre la suma de la media global y del efecto del bloque.
Aun cuando este modelo aditivo simple muchas veces es útil, hay situaciones en las que resulta inade
cuado. Suponga, por ejemplo, que se están comparando cuatro formulaciones de un producto químico
utilizando seis lotes de materia prima; los lotes de materia prima se consideran bloques. Si una impureza
en el lote 2 afecta de manera adversa la formulación 2, dando como resultado un rendimiento inusual
mente bajo, pero no afecta las demás formulaciones, ha ocurrido una interacciónentre las formulaciones
(o tratamientos) y los lotes (o bloques). De manera similar, pueden ocurrir interacciones entre los trata
mientos y los bloques cuando la respuesta se mide en la escala incorrecta. Por lo tanto, una relación que es
multiplicativa en las unidades originales, por ejemplo
es lineal o aditiva en una escala logarítmica, ya que, por ejemplo,
E(y; )= µ· +r; +P:

Aun cuando este tipo de interacción puede eliminarse con una transformación, no todas las interacciones
pueden tratarse con tanta facilidad. Por ejemplo, una transformación no elimina la interacción formula
ciónlote que se señaló antes. El análisis residual y otros procedimientos de diagnóstico de verificación
pueden ser útiles para detectar la no aditividad.
Si una interacción está presente, puede afectar seriamente el análisis de varianza y posiblemente lo
invalide. En general, la presencia de una interacción infla el cuadrado medio del error y puede afectar ad
versamente la comparación de las medias de los tratamientos. En situaciones en las que ambos factores,
así como su posible interacción, son de interés, deben usarse diseños factoriales.Estos diseños se anali
zan en detalle en los capítulos 5 al 9. ·
Tratamientos y bloques aleatorios

Aun cuando el procedimiento de prueba se ha descrito considerando los tratamientos y los bloques como
factores fijos, se utiliza el mismo procedimiento de análisis si los tratamientos o los bloques (o ambos) son
aleatorios. Sin embargo, hay algunas modificaciones en la interpretación de los resultados. Por ejemplo,
si los bloques son aleatorios, como es con mucha frecuencia el caso, se espera que las comparaciones en
tre los tratamientos sean las mismas a lo largo de la población de bloques de la cual se seleccionaron alea
toriamente para realizar el experimento. Están también las modificaciones correspondientes en los
cuadrados medios esperados. Por ejemplo, si los bloques son variables aleatorias independientes con va
rianza común, entonces E(MSmoques) = a2 + aa~, donde a~ es el componente de la varianza de los efectos
de los bloques. En cualquier situación, E(MSna•amientos) siempre está libre de cualquier efecto de bloque, y
el estadístico de prueba para la variabilidad entre los tratamientos siempre esF0 = MSnaiamiemo.fMSe.
En situaciones en las que los bloques son aleatorios, si está presente una interacción tratamien
tobloque, las pruebas para las medias de los tratamientos no están afectadas por la interacción. La razón
de ello es que los cuadrados medios esperados de los tratamientos y del error contienen ambos el efecto
de la interacción; por consiguiente, la prueba de las diferencias en las medias de los tratamientos puede
realizarse como de costumbre comparando el cuadrado medio de los tratamientos con el cuadrado medio
del error. Este procedimiento no proporciona ninguna información acerca de la interacción.
4.1 DISEÑO DE BLOQUES COMPLETOS ALEA TORIZADOS 139
Elección del tamaño de la muestra
La elección del tamaño de la muestra, o número de bloques que deben correrse, es una decisión impor
tante cuando se usa un RCBD. Al incrementar el número de bloques, se incrementa el número de réplicas
y el número de grados de libertad del error, con lo cual se aumenta la sensibilidad del diseño. Cualquiera
de las técnicas descritas en el capítulo 3 (sección 37) para seleccionar el número de réplicas que deben
correrse en un experimento completamente aleatorizado con un solo factor puede aplicarse de forma di
recta al RCBD. Para el caso de un factor fijo, las curvas de operación característica de la parte V del apén
dice pueden usarse con
(414)
donde hay a 1 grados de libertad en el numerador y (a 1 )(b-1) grados de libertad en el denominador.
EJEMPLO 4-2 · · · · · · · · · · · · · · · · · · . . . . . . . . . . . . . . . . . . . . . . . . • • . . . . . , • . . • . . . . . . .
Considere el problema de la prueba de la dureza del ejemplo 41. Suponga que quiere determinarse el nú
mero apropiado de bloques que deben correrse si el interés se encuentra en detectar una diferencia máxi
ma real en las lecturas de la dureza media de 0.4 con una alta probabilidad, y una estimación razonable
de la desviación estándar de los errores es a= 0.1. (Estos valores se dan en las unidades originales; recuerde
que el análisis de varianza se realizó usando datos codificados.) Por la ecuación 349, el valor mínimo
de <1>2 es (escribiendo b, el número de bloques, en lugar de n)
<1>2 = bD2
2aa2
donde D es la diferencia máxima que quiere detectarse. Por lo tanto,
<1>2 = b(0.4)2 = 20b

2(4)(0.1)2
Sí se usan b = 3 bloques, entonces = V2.0ó = ~ =

2.45, y hay (a 1 )(b1) = 3(2) = 6 grados de li
bertad del error. La parte V del apéndice con v1 =a 1 = 3 y a = 0.05 indica que el riesgo p de este diseño
es aproximadamente0.10 (potencia= 1-{3 = 0.90). Siseusanb = 4 bloques, v'2.0b v'2.0(4) = 2.83, = =
con (a - l)(b 1) = 3(3) = 9 grados de libertad del error, y el riesgo f3 correspondiente es aproximada
mente 0.03 (potencia = 1-{J = 0.97). Tres o cuatro bloques darán como resultado un diseño con una alta
probabilidad de detectar la diferencia entre las lecturas de la dureza media consideradas importantes.
Debido a que los ejemplares de prueba (bloques) son baratos y están en disponibilidad y el costo de la
prueba es bajo, el experimentador decide usar cuatro bloques .
.........................................................................
Estimación de valores faltantes
Cuando se usa el RCBD, en ocasiones falta una observación en uno de los bloques. Esto puede ocurrir de
bido a descuido o error o por razones fuera del control del experimentador, tal como un daño inevitable a
una unidad experimental. Una observación faltante introduce un nuevo problema en el análisis debido a
que los tratamientos dejan de ser ortogonales a los bloques; es decir, no ocurren todos los tratamientos en
Tabla 4 7 Diseño de bloques completos aleatorizados para el

experimento de la prueba de dureza con un valor faltante
Tipode punta 1 2 3 4
1 2 1 1 5
2 1 2 X 4
3 3 1 o 2
4 2 1 5 7
cada uno de los bloques. Existen dos enfoques generales para el problema de los valores faltantes. El pri
mero es un análisis aproximado, en el cual la observación faltan te se estima y se lleva a cabo el análisis de
varianza usual como si la observación estimada fuera un dato real, con los grados de libertad del error re
ducidos en l. Este análisis aproximado es materia de esta sección. El segundo es un análisis exacto, el cual
se revisa en la sección 41.4.
Suponga que falta la observacióny, del tratamiento i en el bloque j. La observación faltante se denota
comox. Como una ilustración, suponga que en el experimento de la prueba de dureza del ejemplo 41 el
ejemplar de prueba 3 se rompió mientras se probaba la punta 2 y que no pudo obtenerse el dato para esa
punta. Los datos aparecerían como en la tabla 47.
En general, se hará que Y.'. represente el gran total con una observación faltante, que y;_ represente el
total del tratamiento con una observación faltante, y que Y.~ sea el total del bloque con una observación
faltante. Suponga que quiere estimarse la observación faltante x de tal modo que x tenga una participa
ción mínima en la suma de cuadrados del error. Puesto que SSE = ~~~1 ~~~1 (yíi - Ji;. Y.¡ +Y. )2, esto es
equivalente a elegir x para minimizar
SSE= ~~
Q b
y:-b~
1 Q (
# v, ;;# ~ v,
b )2 1 b ( • )2 1 (
+ ab ~~
Q b
yij
)2
o
1 1 1
SSE =x2 --(y'.
b r,
+x)2 --(y' +x)2 +-(y' +x)2 +R
a ·1 ab ··
(415)
donde R incluye todos los términos en los que no interviene x. A partir de dSSE/dx=O, se obtiene
ay;_ +by_~ - Y.'.
x= (416)
(al)(b1)
como la estimación de la observación faltante.

Para los datos de la tabla 47, se encuentra que y;_ = 1, y_'3 = 6 y Y.'. = 17. Por lo tanto, por la ecuación
416,
x= y 23 = 4( 1)+4(6)17
(3)(3)
= 1.22
Ahora puede realizarse el análisis de varianza común utilizando y23 = 1.22y reduciendo los grados de li
bertad del error en l. El análisis de varianza se muestra en la tabla 48. Compare los resultados de este
análisis aproximado con los resultados obtenidos para el conjunto de datos completo (tabla 45).
41 DISEÑO DE BLOQUES COMPLETOS ALEA TORIZADOS 141
Tabla 48 Análisis de varianza aproximado del ejemplo 41 con un valor faltante
Tipo de punta 39.98 3 13.33 17.12 0.0008
Ejemplares de prueba (bloques) 79.53 3 26.51
Error 6.22 8 0.78
Tutal 125.73 14
Si son varias las observaciones faltantes, pueden estimarse escribiendo la suma de cuadrados del
error como una función de los valores faltantes, derivando con respecto a cada valor faltante, igualando
los resultados con cero y resolviendo las ecuaciones resultantes. De manera alternativa, puede usarse la
ecuación 416 de manera iterativa para estimar los valores faltantes. Para ilustrar el enfoque iterativo, su
ponga que faltan dos valores. Se estima arbitrariamente el primer valor faltante y después se usa este va
lor junto con los datos reales y la ecuación 416 para estimar el segundo. Entonces puede usarse la
ecuación 416 para volver a estimar el primer valor faltante, y después de esto, puede volver a estimarse el
segundo. Este proceso se continúa hasta que se obtiene la convergencia. En cualquier problema con valo
res faltan tes, los grados de libertad del error se reducen en una unidad por cada observación faltan te.
4 .. 1.4 Estimación de los parámetros del modelo y la prueba general

de significación de la regresión
Si tanto los tratamientos como los bloques son fijos, los parámetros del RCBD pueden estimarse por mí
nimos cuadrados. Recuerde que el modelo estadístico lineal es
i = l, 2, ... , a
Y¡¡=µ+r;+/3j+e¡¡ {J'=1 , 2, ... , b (417)
Al aplicar las reglas de la sección 39.2 para encontrar las ecuaciones normales del modelo de un diseño
experimental, se obtiene
µ: abf¡, + bi, + hf2 + ... + bi; + ap1 + afJz + .. · + apb = y__
r1: bµ + bi, + P1 + 'A. + ... + pb = Yi.

r2: bµ + bf2 + P1 + P2 + ... + pb = Y2.
ra: bµ + bi¿ + f31 + Pz + ... + j3b = Ya. (418)

/31: aµ + f1 + f2 + + fª + aft1 = Y.1
f32: aft + f1 + f2 + +f., + aP2 = Y.2
{3b: aft + f1 + f2 + ... +f. + apb = Y.b
Observe que la suma de la segunda a la (a + Ijésima ecuaciones de la ecuación 418 es la primera

ecuación normal, como también es el caso de las b últimas ecuaciones. Por lo tanto, hay dos dependencias
142 CAPÍTIJLO 4 BLOQUES ALEATOIUZAOOS, CUADRADOS LATINOS Y DISEÑOS RELACIONADOS
lineales en las ecuaciones normales, lo cual implica que deben imponerse dos restricciones para resolver
la ecuación 4 18. Las restricciones usuales son
(419)
Al utilizar estas restricciones, las ecuaciones normales se simplifican considerablemente. De hecho, que
dan como
abli= Y..
bft+bf. =y. i=l, 2, , a (420)
aft + ap'.I = ;,·.¡ i= 1, 2, , b
cuya solución es
ft=r ..
t.=y-.-y- i = 1, 2, , a (421)
Pj = Y.1 r .
.... ' t, ••
i= 1, 2, , b
Al utilizar la solución de la ecuación normal de la ecuación 421, puede encontrarse el valor estimado o
ajustado de Y;¡ como
s, = µ+t; +P1
+(Y1.
= Y.. )+(Y.j - Y..
- Y.. )
= Y1. +Y.1 -Y..
Este resultado se usó anteriormente en la ecuación 413 para calcular los residuales de un diseño de blo
ques aleatorizados.
La prueba general de significación de la regresión puede usarse para desarrollar el análisis de varian
za del diseño de bloques completos aleatorizados. Al utilizar la solución de las ecuaciones normales dada
por la ecuación 421, la reducción en la suma de cuadrados para ajustar el modelo completo es
L T;Y1. + L P1Y.1
a b
R(µ, r; {J)= ftY.. +
~ <YL - Y..
) Y1 + ,¿,,,
~ eY.¡ - Y..
) Y.¡
a b
= Y .. Y.. + ,¿,,,
;~1 1~1
2 • 2 b 2
-L+~ - __L_+~
- b ,¿,,, Y;. Y;.
_ _L_
b ,¿,,, Y.1 Y.1 ab
a ;~1 a j~1
=:L '·Y2b+:L
;1
a
1~1
b y2.
_.1
a
__
Y2
..
ab
con a + b - 1 grados de libertad, y la suma de cuadrados del error es
= LL
a b
SSE y:-R(µ,t,{3)
a b
~~,¿,,, ( yii - Y;.
= ,¿,,,
- Y.1 +y__ )2
;~1 ¡~1
con (a - l)(b ~ 1) grados de libertad. Compare esta última ecuación con SSE en la ecuación 47.
Para probar la hipótesis H0:r1 = O, el modelo reducido es
YIJ = µ+/3¡ +E;¡
que es un análisis de varianza de un solo factor. Por analogía con la ecuación 35, la reducción en la suma
de cuadrados para ajustar el modelo reducido es
L
b 2
R(µ, /3) = Y.j
i=t a
que tiene b grados de libertad. Por lo tanto, la suma de cuadrados debida a {r1} después de ajustarµ y
{/3) es
R( tj µ, P) = R(µ, r, {3)- R(µ, P)
= R(Modelo completo)R(Modelo reducido)
=}:
2
Y1. +_L
b 2
Y.¡ _L.__
2
L Y.¡
b 2
b ¡..¡ a ab ¡-i a
s:»:
2 2
b ab
ex.presiónque se identifica como la suma de cuadrados de los tratamientos con a - 1 grados de libertad
(ecuación 410).
La suma de cuadrados de los bloques se obtiene ajustando el modelo reducido
Y;¡= µ+r;+t9
que también es un análisis de un solo factor. De nueva cuenta, por analogía con la ecuación 35, la reduc
ción en la suma de cuadrados para ajustar este modelo es
y2
L
d
R(µ,r)= a:
i=l b
con a grados de libertad. La suma de cuadrados de los bloques {/31} después de ajustarµ y {r1} es
R(,81 µ, r) = R(µ, r, /3) R(µ, r]
2
l'.!:._+.L
b y2.
_.,_L.__
a ab
2
I~b
a ~
i=l b j•l ;..i
2 2
=I
b
Y.1 _L._
j=l
a ab
con b - 1 grados de libertad, la cual se había dado anteriormente como la ecuación 411.
Se han desarrollado las sumas de cuadrados de los tratamientos, de los bloques y del error en el dise
ño de bloques completos aleatorizados utilizando la prueba general de significaciónde la regresión. Aun
cuando la prueba general de significaciónde la regresión no se usaría ordinariamente para hacer el análi
sis real de los datos en un bloque completo aleatorizado, en ocasiones el procedimiento resulta útil en di
seños de bloques aleatorizados más generales, como los que se revisan en la sección 44.
144 CAPÍTIJLO 4 BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEÑOS RELACIONADOS
Análisis exacto del problema del valor faltante

En la sección 41.3 se presentó un procedimiento aproximado para solucionar las observaciones faltantes
·en el RCBD. Este análisis aproximado consiste en estimar el valor faltan te de tal modo que se minimice el
cuadrado medio del error. Puede demostrarse que el análisis aproximado produce un cuadrado medio
sesgado de los tratamientos en el sentido de que E(MSnacamienros) es mayor que E(MS E) si la hipótesis nula
es verdadera. Por consiguiente, se reportan demasiados resultados significativos.
El problema del valor faltante puede analizarse exactamente utilizando la prueba general de
significación de la regresión. El valor faltante hace que el diseño sea no balanceado, y dado que no todos
los tratamientos ocurren en todos los bloques, se dice que los tratamientos y los bloques no son ortogona
les. Este método de análisis también se usa en tipos más generales de diseños de bloques aleatorizados; el
tema se analiza con mayor amplitud en la sección 44. En el problema 426 se le pide al lector que realice
el análisis exacto para un diseño de bloques completos aleatorizados con un valor faltante.
4.. 2 DISEÑO DE CUADRADO LATINO
En la sección 41 se introdujo el diseño de bloques completos aleatorizados como un diseño para reducir
el error residual de un experimento al eliminar la variabilidad debida a una variable perturbadora conoci
da y controlable. Hay otros tipos de diseños que utilizan el principio de la formación de bloques. Por
ejemplo, suponga que un experimentador estudia los efectos que tienen cinco formulaciones diferentes
de la carga propulsora utilizada en los sistemas de expulsión de la tripulación de un avión basado en la ra
pidez de combustión. Cada formulación se hace con un lote de materia prima que sólo alcanza para pro
bar cinco formulaciones. Además, las formulaciones son preparadas por varios operadores, y puede
haber diferencias sustanciales en las habilidades y experiencia de los operadores. Por lo tanto, al parecer
hay dos factores perturbadores que serán "calculados en promedio" en el diseño: los lotes de materia pri
ma y los operadores. El diseño apropiado para este problema consiste en probar cada formulación exac
tamente una vez con cada uno de los cinco operadores. Al diseño resultante, ilustrado en la tabla 49, se le
llama diseño de cuadrado latino. Observe que el diseño es un arreglo cuadrado y que las cinco formula
ciones (o tratamientos) se denotan por las letras latinas A, B, C, D y E; de ahí el nombre de cuadrado lati
no. Se observa que tanto los lotes de materia prima (renglones) como los operadores (columnas) son
ortogonales a Jos tratamientos.
El diseño de cuadrado latino se usa para eliminar dos fuentes de variabilidad perturbadora; es decir,
permite hacer la formación de bloques sistemática en dos direcciones. Por lo tanto, los renglones y las co
lumnas representan en realidad dos restricciones sobre la aleatorización. En general, un cuadrado latino
para p factores, o cuadrado latino p x p, es un cuadrado con p renglones y p columnas. Cada una de las p2
Tabla 4.9 Diseño del cuadrado latino para el problema de la carga propulsora
Lotes de materia Operadores
prima 1 2 3 4 5
1 A =24 B=20 C=19 D =24 E=24
2 B = 17 C""24 D =30 E=27 A= 36
3 e= 1s D=38 E=26 A =27 B =21
4 D =26 E=31 A =26 B = 23 C=22
5 E= 22 A =30 B = 20 C= 29 D = 31
42 DISEÑO DE CUADRAOO LATINO 145
celdas resultantes contiene una de las p letras que corresponde a los tratamientos, y cada letra ocurre una
y sólo una vez en cada renglón y columna. Algunos ejemplos de cuadrados latinos son
4x4 sxs 6x6

ABDC ADBEC ADCEBF
BCAD DACBE BAECFD
CDBA CBEDA CEDFAB
DACB BEACD DCFBEA
ECDAB FBADCE
EFBADC
El modelo estadístico de un cuadrado latino es
i=l, 2, , p
Y;¡k =µ+a;+t'¡+/3k+E;¡k j:l, 2, , P (422)
{
k1, 2, , p
donde Y;¡k es la observación en el renglón iésimo y la columna késima para el tratamiento jésimo, µ es la
media global, a; es el efecto del renglón iésimo, r¡ es el efecto del tratamiento jésimo, pk es el efecto de la
columna késima, y E;¡k es el error aleatorio. Observe que se trata de un modelo de los efectos. El modelo es
completamente aditivo; es decir, no hay interacción entre renglones, columnas y tratamientos. Puesto
que hay una sola observación en cada celda, sólo se necesitan dos de los tres subíndices i, j y k para denotar
una observación particular. Por ejemplo, con referencia al problema de la carga propulsora de la tabla
=
49, si i 2 y k = 3, se encuentra automáticamente quej = 4 (formulaciónD), y si i = 1 y j = 3 (formula
=
ción C), se encuentra que k 3. Ésta es una consecuencia de que cada tratamiento aparezca una vez exac
tamente en cada renglón y columna.
El análisis de varianza consiste en hacer la partición de la suma de cuadrados total de las N = p2 ob
servaciones en los componentes de los renglones, las columnas, los tratamientos y el error, por ejemplo,
(423)
con los respectivos grados de libertad
p2 1 = p-l +p1+ pl+(p2)(p1)

Bajo el supuesto usual de que e,1k es NID(O, a2), cada suma de cuadrados del lado derecho de la ecuación
423 es, al dividir por o', una variable aleatoria jicuadrada con una distribución independiente. El esta
dístico apropiado para probar que no hay diferencias en las medias de los tratamientos es
F. _ MS TralJJmientos
o .MSE
que se distribuye como Fp-l, (pl)(pl) bajo la hipótesis nula. También puede probarse la ausencia de efectos
de los renglones o la ausencia de efectos de las columnas formando el cociente de MS&ngtones o MSeoiumn••
conMSE. Sin embargo, puesto que los renglones y las columnas representan restricciones sobre la aleato
rización, estas pruebas quizá no sean apropiadas.
En la tabla 410 se presenta el procedimiento de cálculo para el análisis de varianza. Por las fórmulas
de cálculo para las sumas de cuadrados, se observa que el análisis es una extensión simple del RCBD, con
la suma de cuadrados resultante de los renglones obtenida a partir de los totales de los renglones.
·· · ·· · ··
146 CAPÍTIJLO 4 BLOQUES ALEATORIZAIXJS, CUADRADOS LATINOS Y DISEÑOS RELACIONADOS
Tabla 4·10 Análisis de varianza del diseño del cuadrado latino

Fuente de Grados de
'Iratamíentos SSTratamientao -¡; i.

_ 1
¡•l
2 Y~.
Y.¡. - N p-1
SSTratamienloo
p....:1
F, =
0
MSTratamlentos
MSF.
p1 f. ·
SSRenglones
Y~.
Renglones SSRenglones =
2
Y; .. - N p-l p-l
'ª1
1
Columnas SS
eo1unuw
=
Pk~t
Ly
p
2
. .k
_L.
N
2
p-l
Error SSF. (por sustracción) (p-2)(p- l) (p-2)(p- 1)
LLL yi
2
Tutal SS - _Y ... p2l

r ": . k qk N
' 1
EJEMPLO 4,. 3 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Considere el problema de la carga propulsora descrito previamente, donde tanto los lotes de materia pri
ma como los operadores representan restricciones sobre la aleatorización. El diseño para este experi
mento, el cual se muestra en la tabla 49, es un cuadrado latino 5 x 5. Después de codificar los datos
restando 25 de cada observación, se obtienen los datos de la tabla 411. Las sumas de cuadrados del total
de los lotes (renglones) y los operadores (columnas) se calculan de la siguiente manera:
Tabla 4·11 Datos codificados para el problema de la carga propulsora

Lotes de Operadores
materia prima 1 2 3 4 5 Y;..
1 A =l B=-5 e =6 D=1 E= 1 -14
2 B=-8 C=1 D= 5 E= 2 A= 11 9
3 C=7 D=l3 E= 1 A= 2 B= 4 5
4 D= 1 E= 6 A= 1 B = 2 C= -3 3
5 E=-3 A= 5 B=-5 C= 4 D= 6 7
Y..k -18 18 -4 5 9 10 =Y..

42 DISEÑODECUADRADOLATINO 147
Tabla 412 Análisis de varianza del experimento de la carga propulsora
Formulaciones 330.00 4 82.50 7.73 0.0025
Lotes de materia prima 68.00 4 17.00
Operadores 150.00 4 37.50
Error 128.00 12 10.67
Total 676.00 24
Los totales para los tratamientos (las letras latinas) SOL
Letra latina Total del tratamiento

A Y.i. = 18
B y2 = 24
C y3_ = 13
D Y.4. = 24
E Y.5. = 5
La suma de cuadrados que resulta de las formulaciones se calcula a partir de estos totales como
1 p 2
SS
Formulaciones = p "f:t_
~ y2.
.¡.
_LN
= 182 +(24)2 +(13)2 +242 +52 (l0)2 = 330.00

5 25
La suma de cuadrados del error se encuentra por sustracción:
SSE = SST - SS Lotes SS Opeiado= SS Formulaciones
= 676.00 68.00150.00 330.00 = 128.00
El análisis de varianza se resume en la tabla 412. Se concluye que hay una diferencia significativa en
la rapidez de combustión media generada por las diferentes formulaciones de la carga propulsora. 'Iam
bién hay indicios de que hay diferencias entre los operadores, por lo que la formación de bloques de este
factor fue una buena precaución. No hay evidencia sólida de una diferencia entre los lotes de materia pri
ma, por lo que al parecer en este experimento particular hubo una preocupación innecesaria en esta fuen
te de variabilidad. Sin embargo, la formación de bloques de los lotes de materia prima es por lo general
una buena idea.
Como en cualquier problema de diseño, el experimentador debería investigar la adecuación del mo
delo inspeccionando y graficando los residuales. Para un cuadrado latino, los residuales están dados por
e¡¡k = Y;¡k - Y;¡k
- Y.
= Y¡¡k - YL ¡. - Y. k +2Y..
El lector deberá encontrar los residuales del ejemplo 44 y construir las gráficas apropiadas.
Tabla 413 Cuadrados latinos estándares y número de cuadrados latinos de varios tamaños
Tamaño 3x3 4x4 5x5 6x6 7x7 p Xp
Ejemplos de ABC ABCD ABCDE ABCDEF ABCDEFG ABC P
cuadradosestándares BCA BCDA BAECD BCFADE BCDEFGA BCD A
CAB CDAB CDAEB CFBEAD CDEFGAB CDE B
DABC DEBAC DEABFC DEFGABC
ECDBA EADFCB EFGABCD
FDECBA FGABCDE PAB ... (P-1)
GABCDEF
Número de cuadrados 1 4 56 9408 16,942,080
estándares
Número total de 12 576 161,280 818,851,200 61,479,419,904,000 p!(p1)! X
cuadrados latinos (número de
cuadrados estándares)
Parte de la información de esta tabla se encuentra en S14ti6tical Jables for Bio/ogica~ Agricultura/ and M•dical Research; 4a. edición, de R.A. Fisher y F. Yates, Oliver & Boyd,
Edimburgo. Es poco lo que se sabe de las propiedades de los cuadrados latinos más grandes que 7 x 7.
A un cuadrado latino en el que el primer renglón y la primera columna constan de letras escritas en
orden alfabético se le llama cuadrado latino estándar, que es el diseño que se utilizó en el ejemplo 43.
Siempre es posible obtener un cuadrado latino estándar escribiendo el primer renglón en orden alfabéti
co y escribiendo después cada renglón sucesivo como la sucesión de letras que están justo arriba, recorri
das un lugar a la izquierda. En la tabla 413 se resumen varios hechos importantes acerca de los cuadrados
latinos y de los cuadrados latinos estándares.
Como con cualquier diseño experimental, las observaciones del cuadrado latino deberán tomarse de
manera aleatoria. El procedimiento de aleatorización correcto es seleccionando al azar el cuadrado em
pleado. Como se observa en la tabla 413, hay un gran número de cuadrados latinos de un tamaño particu
lar, por lo que es imposible enumerar todos los cuadrados y seleccionar uno al azar. El procedimiento
usual es seleccionar un cuadrado latino de una tabla de estos diseños, como en Fisher y Yates [ 45], y des
pués arreglar al azar el orden de los renglones, las columnas y las letras. Esto se analiza con mayor detalle
en Fisher y Yates [45].
Ocasionalmente, falta una observación en un cuadrado latino. Para un cuadrado latino p x p, el valor
faltante puede estimarse con
p(y;, +y_~_+ y'k )2Y.'..
(424)
Y;¡k = (p-2)(p-1)
donde las primas indican los totales del renglón, la columna y el tratamiento con el valor faltante, y Y.'.. es
el gran total con el valor faltante.
Los cuadrados latinos pueden ser útiles en situaciones en las que los renglones y las columnas repre
sentan los factores que el experimentador en realidad quiere estudiar y en las que no hay restricciones so
bre la aleatorización. Por lo tanto, los tres factores (renglones, columnas y letras), cada uno conp niveles,
pueden investigarse en sólo p2 corridas. En este diseño se supone que no existe interacción entre los facto
res. Se abundará más adelante sobre el tema de la interacción.
Réplicas de cuadrados latinos
Una desventaja de los cuadrados latinos pequeños es que proporcionan un número relativamente peque
ño de grados de libertad del error. Por ejemplo, un cuadrado latino 3 x 3 sólo tiene dos grados de libertad
del error, un cuadrado latino 4 x 4 sólo tiene seis grados de libertad del error, etc. Cuando se usan cua
drados latinos pequeños, con frecuencia es deseable hacer réplicas de los mismos para incrementar los
grados de libertad del error.
42 DISEÑO DE CUADRADO LA TINO 149
Tabla 4· 14 Análisis de varianza de un cuadrado latino con réplicas, caso 1
Fuente de Grados de
1 ~ 2 y~ SSTratamicntoO MSTratarnientos
Tratamientos np.
¡gl
Y.¡ . ----¡¡ p1
p1
Renglones
1 p
np.
L YL----¡¡Y . . 2
2
p1
SSRenglonos
p1
1=1
Columnas
1 p
np
L Y . ----¡¡
Y.. 2
A.
2
p1
SSColwnnas
p1
t~l
Réplicas pz
L Y.1----¡¡Y . .
1 "
2
2
n1
SSRépli""'
n1
1~1
SSE
Error Sustracción (p- l)[n(p+ 1) 3] (pl)[n(p+l):3)
:¿:¿:¿:¿ yJkl -j;¡
2
Thtal np2-l
Existen varias maneras de hacer réplicas de un cuadrado latino. Para ilustrar este punto, suponga que
se hacen n réplicas del cuadrado latino 5 x 5 utilizado en el ejemplo 43. Esto podría haberse hecho de la
manera siguiente:
l. Usando los mismos lotes y operadores en cada réplica.
2. Usando los mismos lotes pero operadores diferentes en cada réplica (o, de manera equivalente,
usando los mismos operadores pero lotes diferentes).
3. Usando diferentes lotes y diferentes operadores.
El análisis de varianza depende del método utilizado para hacer las réplicas.
Considere el caso 1, donde en cada réplica se usan los mismos niveles de los factores para la formación
de bloques en los renglones y las columnas. Sea Yijkl la observación del renglón i, el tratamiento j, la columna
ky la réplica/. Hay en totalN = np2 observaciones. El análisis de varianza se resume en la tabla 414.
Considere ahora el caso 2 y suponga que en cada réplica se usan nuevos lotes de materia prima pero
los mismos operadores. Por lo tanto, hay ahora cinco nuevos renglones (en general, p nuevos renglones)
Tabla 415 Análisis de varianza de un cuadrado latino con réplicas, caso 2

Fuente de Grados de
±
1 z Y.z. SSTratamlentos
Tratamientos np.
¡•!
Y.¡ . ----¡¡ p1 p1
1 •
:L
p " 2
Renglones ~LLYz
p 11 ;~1 1..I M
z;
P2
n(p1)
SSRenglon••
n(p-1)
1 p
L Y . k.-NY· . .
2
SSColumnas
Columnas np
2
p1 p1
k~I
Réplicas
1
pi
L" Y .2. 1----¡¡
Y .... 2
n1
SSRépllca>
1~1 n1
SSE
Error Sustracción (p- l)(np 1) (pl)(np1).
¿_¿_¿_¿ yJkl -;¡
2
Thtal np2l
1 1 k 1
150 CAPÍTULO 4 BLOQUES ALEATORIZADOS, CUADRAfX)S LATINOS Y DISEÑOS RELACIONADOS
Tabla 416 Análisis de varianza de un cuadrado latino con réplicas, caso 3

Fuente de Grados de
Tratamientos
1
np.
L Y.j .. -¡:¡
p
Y ....
2
2
p-l
SSTratamientos
p-l
MSTratamientas
1~1
l
p~fr yJ..,- ~ L1.
n P n 2
ssl<engloneo
Renglones p2 n(p- l)
n(p1)
1
p~t; y~~ - fr z,p2
n p n 2
SSColumnas
Columnas n(p- l) n(p-l)
Réplicas
1
---¡
L Y...1-¡:¡Y ....
n
2
2
n1
ssl<óplicas
p M n1
SSE
Error Sustracción (p- l)[n(p1)1] (pl)[n(p1)1]
~~~~y:~ _Yir
2
Total np2-l
dentro de cada réplica. El análisis de varianza se resume en la tabla 415. Observe que la fuente de varia
ción de los renglones mide en realidad la variación entre los renglones dentro de las n réplicas.
Por último, considere el caso 3, donde se usan nuevos lotes de materia prima y nuevos operadores en
cada réplica. Ahora la variación que resulta tanto de los renglones como de las columnas mide la varia
ción que resulta de estos factores dentro de las réplicas. El análisis de varianza se resume en la tabla 416.
Hay otros enfoques para analizar cuadrados latinos con réplicas que permiten la presencia de algu
nas interacciones entre tratamientos y cuadrados (referirse al problema 419).
Diseños alternados y diseños balanceados para efectos residuales
Ocasionalmente aparece un problema en el que los periodos son uno de los factores del experimento. En
general, hay p tratamientos que deben probarse en p periodos utilizando np unidades experimentales. Por
ejemplo, un analista del desempeño humano está estudiando el efecto de dos fluidos de restitución para
la deshidratación en 20 sujetos. En el primer periodo, a la mitad de los sujetos (elegidos al azar) se le ad
ministra el fluido A y a la otra mitad el fluido B. Al término del periodo se mide la respuesta, y se deja
transcurrir un lapso en el que se elimina cualquier efecto fisiológico de los fluidos. Después el experimen
tador hace que los sujetos que tomaron el fluido A tomen el fluidoB y aquellos que tomaron el fluido B to
men el fluidoA. A este diseño se le llama diseño alternado o entrecruzado. Se analiza como un conjunto
de 10 cuadrados latinos con dos renglones (los periodos) y dos tratamientos (los tipos de fluido). Las dos
columnas en cada uno de los 10 cuadrados corresponden a los sujetos.
En la figura 47 se muestra la disposición de este diseño. Observe que los renglones del cuadrado lati
no representan a los periodos y que las columnas representan a los sujetos. Los 10 sujetos que recibieron
primero el fluido A (1, 4, 6, 7, 9, 12, 13, 15, 17 y 19) se determinaron al azar.
Cuadrados latinos
1 11 lll IV ·v VI VII VIII IX X

Sujeto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Periodo 1 A B B A B A A B A B B A A B A B A B A B
Periodo 2 B A A B A B B A B A A B B A B A B A B A
Figura 47 Un diseño alternado.

43 DISENO DE CUADRADO GRECOLATINO 151
Tabla 417 Análisis de varianza
del diseño alternado de la
figura 4· 7
Fuente de Grados de
variación libertad
Sujetos (columnas) 19
Periodos (renglones) 1
Fluidos (letras) 1
Error 18
Total 39
En la tabla 417 se resume un análisis de varianza. La suma de cuadrados de los sujetos se calcula
como la suma de cuadrados entre los totales de los 20 sujetos corregida, la suma de cuadrados de los pe
riodos es la suma de cuadrados entre los renglones corregida, y la suma de cuadrados de los fluidos se cal
cula como la suma de cuadrados entre los totales de las letras corregida. Para más detalles del análisis
estadístico de estos diseños, ver Cochran y Cox [26], John [6ld] y Anderson y McLean [2].
'Iambién es posible emplear diseños tipo cuadrado latino para experimentos en los que los tratamien
tos tienen un efecto residual; es decir, por ejemplo, si los datos del fluido Ben el periodo 2 siguen reflejan
do algún efecto del fluido A tomado en el periodo l. En Cochran y Cox [26] y John [61d] se estudian en
detalle los diseños balanceados para efectos residuales.
4.. 3 DISEÑO DE CUADRADO GRECOLATINO
Considere un cuadrado latino p x p al cual se le superpone un segundo cuadrado latino p x p en el que

los tratamientos se denotan con letras griegas. Si cuando se hace la superposición los dos cuadrados tie
nen la propiedad de que cada letra griega aparece una y sólo una vez con cada letra latina, se dice que los
dos cuadrados latinos son ortogonales, y al diseño obtenido se le llama cuadrado grecolatino. En la tabla
418 se muestra un ejemplo de un cuadrado grecolatino 4 x 4.
El diseño de cuadrado grecolatino puede usarse para controlar sistemáticamente tres fuentes de va
riabilidad extraña, es decir, para hacer la formación de bloques en tres direcciones. El diseño permite la
investigación de cuatro factores (renglones, columnas, letras latinas y letras griegas), cada una con p nive
les en sólo p2 corridas. Existen cuadrados grecolatinos para toda p ~ 3, excepto p = 6.
Tabla 418 Diseño del cuadrado grecolatino 4 X 4

Columna
Renglón 1 2 3 4
1 Aa BP Cy Dó
2 Bó Ay Df3 Ca
3 cp Da Ad By
4 t» Cd Ba Af3
Tabla 419 Análisis de varianza de un diseño del cuadrado grecolatino

Fuente de variación Suma de cuadrados Grados de libertad
Tratamientoscon letras latinas SSL =-p.? y~-- _YN_

1 p
¡•l
2
p1
1 p 2
Tratamientos con letras griegas G pf::_ . .z;N
SS = ~ y2
k.
p1
1 p 2
Renglones SSRenglone• -- ~ 2
p ? h.
~
N p1
.~1
1 ~ 2 y_2__
Columnas SSColumnas = -p L.J Y .. J -----¡:¡ p1
1~1
Error SSE (por sustracción) (p- 3)(p1)
=¿¿¿¿y,~~N
2
Tutal SST
• ¡ k 1
El modelo estadístico para el diseño de cuadrado grecolatino es

i = 1, 2, , p
i= 1, 2, , p
Yijkl =µ+();+r¡+wk+'l',+eijkt k=l 2, p (425)
{ ' ,
- l = 1, 2, , p
donde Yiikt es la observación del renglón i y la columna[ para la letra latinaj y la letra griega k, ();es el efecto
del renglón iésimo, ri es el efecto del tratamiento de letra latinaj, wk es el efecto del tratamiento de letra
griega k, '111 es el efecto de la columna l, y e¡¡ki es un componente NID(O, a2) del error aleatorio. Sólo son
necesarios dos de los cuatro subíndices para identificar completamente una observación.
El análisis de varianza es muy parecido al de un cuadrado latino. Puesto que las letras griegas apare
cen exactamente una vez en cada renglón y columna, y exactamente una vez con cada letra latina, el factor
representado por las letras griegas es ortogonal a los renglones, las columnas y los tratamientos de letras
latinas. Por lo tanto, puede calcularse una suma de cuadrados debida al factor de las letras griegas a partir
de los totales de las letras griegas y el error experimental se reduce adicionalmente en esta cantidad. En la
tabla 419 se ilustran los detalles de los cálculos. La hipótesis nula de la igualdad de tratamientos de ren
glones, columnas, letras latinas y letras griegas, se probaría dividiendo el cuadrado medio correspondien
te por el cuadrado medio del error. La región de rechazo es la cola superior del punto de la distribución
Fp-1, (p3)(p1 J·
EJEMPLO 44 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Suponga que en el experimento de la carga propulsora del ejemplo 43 un factor adicional, los montajes
de prueba, podría ser importante. Sea que haya cinco montajes de prueba denotados por las letras griegas
a, {3, y, c5 y e. En la tabla 420 se muestra el diseño de cuadrado grecolatino 5 x 5 resultante.
Observe que, debido a que los totales de los lotes de materia prima (renglones), los operadores (co
lumnas) y las formulaciones (letras latinas) son idénticos a los del ejemplo 43, se tiene
ssll:Jtes = 68.00 SS Operadores = 150. 00 y SSFonnuladones = 330.00
43 DISEÑO DE CUADRADO GRECOLATINO 153
Tabla420 Diseño del cuadrado grecolatino para el problema de la carga propulsora
Lotes de Operadores
materia prima 1 2 3 4 5 Y;.__
1 Aa = 1 By = 5 CE =6 DfJ =1 Eó =1 14

2 BfJ = 8 Có = 1 Da= 5 Ey = 2 ÁE = 11 9
3 Cy = 7 De = 13 E{J = 1 Aó = 2 Ba =4 5
4 Dó = 1 Ea= 6 Ay= 1 Be =2 cp =3 3
5 EE = 3 A{J = 5 Bó =5 Ca= 4 Dy = 6 7
Y.1 18 18 4 5 9 10 =Y.
Los totales de los montajes de prueba (las letras griegas) son
Letra griega Total de la prueba de ensamblaje

a Y.. í. = 10
/3 Y..2. = 6
y y __3_ = 3
ó YA.= 4
E Y.. s. = 13
Por lo tanto, la suma de cuadrados debida a los montajes de prueba es

1 p 2
SS Ensamblaje• -- " 2
p L., Y. k.
_bN
k~l
= ~[102 +(6)2 +(3)2 +(4)2 +132 ] <1~2 = 62.00

En la tabla 421 se resume el análisis de varianza completo. Las formulaciones son diferentes significati
vamente en 1 %. Al comparar las tablas 421y412, se observa que al sacar la variabilidad debida a los
montajes de prueba, e~ error experimental disminuye. Sin embargo, al disminuir el error experimental, se
han reducido también los grados de libertad de 12 (en el diseño del cuadrado latino del ejemplo 43)a 8.
Por lo tanto, la estimación del error tiene menos grados de libertad, y la prueba puede ser menos sensible .
................................ ' .
Tabla 421 Análisis de varianza del problema de la carga propulsora

Formulaciones 330.00 4 82.50 10.00 0.0033
Lotes de materia prima 68.00 4 17.00
Operadores 150.00 4 37.50
Montajes de la prueba 62.00 4 15.50
Error 66.00 8 8.25
lb tal 676.00 24
154 CAPÍTIJLO 4 BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEÑOS RELACIONADOS
Puede hacerse cierta ampliación del concepto de los pares ortogonales de cuadrados latinos que for
man un cuadrado grecolatino. Un hipercuadrado p x p es un diseño en el que se superponen tres o más
cuadrados latinos ortogonales p x p. En general, hasta p + 1 factores podrían estudiarse si se dispone de
un conjunto completo de p - 1 cuadrados latinos ortogonales. En este diseño se utilizarían todos los (p +
1 )(p - 1) = p2 1 grados de libertad, por lo que se necesita una estimación independiente de la varianza
del error. Desde luego, no debe haber interacciones entre los factores cuando se usan hipercuadrados.
4 .. 4 DISEÑOS DE BLOQUES INCOMPLETOS BALANCEADOS
En ciertos experimentos en los que se utilizan diseños de bloques aleatorizados quizá no sea posible co
rrer todas las combinaciones de los tratamientos en cada bloque. Situaciones como ésta ocurren general
mente por limitaciones del aparato experimental o de las instalaciones o por el tamaño físico del bloque.
Por ejemplo, en el experimento de la prueba de la dureza (ejemplo 41), suponga que debido a sus dimen
siones cada ejemplar de prueba sólo puede usarse para probar tres puntas. Por lo tanto, no es posible pro
bar todas las puntas en cada uno de los ejemplares. Para este tipo de problema es posible utilizar diseños
de bloques aleatorizados en los que cada tratamiento no está presente en cada bloque. Estos diseños se
conocen como diseños de bloques incompletos aleatorizados.
Cuando las comparaciones de todos los tratamientos son igualmente importantes, las combinaciones
de los tratamientos usadas en cada bloque deberán seleccionarse en una forma balanceada, es decir, de
tal manera que cualquier par de tratamientos ocurra conjuntamente el mismo número de veces que cual
quier otro par. Por lo tanto, un diseño de bloques incompletos balanceados (BIBD, balanced lncomplete
block design) es un diseño de bloques incompletos en el que dos tratamientos cualesquiera aparecen con
juntamente el mismo número de veces. Suponga que hay a tratamientos y que cada bloque puede conte
ner exactamente k (k < a) tratamientos. Un diseño de bloques incompletos balanceados puede
construirse tomando e:) bloques y asignando una combinación de tratamientos diferente a cada bloque.
Con frecuencia, sin embargo, puede obtenerse un diseño balanceado con menos de (:) bloques. Tablas de
BIBD se proporcionan en Fisher y Yates (45], Davies [36] y Cochran y Cox [26].
Como un ejemplo, suponga que un ingeniero químico piensa que el tiempo de reacción de un proceso
químico es una función del tipo de catalizador empleado. Se están investigando cuatro catalizadores. El
procedimiento experimental consiste en seleccionar un lote de materia prima, cargar la planta piloto,
aplicar cada catalizador en una corrida separada de la planta piloto y observar el tiempo de reacción. De
bido a que las variaciones en los lotes de materia prima pueden afectar el desempeño de los catalizadores,
el ingeniero decide usar los lotes de materia prima como bloques. Sin embargo, cada lote es apenas lo su
ficientemente grande para permitir que se prueben tres catalizadores. Por lo tanto, debe usarse un diseño
Tabla 422 Diseño de bloques incompletos balanceados para el

experimento del catalizador
Tratamiento Bloque (lote de materia prima)
(catalizador) 1 2 3 4 Y;.
1 73 74 71 218
2 75 67 72 214
3 73 75 68 216
4 75 72 75 222
Y¡ 221 224 207 218 870=y ..

H DISEÑOS DE BLOQUES INCOMPLETOS BALANCEADOS 155
de bloques incompletos aleatorizados. El diseño de bloques incompletos balanceados para este experi
mento, junto con las observaciones registradas, se muestran en la tabla 422. El orden en que se corren los
catalizadores en cada bloque está aleatorizado.
4..4.1 Análisis estadístico del diseño de bloques incompletos balanceados

Como de costumbre, se supone que hay a tratamientos y b bloques. Además, se supone que cada bloque
contiene k tratamientos, que cada tratamiento ocurre r veces en el diseño (o que se hacen r réplicas del
mismo), y que hay N = ar = bk observaciones en total. Asimismo, el número de veces que cada par de tra
tamientos aparece en el mismo bloque es
). = r(k1)
a-1
Si a = b, se dice que el diseño es simétrico.
El parámetro). debe ser un entero. Para deducir la relación para A., considere cualquier tratamiento,
por ejemplo el tratamiento l. Puesto que el tratamiento 1 aparece en r bloques y hay otros k1 tratamien
tos en cada uno de esos bloques, hay r(k1) observaciones en un bloque que contiene al tratamiento l.
Estas r(k - 1) observaciones también tienen que representar a los a - 1 tratamientos restantes). veces. Por
lo tanto, A.(a - 1) = r(k - 1).
El modelo estadístico del BIBD es
(426)
donde Y;¡ es la observación iésima en el bloque jésimo, µ es la media global, t, es el efecto del tratamiento
zésímo, pi es el efecto del bloque jésimo, y e1¡ es el componente NID(O, cr) del error aleatorio. La variabi
lidad total en los datos se expresa por la suma de cuadrados totales corregida:
(427)
Puede hacerse la partición de la variabilidad total en
SST = SSTratainientos(ajustados)+SSBloques +SSE

donde la suma de cuadrados de los tratamientos está ajustada para separar los efectos de los tratamientos
y de los bloques. Este ajuste es necesario porque cada tratamiento está representado en un conjunto dife
rente de r bloques. Por lo tanto, las diferencias entre los totales de los tratamientos no ajustados YI.>Yv ... ,
Ya. también son afectadas por las diferencias entre los bloques.
La suma de cuadrados de los bloques es
(428)
donde y 1 es el total del bloque jésimo. SSaioqu•• tiene b 1 grados de libertad. La suma de cuadrados de los
tratamientos ajustada es ·
(429)
156 CAPÍTULO 4 l:ILOQUES ALEATORIZADOS, CUADRAfX)S LATINOS Y DISEÑOS RELACIONAOOS
Tabla 4·23 Análisis de varianza del disefio de bloques incompletos balanceados

Fuente de Grados de
Tratamientos kÍ: Q2 a1
SSTta.1amieotm(ajustado,) F, = MS¡.,atamient<><(ajm!Bd"')
(ajustados) A.a a1 o MSE

1
Bloques -_L
k
y2._L
· N
2
b1
SSBioqu"'
1 b1
SSE
Error SSE(por sustracción) N-a-b +1 N-a-b+l
2
Total }:}: y,~-~ N1
donde Q; es el total ajustado del tratamiento íésímo, el cual se calcula como

1 b
Q, =Y;. -k ¿ niiy·i
j=l
i=l,2, ... ,a (430)
connii = 1 si el tratamientoi aparece en el bloquej yx, =O en caso contrario. Los totales de los tratamien
tos ajustados siempre sumarán cero. SS'lhltami•ntos(ajustactos) tiene a 1 grados de libertad. La suma de cuadra
dos del error se calcula por sustracción como
SSE = SST - SSTntamiento<(ajustados) SS Bloques (431)
y tiene N - a - b + 1 grados de libertad.
El estadístico apropiado para probar la igualdad de los efectos de los tratamientos es
F. = MS Tratamkntos(ajustados)
0
MS E
En la tabla 423 se resume el análisis de varianza.
EJEMPLO 4-5 · · · · · · · · · · · · · · · · · · · · · · • · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Considere los datos de la tabla 422 para el experimento del catalizador. Se trata de un BIBD con a = 4,
b = 4, k == 3, r = 3, A. = 2 y N = 12. El análisis de estos datos es el siguiente.La suma de cuadrados total es
=L L y~ - L._
2
SST
i j 12
= 63,156 (87º)2
12
= 81 . 00
La suma de cuadrados de los bloques se encuentra con la ecuación 428 como
1
=JL
4 y2
SSBloques Y.~ - Ú
1=1
= ~[(221) 2 +(207)2 +(224)2 +(218)2 ] (S~~)2 = 55.00

4.4 DISEÑOS DE BLOQUES INCOMPLETOS BALANCEADOS 157
Tabla 4·24 Análisis de varianza del ejemplo 45
Fuente de variación cuadrados libertad medio Fo ValorP
Tratamientos (ajustados 22.75 3 7.58 11.66 0.0107
para los bloques)
Bloques 55.00 3
Error 3.25 5 0.65
Thtal 81.00 11
Para calcular la suma de cuadrados de los tratamientos ajustados para los bloques, primero se determinan
los totales de los tratamientos ajustados utilizando la ecuación 430 como
Ql = (218) t(221+224+218)= 9/ 3
Q2 = (214)t{207+224+218)= 7 / 3
Q3 =(216)t{221+207+224)=4/3
Q4 = (222) t(221+207 + 218) = 20 / 3
La suma de cuadrados de los tratamientos ajustados se calcula con la ecuación 429 como
k¿
4
Q¡2
_i=_l __
SSTratamicatos(ajustados) = Atl
= ~(9/ 3)2 +(7 / 3)2 +(4/ 3)2 +(20/ 3)2] = 22 75
(2)(4)
La suma de cuadrados del error se obtiene por sustracción como
SSE = SST SSTratamiealOO(ajustadoo) SS 81oqa••
= 81.00 22 75 55.00 = 3.25

En la tabla 424se muestra el análisis de varianza. Puesto que el valor Pes pequeño, se concluye que el ca
talizador empleado tiene un efecto significativo sobre el tiempo de reacción .
• • • • • • • • • • • • • • • • • • • • • • ID • W •••••••••••••••• e a a ••••• e •••• e ••••••• W ••••••••••
Si el factor bajo estudio es fijo, las pruebas para las medias de tratamientos individuales pueden ser
de interés. Si se emplean contrastes ortogonales, los contrastes deben hacerse sobre los totales de los tra
tamientos ajustados, las {Q;} en lugar de las {y;.}. La suma de cuadrados de los contrastes es
SSc
k(í
= •=_1
C¡Q¡ r
!
A.tl
i•l
e¡
donde {e;} son los coeficientes de los contrastes. Pueden usarse otros métodos de comparación múltiple
158 CAPITuLO 4 BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEÑOS RELACIONADOS
para comparar todos los pares de efectos de los tratamientos ajustados (sección 44.2),los cuales se esti
man con f; = kQ/(A.a). El error estándar del efecto de un tratamiento ajustado es
S --~~~E
AU (432)
En el análisis que acaba de describirse, se ha hecho la partición de la suma de cuadrados total en una
suma de cuadrados de los tratamientos ajustados, una suma de cuadrados de los bloques sin ajuste y una
suma de cuadrados del error. En ocasiones habría interés en evaluar los efectos de los bloques. Para ello
se requiere hacer una partición alternativa de SSn es decir, ·
SST = SSTratamienl06 +SSBloques(ajustados) +SSE

Aquí, SSn.iamienios está sin ajuste. Si el diseño es simétrico, es decir, si a = b, puede obtenerse una fórmula
simple para SSaioques(aiustados)· Los totales de los bloques ajustados son
Q'. =y.--
1 .J
1
r
L n .. y¡
a
•~i •1 .
j= 1, 2, ... , b (433)
r~ (Qj)2
¡~1
SS Bloqucs(ajustados) = )..b (434)
El BIBD del ejemplo 45 es simétrico porque a = b = 4. Por lo tanto,

Q; = (221)t(218+ 216+ 222) = 7 / 3
Q; = (224)t(218+214+216)= 24/ 3
Q; = (207)t(214+216+222)= 31/ 3
Q; = (218)t(218+214+222)= o
y
s = 3[(7/ 3)2 +(24 / 3)2 +(31/3)2 +(0)2]
66.08
SBloques(ajustados) (2){ 4)
Asimismo,
SS . = (218)2 +(214)2 +(216)2 +(222)2 (870)2 = 11 67
Tratanuenl06 3 12 .
Tabla 425 Análisis de varianza del ejemplo 45, incluyendo tanto los tratamientos como los bloques
'Iratamientos (ajustados) 22.75 3 7.58 11.66 0.0107
Tratamientos (sin ajuste) 11.67 3
Bloques (sin ajuste) 55.00 3
Bloques (ajustados) 66.08 3 22.03 33.90 0.0010
Error 3.25 5 0.65
Tutal 81.0 11
44 DISEÑOS DE BLOQUES INCOMPLETOS BALANCEADOS 159
En la tabla 425 se presenta un resumen del análisis de varianza del BIBD simétrico. Observe que las
sumas de cuadrados asociadas con los cuadrados medios de la tabla 425 no producen la suma de cuadra
dos total, es decir,
SST :¡t SS Tratamienlos(ajustadoo) + SSBJoques(ajustadoo) +SS E

Esto es consecuencia del carácter no ortogonal de los tratamientos y los bloques.
Salida de
computadora
Existen varios paquetes de computadora que realizarán el análisis de un diseño de bloques incompletos
balanceados. El procedimiento de Modelos Lineales Generales (General Linear Models) del SAS es uno
de ellos, y Minitab, un paquete de estadística para computadoras personales de uso generalizado, es otro.
La parte superior de la tabla 426 es la salida del procedimiento de Modelos Lineales Generales de Mini
tab para el ejemplo 45. Al comparar las tablas 426 y 425, se observa que Minitab ha calculado la suma
de cuadrados de los tratamientos ajustados y la suma de cuadrados de los bloques ajustados (en la salida
de Minitab se les llama ''.AdjSS" o SS ajustada).
La parte inferior de la tabla 426 es un análisis de comparaciones múltiples, en el que se utiliza el mé
todo de Tukey. Se presentan los intervalos de confianza para las diferencias de todos los pares de medias y
la prueba de Tukey. Observe que el método de Tukey llevaría a la conclusión de que el catalizador 4 es di
ferente de los otros tres.
4 ..4.2 Estimación de mínimos cuadrados de los parámetros

Considere la estimación de los efectos de los tratamientos en el modelo BIBD. Las ecuaciones normales
de mínimos cuadrados son
• b
µ:NP,+r L f; +k L Pj =Y..
L n¡¡Pj =Y;.
b
-r;:rP,+rf; + i=l, 2, ... , a (435)

j=l
i= 1, 2, ... , b
Al imponer las restricciones If; = ~ i = O, se encuentra que fJ. = 5'. . Además, al utilizar las ecuaciones
para {Pi} para eliminar los efectos de los bloques de las ecuaciones para {r1}, se obtiene
b • b
rkf; -ñ; - LL nijnpjf

J=I p=I
P = ky;_ - L n;¡Y.i
j=I
(436)
p~i
Observe que el miembro del lado derecho de la ecuación 436 es kQ;, donde Q; es el total del tratamiento
ajustado résimo (ver la ecuación 429). Entonces, puesto que !.~=1n;¡ip¡ =A. sip "# i 1 nPJ (ya quenpj yn; = =
O o 1), la ecuación 436 puede reescribirse como
r(k-l)T; A.! p•l

fP = kQ; i=l,2, ...,a (437)
p~i
Tabla 4·26 Análisis de Minitab (Modelo Lineal General) para el ejemplo 45
Modelo Lineal General

Factor Type Levels Values
Catalyst fixed 4 1 2 3 4
Block fixed 4 1 2 3 4
Analysis of Variance for Time, using Adjusted SS for Tests

Source DF Seq SS Adj SS Adj MS F p
Catalyst 3 11.667 22.750 7.583 11. 67 0.011
Block 3 66.083 66.083 22.028 33.89 0.001
Error 5 3.250 3.250 0.650
Total 11 81.000
Tukey 95.0X Simultaneous Confidence Intervals

Response Variable Time
All Pairwise Comparisons among Levels of Catalyst
Catalyst = 1 subtracted from:
Catalyst
2
Lower
-2.327
Center
0.2500
Upper
2.827
----------+---------+---------+------
<---------*---------)
3
4
-1.952
1. 048
0.6250
3.6250
3.202
6.202
(----------*---------) (----------*---------)
----------+---------+---------+------
º·º 2.5 5.0
Catalyst = 2 subtracted froM:

Catalyst
3
Lower
-2.202
Center
'0.3750
Upper
2.952
----------+---------+---------+------
(---------*---------)
4 0.798 3.3750 5.952 (----------*---------)
----------+---------+---------+------
º·º 2.5 5.0

Catalyst
4
Lower
0.4228
Center
3.000
Upper
5.577
----------+---------+---------+------
(---------*---------)
----------+--
0. 0
--------+---------+------
2.5 5.0
Tukey Simultaneous Tests

Response Variable Time
All Pairw1se Comparisons among Levels of Catalyst
Level l>ifference SE of Adjusted
Catalyst of Means l>ifference T-Value P-Value
2 0.2500 0.6982 0.3581 0.9825
3 0.6250 0.6982 0.8951 0.8085
4 3.6250 0.6982 5. 1918 o. 0130
ca t a t yst = 2 subtracted from:
Level l>ifference SE of Adjusted
Catalyst of Mea ns .Di fference T-Value P-Value
3 0.3750 0.6982 0.5371 0.9462
4 3.3750 0.6982 4.8338 o. 0175
Catalyst "' 3 subtracted from:
Level Difference SE ot lló)usteó
Catalyst of Mea ns Difference T-Value P-Value
4 3.000 0.6982 4.297 0.0281
Por último, observe que la restricción l:~=ii¡ =O implica que l:~=1t P = t; y recuerde que r(k1) = .t(a-
1 ), de donde se obtiene P"i
A.tlt ¡ = kQ¡ i = 1, 2, ... , a (438)

Por lo tanto, los estimadores de mínimos cuadrados de los efectos de los tratamientos en el modelo de
bloques incompletos balanceados son
i = 1, 2, ... , a (439)
Como una ilustración, considere el BIBD del ejemplo 45. Puesto que Q1 = 9/3, Q2 = 7 /3, Q3 = 4/3
y Q4 = 20/3, se obtiene
i1
3(9/3) __
2)(4) 91
8 i2 = 3(7/3)=7/8
(
(2)(4)
i - 3(4/ 3) 4
3 (2)(4) /8
º
i 4 = 3(2 13)
(2)(4)
= 20/ 8
como se encontró en la sección 44.1.
4 ..4,3 Recuperación de información interbloques en el diseño

de bloques incompletos balanceados
Al análisis del BIBD presentado en la sección 44.1 suele llamársele el análisis intrabloques porque las
diferencias de los bloques se eliminan y todos los contrastes de los efectos de los tratamientos pueden ex
presarse como comparaciones entre las observaciones del mismo bloque. Este análisis es apropiado inde
pendientemente de si los bloques son fijos o aleatorios. Yates [113c] señaló que si los efectos de los
bloques son variables aleatorias no correlacionadas con medias cero y varianza a~, es posible obtener in
formación adicional acerca de los efectos de los tratamientos t¡. Yates llamó análisis interbloques al mé
. todo para obtener esta información adicional.
Considere los totales de los bloques y 1 como una colección de b observaciones. El modelo para estas
observaciones (siguiendo a John [61d]) es
Y.j = kµ+ ~ niir; +(kp1 +~ Eii) (440)
donde el término entre paréntesis puede considerarse como el error. Los estimadores interbloques deµ y
t, se encuentran minimizando la función de mínimos cuadrados
Se obtienen así las siguientes ecuaciones normales de mínimos cuadrados:
µ:Nji.+r ! i¡ =Y..
rP = L n¡¡Y.¡
• b
r¡:krfi+ri;+.t.L i=l,2, ... ,a

p•l j•l
p~i
162 CAPÍTIJLO 4 BLOQUES ALEATOIUZADOS, CUADRADOS LATINOS Y DISEÑOS RELACIONADOS
donde fi y i i denotan los estimadores interbloques. Al imponer la restricción l::~ f

1 1 = O, se obtienen las
soluciones de las ecuaciones 441 como ·
fi= y_ (442)
.L nljyj
b
-kfY ..
-
'r¡ = ,_).
1~1
i=l,2, ... ,a (443)
Es posible demostrar que los estimadores interbloques ff,} y los estimadores intrabloques {f 1} no están
correlacionados.
Los estimadores interbloques {i,} pueden diferir de los estimadores intrabloques {ti}. Por ejemplo,
los estimadores interbloques para el BIBD del ejemplo 45 se calculan de la siguiente manera:
663(3)(3)(72.50) o 50
7:1 32 1.
649(3)(3)(72.50) 3.50
1:2 = 32
652(3)(3)(72.50) 0.50
T3 = 32
646(3)(3)(72.50) 6.50
T4 = 32
Observe que los valores de l'.: ~~1 nij y1 se usaron en la página 157 para calcular los totales de los tratamien
tos ajustados en el análisis intrabloques.
Suponga ahora que quieren combinarse los estimadores interbloques e intrabloques para obtener
una sola estimación de la varianza mínima insesgada de cada r, Es posible demostrar que f 1 y s. son inses
gados y también que
(intrabloques)
y
k(a-l)
V(r)= (a2+ka2) ( intrabloques)
t a(r-).) fJ
Se usa una combinación lineal de los dos estimadores, por ejemplo

(444)
para estimar -r1• En este método de estimación, el estimador combinado insesgado de la varianza mínima
?:; deberá tener las ponderaciones a1 = u1/(u1 + u2) y a2 = u-j(u1 + u2), donde u1 = l/V(t;) y u2 = l/V(i;).
Por lo tanto, las ponderaciones óptimas son inversamente proporcionales a las varianzas de f 1 y r 1• Esto
implica que el mejor estimador combinado es
A k( a - 1) ( 2 ka 2 ) _ k( a - 1) 2
• ?:¡ a(r-).) a + fJ +r, Afi2 a
-r.=---'---'----------- i=l, 2, ..., a
k( a- l) k( a- l) ( 2 k 2 )
~-~a+ a+ a
1 2
Afi2 a(r-1) fJ
que puede simplificarse como
• kQ;(a2+ka~)+(~ niJyi-kry .. ~2
T = i=1, 2, ... , a (445)
; (rA.)a2 +A.a(a2 +ka~)
Desafortunadamente, la ecuación 445 no puede usarse para estimar r1 porque no se conocen las va
rianzas a2y a~. El enfoque común es estimara2ya~ a partir de los datos y sustituir estos parámetros de la
ecuación 445 con las estimaciones. La estimación que suele tomarse para a2 es el cuadrado medio del
error del análisis de varianza intrabloques, o el error intrabloques. Por lo tanto,
{j2 = MSE
La estimación de a~ se encuentra a partir del cuadrado medio de los bloques ajustados para los trata
mientos. En general, para un diseño de bloques incompletos balanceados, este cuadrado medio es
k !
i~l
Q¡2
+ L 't: L
b y2 • 2
Y;.
A.a 1=1 •=l r
MS Bloquesfejustadoa) = (b1)
(446)
y su valor esperado (cuya deducción se hace en Graybill [50]) es
J<TMS
LJL Blcquesfajustedcs}
1 a'+

a(r1)
b 1
2
a fJ
Por lo tanto, si MSmoques(aiustados¡ > MSE, la estimación de á~ es

[ MS Bloquesfajustados) MS e ]( b1)
a2 =
A
(447)
fJ a(r-1)
y si MSmoques(ajustados) s MSE, se hace á~ = O. Esto resulta en el estimador combinado
r·¡-
kQ;(a2 +M~
(r- A. )á2 +A.a(

)+(~ »,»,
l1=l
a 2 +ka-~)
-kry .
rt_
2
¿¡2 >0
fJ
(448a)
Y; (1/ a)y_
{j2{J - o (448b)
r
A continuación se calculan las estimaciones combinadas para los datos del ejemplo 45. Por la tabla
425 se obtiene fi2 = MSE = 0.65 y MSBloques(ajustados) = 22.03. (Observe que para calcular MSB!oques(ajustados) se
hace uso del hecho de que éste es un diseño simétrico. En general, debe usarse la ecuación 446.) Puesto
que MSB!oques(ajustados) > MSE, se usa la ecuación 447 para estimar a~ como
{j2 = (22.03 0.65)(3) = 8.02
fJ 4(31)
Por lo tanto, pueden sustituirse a 2 = 0.65 y a~ = 8.02 en la ecuación 448a para obtener las estimaciones
combinadas que se enlistan enseguida. Por conveniencia, también se presentan las estimaciones intrablo
ques e interbloques. En este ejemplo, las estimaciones combinadas están próximas a las estimaciones in
trabloques debido a que la varianza de las estimaciones interbloques es relativamente grande.
Parámetro Estimación intrabloques Estimacióninterbloques Estimacióncombinada

't¡ 1.12 10.50 1.09
't2 0.88 3.50 0.88
't3 0.50 0.50 0.50
't4 2.50 6.50 2.47
4-5 PROBLEMAS
41. Un químico quiere probar el efecto de cuatro agentes químicos sobre la resistencia de un tipo particular de
tela. Debido a que podría haber variabilidad de un rollo de tela a otro, el químico decide usar un diseño de blo
ques aleatorizados, con los rollos de tela considerados como bloques. Selecciona cinco rollos y aplica los
cuatro agentes químicos de manera aleatoria a cada rollo. A continuación se presentan las resistencias a la
tensión resultantes. Analizar los datos de este experimento (utilizar a = O.OS) y sacar las conclusiones
apropiadas.
Agente Rollo
químico 1 2 3 4 s
1 73 68 74 71 67
2 73 67 75 72 70
3 75 68 78 73 68
4 73 71 75 75 69
42. Se están comparando tres soluciones de lavado diferentes a fin de estudiar su efectividad para retardar el
crecimiento de bacterias en contenedores de leche de 5 galones. El análisis se hace en un laboratorio y sólo
pueden realizarse tres ensayos en un día. Puesto que los días podrían representar una fuente potencial de va
riabilidad, el experimentador decide usar un diseño de bloques aleatorizados. Se hacen observaciones en
cuatro días, cuyos datos se muestran enseguida. Analizar los datos de este experimento (utilizar a = O.OS) y
sacar las conclusiones apropiadas.
Días
Solución 1 2 3 4
1 13 22 18 39
2 16 24 17 44
3 5 4 1 22
43. Graficar las resistencias a la tensión medias observadas para cada tipo de agente químico en el problema 41
y compararlas con una distribución t con la escalación apropiada. ¿Qué conclusiones se sacarían a partir de
esta representación gráfica?
44. Graficar los conteos de bacterias promedio para cada solución en el problema 42 y compararlos con una dis
tribución t escalada. lQué conclusiones pueden sacarse?
45. En un artículo de Fire Safety Joumal ("El efecto del diseño de boquillas en la estabilidad y el desempeño de
surtidores de agua turbulenta", vol. 4) se describe un experimento en el que se determinó un factor de la for
ma para varios diseños diferentes de boquillas con seis niveles de la velocidad del flujo de salida del surtidor.
45 PROBLEMAS 165
El interés se centró en las diferencias potenciales entre los diseños de las boquillas, con la velocidad conside
rada como una variable perturbadora. Los datos se presentan a continuación.
Diseño dela Velocidad del flujo de salida del surtidor (mis)

boquilla 11.73 14.37 16.59 20.43 23.46 28.74
1 0.78 0.80 0.81 0.75 0.77 0.78
2 0.85 0.85 0.92 0.86 0.81 0.83
3 0.93 0.92 0.95 0.89 0.89 0.83
4 1.14 0.97 0.98 0.88 0.86 0.83
5 0.97 0.86 0.78 0.76 0.76 0.75
a) lEl diseño de la boquilla afecta el factor de la forma? Comparar las boquillas con un diagrama de disper
sión y con un análisis de varianza, utilizando a = 0.05.
e) lQué diseños de las boquillas son diferentes con respecto al factor de la forma? Trazar una gráfica del
factor de la forma promedio para cada tipo de boquilla y compararla con una distribución t escalada.
Comparar las conclusiones que se sacaron a partir de esta gráfica con las de la prueba del rango múltiple
de Duncan.
46. Considere el experimento del algoritmo para controlar la proporción de alúmina del capítulo 3, sección 38.
El experimento se llevó a cabo en realidad como un diseño de bloques aleatorizados, en el que se selecciona
ron seis periodos como bloques, y se probaron los cuatro algoritmos para controlar la proporción en cada pe
riodo. El voltaje promedio de la celda y la desviación estándar del voltaje (indicada entre paréntesis) para
cada celda son los siguientes:
Algoritmo Tiempo
para controlar
la proporción 1 2 3 4 5 6
1 4.93 (0.05) 4.86 (0.04) 4.75 (O.OS) 4.9S (0.06) 4.79 (0.03) 4.88 (0.05)
2 4.85 (0.04) 4.91 (0.02) 4.79 (0.03) 4.8S (0.05) 4.75 (0.03) 4.85 (0.02)
3 4.83 (0.09) 4.88 (0.13) 4.90 (0.11) 4.75 (0.15) 4.82 (0.08) 4.90 (0.12)
4 4.89 (0.03) 4.77 (0.04) 4.94 (O.OS) 4.86 (O.OS) 4.79 (0.03) 4.76 (0.02).
a) Analizar Jos datos del voltaje promedio de las celdas. (Utilizar a = O.OS.) lLa elección del algoritmo para
controlar Ja proporción afecta el voltaje promedio de las celdas?
b) Realizar el análisis apropiado de la desviación estándar del voltaje. (Recuerde que a éste se le llamó "rui
do del crisol".) lLa elección del algoritmo para controlar la proporción afecta el ruido del crisol?
e) Realizar los análisis residuales que parezcan apropiados.
d) lQué algoritmo para controlar la proporción debería seleccionarse si el objetivo es reducir tanto el vol
taje promedio de las celdas como el ruido del crisol?
4 7. El fabricante de una aleación maestra de aluminio produce refinadores de textura en forma de lingotes. La
compañía produce el producto en cuatro hornos. Se sabe que cada horno tiene sus propias características
únicas de operación, por lo que en cualquier experimento que se corra en la fundición en el que se use más de
un horno, los hornos se considerarán como una variable perturbadora. Los ingenieros del proceso sospechan
que la velocidad de agitación afecta la medida de la textura del producto. Cada horno puede operarse con
166 CAPÍTULO 4 BLOQUES ALEATORIZADOS, CUADRADOS LATL'JOS Y DISENOS RELACIONADOS
cuatro diferentes velocidades de agitación. Se lleva a cabo un diseño de bloques aleatorizados para un refina
dor particular y los datos resultantes de la medida de la textura se muestran a continuación:
Horno
Velocidad de agitación (rpm) 1 2 3 4
5 8 4 5 6
10 14 5 6 9
15 14 6 9 2
20 17 9 3 6
a) lExiste evidencia de que la velocidad de agitación afecta la medida de la textura?

b) Representar los residuales de este experimento en una gráfica de probabilidad normal. Interpretar esta gráfica.
e) Graficar los residuales contra el horno y la velocidad de agitación. lEsta gráfica proporciona alguna in
formación útil?
d) lCuál sería la recomendación de los ingenieros del proceso con respecto a la elección de la velocidad de
agitación y del horno para este refinador de textura particular si es deseable una medida de la textura pe
queña?
48. Analizar los datos del problema 42 utilizando la prueba general de significación de la regresión.
49. Suponiendo que los tipos de agentes químicos y los rollos de tela son fijos, estimar los parámetros del modelo
t¡ y flj del problema 41.
410. Trazar una curva de operación característica para el diseño del problema 42. lLa prueba parece ser sensible
a las diferencias pequeñas en los efectos de los tratamientos?
411. Suponga que falta la observación del agente químico 2 y el rollo 3 en el problema 41. Analizar el problema
estimando el valor faltante. Realizar el análisis exacto y comparar los resultados.
412. Dos valoresfaltantes en un bloque aleatorizado, Suponga que en el problema 41 faltan las observaciones del
agente químico tipo 2 y el rollo 3 y del agente químico tipo 4 y el rollo 4.
a) Analizar el diseño haciendo la estimación iterativa de los valores faltantes, como se describe en la sec
ción 41.3.
b) Derivar SSE con respecto a los dos valores faltantes, igualar los resultados con cero y resolver las ecuacio
nes para las estimaciones de los valores faltantes, Analizar el diseño utilizando estas dos estimaciones de
los valores faltantes.
e) Deducir las fórmulas generales para estimar dos valores faltantes cuando las observaciones están en blo
ques diferentes.
d) Deducir las fórmulas generales para estimar dos valores faltantes cuando las observaciones están en el
mismo bloque.
413. Un ingeniero industrial está realizando un experimento sobre el tiempo de enfoque del ojo. Se interesa en el
efecto de la distancia del objeto al ojo sobre el tiempo de enfoque. Cuatro distancias diferentes son de inte
rés. Cuenta con cinco sujetos para el experimento. Debido a que puede haber diferencias entre los indivi
duos, el ingeniero decide realizar el experimento en un diseño de bloques aleatorizados. Los datos obtenidos
se presentan a continuación. Analizar los datos de este experimento (utilizar a = 0.05) y sacar las conclusio
nes apropiadas.
Sujeto
Distancia (pies) 1 2 3 4 5
4 10 6 6 6 6
,
6 7 o 6 1 6
8 5 3 3 2 5
10 6 4 4 2 3
4~5 PROBLEMAS 167
414. Se estudia el efecto de cinco ingredientes diferentes (A, B, C, D y E) sobre el tiempo de reacción de un proce
so químico. Cada lote de material nuevo sólo alcanza para permitir la realización de cinco corridas. Además,
cada corrida requiere aproximadamente 11/2 horas, por lo que sólo pueden realizarse cinco corridas en un
día. El experimentador decide realizar el experimento como un cuadrado latino para que los efectos del día y
el lote puedan controlarse sistemáticamente. Obtiene los datos que se muestran enseguida. Analizar los da
tos de este experimento (utilizar a = 0.05) y sacar conclusiones.
Día
Lote 1 2 3 4 5
1 A =8 B=7 D = 1 C=7 E= 3
2 e= 11 E=2 A =7 D =3 B=8
3 B=4 A= 9 C= 10 E=l D =5
4 D=6 C=8 E= 6 B=6 A= 10
5 E =4 D=2 B =3 A =8 C=8
415. Un ingeniero industrial investiga el efecto de cuatro métodos de ensamblaje (A, B, Cy D) sobre el tiempo de
ensamblaje de un componente de televisores a color. Se seleccionan cuatro operadores para el estudio. Ade
más, el ingeniero sabe que todos los métodos de ensamblaje producen fatiga, de tal modo que 'el tiempo re
querido para el último ensamblaje puede ser mayor que para el primero, independientemente del método.
Es decir, se desarrolla una tendencia en el tiempo de ensamblaje requerido. Para tomar en cuenta esta fuente
de variabilidad, el ingeniero emplea el diseño del cuadrado latino que se presenta a continuación. Analizar
los datos de este experimento (a = O.OS) y sacar las conclusiones apropiadas.
Orden de Operador
ensamblaje 1 2 3 4
1 C= 10 D = 14 A= 7 B=8
2 B=7 e= 18 D=ll A= 8
3 A =5 B=lO e= 11 D =9
4 D=lO A= 10 B = 12 C= 14
416. Suponga que en el problema 414 falta la observación del lote 3 en el día 4. Estimar el valor faltante con la
ecuación 424, y realizar el análisis utilizando este valor.
417. Considere un cuadrado latino p x p con renglones (a;), columnas (A) y tratamientos ('rj) fijos. Obtener esti
maciones de mínimos cuadrados de los parámetros del modelo a;, f3k y rj.
418. Deducir la fórmula del valor faltante (ecuación 424) para el diseño del cuadrado latino.
419. Diseños que incluyen varios cuadrados latinos. (Ver Cochran y Cox [26] y J ohn [ 61d].) El cuadrado latino p x p
contiene únicamente p observaciones para cada tratamiento. Para obtener más réplicas, el experimentador
puede usar varios cuadrados, por ejemplo n. No es relevante si los cuadrados usados son el mismo o son dife
rentes. El modelo apropiado es
i= 1, 2, , p
=
j
j 1, 2, , p
Yijkh = µ+ph +a,(hl +rj +/3k(h) +(rp)ih +eiikh k=
1 , 2, , p
h= 1, 2, , n
donde Y;¡kh es la observación del tratamiento j en el renglón i y la columna k del cuadrado hésimo. Observe
que ai(h) y {Jk(h) son los efectos del renglón y la columna en el cuadrado hésimo, ph es el efecto del cuadrado
h-ésimo y (r:p )¡h es la interacción entre los tratamientos y los cuadrados.
a) Establecer las ecuaciones normales para este modelo y resolverlas para las estimaciones de los paráme
tros del modelo. Suponga que las condiciones auxiliares apropiadas de los parámetros son ~hPi. =O,
~,iti(h) =O y ~k{Jk(h) =O para cada h, ~¡i¡ =O, ~¡(ip)¡h =O para cada h y ~h(ip)¡h =O para cadaj.
b) Desarrollar la tabla del análisis de varianza para este diseño.
420. Comentar la forma en que pueden utilizarse las curvas de operación característica del apéndice con el diseño
del cuadrado latino.
421. Suponga que en el problema 414 los datos tomados en el día 5 se analizaron incorrectamente y fue necesario
descartarlos. Desarrollar un análisis apropiado para los datos restantes.
422. El rendimiento de un proceso químico se midió utilizando cinco lotes de materia prima, cinco concentracio
nes del ácido, cinco tiempos de procesamiento (A, B, C, Dy E) y cinco concentraciones del catalizador (a,{J,
y, d, .e). Se usó el cuadrado grecolatino siguiente. Analizarlos datos de este experimento (utilizar a = 0.05) y
sacar conclusiones.
Concentración del ácido

Lote 1 2 3 4 5
1 Aa=26 BfJ = 16. Cy = 19 Dd = 16 Ee = 13
2 By= 18 Cd = 21 De = 18 Ea= 11 AfJ = 21
3 Ce = 20 Da= 12 EfJ = 16 Ay =25 Bd = 13
4 DfJ = 15 Ey = 15 Ad =22 Be = 14 Ca= 17
5 Ed = 10 A.e =24 Ba = 17 C{J = 17 Dy = 14
423. Suponga que en el problema 415 el ingeniero sospecha que los sitios de trabajo usados por los cuatro opera
dores pueden representar una fuente adicional de variación. Es posible introducir un cuarto factor, el sitio de
trabajo (a, {J, y, ó), y realizar otro experimento, de donde resulta el cuadrado grecolatino siguiente. Analizar
los datos de este experimento (utilizar a = 0.05) y sacar conclusiones.
Orden de Operador
ensamblaje 1 2 3 4
1 CfJ = 11 By= 10 Dd = 14 Aa =8
2 Ba =8 rn = 12 Ay= 10 D{J = 12
3 Ad =9 Da= 11 BfJ = 7 Cy = 15
4 Dy =9 A{J = 8 Ca= 18 Bd =6
424. Construir un hipercuadrado 5 x 5 para estudiar los efectos de cinco factores. Desarrollar la tabla del análisis
de varianza para este diseño.
425. Considere los datos de los problemas 415 y 423. Después de eliminar las letras griegas del problema 423,
analizar los datcis utilizando el método desarrollado en el problema 419.
426. Considere el diseño de bloques aleatorizados con un valor faltante en la tabla 4 7. Analizar los datos utilizan
do el análisis exacto del problema del valor faltante revisado en la sección 41.4. Comparar los resultados con
el análisis aproximado de estos datos que se presenta en la tabla 48.
427. Un ingeniero estudia las características del rendimiento de combustible de cinco tipos de aditivos de gasoli
na. En laprueba de carretera el ingeniero desea usar los automóviles como bloques; sin embargo, debido a
45 PROBLEMAS 169
una restricción de tiempo, debe utilizar un diseño de bloques incompletos. Realiza el diseño balanceado con
los cinco bloques siguientes. Analizar los datos de este experimento (utilizar a = 0.05) y sacar conclusiones.
Automóvil
Aditivo 1 2 3 4 5
1 17 14 13 12
2 14 14 13 10
3 12 13 12 9
4 13 11 11 12
5 11 12 10 8
428. Construir un conjunto de contrastes ortogonales para Jos datos del problema 427. Calcular la suma de cua
drados para cada contraste.
429. Se estudian siete concentraciones diferentes de madera dura para determinar su efecto sobre Ja resistencia
del papel producido. Sin embargo, en la planta piloto sólo pueden hacerse tres corridas de producción por
día. Dado que los días pueden diferir, el analista utiliza el diseño de bloques incompletos balanceados que se
muestra abajo. Analizar los datos de este experimento (utilizar a = 0.05) y sacar conclusiones.
Concentración de Días
madera dura(%) 1 2 3 4 5 6 7
2 114 120 117
4 126 120 119
6 137 117 134
8 141 129 149
10 145 150 143
12 120 118 123
14 136 130 127
430. Analizar los datos del ejemplo 46 utilizando la prueba general de significación de la regresión.
431. Demostrar que k~~=1(t /(la) es la suma de cuadrados ajustada de los tratamientos en un BIBD.
432. Un experimentador quiere comparar cuatro tratamientos en bloques de dos corridas. Encontrar un BIBD
para este experimento con seis bloques.
433. Un experimentador quiere comparar ocho tratamientos en bloques de cuatro corridas. Encontrar un BIBD
con 14 bloques y ,\ = 3.
434. Realizar el análisis interbloques del diseño del problema 427.
435. Realizar el análisis interbloques del diseño del problema 429.
436. Comprobar que no existe un BIBD con parámetros a = 8, r = 8, k = 4 y b 16. =
437. Demostrar que la varianza de los estimadores intrabloques {iJ es k(a ~ 1 )a2 / (Aa.2).
438. Diseños extendidos de bloques incompletos. Ocasionalmente, el tamaño del bloque cumple con la relación a < k
< 2a. Un diseño extendido de bloques incompletos consiste en una sola réplica de cada tratamiento en cada
bloque junto con un diseño de bloques incompletos con k" = k - a. En el caso balanceado, el diseño de blo
ques incompletos tendrá los parámetrosk* = k-a, r" = r-b y,\*. Desarrollar el análisis estadístico. (Suge-
rencia: en el diseño extendido de bloques incompletos, se tiene ,\ = 2r - b + ,\ *.)
Introducción
a los diseños
factoriales
51 DEFINICIONES Y PRINCIPIOS BÁSICOS
En muchos experimentos interviene el estudio de los efectos de dos o más factores. En general, los dise
ños factoriales son los más eficientes para este tipo de experimentos. Por diseño factorial se entiende que
en cada ensayo o réplica completa del experimento se investigan todas las combinaciones posibles de los
niveles de los factores. Por ejemplo, si el factor A tiene a niveles y el factor B tiene b niveles, cada réplica
contiene todas las ab combinaciones de los tratamientos. Cuando los factores están incluidos en un dise
ño factorial, es común decir que están cruzados.
El efecto de un factor se define como el cambio en la respuesta producido por un cambio en el nivel
del factor. Con frecuencia se le llama efecto principal porque se refiere a los factores de interés primario
en el experimento. Por ejemplo, considere el experimento sencillo de la figura 5L Se trata de un experi
mento factorial de dos factores en el que los dos factores del diseño tienen dos niveles. A estos niveles se
les ha denominado "bajo" y "alto" y se denotan como"" y"+", respectivamente. El efecto principal del
factor A de este diseño de dos niveles puede visualizarse como la diferencia entre la respuesta promedio
con el nivel bajo de A y la respuesta promedio con el nivel alto de A. Numéricamente, esto es
A= 40+52 _ 20+30 = 21
2 2
Es decir, cuando el factor A se incrementa del nivel bajo al nivel alto se produce un incremento de la res
puesta promedio de 21 unidades. De manera similar, el efecto principal de B es
B= 30+52 _ 20+40 = ll
2 2
Cuando los factores tienen más de dos niveles, es necesario modificar el procedimiento anterior, ya que
existen otras formas de definir el efecto de un factor. Este punto se estudia con mayor profundidad más
adelante.
En algunos experimentos puede encontrarse que la diferencia en la respuesta entre los niveles de un
factor no es la misma para todos los niveles de los otros factores. Cuando esto ocurre, existe una interac
170
51 DEFINICIONES Y PRINCIPIOS BÁSICOS 171
D D
+ 30 52 + 40 12
(Alto) (Alto)
1:1:¡ 1:1:¡
o
....
§
<>
...~
(Bajo) (Bajo)
20 40 20 50
+ +
(Bajo) (Alto) (Bajo) (Alto)
Factor A Factor A
Fignra S1 Experimento factorial de dos Figura S·2 Experimento factorial de dos
factores con la respuesta (y) indicada en los factores con interacción.
vértices.
ción entre los factores. Por ejemplo, considere el experimento factorial de dos factores que se ilustra en la
figura 52. Con el nivel bajo del factor B (o 11), el efecto de A es
A= 5020= 30
y con el nivel alto del factor B (o B+), el efecto de A es
A= 1240= 28
Puesto que el efecto deA depende del nivel que se elige para el factor B, se observa que existe una interac
ción entreAy B. La magnitud del efecto de la interacción es la diferencia promedio de estos dos efectos de
A, o AB = (28 30)/2 = 29. Evidentemente, en este experimento la interacción es grande.
Estas ideas pueden ilustrarse gráficamente. En la figura 53 se grafican los datos de las respuestas de
la figura 51 contra el factor A para ambos niveles del factor B. Observe que las rectas B''y B+ son aproxi
madamente paralelas, lo cual indica la ausencia de interacción entre los factores A y B. De manera simi
lar, en la figura 54 se grafican los datos de las respuestas de la figura 52. En este caso se observa que las
rectas B' y B+ no son paralelas. Esto indica una interacción entre los factoresAy B. Gráficas como éstas
son de gran ayuda para interpretar las interacciones significativas y para reportar los resultados al perso
nal sin preparación estadística. Sin embargo, no deberán utilizarse como la única técnica para el análisis
de datos, ya que su interpretación es subjetiva y su apariencia con frecuencia es engañosa.
60 B+ 60
50 50
il
~
40 i"':i 40
~ 30 ~ li
C>
30
a: 20 a: 20
B-
10 10
+ +
Factor A Factor A
Figura 53 Experimento factorial sin in FiguraS4 Experimento factorial con ínter
ter acción. acción.
172 CAPÍTULO 5 INTRODUCCIÓN A lDS DISEÑOS FACTORIALES
El concepto de interacción puede ilustrarse de otra manera. Suponga que los dos factores del diseño
tratado son cuantitativos (temperatura, presión, tiempo, etc.). Entonces una representación con un mo
delo de regresión del experimento factorial de dos factores podría escribirse como
y= Po +/31X1 +/32X2 +f:31zX1Xz +E
donde y es la respuesta, las p son parámetros cuyos valores deben determinarse, x1 es una variable que re
presenta al factorzí.z, es una variable que representa al factor B, y E es un término del error aleatorio. Las
variables x1 y x2 se definen en una escala codificada de 1 a + 1 (los niveles bajo y afro de A y B), y x¡X2 re
presenta la interacción entre x1 y x2•
Las estimaciones de los parámetros en este modelo de regresión resultan estar relacionadas con las
estimaciones de los efectos. Para el experimento ilustrado en la figura 51 se encuentra que los efectos
principales de A y B sonA = 21 y B = 11. Las estimaciones de /31 y /32 son la mitad del valor del efecto prin
p p
cipal correspondiente; por lo tanto, 1 = 21/2=10.5 y 2 = 11/2 = 5.5. El efecto de la interacción de la
figura 51 es AB =1, por lo que el valor del coeficiente de la interacción en el modelo de regresión es
p =
12 =
1 / 2 0.5. El parámetro {10 se estima con el promedio de las cuatro respuestas, o
Po= (20+40+30+52)/ 4 = 35.5. Por lo tanto, el modelo de regresión ajustado es
y= 35.5+10.5x1 +5.5x2 +0.5x1x2
a.) La superficie de respuesta
0.6 0.2 0.2 0.6
b) La gráfi~ de contorno
Figura 55 La superficie de respuesta y la gráfica de· contorno para el mode

lo j = 35.5 + 10. .í".1 + 5.5x2•
51 DEFINICIONES Y PRINCIPIOS BÁSICOS 173
Las estimaciones de los parámetros obtenidas de esta manera para el diseño factorial en el que todos los
factores tienen dos niveles (y +) resultan ser estimaciones de mínimos cuadrados (se abundará sobre el
tema más adelante).
El coeficiente de la interacción 12 (P =
0.5) es pequeño en comparación con los coeficientes de los
p P
efectos principales 1 y 2• La interpretación que se hará de este hecho es que la interacción es pequeña y
puede ignorarse. Por lo tanto, al eliminar el término 0.5x¡.t2 se obtiene el modelo
y= 35.5+10.5x1 +5.5x2
En la figura 5-5 se muestran las representaciones gráficas de este modelo. En la figura 5-5a se tiene una
gráfica del plano de los valores de y generados por las diferentes combinaciones de x1 y x2• A esta gráfica
tridimensional se le llama gráfica de superficie de respuesta. En la figura 5-Sb se muestran las líneas de
contorno para las respuestas constantes y en el planox1,x2• Observe que como la superficie de respuesta es
un plano, la gráfica de contorno contiene líneas rectas paralelas.
Suponga ahora que la contribución de la interacción en el experimento no fuera insignificante; es de
cir, que el cceñcíenteji., no fuera pequeño. En la figura 56 se presenta la superficie de respuesta y la grá
fica de contorno del modelo
al La superficie de respuesta
0.6
0.2
""' 0.2
0.6
1
1 0.6 0.2 0.2 0.6
b) La gráfica de contorno
Figura 56 La superficie de respuesta y la gráfica de contorno para el mo

delo y= 35.5 + 10.5r1 + 5.5r2 + lk¡X2•
174 CAPÍTULO 5 INTRODUCCIÓN A LOS DISEÑOS FACTORIALES
(Se ha hecho que el efecto de la interacción sea el promedio de los dos efectos principales.) Observe que
el efecto significativo de la interacción provoca el "torcimiento" del plano de la figura 5-6a. Este torci
miento de la superficie de respuesta produce líneas de contorno curvas para las respuestas constantes en
el planox1,x2, como se muestra en la figura 5-6b. Por lo tanto, una interacción es una forma de curvatura
en el modelo de superficie de respuesta fundamental del experimento.
El modelo de superficie de respuesta de un experimento es de gran importancia y utilidad. El tema se
ampliará en la sección 55 y en capítulos posteriores.
En general, cuando una interacción es grande, los efectos principales correspondientes tienen escaso
significado práctico. En el experimento de la figura 52, la estimación del efecto principal deA sería
A= 50+12_ 20+40 = l
2 2
que es muy pequeño, y se llegaría a concluir que no hay ningún efecto debido a A. Sin embargo, cuando se
examinan los efectos de A con niveles diferentes del factor B, se observa que no es éste el caso. El factor A
tiene un efecto, pero depende del nivel del factor B. Es decir, el conocimiento de la interacciónAB es más
útil que el conocimiento del efecto principal. Una interacción significativa suele enmascarar la significa
ción de los efectos principales. Estos puntos se ponen de manifiesto con claridad en la gráfica de la inter
acción de la figura 54. En presencia de una interacción significativa, el experimentador deberá por lo
general examinar los niveles de uno de los factores, por ejemplo del factor A, manteniendo fijos los nive
les de los otros factores para sacar conclusiones acerca del efecto principal de A.
52 LA VENTAJA DE LOS DISEÑOS FACTORIALES
Es sencillo ilustrar la ventaja de los diseños factoriales. Suponga que se tienen dos factores A y B, cada
uno con dos niveles. Los niveles de los factores se denotan porA-,A+,B-y B+. Podría obtenerse informa
ción acerca de ambos factores haciéndolos variar uno a la vez, como se muestra en la figura 5 7. El efecto
de cambiar el factor A está dado porA+B--A-s-, y el efecto de cambiar el factorB está dado porA-B+ -
A-B-. Debido a que está presente el error experimental, es deseable realizar dos observaciones, por ejem
plo, para cada combinación de tratamientos y estimar los efectos de los factores utilizando las respuestas
promedio. Por lo tanto, se necesita un total de seis observaciones.
Si se hubiera efectuado un experimento factorial, se habría registrado una combinación adicional
de los tratamientos,A + B+. Ahora, utilizando sólo cuatro observaciones, pueden hacerse dos estimacio
nes del efecto de A :A+ B- -A-s-y A+ B+ -A-B+. De manera similar, pueden hacerse dos estimaciones del
A-B+
+
~....
o
t;
"'
u.
A-a- A+B-
+
Factor A
Figura 5·7 Experimento con un factor a la vez.
5-3 DISENO FACTORIAL DE DOS FACTORES 175
4.0
3.5
·~., 3.0
1i.,
·g 2.5
;gw"' 2.0
1.5
1.0
2 3 4 5 6
Número de factores
Figura 58 Eficiencia relativa de un diseño factorial con

respecto a un experimento de un factor a la vez (dos niveles
del factor).
efecto de B. Estas dos estimaciones de cada efecto principal podrían promediarse para producir efectos
principales promedio que tienen la misma precisión que las estimaciones del experimento con un solo
factor, pero sólo se requieren cuatro observaciones en total, y nosotros diríamos que la eficiencia relati
va del diseño factorial con respecto al experimento de un factor a la vez es de (6/4) = 1.5. En general,
esta eficiencia relativa aumentará conforme se incremente el número de factores, como se muestra en
la figura 58.
Suponga ahora que está presente una interacción. Si el diseño de un factor a la vez indicara queA-B+
y A+ Edieron mejores respuestas queAB, una conclusión lógica seria que A+ B+ sería todavía mejor. Sin
embargo, si está presente una interacción, esta conclusión puede ser una equivocación grave. Para un
ejemplo, referirse al experimento de la figura 52.
En resumen, observe que los diseños factoriales ofrecen varias ventajas. Son más eficientes que los
experimentos de un factor a la vez. Además, un diseño factorial es necesario cuando puede haber interac
ciones presentes a fin de evitar llegar a conclusiones incorrectas. Por último, los diseños factoriales permi
ten la estimación de los efectos de un factor con varios niveles de los factores restantes, produciendo
conclusiones que son válidas para un rango de condiciones experimentales.
5~3 DISEÑO FACTORIAL DE DOS FACTORES
5~3.1 Un ejemplo
Los tipos más simples de diseños factoriales incluyen únicamente dos factores o conjuntos de tratamien
tos. Hay a niveles del factor A y b niveles del factor B, los cuales se disponen en un diseño factorial; es de
cir, cada réplica del experimento contiene todas las ab combinaciones de los tratamientos. En general,
hay n réplicas.
Como ejemplo de un diseño factorial en el que intervienen dos factores, un ingeniero está diseñando
una batería que se usará en un dispositivo que se someterá a variaciones de temperatura extremas. El úni
co parámetro del diseño que puede seleccionar en este punto es el material de la placa o ánodo de la bate
ría, y tiene tres elecciones posibles. Cuando el dispositivo esté fabricado y se envíe al campo, el ingeniero
no tendrá control sobre las temperaturas extremas en las que operará el dispositivo, pero sabe por expe
Tabla 5·1 Datos de la vida (en horas) para el ejemplo del diseño de la batería
Tipo de 'Iemperatura (ºF)
material 15 70 125
1 130 155 34 40 20 70
74 180 80 75 82 58
2 150 188 136 122 25 70
159 126 106 115 58 45
3 138 110 174 120 96 104
168 160 150 139 82 60
rienda que la temperatura probablemente afectará la vida efectiva de la batería. Sin embargo, la tempe
ratura puede controlarse en el laboratorio donde se desarrolla el producto para fines de prueba.
El ingeniero decide probar los tres materiales de la placa con tres niveles de temperatura15, 70 y
125"F, ya que estos niveles de temperatura son consistentes con el medio ambiente donde se usará final
mente el producto. Se prueban cuatro baterías con cada combinación del material de la placa y la tempe
ratura, y las 36 pruebas se corren de manera aleatoria. En la tabla 51 se presentan los datos del
experimento y de la vida observada de la batería.
En este problema, el ingeniero quiere responder las preguntas siguientes:
l. lQué efectos tienen el tipo de material y la temperatura sobre la vida de la batería?

2. lExiste alguna elección del material que produzca de manera regular una vida larga de la batería
independientemente de la temperatura?
La segunda pregunta es de particular importancia. Quizá sea posible encontrar una alternativa del mate
rial que no resulte afectada considerablemente por la temperatura. De ser éste el caso, el ingeniero puede
hacer que la batería sea robusta para la variación de la temperatura en el campo. Se trata de un ejemplo
de la aplicación del diseño experimental estadístico en el diseño de productos robustos, un problema de
ingeniería muy importante.
El anterior es un ejemplo específico del caso general de un diseño factorial de dos factores. Para pa
=
sar al caso general, seay1jk la respuesta observada cuando el factor A tiene el nivel iésimo (i 1, 2, ... ,a) y
el factor B tiene el nivel jésimo (j = 1, 2, ... , b) en la réplica késima (k = 1, 2, ... , n ). En general, el experi
mento factorial de dos factores aparecerá como en la tabla 52. El orden en que se hacen las abn observa
ciones se selecciona al azar, por lo que este diseño es un diseño completamente aleatorizado.
Tabla 52 Arreglo general de un diseño factorial de dos factores

FactorB
1 2 b
1 Y1wY112, Y121>Y122, Y1b!•Y1b2•
····Y11n ... ,y¡2n ... ,ylbn
FactorA 2 Y211.Y212. Y2z1,Yzw Y2b1>Y2bz,
····Y21n ····Yzz. ····Y2bn
a Ya11>Ya12• YazuYa22• Yabl>YabZ•

... ,y.¡. . .. ,y.2n "'>Yabn
1
53 DISEÑO FACTORIAL DE DOS FACTORES 177
Las observaciones de un experimento factorial pueden describirse con un modelo. Hay varias formas
i.:
de escribir el modelo de un experimento factorial. El modelo de los efectos es
1, 2, , a
Y;¡k = u+t , +/3; +(rP)¡; +e¡¡k
{ J1, 2, , b
k = 1, 2, , n
(S1)
dondeµ es el efecto promedio global, t¡ es el efecto del nivel íésimo del factor A de los renglones, fJ; es el
efecto del niveljésimo del factor B de las columnas, ('í{J);¡ es el efecto de la interacción entre 'í; y fJ;. y e1¡k es
un componente del error aleatorio. Se supone que ambos factores son fijos, y los efectos de los tratamien
tos se definen como las desviaciones de la media global, por lo que I~=1 r1 = Oy 'I.~=1/3 ¡ =O. De manera si
milar, los efectos de las interacciones son fijos y se definen de tal modo que I:.
1(r{J)¡¡ = 'I.~=1(r/3)9 =O.
Puesto que hay n réplicas del experimento, hay abn observaciones en total.
i.:
Otro modelo posible de un experimento factorial es el modelo de las medias
1, 2, , a
Y;;k = µ;; +e!i.1: { J 1, 2, , b
k = 1, 2, , n
donde la media de la celda ijésima es

µij = u+t¡ +/3; +(r/3);;
Thmbién podría usarse un modelo de regresión como en la sección 51. Los modelos de regresión resultan
particularmente útiles cuando uno o más de los factores del experimento son cuantitativos. En la mayor
parte de este capítulo se usará el modelo de los efectos (ecuación 51) con referencia al modelo de regre
sión en la sección 55.
En el diseño factorial de dos factores, los factores (o tratamientos) de los renglones y las columnas,A
y B, son de igual interés. Específicamente, el interés se encuentra en probar hipótesis acerca de la igual
dad de los efectos de los tratamientos de los renglones, por ejemplo,
H0:r1 = r2 =···= r0 =O
(S2a)
H1: al menos una r, :;e O
y de la igualdad de los efectos de los tratamientos de las columnas, por ejemplo,

Ho:/31 = /32 =···= P,, =O (52b)
H1: al menos una {Ji "# O
También existe interés en determinar si los tratamientos de los renglones y las columnas interactúan. Por
lo tanto, también querría probarse
H0: (r{J)¡¡ =O para todas las i, j
(S2c)
H1: al menos una ( r/J)¡¡ :;i1: O
A continuación se indica cómo se prueban estas hipótesis utilizando un análisis de varianza de dos factores.
53.2 Análisis estadístico dlel modelo con efectos fijos

Sea que y¡_ denote el total de observaciones bajo el nivel résímo del factor A, que y J. denote el total de
observaciones bajo el nivel jésimo del factor B, que Yij. denote el total de observaciones de la celda
ijésima, y que Y. . denote el gran total de todas las observaciones. Se definen.YuY¡ .• Y;¡. y .Y... como los pro
medios correspondientes de los renglones, las columnas, las celdas y el gran promedio. Expresado ma
temáticamente,
Y;,
Y; .. = bn i=l,2, ... ,a
y ·J·
y::::::
-
.¡. an i= 1, 2, ... , b
(53)
LYijk Yij. =:
n
-
y lj- i::::::l, 2, ,a
Y;¡.::::::
k;l
i= 1, 2, , b
b
Y. . = L L L Y;¡k Y.- . = abn
a n
Y. .
i;l j;l k;l
La suma de cuadrados total corregida puede escribirse como
LLL LLL
~ b n a b n
(yijkJi .. .)2:::::: [(Y; . -Y...)+U.¡. Y...)

¡;¡ j=l k=l j;l i=l k=l
+(y .. -y-.
t.,
1).
-y--l- +y-... )+(y. l)k
.. -y-. )]2 1).
• b
:::::: bnL.J - )2
" (-Yi.. - Y... " (v.¡ - Y... )2
+ an L.J (54)
i=l j=l
a b
+ n L.J
"" L.J (Yij. Y;.. Y.¡. +Y. . · )2
ya que los seis productos cruzados del lado derecho de la igualdad son cero. Observe que se ha hecho la
partición de la suma de cuadrados total en una suma de cuadrados debida a "los renglones", o factor A
(SSA); una suma de cuadrados debida a "las columnas", o factor B (SSB); una suma de cuadrados debida a
la interacción entreA y B (SSAB); y una suma de cuadrados debida al error (SSE)· Por el último componen
te del lado derecho de la igualdad de la ecuación 54, se observa que debe haber por lo menos dos réplicas
(n ;::: 2) para obtener una suma de cuadrados del error.
La ecuación 54 puede escribirse simbólicamente como
SST =SS A +SSB +SS AB +SSE (55)

El número de grados de libertad asociado con cada suma de cuadrados es
Efecto Grados de libertad

A a-1
B b-1
InteracciónAB (a l)(b1)
Error ab(n 1)
Tutal abn-1
5-3 DISEÑO FACTORIAL DE 005 FACTORES 179
Esta asignación de los abn - 1 grados de libertad totales a las sumas de cuadrados puede justificarse de la
siguiente manera: los efectos principales A y B tienen a y b niveles, respectivamente; por lo tanto, tienen a
1 y b - 1 grados de libertad, como se indica. Los grados de libertad de la interacción son sólo el número
de grados de libertad de las celdas (que es ab - 1) menos el número de grados de libertad de los dos efec
tos principalesA y B; es decir,ab l(a1)(b1) = (al)(b1). Dentro de cada una de lasab celdas
hay n 1 grados de libertad entre las n réplicas; por lo tanto hay ab(n 1) grados de libertad para el error.
Observe que la suma del número de grados de libertad en el lado derecho de la ecuación 55 es igual al nú
mero total de grados de libertad.
Cada suma de cuadrados dividida por sus grados de libertad es un cuadrado medio. Los valores espe
rados de los cuadrados medios son
SS bn! r;
E( MS A ) = """la1
J_A) = ª2 + ;~1
a- l
b
SS )J an~ /3~
E(MSB )= i;,lb-Bl = 02 + ~~l
n¿¿ (r/3)~
a b
E( MS ) = E( SS AB ) = a2 + 1ml j~l
AB (a 1 )( b= 1) (a 1)( b - 1)
Observe que si es verdadera la hipótesis nula de que no hay efectos de los tratamientos de los renglones,
ni de los tratamientos de las columnas, ni interacción, entonces MS A• MS B• MS AB y MS E son todas estima
ciones de a2. Sin embargo, si hay diferencias entre Jos efectos de los tratamientos de los renglones, por
ejemplo, entonces MSA será mayor que MSE. De manera similar, si están presentes efectos de los trata
mientos de las columnas o de la interacción, entonces los cuadrados medios correspondientes serán ma
yores que MSE. Por lo tanto, para probar la significación de los dos efectos principales y su interacción,
simplemente se divide el cuadrado medio correspondiente por el cuadrado medio del error. Los valores
grandes de este cociente implican que los datos no apoyan la hipótesis nula.
Si se supone que el modelo (ecuación 51) es adecuado y que los términos del error eijk tienen una dis
tribución normal e independiente con varianza a2 constante, entonces cada uno de los cocientes de cua
drados medios MSA/MSE> MSJMSE y MSAJMSE se distribuyen como F con a - l, b - 1 y (a - l)(b 1)
grados de libertad en el numerador, respectivamente, y ab(n 1) grados de libertad en el denominador, 1 y
la región crítica sería la cola superior de la distribución F. El procedimiento de prueba suele resumirse en
una tabla del análisis de varianza, como se muestra en la tabla 53.
En lo que a los cálculos se refiere, por lo general se emplea un paquete de software de estadística para
realizar el análisis de varianza. Sin embargo, no es complicado obtener fórmulas para calcular manual
1 La prueba F puede considerarse como una aproximación de una prueba de aleatorización, como se señaló anteriormente.
Tabla 53 La tabla del análisis de varianza para el diseño factorial de dos factores, modelo con efectos fijos
Fuente de Suma de Grados de
variación cuadrados libertad Cuadrado medio
'IfatamientosA SSA a1 MS = SSA F =MSA
A a-l o MSE
'IratamíentosB SSB b1 MS = SSB F =MSo
B b-l o MSE
Interacción SSAB (al)(b1) F =MSAB
MSAB = (al)(b1) o MSE
Error SSE ab(n-1) SS e
MSE = ab(n-1)
Tutal SSr abn-l
mente las sumas de cuadrados de la ecu_ación 55. La suma de cuadrados total se calcula como de costum
bre con
(56)
Las sumas de cuadrados de los efectos principales son

1 Q 2
SS = ~ y2 _ _L_ (57)
A bn ,¿, i.. abn
•=1
y
2
y_ __
SS8 = __!_ ~ y--
-)-
2
abn
(58)
an j;l
Es conveniente obtener SSAB en dos pasos. Se calcula primero la suma de cuadrados entre los totales de
las ab celdas, a la que se denomina la suma de cuadrados debida a los "subtotales":
1 a b 2
SS = ~~ 2 _ _L_
Subtoteles n L.J ~ Yij. abn
1;1 ¡;l
Esta suma de cuadrados también contiene a SSA y SS8• Por lo tanto, el segundo paso consiste en calcular
SSAIJ como
SS AB = SS Subtotalos SS A - SS B (59)
Puede calcularse SS E por sustracción como
SS E = SST - SS AB - SS A - SS B (510)
o
SS E = SST - SS Subtotales
EJEMPLO 5-1 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · • · · · · · · · · · · · · · · · · · · ·
El experimento del diseño de la batería
En la tabla 54 se presenta la vida efectiva (en horas) observada en el ejemplo del diseño de la batería que
se describió en la sección 53.1. Los totales de los renglones y las columnas se indican en los márgenes de
la tabla y los números encerrados en un círculo son los totales de las celdas.
Tabla 5.4 Datos de la vida (en horas) del experimento del diseño de la batería
Tipo de 'Iemperatura (ºF)
material 15 70 125 Y<.
1 130
74
155
180 @ 34
80
40
75 @) 20
82
70
58 @ 998
2 150
159
188
126 @ 136
106
122
115 (§ 25
58
70
45 @ 1300
3 138
168
110
160 @) 174
150
120
139 @) 96
82
104
60 @ 1501
v¡ 1738 1291 770 3799 =Y ...
Las sumas de cuadrados se calculan de la siguiente manera:

Y.~
= LLL
abn
2
SST Y¡¡k - abn
iml j=l k=l
= (130)2 +(155)2 +(74)2 + ... +(60)2 ( 3799)2 = 77,646.97

36
l
SS --~
a
2 L 2
Material bn ~ Y;,_ abn

1•1
= (3)1(4) [(998)2 +(1300)2 +(1501)2 ] <31::)2 = 10,683. 72

1
SS =~
b
2 L 2
Tompenolura an ~ Y.j. abn

Jml
= (3)~4)[(1738)2 +(1291)2 +(770)2]<31::)2 = 39,118.72
1 Y.~
= ;¡ L L
a b 2
SS Interacción Y¡¡. - bn - SS Material SS Temperatura
i•I }gl Q
= _!_[(539)2 +(229)2 + ... +(342)2 ] (3799)2 10,68172

4 36
39,118. 72 = 9613. 78
y
SSE = SST - SS Material SS Temperatura SS Interacción
= 77,646.9710,683. 72 39,118. 72 9613. 78= 18,230.75
En la tabla 55 se muestra el análisis de varianza. Puesto que Fo.os. 4• 27 = 2.73, se concluye que hay una in
teracción significativa entre los tipos del material y la temperatura. Además, F uos.z, 27 = 3.35, por lo que los
efectos principales del tipo de material y la temperatura también son significativos. En la tabla 55 tam
bién se muestran los valores P para los estadísticos de la prueba.
Como ayuda para interpretar los resultados de este experimento, es conveniente construir una gráfi
ca de las respuestas promedio para cada combinación de los tratamientos. Esta gráfica se muestra en la fi
gura 59. El hecho de que las rectas no sean paralelas indica que la interacción es significativa. En general,
se consigue una vida más larga con una temperatura baja, independientemente del tipo de material. Al
cambiar de una temperatura baja a una intermedia, la vida de la batería con el material tipo 3 tiene un in-
182 CAPÍTIJLO 5 INTRODUCCIÓN A LOS DISEÑOS FACTORIALES
Tabla 5.5 Análisis de varianza de los datos de la vida de la batería

variación cuadrados libertad medio Fo ValorP
Tipos de material 10,683.72 2 5,341.86 7.91 0.0020
'Iemperatura 39,118.72 2 19,559.36 28.97 0.0001
Interacción 9,613.78 4 2,403.44 3.56 0.0186
Error 18,230.75 27 675.21
Tutal 77,646.97 35
cremento real, mientras que con los materiales tipos 1 y 2 disminuye. Con una temperatura de intermedia
a alta, la vida de la batería disminuye para los materiales tipos 2 y 3 y se mantiene en esencia sin cambio
para el material tipo l. El material tipo 3 parece producir los mejores resultados si se quiere una pérdida
.........................................................................
menor de la vida efectiva cuando la temperatura cambia .
Comparaciones múltiples
Cuando el análisis de varianza indica que las medias de los renglones o las columnas difieren, por lo gene
ral es de interés hacer comparaciones entre las medias individuales de los renglones o las columnas para
descubrir diferencias específicas. Los métodos de comparaciones múltiples revisados en el capítulo 3 son
útiles a este· respecto.
Se ilustra ahora el uso de la prueba de Tukey con los datos de la vida de la batería del ejemplo 5- l.
Observe que en este experimento, la interacción es significativa. Cuando la interacción es significativa, las
comparaciones entre las medias de uno de los factores (por ejemplo,A) pueden ser oscurecidas por la in
teracciónAB. Una forma de abordar esta cuestión consiste en fijar el factor B en un nivel específico y apli
car la prueba de Tukey a las medias del factor A con ese nivel. Para ilustrar, suponga que en el ejemplo 51
el interés se encuentra en detectar las diferencias entre las medias de los tres tipos de material. Puesto
que la interacción es significativa, esta comparación se hace con un solo nivel de la temperatura, por
ejemplo el nivel 2 (70"F). Se supone que la mejor estimación de la varianza del error es MS E de la tabla del
análisis de varianza, utilizando el supuesto de que la varianza del error experimental es la misma para to
das las combinaciones de tratamientos.
175
150
,.;,=>125
o
iE 100
Material tipo 3
~ 75
.g ,... __ _....~ Material tipo 1
s 50 Material tipo 2
25
o,__~--~,5--~~~-1-o~~--1~25---~
Temperatura (ºFI
Figura 59 Gráfica tipo de materialtemperatura para el ejem

plo 51.
5-3 DISEÑO FACTORIAL DE DOS FACTORES 183
Los promedios de los tres tipos de material a 70ºF dispuestos en orden ascendente son
y12. = 57.25 (material tipo 1)

y22. = 119. 75 (material tipo 2)
Y32. = 145. 75 (material tipo 3)
To.0$ = qo.os (3, 27 '(MS;

JV;¡
= 3.50~67!21
= 45.47
donde q0.05(3, 27) = 3.50 se obtiene por interpolación en la tabla VIlI del apéndice. Las comparaciones por
pares dan como resultado
3 vs. 1: 145.75 57.25 = 88.50 > To.os= 45.47

3 vs. 2: 145.75 119.75 = 26.00 < To.os= 45.47
2 vs. 1: 119.75 57.25 = 62.50 > To.os= 45.47
Este análisis indica que con el nivel de temperatura de 70ºF, la vida media de la batería es la misma
para los materiales tipos 2 y 3, y que la vida media de la batería para el material tipo 1 es significativa
mente menor.
Si la interacción es significativa, el experimentador podría comparar las medias de todas las ab celdas
para determinar cuáles difieren significativamente. En este análisis, las diferencias entre las medias de las
celdas incluyen los efectos de la interacción, así como ambos efectos principales. En el ejemplo 51, esto
daría 36 comparaciones entre todos los pares posibles de las nueve medias de las celdas.
Salida de computadora
En la figura 510 se presenta la salida de computadora de Design-Expen para los datos de la vida de la ba
tería del ejemplo 51. Observe que
SS Modelo = SS M11erial + SSTempentura +SS hlieracción

= 10,683.72+39,118.72+9613.78
= 59,416.22
y que
59,416.22 = o. 7652
77,646.97
Es decir, cerca de 77% de la variabilidad de la vida de la batería es explicada por el material de la placa de
la batería, la temperatura y la interacción entre el tipo de material y la temperatura. En la salida de com
putadora se muestran también los residuales del modelo ajustado. A continuación se indica cómo usar es
tos residuales para verificar la adecuación del modelo.
Response: Lite in hours

ANOVA for Selected Factorial Modal
Analysis of variance table [Partial sum of squaresl
Sumof Mean F
Model 59416.22 8 7427.03 11.00 <0.0001 significant
A 10683]2 2 5341.86 7.91 0.0020
B 39118.72 2 19559.36 28.97 <0.0001
AB 9613]8 4 2403.44 3.56 0.0186
Residual 18230.75 27 675.21
Lack of Fit 0.000 o
Pure Error 18230.75 27 675.21
Cor Total 77646.97 35


Standard Actual Predicted Student Cook's Outlier
Order Value Value Residual Leverage Resldual Distance t
1 130.00 134.75 4.75 0.250 0.211 0.002 0.207
2 74.00 134.75 60.75 0.250 2.700 0.270 3. 100
3 155.00 134.75 20.25 0.250 0.900 0.030 0.897
4 180.00 . 134.75 45.25 0.250 2.011 0.150 2.140
5 150.00 155.75 5.75 0.250 0.256 0.002 0.251
6 159.00 155.75 3.25 0.250 0.144 0.001 0.142
7 188.00 155.75 32.25 0.250 1.433 0.076 1.463
8 126.00 155.75 29.75 0.250 1.322 0.065 1.341
9 138.00 144.00 6.00 0.250 0.267 0.003 0.262
10 168.00 144.00 24.00 0.250 1.066 0.042 1.069
11 110.00 144.00 34.00 0.250 1.511 0.085 1.650
12 160.00 144.00 16.00 0.250 0.711 0.019 0.704
13 34.00 57.25 23.26 0.250 1.033 0.040 1.035
14 80.00 57.25 22.75 0.250 1.011 0.038 1.011
15 40.00 57.25 17.25 0.250 0.767 0.022 0.761
16 75.00 57.25 17.75 0.250 0.789 0.023 0.783
17 136.00 119.75 16.25 0.250 0.722 0.019 0.716
18 106.00 119.75 13.75 0.250 0.611 0.014 0.604
19 122.00 119.75 2.25 0.250 0.100 0.000 0.098
20 115.00 119.75 4.75 0.250 0.211 0.002 0.207
21 174.00 145.75 28.25 0.250 1.255 0.058 1.269
22 150.00 145.75 4.25 0.250 0.189 0.001 0.185
23 120.00 145.75 25.76 0.260 1.144 0.048 1.161
24 139.00 145.75 6.76 0.250 0.300 0.003 0.295
25 20.00 57.50 37.60 0.250 1.666 0.103 1.726
26 82.00 67.50 24.50 0.250 1.089 0.044 1.093
27 70.00 57.50 12.50 0.250 0.555 0.011 0.548
28 58.00 57.50 0.50 0.250 0.022 0.000 0.022
29 25.00 49.50 24.50 0.250 1.089 0.044 1.093
30 58.00 49.50 8.50 0.250 0.378 0.005 0.372
31 70.00 49.50 20.50 0.250 0.911 0.031 0.908
32 45.00 49.50 4.5G 0.250 0.200 0.001 0.196
33 96.00 85.50 10.50 0.250 0.467 0.008 0.460
34 82.00 85.50 3.50 0.250 ...:.0.156 0.001 0.153
35 104.00 85.50 . 18.50 0.250 0.822 0.025 0.817
36 60.00 85.50 25.50 0.250 1~ 133 0.048 1.139
Figura 510 Salida de Design-Expert para el ejemplo 51.
53 DISEÑO FACTORlAL DE DOS FACTORES 185
53.3 Verificaciónde la adecuación del modelo
Antes de adoptar las conclusiones del análisis de varianza, deberá verificarse la adecuación del modelo
fundamental. Como anteriormente, la herramienta primaria de diagnóstico es el análisis residual. Los
residuales del modelo factorial de dos factores son
(511)
y puesto que el valor ajustado y''. k =y q.. (el promedio de las observaciones de la celda ijésima), la ecua
ción 511 queda como
eijk = yijk - Y;¡. (512)
En la salida de computadora de Design-Expert (figura 510) y en la tabla 56 se muestran los residuales
de los datos de la vida de la batería del ejemplo 51. La gráfica de probabilidad normal de estos residua
les (figura 511) no revela nada particularmente problemático, aun cuando el residual negativo más gran
de (60. 75 con 15ºF para el material tipo 1) se aparta un poco de los demás. El valor estandarizado de este
residual es 60.75/...fó7ill = 2.34, y es el único residual cuyo valor absoluto es mayor que 2.
En la figura 512 se grafican los residuales contra los valores ajustados y ijk. Esta gráfica indica una li
gera tendencia de la varianza de los residuales a incrementarse cuando la vida de la batería se incrementa.
En las figuras 513 y 514 se grafican los residuales contra los tipos del material y la temperatura, respecti
vamente. Ambas gráficas indican una ligera desigualdad de la varianza, con la combinación del trata
miento 15ºF y material tipo 1, teniendo posiblemente una varianza mayor que las demás.
En la tabla 56 se observa que la celda 15ºFmaterial tipo 1 contiene los dos residuales extremos
(60.75 y 45.25). Estos dos residuales son los principales responsables de la desigualdad de la varianza de
tectada en las figuras 512 a 514. Al examinarse nuevamente los datos no se observa ningún problema ob
vio, tal como un error al registrar los datos, por lo que estas respuestas se aceptan como legítimas. Es
posible que esta combinación de tratamientos particular produzca una vida de la batería ligeramente más
errática que las demás. Sin embargo, el problema no es lo suficientemente grave como para tener un im
pacto dramático en el análisis y las conclusiones.
5 .. 3.4 Estimación de los parámetros del modelo
Los parámetros del modelo de los efectos para el diseño factorial de dos factores
yiik = u+t , +/3¡ +(r/3)¡¡ +sijk (513)
Tabla 56 Residuales del ejemplo 51

. Tipo de Temperatura (ºF)
material 15 70 125
1 4.75 20.25 23.25 17.25 37.50 12.50
60.75 45.25 22.75 17.75 24.50 o.so
2 5.75 32.25 16.25 2.25 24.50 20.50
3.25 29.75 13.75 4.75 8.50 4.50
3 6.00 34.00 28.25 25.75 10.50 18.50
24.00 16.00 4.25 6.75 3.50 25.50
18t CAPÍTIJLO 5 INTRODUCCIÓN A LOS DISEÑOS FACTORIALES
90
~ 80
g 70
"'O
;g'" 50
:Q
"'o
,J:J
is. 30
"'
"'O
~
20
10
5
60.75 34.25 7.75 18.76 46.25
Residual
Figura 5·11 Gráfica de probabilidad normal de los residuales del ejemplo 51.
pueden estimarse por mínimos cuadrados. Puesto que el modelo tiene 1 + a + ab parámetros que deben
estimarse, hay 1 +a + b + ab ecuaciones normales. Al utilizar el método de la sección 39, no es difícil de
mostrar que las ecuaciones normales son
L LPi +nLL
a b a b /\
ui abnis+bn f; +an (r:f3)ii =Y... (514a)

j;l i=i j;¡ j;l
80
60
•
40
•
·'•• • •••
••
20
•
~ o •
"' •so 100•
• •••• 200
•••
150
20
•
Yijk
40 • •• •
60
•
80
Figura 512 Gráfica de los residuales contra Yqt para el ejemplo 51.
60
40 •
•
20 1
••
• •
1
••
.~ o

•1 92 A3
• Tipo de meterial
20 •
• ••
40 • •
60
•
Figura 513 Gráfica de los residuales contra el tipo de mate

rial para el ejemplo 51.
L P¡ +n L(rP)" =Y;..
b b A
r;:bnft+bnt; +n i = 1, 2, ... ,a (514b)

11 J=l
a a A
P¡:anft+n'L t; +anP¡ +n:L(rP)" = Y.1. i= 1, 2, ... ,b (514c)

i•l isl
~ A {i.=_1,2, ... ,Q
(rP)11:nft+nt, +n{J1 +n(rP)¡¡ =Y;¡. (514d)
J1,2, ... ,b
Por conveniencia, el parámetro que corresponde a cada ecuación normal se indica a la izquierda de las
ecuaciones 514.
60
40
•
•
20 ••• ••
• •
¡
.~ o •
:125
Temperatura rFl
-20
40
•• • ••
60 •
80
Figura 514 Gráfica de los residuales contra la temperatura

para el ejemplo 51.
El modelo de los efectos (ecuación 513) está sobreparametrízado, Observe que la suma de las a
ecuaciones de la ecuación 514b es igual a la ecuación 514a y que la suma de las b ecuaciones de la ecua
ción 514c es igual a la ecuación 514a. Asimismo, la operación suma de la ecuación 514d sobre j para una
i particular dará la ecuación 514b, y la operación suma de la ecuación 514d sobre i para unaj particular
dará la ecuación 514c. Por lo tanto, hay a + b + 1 dependencias lineales en este sistema de ecuaciones y
no existirá ninguna solución única. A fin de obtener una solución, se imponen las restricciones
L T¡=O
a
(515a)
/:1
L 'Pj =o
b
(515b)
j:l
a
L
{\
(r/3)¡¡ =o i= 1, 2, ... ,b (515c)

i:l
y
b
L =o = 1, 2, ... , a
{\
(r/3)ij i (515d)
J:l
Las ecuaciones 515a y 515b constituyen dos restricciones, mientras que las ecuaciones 515c y 515d for
man a + b - 1 restricciones independientes. Por lo tanto, se tienen en total a + b + 1 restricciones, el nú
mero que se requiere.
Al aplicar estas restricciones, las ecuaciones normales (ecuaciones 514) se simplifican considerable
mente, y se obtiene la solución
ft=:Y. .
ti = Y1 . - Ji... i = 1, z, , a
a.= y-.·J· -y-•.• 1·= 1, z, ,b
· (-r/3)11
" . = Y11. - Y1.. - Y.;.+ Y. {i == 1, 2,2, ... , ab
P¡
(516)
1. 1 ' ... ,
Observe el gran atractivo intuitivo de esta solución de las ecuaciones normales. Los efectos de los trata
mientos de los renglones se estiman con el promedio del renglón menos el gran promedio; los tratamien
tos de las columnas se estiman con el promedio de la coiumna menos el gran promedio, y la interacción
ijésima se estima con el promedio de la celda ijésima menos el gran promedio, el efecto del renglón iési
mo y el efecto de la columna jésima.
Al utilizar la ecuación 516, el valor ajustado Y;¡k puede encontrarse como
~ "
Y¡¡k = µ+t¡ +/3; +(r/3)¡¡
+O'Y;.. - Y. .. )+(Y.;. -
= Y... Y. .. )
- Y;.. - Y.¡.
+( Y¡¡. +Y. .. )
=JI¡¡.
Es decir, la observación késima de la celda ijésima se estima con el promedio de las n observaciones de
esa celda. Este resultado se usó en la ecuación 512 para obtener los residuales del modelo factorial de
dos factores.
Puesto que se han usado restricciones (ecuaciones 515) para resolver las ecuaciones normales, los
parámetros del modelo no tienen estimaciones únicas. Sin embargo, ciertas funciones importantes de
los parámetros del modelo son estimables, es decir, tienen una estimación única independientemente de
las restricciones elegidas. Un ejemplo es r1 -'ru + (fP)1. (iP)u.• que podría considerarse como la "verdade
ra" diferencia entre los niveles iésimo y uésimo del factor A. Observe que la verdadera diferencia entre
los niveles de cualquier efecto principal incluye un efecto de la interacción "promedio". Es este resultado
el que perturba las pruebas de los efectos principales en presencia de una interacción, como se señaló an
teriormente. En general, cualquier función de los parámetros del modelo que sea una combinación lineal
del miembro izquierdo de las ecuaciones normales es estimable. Esta propiedad también se hizo notar en
el capítulo 3 cuando se estudió el modelo de un solo factor. Para mayores detalles, ver el material suple
mentario del texto de este capítulo.
53.5 Elección del tamaño de la muestra

Para determinar un tamaño de la muestra (el número de réplicas, n) apropiado en un diseño factorial de
dos factores, el experimentador puede apoyarse en las curvas de operación característica que aparecen en
la parte V del apéndice. En la tabla 57 se muestra el valor apropiado del parámetro <ll2, así cómo los gra
dos de libertad del numerador y el denominador.
Una forma muy eficaz de emplear estas curvas consiste en encontrar el valor menor de (1)2 que corres
ponde a una diferencia especificada entre las medias de dos tratamientos cualesquiera. Por ejemplo, si la
diferencia en las medias de dos renglones cualesquiera es D, entonces el valor mínimo de <1>2 es
<1>2 = nbD2 (517)
2auz
mientras que si la diferencia en las medias de dos columnas cualesquiera es D, entonces el valor mínimo
de <ll2 es
(518)
Por último, el valor mínimo de '1>2 que corresponde a una diferencia D entre dos efectos de interacción
cualesquiera es
(1)2 = nD2 (519)
2a2 [(a- l)(b1)+ 1]
Para ilustrar el uso de estas ecuaciones, considere los datos de la vida de la batería del ejemplo 51.
Suponga que antes de correr el experimento se decide que la hipótesis nula deberá rechazarse con una alta
Tabla 5. 7 Parámetros de la curva de operación característica de la parte V del apéndice para el diseño factorial
de dos factores, modelo con efectos fijos
Grados de libertad Grados de libertad
Factor del numerador del denominador
bn! r~ ab(n1)
A 1~1 a1
B b-1 ab(n1)
ba'
AB (al)(b1) ab(n1)
o2[(a 1 )(b 1)+1]
190 CAPinJLo 5 INTRODUCCIÓN A LOS DISEÑOS FACTORIALES
probabilidad si la diferencia en la vida media de la batería entre dos temperaturas cualesquiera es hasta
=
de 40 horas. Por lo tanto D 40, y si se supone que la desviación estándar de la vida de la batería es apro
ximadamente 25, entonces por la ecuación 5· 18 se obtiene
<1>2 = naD2
2002
11(3)(40)2
2(3)(25)2
= 1.2&
como el valor mínimo de <1>2• Suponiendo que a = 0.05, ahora puede usarse la parte V del apéndice para
construir la tabla siguiente:
v1 = Grados de v2 = Grados de
n cl)2 rl> libertad del numerador libertad del error fJ
2 2.56 1.60 2 9 0.45
3 3.84 1.96 2 18 0.18
4 5.12 2.26 2 27 0.06
Observe que con n = 4 réplicas se obtiene un riesgo f3 de cerca de 0.06, o una probabilidad aproxima
da de 94%, de rechazar la hipótesis nula si la diferencia en la vida media de la batería con dos niveles de
temperatura cualesquiera es hasta de 40 horas. Por lo tanto, se concluye que cuatro réplicas bastan para
proporcionar la sensitividad deseada siempre y cuando la estimación usada para la desviación estándar de
la vida de la batería no tenga un error grave. En caso de duda, el experimentador podría repetir el proce
dimiento anterior con otros valores de u para determinar el efecto que tendría una estimación equivocada
de este parámetro sobre la sensitividad del diseño.
53.6 El supuesto de no interacción en un modelo de dos factores

Ocasionalmente, un experimentador siente que es apropiado un modelo de dos factores sin interacción,
por ejemplo
i = l, 2, ,a
{
1, 2, , b
k1, 2, , n
j: (520)
Sin embargo, se deberá ser muy cuidadoso al hacer caso omiso de los términos de interacción, ya que la
presencia de una interacción significativa puede tener un impacto dramático sobre la interpretación de
los datos.
El análisis estadístico de un modelo factorial de dos factores sin interacción es directo. En la tabla 58
se presenta el análisis de los datos de la vida de la batería del ejemplo 51, suponiendo que es válido el mo
Tabla 58 Análisis de varianza de los datos de la vida de la batería suponiendo que no hay interacción
Tipos de material · 10,683.72 2 5,341.86 5.95
Tumperatura 39,118.72 2 19,559.36 21.78
Error 27,844.5?. 31 898.21
Tutal 77,646.96 35
5-3 DISEÑO FACTORIAL DE 005 FACTORES 191
delo sin interacción (ecuación 520). Como ya se señaló, los dos efectos principales son significativos. Sin
embargo, tan pronto como se efectúa el análisis residual de estos datos, se pone de manifiesto que el mo
delo sin interacción es inadecuado. Para el modelo de dos factores sin interacción, los valores ajustados
son .P;;k = Yi. +Y¡. -Y. . ·
Enlafigura515 se presenta lagráñca dejj ~ik (lospromediosdelasceldasmenos
el valor ajustado de esa celda) contra el valor ajustado ))i!. Ahora las cantídadesji; y,¡,t pueden conside
rarse como las diferencias entre las medias de las celdas observadas y las medias de las celdas estimadas
suponiendo que no hay interacción. Cualquier patrón en estas cantidades sugiere la presencia de una in
teracción. En la figura 515 se observa un patrón claro cuando las cantidades y¡¡. - Y,¡k pasan de positivo a
negativo, y después de nuevo a positivo y a negativo. Esta estructura es el resultado de la interacción entre
los tipos del material y la temperatura.
5 .. 3. 7 Una observación por celda

En ocasiones se encuentran experimentos de dos factores con una sola réplica, es decir, en los que sólo
hay una observación por celda. Cuando hay dos factores y una sola observación por celda, el modelo de
{i.:
los efectos es
1, 2, , a
J1, 2, , b
El análisis de varianza para esta situación se presenta en la tabla 59, suponiendo que ambos factores son
fijos.
Al examinar los cuadrados medios esperados, se observa que la varianza del error u2 es no estimable;
es decir, que el efecto de la interacción de los dos factores (TP);; y el error experimental no pueden sepa
rarse de alguna manera obvia. Por consiguiente, no se cuenta con pruebas para los efectos principales a
menos que el efecto de la interacción sea cero. Si no bayuna interacción presente, entonces (r:P);; =O para
toda i y j, y un modelo plausible es
{i.:1, 2, , a
J1, 2, , b
Si el modelo (ecuación 522) es apropiado, entonces el cuadrado medio de los residuales de la tabla 59 es
un estimador insesgado de u2, y los efectos principales pueden probarse comparando MSA y MS8 con
MSRaiduaJ.·
30
30
• •
10
• • •
e;., s
1 o
·~$ 50 100 160 200
10
'IJ>
-20 • •
•
Figura 5·15 Gráfica de Yq, -yl/k contra y,. para los datos de la vida
de la batería.
Tabla 5.9 Análisis de varianza de un modelo de dos factores, una observación por celda
Fuente de Suma de Grados de Cuadrado Cuadrado medio
variación cuadrados libertad medio esperado
L Y;.b _Lab
a 2 2
Renglones (A) a 1 MS u2+~
;.¡ A a1
Columnas (B)
L Y.¡ _L
h 2 2
b1 ª2+ª.L.s~
1•1 a ab b1
Residual oAB Sustracción (al)(b1) MSRosidual

ai+ L L(T,8~
(al)(b1)
Thtal
ab-1
Una prueba desarrollada por Tukey [llla] es útil para determinar si está presente una interacción.
En el procedimiento se supone que el término de la interacción tiene una forma particularmente simple,
a saber,
('r/3)¡¡ = /'T;/3¡
donde y es una constante desconocida. Al definir así el término de la interacción, puede usarse un enfo
que de regresión para probar la significación del término de la interacción. En la prueba se hace la parti
ción de la suma de cuadrados de los residuales en un componente con un solo grado de libertad debido a
la no aditividad (interacción) y un componente del error con (a 1 )(b1) 1 grados de libertad. En lo que
a los cálculos se refiere, se tiene
(523)
con un grado de libertad, y

SSError = SSResidual -ss; (524)
con (a - l)(b 1) 1 grados de libertad. Para probar la presencia de una interacción, se calcula
F=
0
~ (5~)
SSError /[(al)(b1)1]
Si F0 > Fa, 1, (a _ l)(b _ l) _ 1, debe rechazarse la hipótesis de que no hay ninguna interacción.
EJEMPLO 5-2 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·. · · · · · · · · · · · · · · · · · · · · · · · ·
Las impurezas presentes en un producto químico son afectadas por dos factores, la presión y la tempera
tura. En la tabla 510 se muestran los datos de ui;ia sola réplica de un experimento factorial. Las sumas de
cuadrados son
1 ª 2 Y.~
SSA =-b.LYi. --b
i=1 ª
= !(232 +132 +82]~= 23.33
5 (3)(5)
Tabla 5.10 Datos de las Impurezas del ejemplo 52
Tumperatura Presión
(ºF) 25 30 35 40 45 . Y;.
100 5 4 6 3 5 23
125 3 1 4 2 3 13
150 1 1 3 1 2 8
Y.¡ 9 6 13 6 10 44 =y,.
y
SS Residual = SST - SSA - SS 8
= 36.96 23.3311.60 = 200
La suma de cuadrados de la no aditividad se calcula con la ecuación 5~23 de la siguiente manera:
¿¿ Y¡¡Y;.Y.¡ = (5)(23)(9)+(4)(23)(6)+···+(2)(8)(10)=
• b
7236
;~1 j•l
SSN = abSSASS8
[7236( 44)(2133+ 11.60+ 129.07)]2
(3)( 5)(2133)(11.(J())
= [20.00]2 = 0.0985
4059.42
y la suma de cuadrados del error es, por la ecuación 5~24,
SSError = SS Residual SSN
= 2000.0985= 1.9015
El análisis de varianza completo se resume en la tabla 5~ 11. El estadístico de prueba para la no adítívi
=
dad es F0 = 0.0985/0.2716 0.36, de donde se concluye que no hay evidencia de interacción en estos da
.........................................................................
tos. Los efectos principales de la temperatura y la presión son significativos .
Para concluir esta sección, se hace notar que el modelo factorial de dos factores con una observación
por celda (ecuación 5~22) luce exactamente igual que el modelo de bloques completos aleatorizados
Tubla 5.11 Análisis de varianza del ejemplo 52

'Iemperatura 23.33 2 11.67 42.97 0.0001
Presión 11.60 4 2.90 10.68 0.0042
No aditividad 0.0985 1 0.0985 0.36 0.5674
Error 1.9015 7 0.2716
Tutal 36.93 14
(ecuación 41 ). De hecho, la prueba de Tukey con un solo grado de libertad para la no aditividad puede
aplicarse directamente para probar la presencia de una interacción en el modelo de bloques aleatoriza
dos. Sin embargo, es necesario recordar que las situaciones experimentales que llevan al modelo de blo
ques aleatorízados y al modelo factorial son muy diferentes. En el modelo factorial, todas las ab corridas
se hacen de manera aleatoria, mientras que en el modelo de bloques aleatorizados la aleatorización sólo
ocurre dentro del bloque. Los bloques constituyen una restricción sobre la aleatorización. Por lo tanto, la
manera en que se corren los experimentos, así como la interpretación de los dos modelos, es muy diferente.
Í(
5 .. 4 DISEÑO FACTORIAL GENERAL
Los resultados del diseño factorial de dos factores pueden ampliarse al caso general en que hay a niveles
del factor A, b niveles del factor B, e niveles del factor C, etc., dispuestos en un experimento factorial. En
general, habrá abe ··· n observaciones totales si se hacen n réplicas del experimento completo. De nueva
cuenta, observe que es necesario un mínimo de dos réplicas (n ;a: 2) para determinar una suma de cuadra
dos debida al error si todas las interacciones posibles están incluidas en el modelo.
Cuando todos los factores del experimento son fijos, es sencillo formular y probar hipótesis acerca de
los efectos principales y las interacciones. Para un modelo con efectos fijos, los estadísticos de prueba
para cada efecto principal e interacción pueden construirse dividiendo el cuadrado medio correspondien
te del efecto o interacción por el cuadrado medio del error. Tudas estas pruebas F serán de una cola supe
rior. El número de grados de libertad de cualquier efecto principal es el número de niveles del factor
menos uno, y el número de grados de libertad de una interacción es el producto del número de grados de
libertad asociados con los componentes individuales de la interacción.
Por ejemplo, considere el modelo del análisis de varianza de tres factores:
Yijld =µ+-e, +/31 +rk +(r/3)¡¡ +(TY)ik +({Jy)ik

i = 1, 2, ,a
+ (r{Jy)"' +t(lkl k:
{
i= 1, 2, , b
1, 2,
l1, 2,
,~
,n
Suponiendo que A, By C son fijos, la tabla del análisis de variama se presenta en la tabla 512. Las prue
bas F para los efectos principales y las interacciones se siguen directamente de los cuadrados medios es
perados.
11

E
o
"O
oa ~

~ 1
:e H H
t)
H H H
~' ~$ H H H
..._.
... ~
\,)
~
11)
N .,
N'~
c:c:i.. 1 ~ 1
o
\,) ..._.
\,)
H
1 1 1
o

..Q ..Q
<::I \,)
"'e
e
11)
..Q 1 1
o
"O
~
+o
<::!
+
<::!
+
+
<::!
.s ..!::,. i::
<::!
..Q
1
oa "'o "b + + i:: <::!
13es "'1:> 'b +

a
"'ti
"b
o
:e
~ <.¡
.g ">:
VJ"'
<.;
VJ~ ">: VJ'ri. ~ VJ"'
oa ~ ~ ~ ~ ~ ~ ~ ~
13oa
B
.;¡:: a
2u

~
"'o

¡:::
* s
u
"'~ ~11)
1
s
1 1 1
Bu ~
~ ~ 1 1
..s

11)
"O 1 1 1 ~ 1
..Q
"'"' ¡g <::! ..Q \,)
1
\,)
..Q ~
tl "C <::!
~ ~
~
..9
ooa
~
~
~
~ "'
o
'O
.1 ¡a
;:.
oa
<.;
<.¡ <.¡
~
'":,">:
VJ
VJ"'
t""5 ~ ~~ "":¡">: "':i"' VJ"' ~"'
~ 11) VJ c..¡ ~ VJ
1
"O
oa
~
en
~
oa
~
.s 1·~

N
.;.,
G
11)
"O
11)
\..) '«!
~ ~ ""<:
\..)
""<:
\..)
~ ~ ~ iS
195
En general, los cálculos del análisis de varianza se efectuarían utilizando un paquete de software de
estadística. Sin embargo, en ocasiones resultan útiles las fórmulas para calcular manualmente las sumas
de cuadrados de la tabla 512. La suma de cuadrados total se encuentra de la manera acostumbrada como
(527)
Las sumas de cuadrados de los efectos principales se encuentran a partir de los totales de los factores
A(YL), B(Y.¡..) y C(Y ..d de la siguiente manera:
l a
=""",.
2
SS A ben ~1 y2i... ~ aben (528)
1 b 2
SSB --""" y.t.. (529)
- aen ~ aben
2 ~
¡;l
1 e 2
2
SS e == -""" Yk ~ (530)
a bn ~
k~t a ben
Para calcular las sumas de cuadrados de las interacciones de dos factores, se necesitan los totales de las
celdas A x B ,A x C y B x C. Con frecuencia es útil desplegar la tabla de los datos originales en tres tablas
de dos vías para calcular estas cantidades. Las sumas de cuadrados se encuentran con
1 • b 2
SS AB = en~~
""" """ Y.,..: ~
aben SS A - SSB
i;l 1~1
= SS Subtotalcs(AB) SS A - SSB (531)

l
LL
a e 2
SS AC = -b yJk. - Yb.... - SS A - SS e
n¡;1 k~t a en
= SSSubtotales(AC) SS A - SS e (532)
y
l b e 2
sslJC = an ~""" ~""" 2
Y.Jk.
aben SSJJ - SS e
~
i=t k;J
= SS Subtotalos(BC) SSB - SS e (533)
Observe que las sumas de cuadrados de los subtotales de dos factores se encuentran a partir de los totales
de cada tabla de dos vías. La suma de cuadrados de la interacción de los tres factores se calcula a partir de
los totales de las celdas {yiik_} de tres vías como
1 y2
ssABc =
n
LLL o b
a en
1;1 J;J k;J
e
Y~k. __ b.... -ssA -ssB -ssc -ssAB -ssAc -ssnc
.
(534a)
= SSsubtotalcs(ABC) -SS A - SSB - SS e -SS AB -SS AC -SS Be (534b)

La suma de cuadrados del error puede encontrarse restando la suma de cuadrados de cada efecto princi
pal e interacción de la suma de cuadrados total o con
SSE = ssTssSubtotales(ABC) (535)

54 DISEÑOFACTORlALGENERAL 197
EJEMPLO 5-3 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
El problema del embotellado de un refresco
Una empresa embotelladora de refrescos está interesada en obtener alturas de llenado más uniformes en
las botellas que se fabrican en su proceso de manufactura. 'Ieóricamente, la máquina de llenado llena cada
botella a la altura objetivo correcta, pero en la práctica, existe variación en tomo a este objetivo, y a la embo
telladora le gustaría entender mejor las fuentes de esta variabilidad y, en última instancia, reducirla.
El ingeniero del proceso puede controlar tres variables durante el proceso de llenado: el porcentaje
de carbonatación (A), la presión de operación en el llenador (B) y las botellas producidas por minuto ora
pidez de línea (C). Es sencillo controlar la presión y la rapidez, pero el porcentaje de carbonatación es
más difícil de controlar durante la manufactura real debido a que varía con la temperatura. Sin embargo,
para los fines de un experimento, el ingeniero puede controlar la carbonatación en tres niveles: 10, 12 y 14
por ciento. Elige dos niveles para la presión (25 y 30 psi) y dos niveles para la rapidez de línea (200 y 250
bpm). El ingeniero decide correr dos réplicas de un diseño factorial con estos tres factores, haciendo las
24 corridas de manera aleatoria. La variable de respuesta observada es la desviación promedio de la altu
ra del llenado objetivo que se observa en una corrida de producción de botellas con cada conjunto de con
diciones. En la tabla 513 se muestran los datos que resultaron de este experimento. Las desviaciones
positivas son alturas de llenado arriba del objetivo, mientras que las desviaciones negativas son alturas de
llenado abajo del objetivo. Los números encerrados en círculos de la tabla 513 son los totales de las cel
das de tres vías Y;¡k..
La suma de cuadrados total corregida que se encuentra con la ecuación 527 es
o b e n 2
SST = LLLL
k;l 11
¡;¡ ¡;¡
Y:kl- a~n
= 571 (7~{ ::= 336.625
Tabla 513 Datos de la desviación de la altura de llenado del ejemplo 53

Presión de operación (B)
25 psi 30psi
Porcentaje de Rapidez de línea (C) Rapidez de línea (C)

carbonatacíón (A) 200 250 200 250 Y1..
-3 -1 1 1
10
-1 8) o @ o @ 1 (] 4
o
12
1 CD 2
1
G) 2
3 ® 6
5 @ 20
14 5
4 ® 7
6
@ 7
9
@ 10
11 ® 59
Tutales B X C y jk. 6 15 20 34 75 "'Y ..

21 54
TutalesA x B TotalesA X e
Y¡¡ Y1.1<.
B e
A 25 30 A 200 250
10 -5 1 10 -5 1
12 4 16 12 6 14
14 22 37 14 25 34
198 CAPÍTIJLO 5 IN1RODUCCIÓN A LOS DISEÑOS FACTORIALES
y las sumas de cuadrados de los efectos principales que se calculan con las ecuaciones 528, 529 y 530 son
1 a 2
SS ~ .2 Y. ...
Carl>onatación = ben ~ YL. - aben
1=1
= ~((4)2 +(20)2 +(59)2 ] ( 72~2 = 252.750

1 b 2
SS .
Pre6lón
= aen ~~ y2
·1··
__l'::::__
aben
¡•l
= _!_[(21)2 +(54)2 ] ( 75)2 = 45.375

12 24
y
1 e 2
SS Ropidez =~
abn ~ y..2k. ~
ben
k-1 ª
= _!_[(26)
12 .
2 +( 49)2 ] 75)2
(
24
= 22. 042
Para calcular las sumas de cuadrados de las interacciones de dos factores, se deben encontrar los tota
les de las celdas de dos vías. Por ejemplo, para encontrar la carbonataciónpresión o interacciónAB, se
necesitan los totales de las celdasA x B {y;¡) que se muestran en la tabla 513. Utilizando la ecuación
531, se encuentra que las sumas de cuadrados son
1 a b 2
SS =-~~y~ -~-SS -SS 8
AB en~~ ,,.. aben A
1~1 1~1
¡
= [(5)2 +(1 )2 +( 4)2 +(16)2 +(22)2 +(37)2 ] ( 7~2 2.52 750 45.375
= 5.250
Para la carbonataciónrapidez o interacciónAC se usan los totales de las celdasA x C {y¡_d que se mues
tran en la tabla 513 y la ecuación 532:
1 a e
LL
2
SSAc =-b
n ;~1 k~1
YZk. - Yb....
a en
-SSc -ss,
= ¡[(5)2 +(1)2 +(6)2 +(14)2 +(25)2 +(34)2 ] (72~2 252.75022.042
= 0.583
La presiónrapidez o interacciónBC se encuentra con los totales de las celdas B x C {y Jk_} que se mues
tran en la tabla 513 y la ecuación 533:
1 b e
LL
2
SSBC = Y.~k. - Yb.... -SSB -ss,
an i=l k=l a en
= ~[(6)2 +(15)2 +(20)2 +(34)2 ] <1;{ 45.37522.042

= 1.042
54 DISEÑO FACTORIAL GENERAL 199
La suma de cuadrados de la interacción de los tres factores se encuentra con los totales de las celdas
A x B x C Ú'iid, los cuales están encerrados en un círculo en la tabla 513. Por la ecuación 534a se en
cuentra
ssABc
1 a b e
=
n
LLL 2
;~1 i•t
Y.~.
k~t
.
yijk. --b--ssA
a en
-SS8 -ss; -ssAB-ssAc -sssc
1 2 2 2 2 2 (75)2
= 2((4) +(1) +(1) +···+(16) +(21) ]~
252.750 45.375 220425.2500.5831.042
= 1.083
Por último, al observar que
l_
SSSubtotales(ABC) =-.L.LL
n
labc
iml ¡~1 k~l

2
Yijk. b=328.125
a en
se tiene
SSE = SSr - SSsub1ota1cs(ABC)
= 336.625328.125
= 8.500
En la tabla 514 se resume el análisis de varianza. Se observa que el porcentaje de carbonatación, la
presión de operación y la rapidez de línea afectan significativamente el volumen de llenado. El cociente F
de la interacción carbonataciónpresión tiene un valor P de 0.0558, lo cual indica cierta interacción entre
estos factores.
El siguiente paso deberá ser un análisis de los residuales de este experimento. Se deja como ejercicio
para el lector, pero se señala que la gráfica de probabilidad normal de los residuales y los demás diagnós
ticos usuales no indican ningún motivo de preocupación importante.
Como ayuda para la interpretación práctica de este experimento, en la figura 516 se grafican los tres
efectos principales y la interacciónAB ( carbonatacíónpresíón). Las representaciones de los efectos princi
pales son sólo gráficas de los promedios de las respuestas marginales para los niveles de los tres factores.
Observe que las tres variables tienen efectos principales positivos; es decir, el incremento de la variable
mueve hacia arriba la desviación promedio del llenado objetivo. La interacción entre la cabonatación y la
presión es bastante pequeña, como lo indica la forma similar de las dos curvas de la figura S16d.
Puesto que la empresa quiere que la desviación promedio del llenado objetivo esté cerca de cero, el
ingeniero decide recomendar el nivel bajo de la presión de operación (25 psi) y el nivel alto de la rapidez
de línea (250 bpm, que maximizará la rapidez de producción). En la figura 517 se grañca la desviación
Tabla 514 Análisis de varianza del ejemplo 53

Porcentaje de carbonatación (A) 252.750 2 126.375 178.412 <0.0001
Presión de operación (B) 45.375 1 45.375 64.059 <0.0001
Rapidez de línea (C) 22.042 1 22.042 31.118 0.0001
AB 5.250 2 2.625 3.706 0.0558
AC 0.583 2 0.292 0.412 0.6713
BC 1.042 1 1.042 1.471 0.2485
ABC 1.083 2 0.542 0.765 0.4867
Error 8.500 12 0.708
Tutal 336.625 23
.g 8 8
"' e:
~ 6 6
~
o
.,
'O 4 4
~ 2 2
10 12 14 25 30
Porcentaje de carbonatación(AJ Presión (B)
a) b)
10
o
"C 8
"'
e:
~
Qi 6 6
"C
o
'¡¡ 4 4
E
o
~ i 2
O
·¡;
~"' o o
e" 2 .__.._ __ _...___e -2.____.....___..~_._--A
200 250 10 12 14
Rapidez de linea (CI Interacción
e) carbonataciónpresión
d)
Figura 516 Gráficas de los efectos principales y la interacción del

ejemplo 53. a) Porcentaje de carbonatación (A), b) presión (B), e) ra
pidez de línea (C), d) interacción carbonatacíónpresión,
promedio observada de la altura de llenado objetivo con los tres diferentes niveles de carbonatación para
este conjunto de condiciones de operación. Ahora, el nivel de la carbónatación no puede actualmente
controlarse perfectamente en el proceso de manufactura, y la distribución normal indicada con la línea
continua de la figura 517 es una aproximación de la variabilidad de los niveles de carbonatación que se
o 8
"C
"'
.
e:
~

~K 6
!'!e: Distribución mejorada del
Z::2 porcentajede carbonatación
OiSl 4
.!! c.
.g~
o.t::
u 2
~cv
... P.
P.!'!
C:c: o
~8
.!!!
>
-2
~ 10 12 14
Porcentaje de carbonatación(A)
Figura 517 Desviación promedio de la altura de llenado

con rapidez alta y presión baja para diferentes niveles de
carbonatación.
5-5 AJUSTE DE CURVAS Y SUPERFICIES DE RESPUESTA 201
registran actualmente. Como el proceso es impactado por los valores del nivel de carbonatación sacado
de esta distribución, la fluctuación de las alturas de llenado será considerable. Esta variabilidad de las al
turas de llenado podría reducirse si la distribución de los valores del nivel de carbonatación siguieran la
distribución normal indicada con la línea punteada de la figura 517. La reducción de la desviación están
dar de la distribución del nivel de carbonatación se consiguió finalmente mejorando el control de la tem
peratura durante la manufactura.
Se señaló ya que si todos los factores de un experimento factorial son fijos, la construcción del esta
dístico de prueba es directa. El estadístico para probar cualquier efecto principal o interacción se forma
siempre dividiendo el cuadrado medio del efecto principal o la interacción por el cuadrado medio del
error. Sin embargo, si el experimento factorial incluye uno o más factores aleatorios, la construcción del
estadístico de prueba no siempre se hace de esta manera. Es necesario examinar los cuadrados medios es
perados para determinar las pruebas correctas. La revisión completa de los experimentos con factores
aleatorios se pospone hasta el capítulo 12.
5.. 5 AJUSTE DE CURVAS Y SUPERFICIESDE RESPUESTA
Se ha visto que puede resultar útil ajustar una curva de respuesta a los niveles de un factor cuantitativo
para que el experimentador cuente con una ecuación que relacione la respuesta con el factor. Esta ecua
ción podría utilizarse para hacer interpolaciones, es decir, para predecir la respuesta en niveles interme
dios entre los factores, respecto de los que se utilizaron realmente en el experimento. Cuando al menos
dos de los factores son cuantitativos, puede ajustarse una superficie de respuesta para predecir y con va
rias combinaciones de los factores del diseño. En general, se usan métodos de regresión lineal para ajus
tar estos modelos a los datos experimentales. Este procedimiento se ilustra en la sección 35.. 1 para un
experimento con un solo factor. A continuación se presentan dos ejemplos que incluyen experimentos
factoriales. Se utilizará un paquete de software de computadora para generar los modelos de regresión.
Para mayor información acerca del análisis de regresión, referirse al capítulo 10 y al material suplementa
rio del texto de este capítulo.
EJEMPLO 5 ..4 · · · · · · · · · · · · · · · · · · · · · · · · • · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ~
Considere el experimento que se describe en el ejemplo 51. El factor temperatura es cuantitativo y el tipo
de material es cualitativo. Además, hay tres niveles de la temperatura. Por consiguiente, puede calcularse
un efecto de la temperatura lineal y uno cuadrático para estudiar la forma en que la temperatura afecta la
vida de la batería. En la tabla 515 se presenta la salida condensada de Design-Expert para este experimen
to, donde se supone que la temperatura es cuantitativa y el tipo de material es cualitativo.
El análisis de varianza de la tabla 515 indica que la fuente de variabilidad "modelo" se ha subdividi
do en varios componentes. Los componentes "A" y "A2" representan los efectos lineal y cuadrático de
la temperatura, y "B" representa el efecto principal del factor tipo de material. Recuerde que el tipo de ma
terial es un factor cualitativo con tres niveles. Los términos "AB" y "A2B" son las interacciones del factor tem
peratura lineal y cuadrático con el tipo de material.
Los valores P indican queA2 y AB no son significativos, mientras que el términoA2B es significativo.
Con frecuencia se piensa en eliminar los términos o factores no significativos del modelo, pero en este
Tabla 515 Salida de Design-Expert para el ejemplo 54
Response: Llfe In hr
ANOVA for Response Surface Reduced Cublc Model
Analysis of variance table (Partlal sum of squares]
Sum of Mean F
Model 59416.22 B 7427.03 11.00 <0.0001 signlficant
A 39042.67 1 39042.67 57.82 <0.0001
8 10683.72 2 5341.86 7.91 0.0020
A2 76.06 1 76.06 0.11 0.7398
AB 2315.08 2 1157.54 1.71 0.1991
A28 7298.69 2 3649.35 5.40 0.0106
Residual 18230.75 27 675.21
Lack of Fit 0.000 o
Pure Error 18230.75 27 675.21
Cor Total 77646.97 35
Std. Oev. 25.98 RSquared 0.7652
Coefficient Standard 95%CI 95%CI
Term Estimate DF Error Low High VIF
lntercept 107.58 1 7.50 92.19 122.97
ATemp 40.33 1 5.30 51.22 29.45 1.00
8[1) 50.33 1 10.61 72.10 28.57
8(2] 12.17 1 10.61 9.60 33.93
A2 3.08 1 9.19 21.93 15.77 1.00
AB[1] 1.71 1 7.50 13.68 17.10
AB[2J 12.79 1 7.50 28.18 2.60
A2B[1] 41.96 1 12.99 15.30 68.62
A2B[21 14.04 1 12.99 40.70 12.62
Final Equation in Terms of Coded Factors:
Life =
+107.58
40.33 *A
50.33 *8[1]
+12.17 *8[21
3.08 *A2
+1.71 *AB[1)
12.79 *AB[2)
+41.96 *A28[1)
14.04 *A28[2]
Final Equation in Terms of Actual Factors:
Material Type 1
Life =
+169.38017
2.48860 *Temp
+0.012851 *Temp2
Material Type 2
Life =
+159.62397
0.17901 *Temp
+0.41627 *Temp2
Material. Type 3
Life =
+132.76240
+0.89264 *Temp
0.43218 *Temp2
55 AJUSTE DE CURVAS Y SUPERFICIES DE RESPUESTA 203
caso eliminar A2 y AB y conservar A 2B resultará en un modelo que no es jerárquico. El principio de jerar
quía establece que si un modelo contiene un término de orden superior (tal comoA2B), deberá contener
también todos los términos de orden inferior que lo componen (Az y AB en este caso). La jerarquía pro
mueve un tipo de consistencia interna en un modelo, y muchos constructores de modelos estadísticos si
guen rigurosamente este principio. Sin embargo, la jerarquía no es siempre una buena idea, y muchos
modelos en realidad funcionan mejor como ecuaciones de predicción que no incluyen los términos no sig
nificativos que propone la jerarquía. Para mayor información, ver el material suplementario del texto de
este capítulo.
La salida de computadora incluye también estimaciones de los coeficientes del modelo y una ecua
ción para la predicción final de la vida de la batería en términos de factores codificados. En esta ecuación,
los niveles de la temperatura sonA = 1, O, + 1, respectivamente, cuando la temperatura está en los nive
les bajo, intermedio y alto (15, 70, 12SºF). Las variablesB[l] y B[2] son variables indicadoras codificadas
que se definen de la siguiente manera:
Upo de material
1 2 3
B[l] 1 O 1
B[2] O 1 1
Hay también ecuaciones para la predicción de la vida de la batería en términos de los niveles de los facto
res reales. Observe que como el tipo de material es un factor cualitativo, hay una ecuación para la vida
predicha como una función de la temperatura para cada tipo de material. En la figura 518 se muestran
188 •
••
20 ••
16.00 42.60 70.00 97.50 126.00
Temperatura
Figura 518 La vida predicha como una función de la temperatura para los tres ti
pos de material, ejemplo 54.
las curvas de respuesta generadas por estas tres ecuaciones de predicción. Compárense con la gráfica de
la interacción de dos factores para este experimento de la figura 59 .
.........................................................................
Si varios de los factores de un experimento factorial son cuantitativos, puede usarse una superficie de
respuesta para modelar la relación entre y y los factores del diseño. Además, los efectos de los factores
cuantitativos pueden representarse con efectos polinomiales con un solo grado de libertad. De manera si
milar, es posible hacer la partición de las interacciones de factores cuantitativos en componentes de inter
acción con un solo grado de libertad. Esto se ilustra en el ejemplo siguiente.
EJEMPLO 5,. S • • • • • · • • • • • • • • · • • · • · • • • • • • · · · · • • · • • · • · • • • • • • • • • • · • • · · • • • · · • • •
Se piensa que la vida efectiva de una herramienta de corte instalada en una máquina controlada numéri
camente se afecta por la velocidad de corte y el ángulo de la herramienta. Se seleccionan tres velocidades
y tres ángulos, y se lleva a cabo un experimento factorial con dos réplicas. En la tabla 516 se muestran los
datos codificados. Los números de las celdas encerrados en círculos son los totales de las celdas {y¡¡.}.
En la tabla 517 se presenta la salida condensada de Design-Expert para este ejemplo. Los términosA
y A2 son los efectos lineal y cuadrático del ángulo de la herramienta, y By B2 son los efectos lineal y cua
drático de la velocidad. Los términosAB,A2B,AB2yA2B2 representan los componentes lineal x lineal,
cuadrático x lineal, lineal x cuadrático y cuadrático x cuadrático de la interacción de dos factores. Aun
cuando hay algunos valores P grandes, se han conservado todos los términos del modelo para respetar la
jerarquía. En la ecuación de predicción expresada en factores codificados se utilizan los niveles 1, O y + 1
de A y B para representar los niveles bajo, intermedio y alto, respectivamente, de estos factores.
En la figura 519 se presenta la gráfica de contorno de la superficie generada por la ecuación de pre
dicción de la vida de la herramienta. El examen de esta superficie de respuesta indica que la vida máxima
de la herramienta se consigue con velocidades de corte de alrededor de 150 rpm y ángulos de la herra
mienta de 25º. La gráfica de la superficie de respuesta tridimensional de la figura 520 proporciona en
esencia la misma información, pero ofrece una perspectiva diferente, y en ocasiones más útil, de la super
ficie de respuesta de la vida de la herramienta. La exploración de las superficies de respuesta es un aspec
to muy importante del diseño experimental, el cual se estudiará en detalle en el capítulo 11.
Tabla 5·16 Datos del experimento de la vida de la herramienta de corte

Ángulo de la herramienta Velocidad de corte (pulg/min)
(grados) 125 150 175 Y;..
15 -2 -3 2
-1 @) o 0) 3 CD -1
20 o 1 4
2
@ 3 © 6
@) 16
25 1
0) 5
@ o 0) 9
o 6 -1
Y¡_ -2 12 14 24 =Y ...
5-5 AJUSTE DE CURVAS Y SUPERFICIES DE RESPUESTA 205
Tabla 5·17 Salida de Design-Expert para el ejemplo 5-5
Response: Ufe in Hours
ANOVA for Response Surface Reduced Order 4 Modal
Analysis of varlance table [Partlal sum of squares)
Sum of Mean F
Source Squares IOF Square Value Prob> F
A 49.00 1 49.00 33.92 0.0003
8 16.00 1 16.00 11.08 0.0088
A2 0.000 1 0.000 0.000 1.0000
FJl 1.33 1 1.33 0.92 0.3618
AB 8.00 1 8.00 5.54 0.0431
A28 2.67 1 2.67 1.85 0.2073
A/32 42.67 1 42.67 29.54 0.0004
A2/32 8.00 1 8.00 5.54 0.0431
Residual 13.00 9 1.44
LackofFit 0.000 o
Pure Error 13.00 9 1.44
Cor Total 124.00 17
Std. Dev. 1.20 IRSquared 0.8952
c.v. 90.14 f'red R"Squared 0.5806
Factor Estimate DF Error Low Hlgh VIF
lntercept 2.00 1 0.85 0.078 3.92
ATool Angle 3.50 1 0.60 2.14 4.86 3.00
BSpeed 2.00 1 0.60 0.64 3.36 3.00
A2 0.000 1 1.04 2.35 2.35 3.00
82 1.00 1 1.04 1.35 3.35 3.00
AB 1.00 1 0.42 1.96 0.039 1.00
A2B 1.00 1 0.74 2.66 0.66 3.00
AB2 4.00 1 0.74 5.66 2.34 3.00
A292 3.00 1 1.27 5.88 0.12 5.00
Life =
+2.00
+3.50 *A
+2.00 *B
+0.000 *A2
+1.00 *82
1.00 *A *B
1.00 *A2 *B
4.00 *A *B2
3.00 *A2 *82
Lite=
1068.00000
+136.30000 *Tool Angle
+ 14.48000 *Speed
4.08000 *Tool Angle2
0.049600 *Speed2
1.86400 *Tool Angle *$peed
+0.056000 *Tool Angle2 *Speed
+6.40000E003 *Tool Angle *Speecf
1.92000E004 *Tool Angle2 *Speed2
•......~•r..:"IC:=:•
2 2 2
175.00
162.50
1
"C
2 2
160.00
~
137.50
17.50 22.50 25.00

Ángulo de la herramienta
Figura 5.¡9 Gráfica de contorno bidimensionalde la superficie de respuesta de la vida de

la herramienta del ejemplo 55.
5.5
.
"C
-2
5
Velocidad
Ángulo de la herramienta
Figura 520 Superficiede respuesta tridimensional de la vida de la herramienta del

ejemplo 55.
206
56 FORMACIÓN DE BLOQUF.S EN UN DISEÑO FACTORIAL 207
56 FORMACIÓN DE BLOQUES EN UN DISEÑO FACTORIAL
Se han revisado los diseños factoriales en el contexto de un experimento completamente aleatorizado. En

ocasiones no es factible o práctico hacer la aleatorización completa de todas las corridas de un diseño fac
torial. Por ejemplo, la presencia de un factor perturbador puede hacer necesario que el experimento se
corra en bloques. Los conceptos básicos de la formación de bloques se analizaron en el capítulo 4 en el
contexto de un experimento con un solo factor. Ahora se indica la forma en que la formación de bloques
puede incorporarse en un diseño factorial. Otros aspectos de la formación de bloques en diseños factoria
les se presentan en los capítulos 7, 8, 9 y 13.
Considere un experimento factorial con dos factores (A y B) y n réplicas. El modelo estadístico lineal
de este diseño es
(536)
donde r1, {31 y (r/3);¡ representan los efectos de los factores A, By la interacciónAB, respectivamente. Su
ponga ahora que para realizar este experimento se necesita una materia prima particular. Esta materia
prima está disponible en lotes cuyo tamaño no es suficiente para permitir que se corran todas las abn com
binaciones de los tratamientos con el mismo lote. Sin embargo, si un lote contiene material suficiente
para hacer ab observaciones, entonces un diseño alternativo es correr cada una de las n réplicas utilizando
un lote separado de materia prima. Por consiguiente, los lotes de materia prima representan una restric
ción sobre la aleatorización o un bloque, y se corre una sola réplica de un experimento factorial completo
¡ i.:
dentro de cada bloque. El modelo de los efectos para este nuevo diseño es
1, 2, ,a
Ylik = u+t¡ +{31 +(r/3);¡ +ók +E¡¡k 1- l, 2, , b (537)
k = 1, 2, , n
donde ók es el efecto del bloque késimo. Desde luego, dentro de un bloque el orden en que se corren las
combinaciones de los tratamientos está completamente aleatorizado.
En el modelo (ecuación 537) se supone que la interacción entre los bloques y los tratamientos es in
significante. Anteriormente se estableció el mismo supuesto en el análisis de diseños de bloques aleatori
zados. Si estas interacciones existen, no pueden separarse del componente del error. De hecho, el
término del error en este modelo se compone en realidad de las interacciones ('ró)ik, (fló)¡k y (rf3ó)1¡k· En la
tabla 518 se describe el análisis de varianza. La disposición tiene un gran parecido con la de un diseño
factorial, con la suma de cuadrados del error reducida por la suma de cuadrados de los bloques. En lo que
a los cálculos se refiere, la suma de cuadrados de los bloques se encuentra como la suma de cuadrados en
tre los totales de los n bloques {y.JJ.
En el ejemplo anterior, la aleatorización se restringió al interior de un lote de materia prima. En la
práctica, una diversidad de fenómenos pueden producir restricciones sobre la aleatorización, como el
tiempo, los operadores, etc. Por ejemplo, si el experimento factorial completo no pudo correrse en un día,
entonces el experimentador podría correr una réplica completa el día 1, una segunda réplica el día 2, etc.
Por consiguiente, cada día sería un bloque.
Ej'El\-fPLO 5 .-6 • · · • • • · · · · · · · · · • • • • · • • • · • • • • · • • • • • • • · · · · · · · · · · • • • • • • • · • · · · · · ·
Un ingeniero estudia los métodos para mejorar la capacidad para detectar objetivos en el campo de ac
ción de un radar. Dos factores que el ingeniero considera importantes son la cantidad de ruido de fondo,
o "desorden de terreno", en el campo de acción del radar y el tipo de filtro colocado sobre la pantalla. Se
Tabla 518 Análisis de varianza de un diseño factorial de dos factores en bloques completos aleatorízados
variación cuadrados libertad medio esperado
Bloques
A
1 L h. - abn
Y~.
2
a-1 2
bn ,Li-; MSA
bn 1. ª + a1 MSE
B
1 2L Y~.
an . Y.¡. - abn b1 2
an 2;P~ MSB
1 o + b1 MSE
AB 2:2:
1
n . .
y~' _L-ss
abn 1·
2
A
-SS
B (al)(b1)
2
a+
n L L(r,8)~ MSAB
' 1 (al)(b1) MSE
Error Sustracción (ab- l)(n1) ª2
Tu tal 2:2:2: Y1;k - abn
. .
y~ k
2
abn-1
1 1
diseña un experimento utilizando tres niveles del desorden de terreno y dos tipos de filtro. Estos factores
se considerarán fijos. El experimento se lleva a cabo seleccionando al azar una combinación de los trata
mientos (nivel del desorden de terreno y tipo de filtro) e introduciendo después una señal que representa
el objetivo en el campo de acción del radar. La intensidad de este objetivo se incrementa hasta que el ope
rador lo observa. Entonces se mide el nivel de intensidad en el momento de la detección como la variable
de respuesta. Debido a la disponibilidad de los operadores, es conveniente seleccionar un operador y
mantenerlo en el sistema hasta que se han realizado todas las corridas necesarias. Además, los operado
res difieren en su habilidad y capacidad para operar el sistema. Por consiguiente, parece lógico usar los
operadores como bloques. Se seleccionan cuatro operadores al azar. Una vez que se ha elegido a un ope
rador, el orden en que se corren las seis combinaciones de los tratamientos se determina aleatoriamente.
Por lo tanto, se tiene una corrida de un experimento factorial 3 X 2 en un bloque completo aleatorizado.
Los datos se presentan en la tabla 519.
El modelo lineal para este experimento es
i= 1, 2, 3
i= 1 2
{
k=;,2,3,4
donde r¡ representa el efecto del desorden de terreno, {Ji representa el efecto del tipo de filtro, (r/3)ii es la
interacción, ók es el efecto del bloque y eiik es el componente NID(O, a2) del error. Las sumas de cuadrados
del desorden de terreno, del tipo de filtro y de su interacción se calculan de la manera usual. La suma de
Tabla 519 Nivel de intensidad al detectarse el objetivo

Operadores (bloques) 1 2 3 4
Tipo de filtro 1 2 1 2 1 2 1 2
Desorden de terreno
Bajo 90 86 96 84 100 92 92 81
Intermedio 102 87 106 90 105 97 96 80
Alto 114 93 112 91 108 95 98 83
56 FORMACIÓN DE BLOQUES EN UN DISEÑO FACTORIAL 209
Fuente de variación cuadrados libertad medio Fo Valor P
Desorden de terreno (G) 335.58 2 167.79 15.13 0.0003
Tipo de filtro (F) 1066.67 1 1066.67 96.19 <0.0001
GF 77.08 2 38.54 3.48 0.0573
Bloques 402.17 3 134.06
Error 166.33 15 11.09
Tutal 2047.83 23
cuadrados debida a los bloques se encuentra a partir de los totales de los operadores {r . .,.J de la siguiente
manera:
1 ~ 2 y~
SSBloqucs = ab ,L.,¡ Y.» - abn
k~l
= (3)~2)[(572)2 +(579)2 +(597)2 +(530)2 ] (~~~~~~:)
= 402.17
En la tabla 520 se resume el análisis de varianza completo de este experimento. La presentación de
la tabla 520 indica que todos los efectos se probaron dividiendo sus cuadrados medios por el cuadrado
medio del error. Tanto el desorden de terreno como el tipo de filtro son significativos en el nivel de 1 %,
mientras que su interacción sólo es significativa en el nivel de 10%. Por lo tanto, se concluye que tanto
el nivel del desorden de terreno como el tipo de filtro de campo usado en la pantalla afectan la habili
dad del operador para detectar el objetivo, y existe cierta evidencia de una ligera interacción entre ambos
factores .
.........................................................................
En el caso de dos restricciones sobre la aleatorización, cada una con p niveles, si el número de combi
naciones de los tratamientos en un diseño factorial de k factores es exactamente igual al número de nive
les de la restricción, es decir, sip = ab ... m, entonces el diseño factorial puede correrse en un cuadrado
latino p X p. Por ejemplo, considere una modificación del experimento de la detección del objetivo en el
radar del ejemplo 5-6. Los factores de este experimento son el tipo de filtro (dos niveles) y el desorden de
terreno (tres niveles), y los operadores se consideran como bloques. Suponga ahora que debido a limita
ciones de tiempo, sólo pueden hacerse seis corridas por día. Por lo tanto, los días se convierten en una se
gunda restricción sobre la aleatorización, lo cual resulta en un diseño del cuadrado latino 6 x 6, como
se muestra en la tabla 521. En esta tabla se han usado las letras minüsculasf y gi para representar los nive
les iésimo yjésimo del tipo de filtro y del desorden de terreno, respectivamente. Es decir,/ ¡g-2 representa
el filtro tipo 1 y un desorden de terreno intermedio. Observe que se necesitan ahora seis operadores, en
lugar de los cuatro del experimento original, por lo que el número de combinaciones de tratamientos en
el diseño factorial 3 x 2 es exactamente igual al número de niveles de restricción. Además, en este diseño
cada operador se usaría una sola vez en cada día. Las letras latinas A, B, C, D, E y F representan las 3 x 2
= 6combinaciones de tratatnientos del diseño factorial como sigue:A = f'J!:1,B = f'J!:2, C = f¡g-3,D = f.jg¡,E
= /$2 y F = f'fi3·
210 CAPÍTULOS INTRODUCCIÓN A LOS DISEÑOS FACTORIALES
Tabla 521 El experimento de la detección del radar realizado en un cuadrado latino 6 X 6

Operador
Día 1 2 3 4 5 6
1 A(f¡g1 = 90) B(f¡g2 = 106) C(f1g3 = 108) D(fúJ1 = 81) F(fúJ3 = 90) E(f úJ2 = 88)
2 C(f¡g3 = 114) A(f¡g1 = 96) B(f ¡g2 = 105) F(fúJ3 = 83) E(f úJ2 = 86) D(fúJ1 = 84)
3 B(f ¡g2 = 102) E(fúJz = 90) F(fúJ3 = 95) A(f¡g1 = 92) D(fúJ1 = 85) C(f¡g3 = 104)
4 E(f úJ2 = 887) D(fúJ1 = 84) A(f1g1 = 100) B(f1g2 = 96) C(f¡g3 = 110) F(fúJ3 = 91)
5 F(fúJ3 = 93) C(f¡g3 = 112) D(fúJ1 = 92) EifúJi = 80) A(f¡g1 = 90) Bif182 = 98)
6 DlfúJ1 == 86) F(fúJ3 = 91) E(fúJ2 = 97) C(f¡g3 = 98) B(f ¡g2 = 100) A(f¡g1 = 92)
Los cinco grados de libertad entre las seis letras latinas corresponden a los efectos principales del tipo
de filtro (un grado de libertad), el desorden de terreno (dos grados de libertad) y su interacción (dos gra
dos de libertad). El modelo estadístico lineal de este diseño es
i= 1, 2, ... , 6
j=l,2,3
Y;¡kl =u+a¡ +r i + {3k +(rf3)jk +01 +eiikl k=1 2 (538)
{
/=1.'2, ... ,6
donde ri y {3k son los efectos del desorden de terreno y del tipo de filtro, respectivamente, y a; y 01 represen
tan las restricciones sobre la aleatorización de los días y los operadores, respectivamente. Para calcular las
sumas de cuadrados, la siguiente tabla de dos vías de los totales de los tratamientos es útil:
Desorden de terreno Filtro tipo 1 Filtro tipo 2 Y.¡..
Bajo 560 512 1072
Intermedio 607 528 1135
Alto 646 543 1189

Y._k 1813 1583 3396 =y ___
Además, los totales de los renglones y las columnas son

Renglones (Y_¡kl): 563 568 568 568 565 564
Columnas (Y11k.): 572 579 597 530 561 557
En la tabla 522 se resume el análisis de varianza. Se ha agregado una columna a esta tabla que indica
cómo se determina el número de grados de libertad de cada suma de cuadrados.
Tabla522 Análisis de varianza del experimento de la detección en el radar realizado como un disefiofactorial 3 x 2 en un
cuadrado latino
Fórmula general
Fuente de Suma de Grados de para los grados Cuadrado
variación cuadrados libertad de libertad medio Fo ValorP
Desorden de terreno, G 571.50 2 a1 285.75 28.86 <0.0001
Tipo de filtro, F 1469.44 1 b1 1469.44 148.43 <0.0001
GF 126.73 2 (a - l)(b1) 63.37 6.40 0.0071
Días (renglones) 4.33 5 ab-1 0.87
Operadores 428.00 5 ab-1 85.60
(columnas)
Error 198.00 20 (ab - l)(ab - 2) 9.90
Tutal 2798.00 36 (ab)2- 1
57 PROBLEMAS 211
5 .. 7 PROBLEMAS
51. Se estudia el rendimiento de un proceso químico. Se piensa que las dos variables más importantes son la pre
sión y la temperatura. Se seleccionan tres niveles de cada factor y se lleva a cabo un experimento factorial con
dos réplicas. Los datos del rendimiento son:
Presión (psig)
Temperatura (°C) 200 215 230
150 90.4 90.7 90.2
90.2 90.6 90.4
160 90.1 90.5 89.9
90.3 90.6 90.1
170 90.5 90.8 90.4
90.7 90.9 90.1
a) Analizar los datos y sacar conclusiones. Utilizar a = 0.05.

b) Construir las gráficas de los residuales apropiadas y comentar la adecuación del modelo.
e) lBajo qué condiciones debería operarse este proceso?
52. Un ingeniero sospecha que el acabado superficial de una pieza metálica se afecta por la velocidad de alimen
tación y la profundidad de corte. Selecciona tres velocidades de alimentación y cuatro profundidades de cor
te. Después realiza un experimento factorial y obtiene los siguientes datos:
Velocidad de alimentación Profundiad de corte (pulg)

(pulg/min) 0.15 0.18 0.20 0.25
74 79 82 99
0.20 64 68 88 104
60 73 92 96
92 98 99 104
0.25 86 104 108 110
88 88 95 99
99 104 108 114
0.30 98 99 110 111
102 95 99 107

e) Obtener estimaciones puntuales del acabado superficial promedio con cada velocidad de alimentación.
d) Encontrar los valores P para las pruebas del inciso a.
53. Para los datos del problema 52, calcular la estimación de un intervalo de confianza de 95% de la diferencia
media en la respuesta para velocidades de alimentación de 0.20 y 0.25 pulg/min.
54. En un artículo de Industrial Quality Control se describe un experimento para investigar el efecto del tipo de
cristal y del tipo de fósforo sobre la brillantez de un cinescopio. La variable de respuesta es la corriente (en
microamperes) necesaria para obtener un nivel de brillantez específico. Los datos son los siguientes:
Tipo de Tipo de fósforo

cristal 1 2 3
280 300 290
1 290 310 285
285 295 290
230 260 220
2 235 240 225
240 235 230
a) lExiste algún indicio de que alguno de los dos factores influye en la brillantez? Utilizar a = 0.05.
b) lLos dos factores interactúan? Utilizar a = 0.05.
e) Analizar los residuales de este experimento.
55. Johnson y Leone (Statistics and Experimental Design in Engineering and the Physical Sciences, John Wiley)
describen un experimento realizado para investigarla torcedura de placas de cobre. Los dos factores estudia
dos fueron la temperatura y el contenido de cobre de las placas. La variable de respuesta fue una medida de
la cantidad de torcedura. Los datos fueron los siguientes:
Contenido de cobre(%)
Temperatura (ºC) 40 60 80 100
50 17,20 16, 21 24,22 28,27
75 12, 9 18, 13 17, 12 27,31
100 16, 12 18,21 25,23 30,23
125 21, 17 23,21 23,22 29,31
a)lExiste algún indicio de que alguno de los dos factores afecta la cantidad de torcedura? lHay alguna in
teracción entre los factores? Utilizar a = 0.05.
e) Graficar la torcedura promedio con cada nivel del contenido de cobre y compararlas con una distribu
ción t con la escala apropiada. Describir las diferencias en los efectos de los diversos niveles del conteni
do de cobre sobre la torcedura. Si es deseable una torcedura baja, lqué nivel del contenido de cobre
debería especificarse?
d) Suponga que no es sencillocontrolar la temperaturaen el medio ambiente donde van a usarse las placas
de cobre. lEste hecho modifica la respuesta que se dio para el inciso e?
56. Se estudian los factores que influyenen la resistencia a la ruptura de una fibra sintética. Se eligen cuatro má
quinas de producción y tres operadores y se corre un experimento factorial utilizando fibra del mismolote de
producción. Los resultados son los siguientes:
Máquina
Operador 1 2 3 4
1 109 110 108 110
110 115 109 108
2 110 110 111 114
112 111 109 112
3 116 112 114 120
114 115 119 117
5- 7 PROBLEMAS 213
5 7. Un ingeniero mecánico estudia la fuerza de empuje desarrollada por una taladradora. Sospecha que la velo
cidad de taladrado y la velocidad de alimentación del material son los factores más importantes. Selecciona
cuatro velocidades de alimentación y usa una velocidad de taladrado alta y otra baja elegidas para represen
tar las condiciones de operación extremas. Obtiene los siguientes resultados. Analizar los datos y sacar con
clusiones. Utilizar a = 0.05.
Velocidad de alimentación
Velocidad de taladrado 0.015 0.030 0.045 0.060
125 2.70 2.45 2.60 2.75
2.78 2.49 2.72 2.86
200 2.83 2.85 2.86 2.94
2.86 2.80 2.87 2.88
58. Se realiza un experimento para estudiar la influencia de la temperatura de operación y tres tipos de placas de
recubrimiento de cristal, en la salida luminosa de un tubo de osciloscopio. Se registraron los siguientes datos:
Tipode Temperatura
cristal 100 125 150
580 1090 1392
1 568 1087 1380
570 1085 1386
550 1070 1328
2 530 1035 1312
579 1000 1299
546 1045 867
3 575 1053 904
599 1066 889
a) Utilizar a= 0.05 en el análisis. lExiste un efecto de interacción significativo? lEl tipo de cristal o la tem
peratura afectan la respuesta? lA qué conclusiones se llega?
b) Ajustar un modelo apropiado que relacione la salida luminosa con el tipo de cristal y la temperatura.
e) Analizar Jos residuales de este experimento. Comentar Ja adecuación de los modelos que se hayan consi
derado.
59. Considere el experimento del problema 51. Ajustar un modelo apropiado a los datos de la respuesta. Usar
este modelo como guía para las condiciones de operación del proceso.
510. Usar la prueba de Thkey para determinar los niveles del factor presión que son significativamente diferentes
para los datos del problema 51.
214 CAPITULO 5 INTRODUCCIÓN A LOS DISEÑOS FACTORIALES
511. Se llevó a cabo un experimento para determinar si la temperatura de cocción o la posición en el horno afec
taban el espesor del endurecimiento de un ánodo de carbono. Los datos se presentan a continuación:
'Iemperatura (ºC)
Posición 800 825 850
570 1063 565
1 565 1080 510
583 1043 590
528 988 526
2 547 1026 538
521 1004 532
Suponga que se considera que no existe ninguna interacción. Desarrollar el modelo estadístico. Realizar el
análisis de varianza y probar las hipótesis sobre los efectos principales. lQué conclusiones pueden sacarse?
Comentar la adecuación del modelo.
512. Deducir los cuadrados medios esperados para un análisis de varianza de dos factores con una observación
por celda, suponiendo que ambos factores son fijos.
513. Considere los siguientes datos de un experimento factorial de dos factores. Analizar los datos y sacar conclu
siones. Realizar una prueba de no aditividad. Utilizar a = 0.05.
Factor de la columna
Factor del renglón 1 2 3 4
1 36 39 36 32
2 18 20 22 20
3 30 37 33 34
514. Se piensa que la resistencia al corte de un adhesivo se afecta por la presión de aplicación y la temperatura. Se
realiza un experimento factorial en el que ambos factores se suponen fijos. Analizar los datos y sacar conclu
siones. Realizar una prueba de no aditividad.
Presión 'Iemperatura (ºF)

(lb/pulg2) 250 260 270
120 9.60 11.28 9.00
130 9.69 10.10 9.57
140 8.43 11.01 9.03
150 9.98 10.44 9.80
515. Considere el modelo de tres factores
i.: 1, 2, ,a
Yijt = u+t ¡ +P1 +r, +('C/3)ii +(/3y)ik +eiik
{=
J1, 2,
k 1, 2,
,b
,e
Observe que hay una sola réplica. Suponiendo que los tres factores son fijos, desarrollar la tabla del análisis
de varianza, incluyendo los cuadrados medios esperados. lQué se usaría como "error experimental" para
probar las hipótesis?
57 PROBLEMAS 215
516. El porcentaje de la concentración de madera dura en la pulpa bruta, la presión de la cuba y el tiempo de coc
ción de la pulpa se investigan en cuanto a sus efectos sobre la resistencia del papel. Se seleccionan tres niveles
de la concentración de madlera dura, tres niveles de la presión y dos tiempos de cocción. Se lleva a cabo un ex
perimento factorial con dos réplicas, obteniéndose los siguientes datos:
Tiempo de cocción 3.0 horas Tiempo de cocción 4.0 horas

Porcentaje de la
Presión Presión
concentración de
madera dura 400 500 650 400 500 650
2 196.6 197.7 199.8 198.4 199.6 200.6
196.0 196.0 199.4 198.6 200.4 200.9
4 198.5 196.0 198.4 197.5 198.7 199.6
197.2 196.9 197.6 198.1 198.0 199.0.
8 197.5 195.6 197.4 197.6 197.0 198.5
196.6 196.2 198.1 198.4 197.8 199.8

e) ¿Bajo qué conjunto de condiciones debería operarse este proceso? lPor qué?
517. El departamento de control de calidad de una planta de acabados textiles estudia el efecto de varios factores
sobre el teñido de una tela de algodón y fibras sintéticas utilizada para fabricar camisas para caballero. Se se
leccionaron tres operadores, tres duraciones del ciclo y dos temperaturas, y se tiñeron tres ejemplares peque
ños de la tela bajo cada conjunto de condiciones. La tela terminada se comparó con un patrón, y se le asignó
una evaluación numérica. Los datos se presentan enseguida. Analizar los datos y sacar conclusiones. Comen
tar la adecuación del modelo.
Temperatura
300º 350º
Operador Operador
Duración del ciclo 1 2 3 1 2 3
23 27 31 24 38 34
40 24 28 32 23 36 36
25 26 29 28 35 39
36 34 33 37 34 34
50 35 38 34 39 38 36
36 39 35 35 36 31
28 35 26 26 36 28
60 24 35 27 29 37 26
27 34 25 25 34 24
518. Suponga que en el problema 51 quiere rechazarse la hipótesis nula con una alta probabilidad si la diferencia
entre el verdadero rendimiento promedio con dos presiones cualesquiera es mayor que 0.5. Si una estima
ción previa razonable de la desviación estándar del rendimiento es 0.1, lcuántas réplicas deberán correrse?
519. Se estudia el rendimiento de un proceso químico. Los dos factores de interés son la temperatura y la presión.
Se seleccionan tres niveles de cada factor; sin embargo, sólo es posible hacer nueve corridas en un día. El ex
perimentador corre una réplica completa en cada día. Los datos se muestran en la tabla siguiente. Analizar
los datos, suponiendo que los días son bloques.
Dial Día2
Presión Presión
'Iemperatura 250 260 270 250 260 270
Baja 86.3 84.0 85.8 86.1 85.2 87.3
Intermedia 88.5 87.3 89.0 89.4 89.9 90.3
Alta 89.1 90.2 91.3 91.7 93.2 93.7
520. Considere los datos del problema 55. Analizar los datos, suponiendo que las réplicas son bloques.
521. Considere los datos del problema 56. Analizar los datos, suponiendo que las réplicas son bloques.
522. En un artículo deloumal ofTesting and Evaluation (vol. 16, no. 2, pp. 508515) se investigaron los efectos de
la frecuencia de carga cíclica y de las condiciones ambientales sobre el crecimiento de las fisuras por fatiga
con un esfuerzo constante de 22 MPa para un material particular. Los datos del experimento se presentan
abajo (la respuesta es el índice de crecimiento de las fisuras por fatiga):
Medio ambiente
Frecuencia Aire HzÜ HzÜ salada
2.29 2.06 1.90
2.47 2.05 1.93
10 2.48 2.23 1.75
2.12 2.03 2.06
2.65 3.20 3.10
2.68 3.18 3.24
1 2.06 3.96 3.98
2.38 3.64 3.24
2.24 11.00 9.96
0.1 2.71 11.00 10.01
2.81 9.06 9.36
2.08 11.30 10.40
a) Analizar los datos de este experimento (utilizar a = O.OS).

b) Analizar los residuales.
e) Repetir los análisis de los incisos a y b utilizando ln{y) como la respuesta. Comentar los resultados.
523. En un artículo de IEEE Transactions on Electron Devices se describe un estudio sobre el dopado del polisili
cio. El experimento que se muestra a continuación es una variante de dicho estudio. La variable de respuesta
es la corriente fundamental.
Dopado del Tumperatura de revenido (°C)

polisilicio (iones) 900 950 1000
4.60 10.15 11.01
1 X 1{)20
4.40 10.20 10.58
2 X 1020
3.20 9.38 10.81
3.50 10.02 10.60
57 PROBLEMAS 217
a) ¿Existe evidencia(con a = 0.05) que indique que el nivel de dopado del polisílicioo la temperatura de fi
jación afecten la corriente fundamental?
b) Construir representaciones gráficas como ayuda para interpretar este experimento.
e) Analizar los residuales y comentar la adecuación del modelo.
d) lEI modelo
y= f3o + /31X1 + f32x2 + f322x~ + f312X1X2 +E

está apoyadopor este experimento (x1 = nivel de dopado, x2 = temperatura)? Estimar los parámetros de
este modelo y graficar la superficie de respuesta.
Diseño factorial 2k
6.. 1 INTRODUCCIÓN
Los diseños factoriales se usan ampliamente en experimentos que incluyen varios factores cuando es ne
cesario estudiar el efecto conjunto de los factores sobre una respuesta. En el capítulo 5 se presentaron los
métodos generales para el análisis de los diseños factoriales. Sin embargo, hay varios casos especiales del
diseño factorial general que son importantes debido a su uso generalizado en el trabajo de investigación y
porque constituyen las bases de otros diseños de gran valor práctico.
El más importante de estos casos especiales es el de k factores, cada uno con sólo dos niveles. Estos
niveles pueden ser cuantitativos, como dos valores de temperatura, presión o tiempo, o bien cualitativos,
como dos máquinas, dos operadores, los niveles "alto" y "bajo" de un factor, o quizá la presencia o ausen
cia de un factor. Una réplica completa de este diseño requiere 2 x 2 x ... x 2 = zk observaciones y se le
llama diseño factorial 2k.
Este capítulo se enfoca en esta clase en extremo importante de diseños. A lo largo del capítulo se su
pone que 1) los factores son fijos, 2) los diseños son completamente aleatorizados y 3) se satisfacen los su
puestos de normalidad usuales.
El diseño 2k es de particular utilidad en las etapas iniciales del trabajo experimental, cuando proba
blemente se estén investigando muchos factores. Este diseño proporciona el menor número de corridas
con las que pueden estudiarse k factores en un diseño factorial completo. Por consiguiente, estos diseños
se usan ampliamente en los experimentos de tamizado o selección de factores.
Puesto que sólo hay dos niveles para cada factor, se supone que la respuesta es aproximadamente li
neal en el rango elegido para los niveles de los factores. En muchos experimentos de tamizado de facto
res, cuando se acaba de iniciar el estudio del proceso o sistema, este supuesto suele ser razonable. En la
sección 66 se presentará un método simple para verificar este supuesto, y se analizarán las acciones que
deberán emprenderse en caso de que se viole.
218
62 ELDISEÑOZJ 219
62 EL DISEÑO 22
El primer diseño de la serie 211 es el que sólo tiene dos factores, por ejemplo,A y B; cada uno se corre a dos
niveles. A este diseño se le llama diseño factorial 22• Los niveles de los factores pueden denominarse arbi
trariamente "bajo" y "alto". Como un ejemplo, considere la investigación del efecto de la concentración
del reactivo y de la cantidad del catalizador sobre la conversión (rendimiento) de un proceso químico. Sea
la concentración del reactivo el factor A, y sean 15 y 25 por ciento los dos niveles de interés. El catalizador
es el factor B, con el nivel alto dlenotando el uso de 2 libras del catalizador y el nivel bajo denotando el uso
de 1 libra. Se hacen tres réplicas del experimento, y los datos son los siguientes:
Factor Combinación de Réplica

A B tratamientos 1 11 m Tu tal
A bajo, B bajo 28 25 27 80
+ A alto, B bajo 36 32 32 100
+ A bajo, B alto 18 19 23 60
+ + A alto, B alto 31 30 29 90
Las combinaciones de los tratamientos se ilustran gráficamente en la figura 6 l. Por convención, el

efecto de un factor se denota con una letra mayúscula latina. Por lo tanto, ''A" se refiere al efecto del fac
tor A, "B" al efecto del factor B, y "AB" a la interacciónAB. En el diseño 22, los niveles bajo y alto de A y B
se denotan por "" y"+", respectivamente, en los ejesA y B. Por lo tanto, en el ejeA representa el nivel
bajo de la concentración (15% ), mientras que + representa el nivel alto (25% ), y en el eje B representa
el nivel bajo del catalizador, mientras que + denota el nivel alto.
Las cuatro combinaciones de tratamientos suelen representarse con letras minúsculas, como se
muestra en la figura 61. Por la figura se observa que el nivel alto de cualquiera de los factores en una com
binación de tratamientos se denota por la letra minúscula correspondiente y que el nivel bajo de un factor
en una combinación de tratamientos se denota por la ausencia de la letra respectiva. Por lo tanto, a repre
b·60 ob-90
(18+19 + 231 (31+30 +29)
Alto +
(2 libras)
Bajo _
(1 libra) (1) •
80 Cl"" 100
(28 + 25 + 27) (36 + 32 + 32)
+
Bajo Alto
(15%) (25%)
Concentración
del reactivo,
A
Figura 61 Combinaciones de los tratamientos en el di·
sefi.o 22•
220 CAPÍTIJLO 6 DISEÑO FACTORIAL z•
senta la combinación de tratamientos conA en el nivel alto y Ben el nivel bajo, b representa A en el nivel
bajo y Ben el nivel alto, y ab representa ambos factores en el nivel alto. Por convención, se usa (1) para de
notar que ambos factores están en el nivel bajo. Esta notación se utiliza en todas las series 2k.
En un diseño factorial con dos niveles, el efecto promedio de un factor puede definirse como el cam
bio en la respuesta producido por un cambio en el nivel de ese factor promediado para los niveles del otro
factor. Asimismo, los símbolos (1 ), a, by ab representan ahora el total de las n réplicas hechas con la com
binación de los tratamientos, como se ilustra en la figura 61. Ahora el efecto de A en el nivel bajo de B es
[a (1)]/n y el efecto deA con el nivel alto deB es [ab-b]ln.Al promediarse estas dos cantidades se obtie
ne el efecto principal de A:
1
A= {[abb]+[a(1)]}
2n
1
= -[ab+a-b-(1)] (61)
2n
El efecto principal promedio deB se encuentra a partir del efecto deB con el nivel bajo deA (es decir,
[b (1) ]In) y con el nivel alto de A (o sea, [ab - a ]In) como
1
B= {[aba]+[b(1)]}
2n
1
=[ab+ba(1)] (62)
2n ·
El efecto de la interacciónAB se define como la diferencia promedio entre el efecto de A con el nivel
alto de B y el efecto de A con el nivel bajo de B. Por lo tanto,
1
AB= {[abb][a(1)]}
2n
1
= 2n[ab+(l)-a-b] (63)
De manera alternativa,AB puede definirse como la diferencia promedio entre el efecto de B con el
nivel alto de A y el efecto de B con el nivel bajo de A. Esto llevará también a la ecuación 63.
Las fórmulas de los efectos de A, By AB pueden deducirse con otro método. El efecto de A puede en
contrarse como la diferencia en la respuesta promedio de las dos combinaciones de tratamientos situadas
a la derecha del cuadrado de la figura 61 (a este promedio se le llama .Y>, porque es la respuesta prome
dio con las combinaciones de tratamientos donde A está en el nivel alto) y las dos combinaciones de trata
mientos situadas a la izquierda del cuadrado de la figura 61 (o y,..-). Es decir,
A = ji A+ - ji A-
ab +a b+(l)
=
2n 2n
1
=-[ab+a-b-(l)]
2n
Se trata exactamente del mismo resultado que el de la ecuación 61. El efecto deB, ecuación 62, se
encuentra como la diferencia entre el promedio de las dos combinaciones de tratamientos de la parte su
62 EL DISEÑO 21 221
perior del cuadrado (YB+) y el promedio de las dos combinaciones de tratamientos de la parte inferior
CYB-), o
B= YB+ -yB_
ab+b a+(l)
=
2n 2n
1
= -[ab+b-a-(1)]
2n
Por último, el efecto de la interacciónAB es el promedio de las combinaciones de tratamientos de la dia
gonal de derecha a izquierda del cuadrado [ab y (l)] menos el promedio de las combinaciones de trata
mientos de la diagonal de izquierda a derecha (a y b), o
AB= ab+(l) a+b

2n 2n
1
= -[ab+(l)-a-b]
2n
resultado que es idéntico a la ecuación 63.

Utilizando el experimento de la figura 61, los efectos promedio pueden estimarse como
1
A= (90+1006080)= 8.33
2(3)
1
B=(90+6010080)= 5.00
2(3)
1
AB= 2(3)(90+8010060)=1.67
El efecto de A (concentración del reactivo) es positivo; esto sugiere que al incrementar A del nivel bajo
(15%) al nivel alto (25% ), el rendimiento se incrementará. El efecto de B (catalizador) es negativo; esto
sugiere que al incrementar la cantidad del catalizador que se agrega al proceso se reducirá el rendimien
to. El efecto de la interacción parece ser pequeño en comparación con los dos efectos principales.
En muchos experimentos que incluyen diseños 2", se examinará la magnitud y la dirección de los efec
tos de los factores a fin de determinar las variables que son de posible importancia. En la mayoría de los
casos puede usarse el análisis de varianza para confirmar esta interpretación. Hay varios paquetes de soft
ware de estadística excelentes que son útiles para establecer y analizar diseños 2k. Se cuenta también con
métodos especiales que ahorran tiempo cuando los cálculos se hacen manualmente.
Considere las sumas de cuadrados de A, By AB. Observe, por la ecuación 61, que se usó un contraste
para estimar A, a saber
Contraste A= ab+a-b-(1) (64)
A este contraste suele llamársele el efecto total de A. A partir de las ecuaciones 62 y 63, se observa que
también se usan contrastes para estimar By AB. Además, estos tres contrastes son ortogonales. La suma
de cuadrados de cualquier contraste puede calcularse con la ecuación 329, la cual establece que la suma
de cuadrados del contraste es igual al cuadrado del contraste dividido por el número de observaciones en
222 CAPÍTIJLO 6 DISEÑO FACTORIAL 2k
cada total del contraste multiplicado por la suma de cuadrados de los coeficientes del contraste. Por con
siguiente, se tienen
SS =[ab+a-b-(1)]2
A 4n
SS = [ab+ba(1)]2 (6-6)
B 4n
y
SS = [ab+(l)-a-b] 2
(6-7)
AB 4n
como las sumas de cuadrados de A, B y AB.
Al utilizar el experimento de la figura 61, las sumas de cuadrados de las ecuaciones 65, 66 y 6 7 pue
den encontrarse cmµo
SS = (50)2 = 208.33
A 4(3)
SS = (30)2 75.00 (68)
B 4(3)
y
( 10)2
SS == 8.33
AB 4(3)
La suma de cuadrados total se encuentra como de costumbre, es decir,
Y.:
SSr= LLL 22,,
i=t j:l k=l

z
Yijk--
4n
(69)
En general, SSr tiene 4n 1 grados de libertad. La suma de cuadrados del error, con 4(n 1) grados de li
bertad, suele calcularse por sustracción como
ssE = ssr -ss A -ss0 -ss AB (610)
Para el experimento de la figura 61, se obtiene
SSr = ~~&i
2 2 3 2
Y1¡c- 4(3)
Y.=
= 9398.00 9075.00 = 323.00

y
SSE = SST - SSA - SSB - SSAB
= 323.00 208.33 75.00 8.33
= 31.34
al utilizar SSA, SS0 y SSAB de la ecuación 68. En la tabla 61 se resume el análisis de varianza completo.
Con base en los valoresP, se concluye que los efectos principales son estadísticamente significativos y que
no hay interacción entre estos factores. Esto confirma la interpretación de los datos que se hizo original
mente con base en las magnitudes de los efectos de los factores.
Con frecuencia resulta conveniente escribir las combinaciones de los tratamientos en el orden (1 ), a,
6Z EL DISEÑO V 223
'Thbla 61 Análisis de varianza del experimento de la figura 61
A 208.33 1 208.33 53.15 0.0001
B 75.00 1 75.00 19.13 0.0024
AB 8.33 1 8.33 2.13 0.1826
Error 31.34 8 3.92
Thtal 323.00 11
b, ab, Se hace referencia a esto como el orden estándar (u orden de Yates, por el Dr. Frank Yates). Al
utilizar este orden estándar, se observa que los coeficientes de los contrastes usados para estimar los
efectos son
Efectos (1) a b ab
A: 1 +1 -1 +1
B: -1 -1 +1 +1
AB: +1 -1 -1 +1
Observe que los coeficientes de los contrastes para estimar el efecto de la interacción son sólo el producto
de los coeficientes correspondientes de los dos efectos principales. El coeficiente de un contraste es siem
pre + 1 o 1, y puede usarse una tabla de signos positivos y negativos como la tabla 62 para determinar el
signo correcto para cada combinación de tratamientos. Los encabezados de las columnas de la tabla 62
son los efectos principales (A y B), la interacciónAB e I, que representa el total o promedio del experi
mento completo. Observe que la columna que corresponde a I incluye únicamente signos positivos. Las
etiquetas de los renglones son las combinaciones de los tratamientos. Para encontrar el contraste para es
timar cualquier efecto, simplemente se multiplican los signos de la columna apropiada de la tabla por la
combinación de tratamientos correspondiente y se hace la suma. Por ejemplo, para estimar A, el contras
te es (1) + a - b + ab, que concuerda con la ecuación 61.
El modelo de regresión
En un diseño factorial 2k es sencillo expresar los resultados del experimento en términos de un modelo de
regresión. Puesto que 2k es tan sólo un diseño factorial, podría usarse un modelo de los efectos o de las
medias, pero el enfoque del modelo de regresión es mucho más natural e intuitivo. Para el experimento
del proceso químico de la figura 61, el modelo de regresión es
y= Po +P1X1 +fJ2X2 +E
donde x1 es una variable codificada que representa la concentración del reactivo y x2 es una variable codi
ficada que representa la cantidad del catalizador y las fJ son los coeficientes de regresión. Larelación en
'Thbla 62 Signos algebraicos para calcular los

efectos en el díseño 22
Combinación de Efecto factorial
tratamientos I A B AB
(1) + +
a + +
b + +
ab + + + +
224 CAPÍTULO 6 DISEÑO FACTORIAL Zk
tre las variables naturales la concentración del reactivo y la cantidad de catalizador y las variables
codificadas es
Concentración(Concentraciónb•i• +Concentración g j/ 2
X1 = (Concentración alta Concentración baja ) / 2
y
Catalizador(Catalizadorbaio +Catalizadorj., ) / 2
X=------------------
2 ( Catalízadorj¿ ., Catalizadorbajo ) / 2
Cuando las variables naturales sólo tienen dos niveles, esta codificación producirá la familiar nota
ción ± 1 para los niveles de las variables codificadas. Para ilustrar esto en el ejemplo tratado, observe que
Concentración (15 + 25) / 2
X = '~
! (2515)/2
Concentración 20
=-------
5
Por lo tanto, si la concentración está en el nivel alto (Concentración = 25% ), entonces r, = + l; si la con
centración está en el nivel bajo (Concentración = 15%), entonces x1 = 1. Además,
Catalizador(1+2)/ 2
X2= (21)/2
Catalizador1.5
= 0.5
Por lo tanto, si el catalizador está en el nivel alto (Catalizador= 2 libras), entoncesz, = + l; si el cataliza
dor está en el nivel bajo (Catalizador = 1 libra), entonces x2 = 1.
El modelo de regresión ajustado es
Y= 8.33) X1 + (5.00)
27.5+ (2 2 X2
donde la ordenada al origen es el gran promedio de las.12 observaciones, y los coeficientes de regresión p 1
y p 2 son la mitad de las estimaciones de los efectos de los factores correspondientes. La razón de que el
coeficiente de regresión sea la mitad de la estimación del efecto es que un coeficiente de regresión mide el
efecto de un cambio unitario enx sobre la media dey, y la estimación del efecto se basa en un cambio de
dos unidades (de 1 a + 1 ). Se demostrará más adelante que este método simple para estimar los coefi
cientes de regresión consiste en producir las estimaciones de mínimos cuadrados de los parámetros. Ver
también el material suplementario de este capítulo.
Residuales y adecuación del modelo
El modelo de regresión puede usarse para obtener el valor predicho o ajustado de y en los cuatro puntos
del diseño. Los residuales son las diferencias entre el valor observado y el valor ajustado de y. Por ejem
plo, cuando la concentración del reactivo está en el nivel bajo (x1 = 1) y el catalizador está en el nivel bajo
(x2 = 1 ), el rendimiento predicho es
8.33) (1)+
.Y= 27.5+ (2 (5.00)
2 (1)
= 25.835
62 EL DISEÑO zz 225
· Hay tres observaciones en esta combinación de tratamientos, y los residuales son

e1 = 28 25.835 = 2.165
«. = 25 25.835=0.835
e3=2725.835=1.165
Los valores predichos y los residuales restantes se calculan de manera similar. Para el nivel alto de la con
centración del reactivo y el nivel bajo del catalizador,
8.33) (+1)+ (5.00)
y= 27.5+ (2 2 (1)
= 34.165
y
e4 = 36 34.165=1.835
e5 = 32 34.165=2165
e6 = 32 34.165=2.165
Para el nivel bajo de la concentración del reactivo y el nivel alto del catalizador,
8.33)(1)+
y= 27.5+ (2 (5.00)
2 (+1)
= 20.835
y
e7 = 18 20.835 = 2.835
e8 = 19 20.835 = 1.835
e9 = 23 20.835= 2165
Por último, para el nivel alto de ambos factores,
8.33)(+1)+ (5.00)
y= 27.5+(2 2 (+1)
= 29.165
y
e10 = 31 29.165 = 1.835
e11=3029.165= 0.835
e12 = 29 29.165=0.165
En la figura 62 se presenta una gráfica de probabilidad normal de estos residuales y una gráfica de los re
siduales contra el rendimiento predicho. Estas gráficas parecen ser satisfactorias, por lo que no hay razón
para sospechar problemas con la validez de las conclusiones.
La superficie de respuesta
El modelo de regresión
8.33)X1 + (5.00)
y= 27.5+(2 2 X2
226 CAPÍTULO 6 DISEÑO FACTORIAL 2k
99
95 +
90
~ 80
o 70
e
~ 50
:a
11 30
~ 20
10
5 +
2.833 2.000 2. 167 0.333 0.500 1.333 2.167

Residual
o) Gráficade probabilidad normal
2.167 X X
X X
1.333
X
X
X
0.500
.,
"'
¡;¡
"ª'gj 0.333 X
IC X
1.167
X
2.000
X
2.833 X
20.83 23.06 25.28 27.50 29.72 31.94 34.17

Rendimiento predicho
b) Residualescontra el rendimiento predicho
Figura62 Gráficas de los residuales para el experimento del proce

so químico.
puede usarse para generar gráficas de superficie de respuesta. Si se desea construir estas gráficas en términos
de los niveles de los factores naturales, entonces simplemente las relaciones entre las variables naturales y las ·
codificadas que se dieron anteriormente se sustituyen en el modelo de regresión, de donde se obtiene
Y= 27.s+(8;3)(Concentr;ción 20)+(5~00)(Cataliz~~or1.5)
= 18.33+ O. 8333Concentración 5. OOCat.alizador
En la figura 6-3a se presenta la gráfica de superficie de respuesta tridimensional del rendimiento de

este modelo, y la figura 6-3b es la gráfica de contorno. Puesto que el modelo es de primer orden (es decir,
contiene únicamente los efectos principales), la superficie de respuesta ajustada es un plano. Al examinar
34.17
29.72
y 25.28
1.800 25.00
~IJ. 1.600 23.00
~,O! 21.00 .,.o
"b<Ql 1.400
'q..
19.00 ~ 1e.P'
"'º"líl>~· 1.200 17.00 ,bf>06
1.000 15.00 rfo~<e'"
col'
a) Superficie de respuesta
1.833
"O
o 1.667
¡¡;~
~ 1.500
~
"O
:g"'
á 1.333
1.167
25.00
Concentracióndel reactivo
b) Gráficade contorno
Figura 6·3 Gráfica de la superficie de respuesta y gráfica de contorno del

experimento del proceso químico.
la gráfica de contorno se observa que el rendimiento aumenta cuando la concentración del reactivo se in
crementa y la cantidad de catalizador disminuye. Frecuentemente se usa una superficíe ajustada como
ésta para encontrar la dirección del mejoramiento potencial de un proceso. Una manera formal de hacer
esto, llamada método del ascenso más pronunciado, se presentará en el capítulo 11 cuando se estudien los
métodos para realizar la exploración sistemática de las superficies de respuesta.
228 CAPÍTIJLO 6 DISEÑO FACTORIAL 2'
63 EL DISEÑO Z3
Suponga que tres factores,A, By C, cada uno con dos niveles, son de interés. Al diseño se le llama diseño
factorial 23, y en este caso la representación geométrica de las ocho combinaciones de tratamientos puede
hacerse con un cubo, como se muestra en la figura 6-4a. Utilizando la notación"+" y"" para representar
los niveles alto y bajo de los factores, las ocho corridas del diseño 23 pueden enlistarse como en la figura
64b. Se le conoce en ocasiones como la matriz del diseño. Haciendo una ampliación de la notación de las
etiquetas revisada en la sección 62, las combinaciones de los tratamientos en el orden estándar se escri
ben como (1 ), a, b, ab, e, ac, be y abe. Recuerde que estos símbolos representan también el total de las n
observaciones hechas con esa combinación de tratamientos particular.
Existen en realidad tres notaciones diferentes para las corridas del diseño 23 que son de uso general.
La primera es la notación + y, llamada con frecuencia notación geométrica. La segunda es el uso de las
etiquetas en letras minúsculas para identificar las combinaciones de los tratamientos. La tercera y última
notación utiliza 1 y O para denotar los niveles alto y bajo, respectivamente, de los factores, en lugar de
+ y . Estas diferentes notaciones se ilustran enseguida para el diseño 23:
Corrida A B e Etiquetas A B e
1 (1) o o o
2 + a 1 o o
3 + b o 1 o
4 + + ab 1 1 o
5 + e o o 1
6 + + ae 1 o 1
7 + + be o 1 1
8 + + + abe 1 1 1
Hay siete grados de libertad entre las ocho combinaciones de tratamientos del diseño 23• Tres grados
de libertad se asocian con los efectos principales de A, By C. Cuatro grados de libertad se asocian con las
interacciones; uno con cada una de las interacciones AB, AC y BC y uno con la interacción ABC.
Considere la estimación de los efectos principales. Primero, considere la estimación del efecto princi
palA. El efecto deA cuan.do By C están en el nivel bajo es [a - (1)]/n. De manera similar, el efecto deA
~
c.i
o
¡¡¡
Alto+ 1 c-----;¡-..ac
/
/
1
1
:,. ;z
b•J.
ab +Alto
G.
Corrida
1
A
Factor
B e
~V 2 +
/ ,,;º
u, //
3 +
Bajo ..,,______ Bajo ~ 4 + +
rn a
5 +
6 + +
+ 7 + +
Bajo Alto
8 + + +
Factor A
a) Vista geométrica bl La matriz del diseno
Figura 64 El diseño factorial 23.

63 EL DISEÑO 2' 229
cuando B está en el nivel alto y C está en el nivel bajo es [ab-b ]In. El efecto de A cuando C está en el nivel
alto y B está en el nivel bajo es [ac-c]/n. Por último, el efecto deA cuando tanto E como C están en el ni
vel alto es [abc-bc]/n. Por lo tanto, el efecto promedio deA es sólo el promedio de estos cuatro efectos, o
1
A= -[a-(l)+ab-b+ac-c+abc-bc] (611)
4n
Esta ecuación también puede desarrollarse como un contraste entre las cuatro combinaciones de tra
tamientos de la cara derecha del cubo de la figura 6-5a (donde A está en el nivel alto) y las cuatro de la
cara izquierda (donde A está en el nivel bajo). Es decir, el efecto de A es sólo el promedio de las cuatro co
rridas dondeA está en el nivel alto (YA+) menos el promedio de las cuatro corridas dondeA está en el nivel
bajo (YA-), o
A"" YA· -yA_
a+ab+ac+abc (l)+b+c+bc
=
4n 4n
Esta ecuación puede reescribirse como
1
A:= -[a+ab+ac+abc-(1)-b-c-bc]
4n
que es idéntica a la ecuación 611.
.
J!lil 11" e
e
. .llli
11 •
A B e
a) Efectos principales
.
.
11
e
AB AC BC
bl Interacción de dos factores
cfL:A
• = corridas +
o m corridas
ABC
el Interacción de los tres factores
Figura 6·5 Representación geométrica de los contrastes que corresponden a

los efectos principales y las interacciones del diseno Z3 .
230 CAPÍTULO 6 DISEÑO FACTORIAL z•
De manera similar, el efecto de Bes la diferencia en Jos promedios entre las cuatro combinaciones de
tratamientos de la cara frontal del cubo y las cuatro de la cara posterior. Se obtiene así
B = Y)l·
- - Yii-
-
1
= -[b+ab+bc+abc-(1)-a-c-ae] (612)
4n
El efecto de Ces la diferencia en los promedios entre las cuatro combinaciones de tratamientos de la cara
superior del cubo y las cuatro de la cara inferior, es decir,
C= Ye• :Yc
1
= [c+ac+bc+abc-(1)-a-b-ab] (613)
4n
Los efectos de la interacción de dos factores pueden calcularse con facilidad. Una medida de la in
teracciónAB es la diferencia entre los efectos promedio deA con los dos niveles de B. Por convención, a la
mitad de esta diferencia se le llama la interacción AB. Utilizando símbolos,
B Efecto promedio deA

Alto(+) [(abc-bc)+(ab-b)]
2n
Bajo() {(ace)+ [a(1)]}
2n
Diferencia [abe-be+ ab -b -ac+ e -a+ (1 )]
2n
Puesto que la interacción AB es la mitad de esta diferencia,
AB= [abc-bc+ab-b-ac+e-a+(1)]
(614)
4n
La ecuación 614 puede escribirse de Ja siguiente manera:
AB= abe+ab+c+(l) bc+b+ac+a

4n 4n
En esta forma, resulta fácil ver que la interacciónAB es Ja diferencia en los promedios entre las corridas
de dos planos diagonales del cubo de la figura 6-5b. Utilizando un razonamiento lógico similar y con refe
rencia a la figura 6-Sb, las interacciones AC y BC son
1
AC= -[(1)-a+b-ab-c+ac-bc+ubc] (615)
4n
1
BC= -[(l)+a-b-ab-c-ac+bc+abc] (616)
4n
La interacciónABC se define como la diferencia promedio entre la interacciónAB para los dos dife
rentes niveles de C. Por lo tanto,
1
ABC = {[abc-bc]-[ac- c][abb]+[a(1)]}
4n
1
= -[abc-bc-ac+c-ab+b+a-(1)] (617)
4n
Como antes, la interacciónÁBC puede considerarse como la diferencia de dos promedios. Si se aíslan las
corridas de los dos promedios, éstas definen los vértices de los dos tetraedros que componen el cubo de la
figura 65c.
En las ecuaciones 611a617, las cantidades entre corchetes son contrastes de las combinaciones de
los tratamientos. Es posible desarrollar una tabla de signos positivos y negativos a partir de los contrastes,
la cual se muestra en la tabla 63. Los signos de los efectos principales se determinan asociando un signo
positivo con el nivel alto y un signo negativo con el nivel bajo. Una vez que se han establecido los signos de
los efectos principales, los signos de las columnas restantes pueden obtenerse multiplicando las columnas
precedentes apropiadas, renglón por renglón. Por ejemplo, los signos de la columnaAB son el producto
de los signos de la columna A y la columna B en cada renglón. El contraste de cualquier efecto puede ob
tenerse fácilmente con esta tabla.
La tabla 63 tiene varias propiedades interesantes: 1) Con excepción de la columna l, cada una de las
columnas tienen el mismo número de signos positivos y negativos. 2) La suma de los productos de los sig
nos de dos columnas cualesquiera es cero. 3) La columna I multiplicada por cualquiera de las columnas
deja la columna sin cambio. Es decir, I es un elemento identidad. 4)El producto de dos columnas cuales
quiera produce una columna de la tabla. Por ejemplo, A x B = AB, y
ABxB= AB2 =A
Se observa que los exponentes de los productos se forman utilizando la aritmética módulo 2. (Es decir, el
exponente sólo puede ser O o 1; si es mayor que 1, se reduce con múltiplos de 2 hasta que es O o l.) Todas
estas propiedades se derivan de la ortogonalidad de los contrastes usados para estimar los efectos.
Las sumas de cuadrados de los efectos se calculan con facilidad, ya que cada efecto tiene un contraste
correspondiente con un solo grado de libertad. En el diseño 23 con n réplicas, la suma de cuadrados de
cualquier efecto es
SS= (Contraste )2
(618)
&i
Tabla 63 Signos algebraicos para calcular los efectos del disefio Z3
tratamientos I A B AB e AC BC ABC
(1) + + + +
a + + + +
b + + + +
ab + + + +
e + + + +
ae + + + +
be + + + +
abe + + + + + + + +
232 CAPÍTULO 6 DISENO FACTORIAL z•
EJEMPLO 61 • · · · · · · · · · · · · · · · · · · · • • · · · · · · · · · • • · · · · · · • • • · · · · · · · · · • · · · · · · · · ·
Recuerde el ejemplo 53, donde se presentó un estudio del efecto del porcentaje de carbonatación, la pre
sión de operación y la velocidad de línea sobre la altura de llenado de una bebida carbonatada. Suponga
que sólo se usan dos niveles de carbonatación, de tal modo que el experimento es un diseño factorial 23
con dos réplicas. Los datos (es decir, las desviaciones de la altura de llenado de especificación) se mues
tran en la tabla 64, y en la figura 66 se presenta la representación geométrica del diseño.
Al utilizar los totales bajo las combinaciones de los tratamientos que se muestran en la tabla 64, los
efectos de los factores pueden estimarse de la siguiente manera:
1 .
A= [ a(1 )+ab- b+ac- c+_abc- be]
4n
1
= 8[1(4)+5(1)+3(1)+112]
1
= [24]= 100
8
1
B= [b+ab+bc+abc-(1)-a-c-ac]
4n
1
= 8(1 +5+2+11(..,4)1(1)3]
1
= 8[18]=2.25
1
C= -[c+ac+bc+abc-(1)-a-b-ab]
4n ·
1
= 8[1+3+2+11(4)1(1)5]
1
= 8[14]=1.75
1
AB = [ab-a-b+(l)+abc-bc-ac+c]
4n
1
= 8[51(1)+(4)+11 2 3+(1)]
1
= [6] = 0.75
8
Tabla 64 El experimento de la altura de llenado, ejemplo 61

Desviación de la
Factores codificados altura de llenado Niveles del factor
Corrida A B e Réplica 1 Réplica 2 Bajo (1) Alto ( +1)
1 1 1 1 -3 1 A (psi) 10 12
2 1 1 1 o 1 B (psi) 25 30
3 1 1 1 1 o e (b/min) 200 250
4 1 1 1 2 3
5 1 1 1 1 o
6 1 1 1 2 1
7 -1 1 1 1 1
8 1 1 1 6 5
bc=2 abe =11
e =1 GC=3
250 bpm + F---..11"----4"
1
1
Velocidad (C) 1
,, ,,
,)!:.-l. 7730psi
ab=5
200bpm
11).4 a•1 ~' Presión(B)
+ 25 psi
10% 12%
Carbonatación (Al
Figura 66 El diseño 23 para el experimento de la desviaciónde

la altura de llenado del ejemplo 61.
1
AC= [(1)-a+b-ab-c+ac-bc+abc]
4n
1
= 8[41 +(1)5(1)+32+11]
1
= 2[2)= 0.25
1
BC = [(1 )+a-b-ab-c- ac+bc+abc]
4n
1
= 8[4+1(1)5(1) 3+2+11]
1
= 8[4]= 0.50
y
1
ABC= [abc-bc-ac+c-ab+b+a-(1)]
4n
1
= 8[11 23+(1)5+(1)+1(4)]
1
= 8[4]= 0.50
Los efectos más grandes son para la carbonatación (A = 3.00), la presión (B = 2.25), la velocidad (C =
1.75)y la interacción carbonataciónpresión (AB = 0.75), si bien el efecto de la interacción no parece te
ner un impacto tan grande sobre la desviación de la altura de llenado como los efectos principales.
Las sumas de cuadrados se calculan con la ecuación 618 de la siguiente manera:
SS = (24)2 = 36.00
A 16
SS = (l8)2 = 20.25
B 16
SS = (l4)2 = 12.25
e 16
234 CAPÍTIJLO 6 DISENO FACTORIAL Zk
Tabla 65 Resumen de la estimación de los efectos del ejemplo 61

Estimación Sumas de Contribución
Factor del efecto cuadrados porcentual
A 3.00 36.00 46.1538
B 2.25 20.25 25.9615
e 1.75 12.25 15.7051
AB 0.75 2.25 2.88462
AC 0.25 0.25 0.320513
BC 0.50 1.00 1.28205
ABC 0.50 1.00 1.28205
Error puro 5.00 6.41026
Total 78.00
SS AB = (6) = 2.25
2
16
(2)2
SS AC = 16 == 0.25
( 4)2
SSBC = 16=1.00
SS = (4)2=1.00
ABC 16
La suma de cuadrados total es SST = 78.00, y por sustracción, SSE = 5.00. En la tabla 65 se resumen las
estimaciones de los efectos y las sumas de cuadrados. La columna etiquetada "contribución porcentual"
mide la contribución porcentual de cada uno de los términos del modelo a la suma de cuadrados total. La
contribución porcentual es con frecuencia una guía aproximada pero efectiva de la importancia relativa
de cada término del modelo. Observe que los efectos principales dominan en realidad este proceso, expli
cando más de 87% de la variabilidad total, mientras que la interacción AB explica menos de 3%.
El análisis de varianza de la tabla 66 puede usarse para confirmar la magnitud de estos efectos. Por la
tabla 66 se observa que los efectos principales son altamente significativos (todos tienen valores P muy
Tabla 66 Análisis de varianza de los datos de la altura de llenado

Porcentaje de carbonatación (A) 36.00 1 36.00 57.60 <0.0001
Presión (B) 20.25 1 20.25 32.40 0.0005
Velocidad de línea (C) 12.25 1 12.25 19.60 0.0022
AB 2.25 1 2.25 3.60 0.0943
AC 0.25 1 0.25 0.40 0.5447
BC 1.00 1 1.00 1.60 0.2415
ABC 1.00 1 1.00 1.60 0.2415
Error 5.00 8 0.625
Total 78.00 15
63 EL DISEÑO Z3 235
pequeños). La interacciónAB es significativa con un nivel aproximado de 10%; por lo tanto, existe una li
gera interacción entre la carbonatación Y. la presión.
Quizá el lector quiera referirse al ejemplo 53 para la interpretación práctica de este experimento.
Los responsables del proceso decidieron correrlo con presión baja y velocidad de línea alta, y reducir la
variabilidad de la carbonatación controlando con mayor precisión la temperatura. Se consiguió así una
reducción sustancial en la desviación de la altura de llenado del valor objetivo .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . .
El modelo de regresión y la superficie de respuesta
El modelo de regresión para predecir la desviación de la altura de llenado es
y= Po +P1x1 +P2x2 +'/J3x3 +fJ12X1X2

= 1.00+ 2 ( 3.00) X1
(2.25)
+ 2 X2 + (l.l 75) X3 + (º·Z75) X1X2,
donde las variables codificadas x1, x2 y x3 representan a A, By C, respectivamente. El término X¡X2 es la in
teracciónAB. Los residuales pueden obtenerse como la diferencia entre las desviaciones de la altura de
llenado observada y la predicha. El análisis de estos residuales se deja como ejercicio para el lector.
En la figura 67 se muestra la superficie de respuesta y la gráfica de contorno para la desviación de la
altura de llenado obtenida con el modelo de regresión, suponiendo que la velocidad de línea está en el ni
vel alto (x3 = 1 ). Observe que como el modelo contiene la interacción, las líneas de contorno de la desvia
ción de las alturas de llenado constantes son curvas (o la superficie de respuesta es un plano "torcido").
Es deseable operar este proceso de llenado de tal modo que la desviación del llenado esté tan cerca de
cero como sea posible. La gráfica de contorno indica que si la velocidad de línea está en el nivel alto, en
tonces hay varias combinaciones de los niveles de la carbonatación y la presión que satisfarán este objeti
vo. Sin embargo, será necesario ejercer un control preciso de estas dos variables.
Solución por computadora

Hay muchos paquetes de software de estadística que establecerán y analizarán diseños factoriales con dos
niveles. La salida de uno de estos programas de computadora, Design-Expert, se muestra en la tabla 67.
En la parte superior de la tabla se presenta el análisis de varianza del modelo completo. El formato de
esta presentación es un tanto diferente de los resultados dados en la tabla 66. Observe que el primer ren
glón del análisis de varianza es un resumen global del modelo completo (todos los efectos principales y las
interacciones), y la suma de cuadrados del modelo es
SSModeJo =SS A +SS8 +SS e +SS AB +SS AC +SSBC +SS ABC
= 710
Por lo tanto, el estadístico
Fo = = 10.43 = 16.69
MSModelo
MSE 0.63
está probando las hipótesis
Ho:/31 = f32 = /33 = f312 = f3u = fJz.1 = f3m =O
H1 : al menos una f3 '#. O
236 CAPÍTUW 6 DISEÑOFACTORIALz•
o) La superficie de respuesta
29.17
28.33
e
o
~ 27.50
e,
26.67
25.83
10.33 10.67 11.00 11.33 11.67 12.00

Carbonatación
b) La gráfica de contorno
Figura 67 Superficie de respuesta y gráfica de contorno de la desvia

ción de la altura de llenado, con la velocidad en el nivel alto (250 bpm),
ejemplo 61.
Tabla 6· 7 Salida de Design-Expert para el ejemplo 61
Response: Fill Deviltion in Hellght
ANOVA for Selectecl Factorial Model
Analysls of varlanc:e table (Partlal 8Um of equares)
Sumof Mean F
So urce Squares DF Square Value Prob:io F
A 36.00 1 36.00 57.80 <0.0001
8 20.25 1 20.25 32.40 0.0005
e 12.25 1 12.25 19.60 0.0022
AB 2.25 1 2.25 3.60 0.0943
AC 0.25 1 0.25 0.40 0.5447
BC 1.00 1 1.00 1.60 0.2416
ABC 1.00 1 1.00 1.60 0.2416
Residual 5.00 8 0.63
Lackof Fit 0.000 o
Pure Error 5.00 8 0.63
Cor Total 78.00 15
PRE SS 20.00 Adeq Precision 13.416
Coafflclent Stanct.rd 95%CI 95%CI
Factor Estimate DF Enor Low Hlgh VIF
lntercept
ACarbonation
1.00
1.50 ,
1 0.20
0.20
0.54
1.04
1.46
1.96 1.00
BPressure 1.13 1 0.20 0.67 1.58 1.00
CSpeed 0.88 1 0.20 0.42 1.33 1.00
A8 0.38 1 0.20 0.081 0.83 1.00
AC 0.13 1 0.20 0.33 0.58 1.00
BC 0.26 1 0.20 0.21 0.71 1.00
A8C 0.26 1 0.20 0.21 0.71 1.00
Final Equatlon in Terms of Coded Factors:
Fill Deviation "'
+1.00
+1.50 *A
+1.13 *8
+0.88 *C
+0.38 *A *8
+0.13 *A *C
+0.25 *8 *C
+0.25 *A *8 *C
Final Equation In Terms of Actual Factors:

Flll Devlation =
225.50000
+21.00000 *Carbonation
+ 7.80000 *Pressure
+ 1.08000 *$peed
0.75000 *Call"bonation *Pressure
o. 10500 *Call"bonation *Speed
0.040000 *Pressure *Speed
+4.00000E00: *Carbonation *Pressure *Speed
Reduced Modal:
Response: Flll Deviation in HGlight
ANOVA for Selected Factorial Model
Analysis of variance table [Partlal sum of ...,...)
237
Tabla 67 (continuación)
Sumof Mean F
Model 70.75 4 17.69 26.84 <0.0001 significant
A 36.00 1 36.00 54.62 <0.0001
8 20.25 1 20.25 30.72 0.0002
e 12.25 1 12.25 18.59 0.0012
AB 2.25 1 2.25 3.41 0.0917
Residual 7.25 11 0.66
Lack of Fit 2.25 3 0.75 1.20 0.3700 not significant
Pure Error 5.00 8 0.63
Cor Total 78.00 15
Coefficlent Standard 95o/o CI 95o/o CI
Factor Estimate DF Error Low Hlgh VIF
lntercept 1.00 1 0.20 0.55 1.45
ACarbonation 1.50 1 0.20 1.05 1.95 1.00
8Pressure 1.13 1 0.20 0.68 1.57. 1.00
CSpeed 0.88 1 0.20 0.43 1.32 1.00
AB 0.38 1 0.20 0.072 0.82 1.00
Final Equation In Terms of Coded Factors:
Fill Oeviation =
+1.00
+1.50 *A
+1.13 *B
+0.88 *C
+0.38 *A *B
Fill Deviatíon =
+9.62500
2.62500 *Carbonation
1.20000 *Pressure
+0.035000 .. Speed
+0.15000 *Carbonation *Pressure
Standard Actual Predicted Student Cook's Outlier
Order Value Value Residual Leverage Residual Distance t
1 3.00 2.13 0.88 0.313 1.300 0.154 1.347
2 1.00 2.13 1.13 0.313 1.671 0.254 1.845
3 0.000 0.12 0.12 0.313 0.186 0.003 0.177
4 1.00 0.12 0.88 0.313 1.300 0.154 1.347
5 1.00 0.63 0.38 0.313 0.557 0.028 0.539
6 0.000 0.63 0.63 0.313 0.928 0.078 0.922
7 2.00 3.13 1.13 0.313 1.671 0.254 1.845
8 3.00 3.13 0.13 0.313 0.186 0.003 0.177
9 1.00 0.37 0.63 0.313 0.928 0.078 0.922
10 0.000 0.37 0.37 0.313 0.557 0.028 0.539
11 2.00 1.88 0.13 0.313 0.186 0.003 0.177
12 1.00 1.88 0.88 0.313 1.300 0.154 1.347
13 1.00 1.13 0.13 . 0.313 0.186 0.003 0.177
14 1.00 1.13 0.13 0.313 0.186 0.003 0 .. 177
15 6.00 4.88 1.13 0.313 1.671 0.254 1.845
16 5.00 4.88 0.13 0.313 0.186 0.003 0.177
238
Puesto que F0 es grande, se concluiría que al menos una de las variables tiene un efecto diferente de cero.
Entonces se prueba la significación de cada efecto factorial individual utilizando el estadístico F. Estos re
sultados concuerdan con la tabla 66.
Abajo del análisis de varianza del modelo completo se presentan varios estadísticos R2• La R2 ordina
ria es
R2 = SSModelo = 73.00 = 0.9359
SSTotal 78.00
y mide la proporción de la variabilidad total explicada por el modelo. Un problema potencial con este es
tadístico es que siempre se incrementa cuando se agregan factores al modelo, incluso cuando estos facto
res no son significativos. El estadístico R2 ajustada, definido como
2 SSE / dfE 5.00/ 8
RAjuotada = 1 SS Total /
d'f
Total
= 1 78.00 /1
5 0.8798
es un estadístico que está ajustado para el "tamaño" del modelo; es decir, para el número de factores. La
R2 ajustada puede decrecer en realidad si se agregan términos no significativos al modelo. El estadístico
PRESS es una medida de qué tan bien predecirá datos nuevos el modelo (PRESS es en realidad el acróni
mo de Prediction E"º' Sum of Squares +suma de cuadrados del error de predicción, y se calcula a partir
de los errores de predicción obtenidos al predecir el punto iésimo de los datos con un modelo que incluye
todas las observaciones, excepto la iésima). Un modelo con un valor pequeño de PRESS indica que es po
sible que el modelo sea un buen predictor. El estadístico "R2 de predicción" se calcula como
2 PRESS 20.00
RPredicción = 1 SSToUJJ = 1 78. 00 = O. 7436
Esto indica que se esperaría que el modelo completo explique cerca de 74% de la variabilidad de los datos
nuevos.
La siguiente sección de la salida presenta el coeficiente de regresión de cada término del modelo y el
error estándar (se, standard error) de cada coeficiente, definido como
se(P)= ~V(P) = ~MSE = J0.625 = o.20

n2k 2(8)
Los intervalos de confianza de 95% para cada coeficiente de regresión se calculan a partir de
P- t o.025,N-pse(P) :S /3 :S P + t 0_025 ,N-pse(P)
donde los grados de libertad de tes el número de grados de libertad del error; es decir, N es el número to
tal de corridas en el experimento (16), yp es el número de parámetros del modelo (8). También se presen
ta el modelo completo en términos de las variables codificadas y de las variables naturales.
En la última sección de la tabla 6 7 se ilustra la salida después de eliminar los términos de las interac
ciones no significativas. Este modelo reducido contiene ahora sólo los efectos principalesA, By C, y la
interacciónAB. La suma de cuadrados de los residuales o del error se compone ahora de un componen
te del error puro ("Pure Error") que surge de las réplicas de los ocho vértices del cubo, y un componen
te de falta de ajuste ("Lack of Fit"), compuesto por las sumas de cuadrados de las interacciones que se
eliminaron del modelo (BC, AC y ABC). De nueva cuenta, la representación del modelo de regresión
de los resultados experimentales se presenta en términos de las variables codificadas y las variables na
turales. La proporción de la variabilidad total de la desviación de la altura del llenado que se explica por
este modelo es
R2 = SSModclo = 70.75 = 0.9071

SSTolal 78.00
que es menor que laR2 del modelo completo. Observe, sin embargo, que laR2 ajustada del modelo reduci
do apenas ha cambiado ligeramente respecto de la R2 ajustada del modelo completo, y PRESS del mode
lo reducido es considerablemente menor, lo cual produce un valor más grande de R;,edic;:ión del modelo
reducido. Evidentemente, la eliminación de los términos no significativos del modelo completo ha produ
cido un modelo final que posiblemente funcionará con mayor eficiencia como predictor de datos nuevos.
Observe que los intervalos de confianza para los coeficientes de regresión del modelo reducido son lige
ramente más cortos que los intervalos de confianza correspondientes en el modelo completo.
En la última sección de la salida se presentan los residuales del modelo reducido. Design-Expert tam
bién construirá todas las gráficas de los residuales que se estudiaron anteriormente.
Otros métodos para evaluar la significación de los efectos

El análisis de varianza es una manera formal de determinar cuáles son los efectos de los factores que son
diferentes de cero. Existen varios métodos más que son útiles. A continuación se indica cómo calcular el
error estándar de los efectos y cómo usar los errores estándar para construir intervalos de confianza para
los efectos. Otro método, que se ilustrará en la sección 65, utiliza gráficas de probabilidad normal para
valorar la importancia de los efectos. ·
Es sencillo encontrar el error estándar de un efecto. Si se supone que hay n réplicas en cada una de las
2k corridas del diseño, y si Yn· Yi2• ... , Yin son las observaciones de la corrida iésima, entonces
i = 1,2, ... , 2k
es una estimación de la varianza de la corrida iésima. Las estimaciones de la varianza del diseño 2k pue
den combinarse para dar una estimación de la varianza global:
(619)
Ésta es también la estimación de la varianza dada por el cuadrado medio del error en el análisis de varian
za. La varianza de la estimación de cada efecto es
V (Efecto)= V (C:~~~te)
1
= (nzk1)2 V(Contraste)
Cada contraste es una combinación lineal de los 2" totales de los tratamientos, y cada total consta den ob
servaciones. Por lo tanto,
V(Contraste) = n2k o?
y la varianza de un efecto es
1 k 2
V(Efecto) = (n2k-1 )2 n2 a
1
=--az
n2k-2
2a
= .Jn2k
El error estándar estimado se encontraría sacando la raíz cuadrada de esta última expresión y sustituyen
do a2 con su estimación S2: .
2S
se(Efecto) = .J " (620)
n2
Observe que el error estándar de un efecto es el doble del error estándar de un coeficiente de regre
sión estimado en el modelo de regresión del diseño 2k (ver la salida de computadora de Design-Expen del
ejemplo 61).
Los intervalos de confianza de 100(1 a) por ciento para los efectos se calculan a partir de Efecto ±
tan,N-ySe(Efecto), donde los grados de libertad de t son sólo los grados de libertad de los residuales o del
error (N - p = número total de corridas número de parámetros del modelo).
Para ilustrar este método, considere el experimento de la desviación de la altura de llenado del ejem
plo 61. El cuadrado medio del error esMSE = 0.625. Por lo tanto, el error estándar de cada efecto es (uti
lizando S2 = MSE)
2S
se(Efecto) = vn2k
¡;y
2./0.625
=~
~2(.23)
=0.40
Entonces, t0.025, 8 = 2.31 y t0.025, rtYe(Efecto)= 2.31(0.40) = 0.92, de donde los intervalos de confianza de
95% aproximados para los efectos de los factores son
A: 3.00±0.92
B: 225±0.92
C: 1.75±0.92
AB: 0.75±0.92
AC: 0.25±0.92
BC: 0.50±0.92
ABC: 0.50±0.92
Este análisis indica que A, By C son factores importantes, porque son las únicas estimaciones de los efec
tos de los factores para las que los intervalos de confianza de 95% aproximados no incluyen al cero.
Efectos de dispersión
El ingeniero de proceso que trabajó en el caso del llenado también se interesó en los efectos de disper
sión; es decir, Zalguno de los factores afecta la variabilidad de la desviación de la altura de llenado de una
242 CAPÍTULO 6 DISEÑO FACTORIAL 2•
250 bpm +
1
1
1
Velocidad (C) 1
R·_!¿..-- R· 1
//30psl
200bpmR--2 "' "' " R'" 1 ~8' Presión (B)

+ 25 psi
10% 12%
Carbonatación !A)
Figura 68 Rangos de la desviación de la altura de llenado del
ejemplo 61.
corrida a otra? Una manera de responder esta pregunta es examinando el rango de las desviaciones de la
altura de llenado para cada una de las ocho corridas del diseño 23• Estos rangos se grafican en el cubo de la
figura 68. Observe que los rangos son aproximadamente iguales para las ocho corridas del diseño. Por
consiguiente, no hay evidencia sólida que indique que alguna de las variables del proceso afecte directa
mente la variabilidad de la desviación de la altura de llenado en el proceso.
64 EL DISEÑO GENERAL 2k
Los métodos de análisis que se han presentado hasta este punto pueden generalizarse para el caso de un
diseño factorial 2\ es decir, un diseño con k factores 'lue tienen dos niveles cada uno. El modelo estadísti
co para un diseño 2k incluiría k efectos principales, (~)interacciones de dos factores, (~)interacciones de
tres factores, ... , y una interacción de k factores. Es decir, para un diseño 2k el modelo completo conten
dría zk - 1 efectos. También se usa aquí la notación introducida anteriormente para las combinaciones de
los tratamientos. Por ejemplo, en un diseño 25, abd denota la combinación de tratamientos con los facto
res A, By D en el nivel alto y los factores C y E en el nivel bajo. Las combinaciones de los tratamientos
pueden escribirse en orden estándar introduciendo los factores uno a la vez y combinando sucesivamente
cada nuevo factor con los que lo preceden. Por ejemplo, el orden estándar de un diseño 24 es (1 ), a, b, ab,
e, ae, be, abe, d, ad, bd, abd, cd, acd, bcd y abed.
El enfoque general para el análisis estadístico del diseño zk se resume en la tabla 68. Como se señaló
anteriormente, suele emplearse un paquete de software de computadora en este proceso de análisis.
A estas alturas, la secuencia de pasos de la tabla 68 debe resultar familiar. El primer paso es estimar
los efectos de los factores y examinar sus signos y magnitudes. De este modo el experimentador obtiene in
Tabla 6·8 Procedimiento de análisis

para un disefio 2k
l. Estimar los efectos de los factores
2. Formar el modelo inicial
3. Realizar las pruebas estadísticas
4. Refinar el modelo
5. Analizar los residuales
6. Interpretar los resultados
64 EL DISEÑO GENERAL z• 243
formación preliminar respecto de los factores y las interacciones que pueden ser importantes, y en qué di
recciones deberán ajustarse estos factores para mejorar la respuesta. Para formar el modelo inicial del
experimento, por lo general se elige el modelo completo, es decir, todos los efectos principales y las interac
ciones, siempre que se haya hecho una réplica de al menos uno de los puntos del diseño (en la sección si
guiente se revisa una modificación de este paso). Después, en el paso 3 se usa el análisis de varianza para
probar formalmente la significación de los efectos principales y las interacciones. En la tabla 69 se presenta
la forma general de un análisis de varianza para un diseño factorial 2k con n réplicas. El paso 4, refinar el
modelo, suele consistir en la eliminación de las variables no significativas del modelo completo. El paso 5 es
el análisis residual usual para verificar la adecuación del modelo y los supuestos. En ocasiones ocurrirá una
refinación del modelo después del análisis residual, si se encuentra que el modelo es inadecuado o que hay
violaciones serias de los supuestos. El último paso consiste generalmente en el análisis gráfico: gráficas de
los efectos principales o las interacciones, o superficies de respuesta y gráficas de contorno.
Aun cuando los cálculos descritos se realizan por lo general con una computadora, en ocasiones es ne
cesario calcular manualmente la estimación de un efecto o Ja suma de cuadrados de un efecto. Para estimar
un efecto o calcular la suma de cuadrados de un efecto, primero debe determinarse el contraste asociado
con ese efecto. Esto puede hacerse siempre utilizando una tabla de signos positivos y negativos, como la ta
bla 62 o 63. Sin embargo, para valores grandes de k esto resulta laborioso, y puede usarse un método alter
nativo. En general, el contraste del efecto AB···K se determina expandiendo el miembro derecho de
Contraste AB···K =(a± l)(b ± 1)· -t]: ±1) (621)
Tabla 6·9 Análisis de varianza de un diseño 2"

variación cuadrados libertad
k efectos principales
A SSA 1
B SSB 1
K SSK 1
(~ ) interaccionesde dos factores
AB SSAB 1
AC SSAC 1
JK SSJK 1
(~ ) interaccionesde tres factores
ABC SS.A.Be 1
ABD SSABD 1
IJK ssux 1
e ) = 1 interacción de k factores
ABC ... K SSABC·-·K 1
Error SSE 2k(n1)
Total SST n2k 1
··
~~·¡_'',,
Para expandir la ecuación 621 se usa el álgebra ordinaria reemplazando "1" con (1) en la expresión final.
El signo de cada grupo de paréntesis es negativo si el factor está incluido en el efecto y es positivo si el fac
tor no está incluido.
Para ilustrar el uso de la ecuación 621, considere un diseño factorial 23• El contraste deAB sería
Contraste AB = (al)(b l)(c+ 1)
= abc+ab+c+(1)-ac-bc-a-b
Como un ejemplo más, en un diseño 25, el contraste de ABCD sería
Contraste Asct» =(a- l)(b l)(c l)(d l)(e+ 1)
= abcde+ cde+ bde+ ade + bce
+ace+abe+e+abcd +cd +bd
+ad+bc+ac+ab+(l)-a-b-c
+abc+d=abd=acd=bcd=ae
- be- ce- abce= de- abde= acde- bcde
Una vez que se han calculado los contrastes de los efectos, pueden estimarse los efectos y calcular las
sumas de cuadrados de acuerdo con
AB···K= ~(Contraste
n2k AB .. ·K
) (622)
y
1 2
SS AB···K = n2k (Contraste AB ·K) (623)
respectivamente, donde n denota el número de réplicas. Se cuenta también con un algoritmo tabular de
bido al Dr. Frank Yates que en ocasiones puede ser útil para el cálculo manual de las estimaciones de los
efectos y las sumas de cuadrados. Referirse al material suplementario del texto de este capítulo.
6~5 UNA SOLA RÉPLICA DEL DISEÑO 2k
Incluso para un número moderado de factores, el número total de combinaciones de tratamientos en un

diseño factorial 2k es grande. Por ejemplo, un diseño 25 tiene 32 combinaciones de tratamientos, un dise
ño 26 tiene 64 combinaciones de tratamientos, etc. Debido a que por lo general los recursos son limitados,
el número de réplicas que el experimentador puede emplear quizás esté restringido. Con frecuencia, los
recursos disponibles permiten hacer únicamente una sola réplica del diseño, a menos que el experimen
tador esté dispuesto a omitir algunos de los factores originales.
Un riesgo obvio cuando se realiza un experimento que tiene una sola corrida para cada combinación
de prueba es que el modelo puede ajustarse al ruido. Es decir, si la respuesta y es sumamente variable,
pueden resultar conclusiones engañosas del experimento. La situación se ilustra en la figura 6-9a. En esta
figura, la línea recta representa el verdadero efecto del factor. Sin embargo, debido a la variabilidad alea
toria presente en la variable de respuesta (representada por la franja sombreada), el experimentador ob
tiene en realidad las dos respuestas medidas representadas por los puntos negros. Por consiguiente, el
efecto del factor estimado está cerca de cero y el experimentador ha llegado a una conclusión errónea res
pecto de este factor. Ahora bien, si hay menos variabilidad en la respuesta, la posibilidad de una conclu
sión errónea será más reducida. Otra forma de asegurarse de que se obtienen estimaciones confiables de
los efectos es incrementando la distancia entre los niveles bajo ()y alto (+)del factor, como se ilustra en
65 UNA SOIA RÉPLICA DEL DISEÑO 21 245
Verdadero
efecto
del factor
Efecto estimado
del factor
+
Factor, ;e
al Distancia pequel\e entre los niveles del factor
Verdadero
efecto
del factor
Efecto estimlldo
del factor
+
Factor,:11;
b) Separación agresiva de los niveles del factor
Figura 6·9 El impacto de la elección de los niveles del factor en un diseño

no replicado.
la figura 6-9b. Observe que en esta figura la distancia incrementada entre los niveles bajo y alto del factor
resulta en una estimación razonable del verdadero efecto del factor.
El uso de la estrategia de una sola réplica es común en los experimentos de exploración cuando hay
un número relativamente grandle de factores bajo consideración. Debido a que en estos casos nunca pue
de tenerse la certeza absoluta de que el error experimental es pequeño, una buena práctica en este tipo de
experimentos es separar los niveles de los factores de manera agresiva. Quizás el lector encuentre útil re
leer las pautas generales para elegir los niveles de los factores del capítulo 1.
Una sola réplica de un diseño 2k se denomina en ocasiones diseño factorial no replicado. Con una
sola réplica, no se cuenta con ninguna estimación interna del error (o "error puro"). Una forma de abor
dar este análisis de un diseño factorial no replicado consiste en suponer que algunas interacciones de or
den superior son insignificantes y combinar sus cuadrados medios para estimar el error. Esto es una
apelación al principio de efectos esparcidos; es decir, la mayoría de los sistemas están dominados por al
gunos de los efectos principales y las interacciones de orden inferior, y la mayor parte de las interacciones
de orden superior son insignificantes.
Cuando se analizan datos de diseños factoriales no replicados, ocasionalmente ocurren interacciones

de orden superior reales. El uso de un cuadrado medio del error que se obtiene agrupando las interaccio
nes de orden superior no es apropiado en estos casos. Un método de análisis atribuido a Daniel [35a] pro
porciona una forma simple de resolver este problema. Daniel sugiere examinar una gráfica de
probabilidad normal de las estimaciones de los efectos. Los efectos que son insignificantes siguen una
distribución normal, con media cero y varianza a2, y tenderán a localizarse sobre una línea recta en esta
gráfica, mientras que los efectos significativos tendrán medias diferentes de cero y no se localizarán sobre
la línea recta. Por lo tanto, el modelo preliminar se especificará de tal modo que contenga aquellos efec
tos que aparentemente son diferentes de cero, con base en la gráfica de probabilidad normal. Los efectos
aparentemente insignificantes se combinan como una estimación del error.
E)"EMPLO 6-2 · · · · · · · · · · · · · · · · · · · · · · • · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Una sola réplica del diseño 24
Un producto químico se fabrica en un envase presurizado. Se lleva a cabo un experimento factorial en la
planta piloto para estudiar los factores que se piensa influyen en el índice de filtración de este producto.
Los cuatro factores son la temperatura (A), la presión (B), la concentración del formaldehído (C) y la ve
locidad de agitación (D). Cada factor está presente con dos niveles. La matriz del diseño y los datos de la
respuesta obtenidos de una sola réplica del experimento 24 se muestran en la tabla 610 y en la figura 610.
Las 16 corridas se hacen de manera aleatoria. El ingeniero del proceso está interesado en maximizar el ín
dice de filtración. Las condiciones actuales del proceso producen índices de filtración de alrededor de 75
gal/h. Asimismo, en el proceso actual la concentración de formaldehído, factor C, se usa en el nivel alto.
Al ingeniero le gustaría reducir la concentración de formaldehído lo más posible, pero no ha podido ha
cerlo porque siempre produce índices de filtración más bajos.
El análisis de estos datos se iniciará construyendo una gráfica de probabilidad normal de las estima
ciones de los efectos. La formación de signos positivos y negativos para las constantes de los contrastes
Tabla610 Experimento del índice de filtración en la planta piloto

Número Factor Etiqueta de Índice de
de corrida A B e D la corrida filtración (gal/h)
1 (1) 45
2 + a 71
3 + b 48
.4 + + ab 65
5.,: + e 68
.6' + + ac 60
r· + + be 80
8 + + + abe 65
• ..9 ! + d 43
10 + + ad 100
u + + bd 45
12 + + + abd 104
. 13 .r
'·
+ + cd 75
- 14 + + + acd 86
15 + + + bcd 70
16 + + + + abcd 96
65 UNA SOLA RÉPLICA DEL DISEÑO zt 24 7
D
+
cfL A
Figura 610 Datos del experimento del índice de filtración en la
planta piloto para el ejemplo 62.
del diseño 24 se muestra en la tabla 611. A partir de estos contrastes pueden estimarse 15 efectos factoria
les, y las sumas de cuadrados se presentan en la tabla 612.
En la figura 611 se muestra la gráfica de probabilidad normal de estos efectos. Tudos los efectos que
caen sobre la recta son insignificantes, mientras que los efectos grandes están apartados de ella. Los efec
tos importantes que surgen de este análisis son los efectos principales de A, C y D y las interacciones
ACyAD.
Los efectos principales de A, C y D se grafican en la figura 612.a. Los tres efectos son positivos, y si
sólo se consideraran estos efectos principales, los tres factores se correrían en el nivel alto a fin de maxi
. mizar el índice de filtración. Sin embargo, siempre es necesario examinar cualquier interacción que sea
importante. Recuerde que los efectos principales no tienen mucho significado cuando están presentes en
interacciones significativas.
Las interaccionesAC y AD se grafican en la figura 612b. Estas interacciones son la clave para resol
ver el problema. Observe, por la interacciónAC, que el efecto de la temperatura es muy pequeño cuando
la concentración está en el nivel alto y muy grande cuando la concentración está en el nivel bajo, obte
niéndose los mejores resultados con la concentración baja y la temperatura alta. La interacciónAD indica
que la velocidad de agitaciónD tiene un efecto reducido con una temperatura baja, pero un efecto positi
vo grande con la temperatura alta. Por lo tanto, los mejores índices de filtración parecerían obtenerse
cuando A y D están en el nivel alto y C está en el nivel bajo. Esto permitiría la reducción de la concentra
ción de formaldehído a un nivel más bajo, otro de los objetivos del experimentador .
• • • • • • • • • • • • • • • • • • • • • o ••••••••••• ~ •••••••••••••••••••••••••••••••••••••••
Proyección de un diseño
Es posible hacer otra interpretación de los efectos de la figura 611. Pue~tóqµe B (presión) no es signifi
cativa y todas las interacciones en las que interviene B son insignificantes.B puede descartarse del experi
mento, de tal modo que el diseño se convierte en un factorial 23 en A, C yD con dos réplicas. Esto es fácil
de ver examinando únicamente las columnaszí, C y Den la matriz del diseñoque se muestra en la tabla
610 y observando que esas columnas forman dos réplicas de un diseño 23• En la tabla 613 se resume el
análisis de varianza de los datos utilizando este sppµesto de simplificación, Las conclusiones que se saca
rían de este análisis se mantienen en esencia sin cambios respecto de las del ejemplo 62. Observe que al
hacer la proyección de la réplica única del diseño 24 en un diseño 23 con dos replicas, se tiene ahora tanto
una estimación de la interap<;,ópACI? como UJ,l.a estimación del error basada en lo que en ocasiones se de
nomina réplica oculta. ' c.: ·: .; .' ,:; :: ' ,.. : ·· -.
~+11+1++1 1++1+11+
e
Q:)
1l++++I1++1 1 1 I++
e
"<
1+1++1+1+1+1 1+1+
8++++1 11111 1 1++++
~ 1++11++ + 1 1 + + 1 1 +
~++11++111.1++11++
~+1+1+1+1 1+1+1+1+
~ 1111111 I++++++++
~ 1++1+11+1++1+11+
~++I 11 l++++I 1 1 I++
...
N
s~+1+11+1++1+1 1+1+
el
.:a
~"'~ 111 l++++I 1 1 1++++
4J
~
tl
e
8~+11++11++11++1 i+
-ª~
"'
~Q:¡ 11++11++1 1++11++
¡¡¡
~ ~ 1+1+1+1+1+1+1+1+
248
65 UNA SOLA RÉPLICA DEL DISEÑO 21 249
Tabla612 Estimaciones de los efectos de los factores y sumas de
cuadrados del diseño factorial 24 del ejemplo 62
Término del Estimación Suma de Contribución
modelo del efecto cuadrados porcentual
A 21.625 1870.56 32.6397
B 3.125 39.0625 0.681608
c 9.875 390.062 6.80626
D 14.625 855.563 14.9288
AB 0.125 0.0625 0.00109057
AC 18.125 1314.06 22.9293
AD 16.625 1105.56 19.2911
BC 2.375 22.5625 0.393696
BD 0.375 0.5625 0.00981515
CD 1.125 5.0625 0.0883363
ABC 1.875 14.0625 0.245379
ABD 4.125 68.0625 1.18763
ACD 1.625 10.5625 0.184307
BCD 2.625 27.5625 0.480942
ABCD 1.375 7.5625 0.131959
99
•
A
o•
95
AD
• •
90
80
e
~o
e: 70
~
:e 50
.!
K 30
{:
20
#-
10
•
5 AC
18.12 8.19 1.75 11.69 21.62

Efecto
Figura 6·11 Gráfica de probabilidadnormal de los efectos para el diseño factorial

24 del ejemplo 62.
250 CAPÍTULO 6 DISEÑO FACTORIAL Zl
z
'i%" 90 '90 90
E
o
/
'fEil 80 80
/
80
/
o
is.
c
<:: 70 70 70
·¡¡
~
¡;:; 60 60 60
,,,"'
'O
"'
o 50
+
50
+
60 +
..s A e D
al Gráficas de los efectos principales
100
§' Interacción AC
E"' 90
o
'O
e--
"'
E 80
eo,
<::
:Q 70 70
"
~
,,,"' 60 60
"'o
'O 50 50
_.s:
40 +
A A
b 1 Gráficas de las interacciones
Figura 612 Gráficas de los efectos principales y las interacciones para el ejem
plo 62.
Tabla 613 Análisis de varianza del experimento del índice filtración en la planta piloto en A, C y D
A 1870.56 1 1870.56 83.36 <0.0001
e 390.06 1 390.06 17.38 <0.0001
D 855.56 1 855.56 38.13 <0.0001
AC 1314.06 1 1314.06 58.56 <0.0001
AD 1105.56 1 1105.56 49.27 <0.0001
CD 5.06 1 5.06 <1
ACD 10.56 1 10.56 <1
Error 179.52 8 22.44
Total 5730.94 15
65 UNA SOLA RÉPLICA DEL DISEÑO zt 251
El concepto de proyectar un diseño factorial no replicado en un diseño factorial con réplicas en me
nos factores es muy útil. En general, si se tiene una sola réplica del diseño 2\ y si h (h < k) factores son in
significantes y pueden descartarse, entonces los datos originales corresponden a un diseño factorial
completo con dos niveles en los k - h factores restantes con 2h réplicas.
Verificación de diagnóstico
Deberán aplicarse las verificaciones de diagnóstico usuales a los residuales de un diseño 2k. El análisis
realizado indica que los únicos efectos significativos sonA = 21.625, C = 9.815,D = 14.625,AC = 18.125
y AD = 16.625. Si esto es correcto, los índices de filtración estimados están dados por
J
"'=7 O 06 + (
•
21.625) X+
2 l
(9.875)
--
2 X+
3
(14.625)
--
2 X
4
-
(18.125)
--
2 XX
13
16.625)
+ (2 X¡X4
donde 70.06 es la respuesta promedio y las variables codificadasx¡,x3,x4 asumen valores entre1 y+ l. El
índice de filtración predicho para la corrida (1) es
y= 70.06+(21.~25) (1)+(9.~75)(1)+(14.~25}(1)
(18.~25) (1)(1)+(16.~25) (1)(1)
= 46.22
Puesto que el valor observado es 45, el residual es e =y- y= 45 46.22 = 1.22. A continuación se pre
sentan los valores de y, y y e = y - y para las 16 observaciones.
y j e =y-j
(1) 45 46.22 1.22
a 71 69.39 1.61
b 48 46.22 1.78
ab 65 69.39 4.39
e 68 74.23 6.23
ae 60 61.14 1.14
be 80 74.23 5.77
abe 65 61.14 3.86
d 43 44.22 1.22
ad 100 100.65 0.65
bd 45 44.22 0.78
abd 104 100.65 3.35
ed 75 72.23 2.77
aed 86 92.40 6.40
bed 70 72.23 2.23
abcd 96 92.40 3.60
En la figura 613 se muestra la gráfica de probabilidad normal de los residuales. Los puntos de esta gráfica
se localizan razonablemente próximos a una línea recta, brindando apoyo a la conclusión de que A, C, D,
AC yAD son los únicos efectos significativos y que se satisfacen los supuestos fundamentales del análisis.
99
¡¡¡
E
oe: 70
i
;g
:s 50
~
,,"".,
30
20
~
10
5
6.375 3.34375 0.3125 2.71875 5.75
Residual
La superficie de respuesta
Las gráficas de las interacciones de la figura 6 12 se utilizaron para ofrecer una interpretación práctica de
los resultados de este experimento. En ocasiones es útil emplear la superficie de respuesta para este fin.
La superficie de respuesta se genera por el modelo de regresión
70 06 (21.625)
r.=
J • + 2 X1 + (9.875)
2 X3 +
(14.625) .
2 X4
En la figura 614a se muestra la gráfica de contorno de la superficie de respuesta cuando la velocidad de agita
= =
ción está en el nivel alto (es decir, x4 1 ). Los contornos se generan a partir del modelo anterior conr, 1, o
yA= 77 . 3725 + (38,25)

2 X¡+ (9,875)
2 X3 (18.125)
2 X¡X3
Observe que los contornos son líneas curvas porque el modelo contiene un término de interacción.
La figura 614b es la gráfica de contorno de la superficie de respuesta cuando la temperatura está en
el nivel alto (es decir, x1 =
1). Cuando se hace x1 =
1 en el modelo de regresión se obtiene
J= 80.8725(8~)x3 +(31;25)x4
6-5 UNA SOIA RÉPLICA DEL DISEÑO 2• 253
1.000....... ........................
0.667
t"' 0.333
,g 90.00
l o.ooo
~
8-0.333
0.667
1.000 .____.____._ _ _.__._ __ ....__.._.. __ ....__ __.

1.000 0.667 0.333 0.000 0.333 0.667 1.000
Temperetura, A !%11
al Gréflcade contorno con la velocidad de agitaciónWI, ..,4 1
1.000
0.667
:;
1:1 0.333
,g
:i
15' 0.000
.g,,.
1 0.333
~
0.667
1.000 ...,,.::..,___._ __ _._ __ ..___:;;;..i. __ ....._ _ __,

1.000 0.667 0.333 0.000 0.333 0.667 1.000
Concentración, C ls3I
b) Gréfica de contorno con la temperatura '4), x, = 1
Figura 614 Gráficas de contorno del indice de filtración, ejemplo 62.
Estos contornos son rectas paralelas porque el modelo contiene únicamente los efectos principales de los
factores C (x3) y D (x4).
Ambas gráficas de contorno indican que si se quiere maximizar el índice de filtración, las variables A
(x1) y D (x4) deberán estar en el nivel alto y que el proceso es relativamente robusto para la concentración
C. Se obtuvieron conclusiones similares a partir de las gráficas de las interacciones.
La mitad de grá6.ca normal de los efectos
Una alternativa para la gráfica de probabilidad normal de los efectos de los factores es la mitad de gráfica
normal. Es una gráfica del valor absoluto de las estimaciones de los efectos contra sus probabilidades nor
males acumuladas. En la figura 6~ 15 se muestra la mitad de gráfica normal de los efectos para el ejemplo
6~2. La línea recta de la mitad de gráfica normal siempre pasa por el origen y deberá pasar también cerca del
valor de los datos del percentil cincuenta. Muchos analistas sienten que es más fácil interpretar la mitad de
254 CAPÍTULO 6 DISEÑO FACTORlAL 2k
99
•
A
97
"'C 9.5
·i
•
AC
ªE 90
•
16 AD
85
•
o
.: 80 D
"'C
~"'
t
70
60
"'
"'C
"¡f.
40
20
0.00 5.41 10.81 16.22 21.63
Efecto
Figura 615 Mitad de gráfica normal de los efectos de los factores del ejemplo 62.
gráfica normal, en particular si sólo se cuenta con pocas estimaciones de los efectos, como cuando el experi
mentador ha usado un diseño de ocho corridas. Algunos paquetes de software construirán ambas gráficas.
Otros métodos para analizar diseños factoriales no replicados

El procedimiento de análisis estándar para un diseño factorial de dos factores no replicado es la gráfica
normal (o mitad de gráfica normal) de los efectos estimados de los factores. Sin embargo, los diseños no
replicados son tan usados en la práctica que se han propuesto muchos procedimientos formales de análi
sis para resolver la subjetividad de la gráfica de probabilidad normal. Ramada y Balakrishnan [52] com
pararon algunos de estos métodos. Encontraron que el método propuesto por Lenth [70] tiene una
potencia adecuada para detectar efectos significativos. También es fácil de implementar y, como resulta
do, está empezando a aparecer en algunos paquetes de software para analizar datos de diseños factoriales
no replicados. Se ofrece una breve descripción del método de Lenth. · · , ' ' ·
Suponga que se tienen m contrastes de interés, por ejemplo el• C2, ••• , Cm: Síe] dtsefio es Ün fácforial 2k
no replicado, estos contrastes corresponden a las m = 2k 1 estimaciones'dé fos efectos de los factores: La
base del método de Lenth es estimar la varianza de un contraste a partir de 'fal estimaciones máspeque
ñas (en valor absoluto) de los contrastes. Sean · .. :.~. ,
..
i.s ><·me<ll.a1ii·· .(r(1):: .. \
:'
s~:==-
·'."\),::.·
. : . ¡·, '· . '," : •.•. '.' .. , ......... :·,':. ';:. ,J :: .·i
, ; :1 : f,,~ ~· r-, • • • •.'01 •' .,· I'; "~

6-5 UNA SOLA RÉPLICA DEL DISEÑO 2• 255
PSE denota el "pseudo error estándar", y Lenth demuestra que es un estimador razonable de la varianza
del contraste cuando no hay muchos efectos activos (significativos). El PSE se usa para juzgar la significa
ción de los contrastes. Un contraste individual puede compararse con el margen de error (ME, margino/
error)
ME= t o.025,d x PSE
donde los grados de libertad se definen como d = m/3. Para hacer inferencias sobre un grupo de contras
tes, Lenth sugiere usar el margen de error simultáneo (SME, simultaneous margin o/ error)
SME= t;. xPSE
donde el punto porcentual de la distribución t que se usa es y =

1 (1 + 0.9511m)/2.
Para ilustrar el método de Lenth, considere el experimento 24 del ejemplo 62. Los cálculos dan como
resultado s0 = 1.5 x 12.6251 = 3.9375 y 2.5 x 3.9375 = 9.84375, de donde
PSE= 1.5 x 11.7~= 2625
ME= 2571x2625=6.75
SME = S.219 x 2625 = 13. 70
Considere ahora las estimaciones de los efectos de la tabla 612. El criterio SME indicaría que los cuatro
efectos más grandes (en magnitud) son significativos, ya que las estimaciones de sus efectos exceden
SME. El efecto principal de Ces significativo de acuerdo con el criterio ME, pero no con respecto al SME.
Sin embargo, puesto que es evidente que la interacciónAC es importante, probablemente C se incluiría
en la lista de efectos significativos. Observe que en este ejemplo el método de Lenth produjo la misma
respuesta que la obtenida anteriormente con el examen de la gráfica de probabilidad normal de los
efectos.
Varios autores (ver Ramada y Balakrishnan (52], Loughin [73], Loughin y Noble [74] y Larntz y Whit
comb (69]) han hecho notar que el método de Lenth falla para controlar los índices del error tipo 1, y que
pueden usarse métodos de simulación para calibrar su procedimiento. Larntz y Whitcomb (69] sugieren
reemplazar los multiplicadores ME y SME con multiplicadores ajustados de la siguiente manera:
Número de contrastes 7 15 31
ME original 3.764 2.571 2.218
ME ajustado 2.295 2.140 2.082
SME original 9.008 5.219 4.218
SME ajustado 4.891 4.163 4.030
Estos resultados coinciden en gran medida con los de Ye y Ramada (114].

En general, el método de Lenth es un procedimiento ingenioso y útil. Sin embargo, recomendamos
utilizarlo como complemento de la gráfica de probabilidad normal usual de los efectos, no como su susti
tuto.
Bisgaard (10] ha proporcionado una sutil técnica gráfica, llamada carta de inferencia condicional,
como ayuda para interpretar la gráfica de probabilidad normal. La finalidad de esta gráfica es ayudar al
experimentador a juzgar los efectos significativos. Esto sería relativamente sencillo si se conociera la des
viación estándar a, o si pudiera estimarse a partir de los datos. En diseños no replicados, no se cuenta con
ninguna estimación interna de a, por lo que la carta de inferencia condicional está diseñada para ayudar
al experimentador a evaluar la magnitud de los efectos para un rango de valores de la desviación estándar.
Bísgaard fundamenta la gráfica en el resultado de que el error estándar de un efecto, en un diseño de dos
niveles con N corridas (para un diseño factorial no replicado, N 2k), es =
2u '
JN
donde a es la desviación estándar de una observación individual. Entonces ±2 veces el error estándar de
un efecto es
4a
+
<m
Una vez que se estiman los efectos, se hace una gráfica como la que se muestra en la figura 6 16, con las
estimaciones de los efectos graficadas en el eje vertical, o eje y. En esta figura se han usado las estimacio
nes de los efectos del ejemplo 62. El eje horizontal, ox, de la figura 616 es la escala de la desviación es
tándar (a). Las dos rectas están en
4a 4a
y=+- y y=-~
JN . JN
Enel ejemplo tratado aquí,N = 16, por lo que las rectas están eny =+ay y= -a. Por lo tanto, para cual
quier valor dado de la desviación estándar a, la distancia entre estas dos rectas puede leerse como un in
tervalo de confianza de 95% aproximado para los efectos insignificantes.
En la figura 616 se observa que si el experimentador piensa que la desviación estándar está entre 4 y
8, entonces los factores A, C, D y las interaccionesAC y AD son significativos. Si el experimentador piensa
que la desviación estándar tiene un valor de hasta 10, el factor C quizá no sea significativo. Es decir, para
A 22e
18
AD e
D 14•
+4a/..fN
-10 -4a/{Ñ
14
18
AC •
22
Figura 616 Carta de inferencia condicional para el

ejemplo 62.
65 UNA SOLA RÉPLICA DEL DISEÑO 21 257
D
+
4.f'TT~~
]·h~/·43 et¿
2. 72.44
A
Figura 617 Datos del experimento de perforación del ejemplo 63.
cualquier supuesto dado acerca die la magnitud de a, el experimentador puede construir una "cinta de me
dir" para juzgar la significación aproximada de los efectos. La carta también puede usarse en sentido in
verso. Por ejemplo, suponga que estuviera en duda si el factor C es significativo o no. Entonces el
experimentador podría preguntar si es razonable esperar que a pudiera ser tan grande como 10 o más. Si
es improbable que a sea tan grande como 10, entonces puede concluirse que C es significativo.
Se presentan ahora tres ilustrativos ejemplos de diseños factoriales 1! no replicados.
mEMPLO 6.3 • • • • • • • • • • • • .•...••.••••••••••••••••••••••••••..•••••••••••••

Transformación de datos en un diseño factorial
Daniel [35b] describe un diseño factorial Z' utilizado para estudiar la rapidez de avance de una perforadora
como una función de cuatro factores: la carga de la perforadora (A), la rapidez de flujo (B), la velocidad de rota
ción (C) y el tipo de lodo de perforación usado (D). Los datos del experimento se presentan en la figura 617.
En la figura 618 se muestra la gráfica de probabilidad normal de las estimaciones de los efectos de
este experimento. Con base en esta gráfica, los factores B, C y D, junto con las interacciones BC y BD,
requieren interpretación. La figura 619 es la gráfica de probabilidad normal de los residuales y la fi
99
B
5
• 95
e
~ 10
D • 90
•
X
¡ ... 20 80
1
z, 30 . 70
¡; 8
Eo
~
50 50 ';;
e
al 70 30
:2
:i5 80 20
i 90 10
95
• 5
99
o 2 3 4 5 6 7
Estimación del efecto
Figura 6·18 Gráfica de probabilidad normal de los efectos del ejemplo 63.
99
5
• 95
o
~ 10 90
X
¡;:;. 20 80
=
1
30 70
o
o
ee
Oí
50 50 ';;
o i:i:_.
i 70 30
:!i!
:s 80 20
.2l
2 90
D.. 10
95 5
•
99
-2
_, o 2
Residuales
Figura619 Gráfica de probabilidadnormal de los residuales del ejemplo 63.
gura 620 es la gráfica de los residuales contra la velocidad de avance predicha a partir del modelo que
contiene los factores identificados. Hay problemas evidentes con la normalidad y la igualdad de la varían
za. Con frecuencia se usa una transformación de los datos para abordar estos problemas. Puesto que la va
riable de respuesta es una razón de cambio, la transformación logarítmica parece un candidato razonable .
•
2
m • •
"§
"t>
·¡¡¡ • • •
~ o
•
• •
•
1
•
•
-2
2 5 8 ,, 14
Velocidad de avance predicha
Figura 620 Gráfica de los residuales contra la velocidad de avance

predicha en el ejemplo 6·3.
65 UNA SOLA RÉPLICA DEL DISEÑO 2* 259
99
B
5
• 95
e
•
o
:= 10
D
90
X
¡¡:. 20 • 80
1
30 70
=-ñi g
Eo 50 50 ';
e: ~...
~ 10 30
~ 80 20
~ 10
" 90
95 5
•
99
o 0.3 0.6 0.9 1.2

Estimacióndel efecto
Figura 621 Gráfica de probabilidad normal de los efectos del ejemplo 63 des
pués de la transformación logarítmica.
En la figura 621 se presenta la gráfica de probabilidad normal de las estimaciones de los efectos des
pués de hacer la transformación y* = lny. Observe que al parecer ahora es posible una interpretación
mucho más simple, ya que sólo los factores B, C y D están activos. Es decir, expresar los datos en la métri
ca correcta ha simplificado su estructura hasta el punto de que las dos interacciones han dejado de reque
rirse en el modelo explicatorio.
99
5 95
o
:=
X
10 90
¡¡:, 20 80
30 70
=-
e;;
50
~e:
.,
"O
70 30
]!
:a 80 20
~ 90 10
95 5
•
99
0.2 ~.1 1) 0.1 0.2

Residuales
Figura 622 Gráfica de probabilidad normal de los residuales del ejemplo 63
después de la transformación logarítmica.
260 CAPÍTULO 6 DISEÑO FACTORIAL z¡
0.2
•
•
•
0.1
•
~"'::i • •
:¡., o •
a:
•
•
0.1
•
•
•
o 0.5 1.0 1.5 2.0 2.5
Velocidad de avance logarítmica predicha
Figura 623 Gráfica de los residuales contra la velocidad predicha

para el ejemplo 63 después de la transformación logarítmica.
En las figuras 622 y 623 se presentan, respectivamente, una gráfica de probabilidad normal de los
residuales y una gráfica de los residuales contra la rapidez de avance predicha para el modelo en la escala
logarítmica que contiene a B, C y D. Ahora estas gráficas son satisfactorias. Se concluye que el modelo
y*= lny sólo requiere los factores E, Cy D para una interpretación adecuada. En la tabla 614 se resume
el análisis de varianza de este modelo. La suma de cuadrados del modelo es
SSModelo = SSB +SS e +SSD
= 5.345+1.339+0.431
= 7.115
y R2 = SSModcJjSST = 7.115/7.288 = 0.98, por lo que el modelo explica cerca de 98% de la variabilidad de la
rapidez de avance de la perforadora.
EJEMPLO 6-4 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Efectos de localización y dispersión en un diseño factorial no replicado
Se corrió un diseño 24 en un proceso de manufactura de paneles laterales y ventanas de un avión comer
cial. Los paneles se hacen en una prensa, y bajo las condiciones actuales es demasiado elevado el número
Tabla 614 Análisis de varianza del ejemplo 63 después de la transformación logar(tmica
B (Flujo) 5.345 1 5.345 381.79 <0.0001
C (Velocidad) 1.339 1 1.339 95.64 <0.0001
D (Lodo) 0.431 1 0.431 30.79 <0.0001
Error 0.173 12 0.014
Total 7.288 15
6-5 UNA SOLA RÉPLICA DEL DISEÑO 2• 261
Factores Bajo () Alto(+)
A • Temperatura (ºF) 295 326
B - Tiempo de 5ujeción (min) 7 9
C"' Flujo de resina 10 20
D ~ liempo de cierre (s) 15 30
55
,.........1.5 9.5
,L¡ e/
T ¡ _(. J __ , 15.5
et¿
~,,,,,.......... IY
/ ~/
12.5
A
Figura 624 Datos del experimento del proceso de los paneles
del ejemplo 64.
promedio de defectos por panel en una operación de prensado. (El promedio actual del proceso es 5.5 de
fectos por panel.) Se investigan cuatro factores utilizando una sola réplica de un diseño 24, en el que cada
réplica corresponde a una sola operación de prensado. Los factores son la temperatura (A), el tiempo de
sujeción (B), el flujo de resina (C) y el tiempo de cierre en el prensado (D). En la figura 624 se muestran
los datos de este experimento.
En la figura 625 se muestra la gráfica de probabilidad normal de los efectos de los factores. Es evi
= =
dente que los dos efectos más grandes sonA 5.75 y C 4.25. Ningún efecto de los otros factores pare
ce ser tan grande, y A y C explican cerca de 77% de la variabilidad total, por lo que se concluye que la
temperatura (A) baja y el flujo de resina (C) alto reducirían la incidencia de defectos en los paneles.
El análisis residual cuidadoso es un aspecto importante de cualquier experimento. La gráfica de pro
babilidad normal de los residuales no indicó anomalías, pero cuando el experimentador graficó los resi
99
•A
5 95
10 90
o
;? 20 80
X
~.., 30 70
=
1
50 50 §
1,, 70 30
X
«:
~
.
e
80 20
:o
11 90 10
:f 95 5
C•
99
10 5 o 5 10
Efectos de los factores
Figura 625 Gráfica de probabilidad normal de los efectos de los factores para
el experimento del proceso de los paneles del ejemplo 64.
262 CAPÍTIJLO 6 DISEÑO FACTORIAL Zk
5
••
••
:ll
"¡¡j
"' o
o
·¡¡¡
•1 • B ª Tiempo de sujeción
~
:
•1
5
Figura 626 Gráfica de los residuales contra el tiempo de suje
ción para el ejemplo 64.
duales contra cada uno de los factores A a D, la gráfica de los residuales contra B (tiempo de sujeción)
presentó el patrón de la figura 626. Este factor, que carece de importancia en lo que se refiere al número
promedio de defectos por panel, es muy importante en su efecto sobre la variabilidad del proceso, con el
tiempo de sujeción bajo dando como resultado una variabilidad menor en el número promedio de defec
tos por panel en una operación de prensado.
El efecto de dispersión del tiempo de sujeción también es muy evidente en la gráfica de cubo de la fi
gura 627, donde se grafica el número promedio de defectos por panel y el rango del número de defectos
en cada punto del cubo definido por los factoresA, By C. El rango promedio cuando B está en el nivel alto
(la cara posterior del cubo de la figura 627) es Ré 4.75, y cuando B está en el nivel bajo es RB- 1.25. = =
Como resultado de este experimento, el ingeniero decidió operar el proceso con la temperatura baja
y el flujo de resina alto para reducir el número promedio de defectos, con el tiempo de sujeción bajo para
reducir la variabilidad en el número de defectos por panel, y con el tiempo de cierre en el prensado bajo
(el cual no tuvo ningún efecto ni sobre la localización ni sobre la dispersión). El nuevo ajuste de las condi
ciones de operación produjo un nuevo promedio del proceso de menos de un defecto por panel.
•••••••••••••••••••••••••••••••••••••••••••••••••••••• 41 ••••••••••••••••••
Los residuales de un diseño 2k proporcionan mucha información acerca del problema bajo estudio. Pues
to que los residuales pueden considerarse como los valores observados del ruido o error, con frecuencia ofre
cen información acerca de la variabilidad del proceso. Puede hacerse el examen sistemático de los residuales
de un diseño 2k no replicado para proporcionar información acerca de la variabilidad del proceso.
R~3.5 R4.5
3.2 7.25
R-0.~ ¡ R=2/
l
20
0.75 j'·º
C= Flujo de resina ! R _ 4•5 R ~ 6.5
10
R =1
s.s
,, "
,, _li.75
R,;
11.75
0
:;;.2.25
7
9
Tlernpo de sujeción (minJ
295 325
A ~ Temperatura (ºF)
Figura 627 Gráfica de cubo de la temperatura, el tiempo de sujeción y el flujo de

resina para el ejemplo 64.
264 CAPÍTULO 6 DISEÑO FACTORIAL Zl
Considere la gráfica de los residuales de la figura 626. La desviación estándar de los ocho residuales
donde B está en el nivel bajo es S(Ir) = 0.83, y la desviación estándar de los ocho residuales donde B está
en el nivel alto es S(B+) = 2.72. El estadístico
F" ln S2(B+) = (624)
B S2(B-)
tiene una distribución aproximadamente normal cuando las dos varianzas a2(B+) y a2(B-) son iguales.
Para ilustrar los cálculos, el valor de F; es
S2(B+)
F" =In~
B S2(B)
=In (2 72)2
(0.83)2
=237
En la tabla 615 se presenta el conjunto completo de contrastes para el diseño 24 junto con los resi
duales para cada corrida del experimento del proceso de los paneles del ejemplo 64. Cada columna de
esta tabla contiene el mismo número de signos positivos y negativos, y es posible calcular la desviación es
tándar de los residuales de cada grupo de signos en cada columna, por ejemplo, S(i+) y S(i), i = 1, 2, ... , 15.
Entonces
i = 1, 2, ... , 15 (625)
es un estadístico que puede usarse para evaluar la magnitud de los efectos de dispersión del experimento.
Si la varianza de los residuales de las corridas donde el factor i es positivo es igual a la varianza de los resi
duales de las corridas donde el factor i es negativo, entonces F;" tiene una distribución aproximadamente
normal. Los valores de F; se presentan al final de cada columna de la tabla 615.
La figura 628 es la gráfica de probabilidad normal de los efectos de dispersión F'¡•. Evidentemente, B
es un factor importante en lo que se refiere a la dispersión del proceso. Para un estudio más amplio de
0.1 99.9
99
o
o
,.... B•
X 5 95
¡;:;.
1 20 80
!:
.aE 50 50
...
8
X
o r:i.:,...
¡ 80
e:
20
~
:e
96 6
~
a..
99
99.9 0.1
0.8 0.2 1.2 2.2 3.2
F;
Figura 628 Gráfica de probabilidad normal de los efectos de dispersión
F,' del ejemplo 64.
65 UNA SOLA RÉPLICA DEL DISEÑO 2t . 265
este procedimiento, ver Boxy Meyer [19] y Myers y Montgomery [85a]. Asimismo, para que los residuales
del modelo ofrezcan la información apropiada acerca de los efectos de dispersión, es necesario especifi
car correctamente el modelo de localización. Referirse al material suplementario del texto de este capítu
lo para mayores detalles y un ejemplo.
EJEMPLO 6-S · · · · · · · · · · . · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Mediciones duplicadas de la respuesta
Un equipo de ingenieros en una fábrica de semiconductores realizaron un diseño factorial 24 en un horno
de oxidación vertical. Se "apilan" cuatro obleas en el horno, y la variable de respuesta de interés es el es
pesor del óxido en las obleas. Los cuatro factores del diseño son la temperatura (A), el tiempo (B), la pre
sión (C) y el flujo de gas (D). El experimento se lleva a cabo cargando cuatro obleas en el horno, ajustando
las variables del proceso en las condiciones de prueba requeridas por el diseño experimental, procesando
las obleas y midiendo después el espesor del óxido en las cuatro obleas. Enla tabla 616 se presentan el di
seño y las mediciones del espesor resultantes. En esta tabla, las cuatro columnas bajo el encabezado
"Espesor" contienen las mediciones del espesor del óxido de cada oblea individual, y las dos últimas co
lumnas contienen el promedio muestral y la varianza muestral de las mediciones del espesor en las cuatro
obleas de cada corrida.
La manera apropiada de analizar este experimento es considerar las mediciones del espesor de las
obleas individuales como mediciones duplicadas, y no como réplicas. Si fueran en realidad réplicas,
cada oblea se habría procesado individualmente en una sola corrida del horno. Sin embargo, debido a que
las cuatro obleas se procesaron en conjunto, recibieron los factores de los tratamientos (es decir, los nive
les de las variables del diseño) simultáneamente, por lo que hay mucho menos variabilidad en las medicio
nes del espesor de las obleas individuales que la que se habría observado si cada oblea fuera una réplica.
Por lo tanto, el promedio de las mediciones del espesor es la variable de respuesta correcta que deberá
considerarse inicialmente.
En la tabla 617 se muestran las estimaciones de los efectos de este experimento, utilizando el espesor
y
del óxido promedio como la variable de respuesta. Observe que los factoresA y By la interacciónAB tie
nen efectos grandes que explican en conjunto cerca de 90% de la variabilidad del espesor promedio del
Tabla 6-16 El experimento del espesor del óxido

Orden Orden de
estándar la corrida A B e D Espesor y s2
1 10 -1 -1 -1 -1 378 376 379 379 378 2
2 7 1 -1 -1 1 415 416 416 417 416 0.67
3 3 -1 1 -1 -1 380 379 382 383 381 3.33
4 9 1 1 -1 -1 450 446 449 447 448 3.33
5 6 -1 -1 1 -1 375 371 373 369 372 6.67
6 2 1 -1 1 -1 391 390 388 391 390 2
7 5 1 1 1 -1 384 385 386 385 385 0.67
8 4 1 1 1 -1 426 433 430 431 430 8.67
9 12 -1 -1 -1 1 381 381 375 383 380 12.00
10 16 1 -1 -1 1 416 420 412 412 415 14.67
11 8 -1 1 -1 1 371 372 371 370 371 0.67
12 1 1 1 -1 1 445 448 443 448 446 6
13 14 -1 -1 1 1 377 377 379 379 378 1.33
14 15 1 -1 1 1 391 391 386 400 392 34
15 11 1 1 1 1 375 376 376 377 376 0.67
16 13 1 1 1 1 430 430 428 428 429 1.33
266 CAPÍTULO 6 DISEÑO FACTORIAL 2'
Tabla 617 Estimaciones de los efectos del ejemplo 65, la variable de

respuesta es el espesor promedio del óxido
Término del Estimación Suma de Contribución
modelo del efecto cuadrados porcentual
A 43.125 7439.06 67.9339
B 18.125 1314.06 12.0001
e 10.375 430.562 3.93192
D 1.625 10.5625 0.0964573
AB 16.875 1139.06 10.402
AC 10.625 451.563 4.12369
AD 1.125 5.0625 0.046231
BC 3.875 60.0625 0.548494
BD 3.875 60.0625 0.548494
CD 1.125 5.0625 0.046231
ABC 0.375 0.5625 0.00513678
ABD 2.875 33.0625 0.301929
ACD 0.125 0.0625 0.000570753
BCD 0.625 1.5625 0.0142688
ABCD 0.125 0.0625 0.000570753
óxido. La figura 629 es una gráfica de probabilidad normal de los efectos. Al examinar esta representa
ción, se concluiría que los factores A, By C y las interaccionesAB y AC son importantes. En la tabla 618
se muestra el análisis de varianza de este modelo.
El modelo para predecir el espesor promedio del óxido es
y= 399.19+21.56x1 +9.06x2 5.19x3 +8.44x1x2 5.31x1x3
El análisis residual de este modelo es satisfactorio.

Los experimentadores están interesados en obtener un espesor promedio del óxido de 400 A, y las es
pecificaciones del producto requieren que el espesor sea de entre 390 y 410 Á. En la figura 630 se presen
tan dos gráficas de contorno del espesor promedio, una con el factor C (o x3), la presión, en el nivel bajo
(es decir, x3 = 1) y la otra con C (o x3) en el nivel alto (es decir, x3 = + 1 ). Al examinar estas gráficas de
contorno, es evidente que hay muchas combinaciones del tiempo y la temperatura (factores A y B) que
producirán resultados aceptables. Sin embargo, si la presión se mantiene constante en el nivel bajo, la
"ventana" de operación se corre hacia el extremo izquierdo, o más bajo, del eje del tiempo, indicando que
se necesitarán duraciones del ciclo más cortas para conseguir el espesor del óxido deseado.
Es interesante observar los resultados que se hubieran obtenido si las mediciones del espesor del óxi
do de las obleas se hubieran considerado incorrectamentecomo réplicas. En la tabla 619 se presenta el
análisis de varianza del modelo completo basado en tratar el experimento como un diseño factorial 24 con
réplicas. Observe que hay muchos factores significativos en este análisis, lo cual sugiere un modelo mucho
más complejo del que se encontró cuando se utilizó el espesor promedio del óxido como la respuesta. La
razón de esto es que la estimación de la varianza del error de la tabla 619 es muy pequeña ( á2 = 6.12). El
cuadrado medio de los residuales de la tabla 619 refleja la variabilidad entre las obleas dentro de una co
rrida y la variabilidad entre las corridas. La estimación del error que se obtiene en la tabla 618 es mucho
más grande, á2 = 17.61, y es principalmente una medida de la variabilidad entre las corridas. Ésta es la
mejor estimación del error que deberá usarse para juzgar la significación de las variables del proceso que
se modifican de una corrida a otra.
Una pregunta lógica que podría plantearse es: lqué daño causa identificar demasiados factores como
importantes?, como ciertamente sería el caso en el análisis incorrecto de la tabla 619. La respuesta es que
65 UNA SOLA RÉPLICA DEL DISEÑO 2l 267
99
•
A
95
e
•
90 AB.
.... 80
§e: 70
i:a 50
~c. 30
.,
20
"
;j!.
10
5
10.63 2.81 16.25 29.69 43.13

Efecto
Figura 629 Gráfica de probabilidad normal de los efectos para la respuesta del es
pesor promedio del óxido, ejemplo 6·5.
Tabla 618 Análisis de varianza (de Design-Expen) para la respuesta espesor promedio del óxido,
ejemplo 65
Sumof Mean F
Mode! 10774.31 5 2154.86 122.35 <0.000
A 7439.06 1 7439.06 422.37 <0.000
8 1314.06 1 1314.06 74.61 <0.000
e 430.56 1 430.56 24.45 0.0006
AB 1139.06 1 1139.06 64.67 <0.000
AC 451.56 1 451.56 25.64 0.0005
Residual 176.12 10 17.61
Cor Total 10950.44 15
Mean 399.19 Adj. RSquared 0.9759
c.v. 1.05 Pred. RSquared 0.9588
PRE SS 450.88 Adeq. Precision 27.967

Factor Estlmate DF Error Low Hlgh
lntercept 399.19 1 1.05 396.85 401.53 ··
ATime 21.56 1 1.05 19.22 23.90:
8Temp 9.06 1 1.05 6.72 11.40
CPressure 5.19 1 1.05 7.53 2.85~
AB 8.44 1 1.05 6.10 10.78
AC 5.31 1 1,05 7.65 2.97
··········· ··
268 CAPITuLO 6 DISEÑO FACTORIAL z•
0.50
f
::1
~
!. 0.00 380
E
~
0.50
1·~~.~oo_......._ __ o_.....5_0_..____ o_,.oo

__ .....___e,...50___,,_oo
Tlempo
(a)%3,,,1
0.50
t
::1
1ií
0.00
t
0.50
Tiempo
(b)%3 ~ +1
Figura 630 Gráficas de contorno del espesor promedio del óxido con
la presión (x3) mantenida constante.
intentar manipular u optimizar los factores que no son importantes sería un desperdicio de recursos, y po
dría resultar en agregar variabilidad innecesaria a otras respuestas de interés.
Cuando sehacen mediciones duplicadas de la respuesta, casi siempre hay información útil acerca de
algún aspecto de la variabilidad del proceso contenida en estas observaciones. Por ejemplo, si las medi
ciones duplicadas son pruebas múltiples hechas con un instrumento de medición en la misma unidad ex
65 UNA SOLA RÉPLICA DEL DISEÑO zt 269
TubJa 619 Análisis de varianza (de DesignExpert) de la respuesta individual del espesor del óxido de
las obleas
Sumof Mean F
Model 43801.75 15 2920.12 476.75 <0.0001
A 29756.25 1 29756.25 4858.16 <0.0001
8 5256.25 1 5256.25 858.16 <0.0001
e 1722.25 1 1722.25 281.18 <0.0001
D 42.25 1 42.25 6.90 0.0115
AS 4556.25 1 4556.25 743.88 <0.0001
AC 1806.25 1 1806.25 294.90 <0.0001
AD 20.25 1 20.25 3.31 0.0753
BC 240.25 1 240.25 39.22 <0.0001
BD 240.25 1 240.25 39.22 <0.0001
CD 20.25 1 20.25 3.31 0.0753
ABO 132.25 1 132.25 21.59 <0.0001
ABC 2.25 1 2.25 0.37 0.5473
ACD 0.25 1 0.25 0.041 0.8407
BCD 6.25 1 6.25 1.02 0.3175
ABCD 0.25 1 0.25 0.041 0.8407
Residual 294.00 48 6.12
Lack ofFit 0.000 o
Pure Error 294.00 48 6.13
Cor. Total 44096.76 63
perimental, entonces las mediciones duplicadas proporcionan cierta información acerca de la eficiencia
del instrumento de medición. Si las mediciones duplicadas se hacen en diferentes lugares dentro de una
unidad experimental, pueden brindar cierta información acerca de la uniformidad de la variable de res
puesta en esa unidad. En el ejemplo tratado aquí, ya que se tiene una observación en cada una de cuatro
unidades experimentales que se han sometido a un procesamiento conjunto, se tiene cierta información
acerca de la variabilidad dentro de las corridas del proceso. Esta información se encuentra contenida en la
varianza de las mediciones del espesor del óxido de las cuatro obleas de cada corrida. Sería de interés de
terminar si alguna de las variables del proceso influye en la variabilidad al interior de las corridas.
·La figura 631 es una gráfica de probabilidad normal de las estimaciones de los efectos obtenidas uti
lizando ln(s2) como la respuesta. Recuerde que en el capítulo 3 se indicó que la transformación légarítmí
ca es por lo general apropiada para modelar la variabilidad. No hay ningún efecto individual fuerte, pero
el factor A y la interacción BD son los más grandes. Si se incluyen también los efectos principales de By D
para obtener un modelo jerárquico, entonces el modelo de ln(s2) es
/i--
ln(s )= l.08+0.4lx 0.40x2 +0.20x4 -0.56x2x4
1
El modelo explica apenas poco menos de la mitad de la variabilidad en la respuesta ln(s2), lo cual desde
luego no es nada espectacular para un modelo empírico, pero con frecuencia es difícil obtener modelos
excepcionalmente buenos de las varianzas.
La figura 632 es una gráfica de contorno de la varianza predicha (no del logaritmo de la varianza pre~
dicha) con la presiónz, en el nivel bajo (recuerde que con esto se minimiza la duración del ciclo) y el flujo
de gasx, en el nivel alto. Esta elección del flujo de gas produce los valores mínimos de la varianza predicha
en la región de la gráfica de contorno.
En este caso, los experimentadores se enfocaron en seleccionar valores de las variables de diseño que die
ran un espesor medio del óxido dentro de las especificaciones del proceso y tan cerca de 400 A como fuera po
sible, haciendo al mismo tiempo que la variabilidad dentro de las corridas sea pequeña, por ejemplo s2 s 2...
2 70 CAPÍTIJLO 6 DISEÑO FACTORIAL »
99
•
A
95
90
o;
ee
o
80
70
~ 50
.a
i.,,., 30
20
'/F.
10
5
1.12 0.64 0.15 0.34 0.82
Efecto
Figura631 Gráfica de probabilidad normal de los efectos utilizando In (si) como

la respuesta, ejemplo 65.
Varianza
o.so
e
e8." 0.00
E
f!!.
0.50
1.00 L.__.,1.::;;....1 __.._"""'" __ _.. _.
1.00 0.50 0.00 0.50 1.00

Tiempo
Figura 632 Gráfica de contorno de s2 (variabilidad dentro de las co

rridas) con la presión en el nivel bajo y el flujo de gas en el nivel alto.
6·6 ADICIÓN DE PUNTOS CENTRALES EN EL DISEÑO z• 2 71
..0.60 o.ao
Tiempo
Figura 633 Superposición del espesor promedio del óxido y las res
puestas s2 con la presión en el nivel bajo y el flujo de gas en el nivel alto.
Una manera posible de encontrar un conjunto de condiciones adecuado es superponiendo las gráficas de
contorno de las figuras 630 y 632. La gráfica de la superposición se muestra en la figura 633, con las es
pecificaciones del espesor medio del óxido y la restricción s2 :!;; 2 indicadas como contornos. En esta gráfi
ca, la presión se mantiene constante en el nivel bajo y el flujo de gas se mantiene constante en el nivel alto.
La región no sombreada cerca de la parte central izquierda de la gráfica identifica una región factible
para las variables tiempo y temperatura.
Éste es un ejemplo simple del uso de las gráficas de contorno para estudiar dos respuestas simultá
.........................................................................
neamente. Este problema se analizará con mayor detalle en el capitulo 11 .
66 ADICIÓN DE PUNTOS CENTRALES EN EL DISEÑO 2t
Una preocupación potencial en el uso de diseños factoriales de dos niveles es el supuesto de la linealidad
de los efectos de los factores. Desde luego, no es necesaria la linealidad perfecta, y el sistema Zk funciona
rá bastante bien incluso cuando el supuesto de linealidad sea válido sólo de manera muy aproximada. De
hecho, se ha señalado ya que si se agregan los términos de interacción a un modelo de los efectos princi
pales o de primer orden, de donde se obtiene
k
y= Po+ L Pixi + LL
jml t«¡
/3iixixi +e (626)
entonces se tiene un modelo con la capacidad de representar cierta curvatura en la función de respuesta.
Esta curvatura, desde luego, es resultado del torcimiento del plano inducido por los términos de ínterac
ción fJqXiX¡·
2 72 CAPITuLO 6 DISEÑO FACTORIAL 2k
Habrá situaciones en que la curvatura de la función de respuesta no esté modelada adecuadamente

por la ecuación 626. En tales casos, un modelo lógico por considerar es
k k
y= Po+ L Pixi + LL
j~l i<j
/3;¡xixi + L f3uxJ +e
j~l
(627)
donde lasf3n representan efectos cuadráticos o de segundo orden puros. Ala ecuación 627 se le llama mo
delo de superficie de respuesta de segundo orden.
Cuando se realiza un experimento factorial de dos niveles, por lo general se anticipa el ajuste del mo
delo de primer orden de la ecuación 626, pero deberá estarse alerta ante la posibilidad de que el modelo
de segundo orden de la ecuación 627 sea en realidad más apropiado. Existe un método para hacer una ré
plica de ciertos puntos de un diseño factorial 2k que ofrecerá protección contra la curvatura de los efectos
de segundo orden a la vez que permitirá una estimación independiente del error que va a obtenerse. El
método consiste en agregar puntos centrales en el diseño 2k. Éstos consisten en n réplicas que se corren
=
en los puntos X¡ O (i = 1, 2, ... , k). Una razón importante para agregar réplicas de las corridas en el cen
tro del diseño es que los puntos centrales no afectan las estimaciones usuales de los efectos en un diseño
r. Cuando se agregan puntos centrales, se supone que los k factores son cuantitativos.
Para ilustrar este enfoque, considere un diseño 22 con una observación en cada uno de los puntos fac
toriales (, ), ( +, ), (, +)y ( +, +),y ne observaciones en el punto central (O, O). En la figura 634 se ilus
tra la situación. Sea YF el promedio de las cuatro corridas en los cuatro puntos factoriales y sea Ye el
promedio de las ne corridas en el punto central. Si la diferencia YF - Ye es pequeña, entonces los puntos
centrales caen en el plano (o cerca de él) que pasa por los puntos factoriales, y no hay curvatura cuadráti
ca. Por otra parte, si YF -Ye es grande, entonces está presente una curvatura cuadrática. La suma de cua
drados de la curvatura cuadrática pura con un solo grado de libertad está dada por
(628)
donde, en general, np es el número de puntos del diseño factorial. Esta cantidad puede compararse con el
cuadrado medio del error para probar la curvatura cuadrática pura. Más espe~íficamente, cuando se
Figura 634 Diseño 22 con puntos centrales.

66 ADICIÓN DE PUNTOS CENTRALES EN EL DISEÑO z• 2 73
agregan puntos en el centro del diseño 2k, con la prueba de la curvatura (utilizando la ecuación 628) en
realidad se prueban las hipótesis
J•l
k
H1: ¿pi~ O
j;l
Además, si los puntos factoriales del diseño no tienen réplicas, pueden usarse los ne puntos centrales para
construir una estimación del error con ne - 1 grados de libertad.
'E)'EMPW 6-6 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·· · ·
Un ingeniero químico estudia el rendimiento de un proceso. Hay dos variables de interés, el tiempo de
reacción y la temperatura de reacción. Debido a que no se tiene la seguridad sobre el supuesto de lineali
dad en la región de exploración, el ingeniero decide realizar un diseño factorial 22 (con una sola réplica de
cada corrida factorial) aumentando con cinco puntos centrales. El diseño y los datos del rendimiento
se muestran en la figura 635.
En la tabla 620 se resume el análisis de varianza de este experimento. El cuadrado medio del error se
calcula a partir de los puntos centrales de la siguiente manera:
MS = SSE
E ne 1
:¿ (y;-Y>2
= Puntoolnleo
ne 1
Por lo tanto, por la tabla 620,
Í
MSE = ..:.:i;::.l
(Y; 40.46)2
_
4
0.1720
=
4
= 0.0430
40.0 41.5
160
r
ee
:::i 40.5
! 156 o • 40.7
s
E
40.2
{!. 40.6
11
1:1:1
39.3 40.9
150 1
1 o +1
30 35 40
A =Tiempo de reacción (min)
Figura 635 El diseño 22 con cinco puntos

centrales para el ejemplo 66.

A (Tiempo) 2.4025 1 2.4025 55.87 0.0017
B (Tumperatura) 0.4225 1 0.4225 9.83 0.0350
AB 0.0025 1 0.0025 0.06 0.8185
Cuadrática pura 0.0027 1 0.0027 0.06 0.8185
Error 0.1720 4 0.0430
Thtal 3.0022 8
=
El promedio de los puntos de la parte factorial del diseño es YF 40.425, y el promedio de los puntos si
tuados en el centro esyc = 40.46. La diferenciayFYc = 40.42540.46 = 0.035 parece ser pequeña. La
suma de cuadrados de la curvatura cuadrática pura de la tabla del análisis de varianza se calcula con la
ecuación 628 de la siguiente manera:
SS _ nFnc(.YF - Ye )2
Cuadrática puno n +n
F e
( 4)(5)(0.035)2
4+5
= 0.0027
El análisis de varianza indica que ambos factores tienen efectos principales significativos, que no existe
interacción, y que no hay evidencia de curvatura de segundo orden en la respuesta en la región de explora
ción. Es decir, la hipótesis nula H0: Pu + P22 = O no puede rechazarse.
En el ejemplo 66 se llegó a la conclusión de que no había indicios de efectos cuadráticos; es decir, un
modelo de primer orden
y= Po +P1X1 +P2x2 +/312X1X2 +E

es apropiado (aun cuando probablemente no se necesite el término de la interacción). Habrá situaciones
en las que se necesitarán los términos cuadráticos. Es decir, se tendrá que suponer entonces un modelo de
segundo orden tal como
y= Po +P1x1 +P2X2 +P12x1X2 +/311X12 +P22xi +e

Desafortunadamente, los parámetros desconocidos (las /3) de este modelo no pueden estimarse, ya que
hay seis parámetros por estimar y el diseño 22 más los puntos centrales de la figura 635 sólo tienen cinco
corridas independientes.
Una solución simple y de gran efectividad de este problema es aumentar el diseño 22 con cuatro corri
das axiales, como se ilustra en la figura 636a. El diseño resultante, llamado diseño central compuesto,
puede usarse entonces para ajustar el modelo de segundo orden. En la figura 636b se muestra un diseño
central compuesto para k = 3 factores. Este diseño tiene 14 + ne corridas (generalmente 3 s ne :s; 5), y es
un diseño muy eficiente para ajustar el modelo de segundo orden con 10 parámetros en k = 3 factores.
Los diseños compuestos centrales se usan ampliamente para construir modelos de superficie de res
puesta de segundo orden. Estos diseños se estudiarán con mayor detalle en el capítulo 11.
66 ADICIÓN DE PUNTOS CENTRALES EN EL DISEÑO 2• 275
~ %1
al Dos factores b) Tres factores
Figura 636 Diseiios centrales compuestos.
Se concluye esta sección con algunas sugerencias y observaciones adicionales útiles referentes al uso
de puntos centrales.
l. Cuando un experimento factorial se lleva a cabo en un proceso en marcha, considere utilizar las
condiciones de operación actuales (o de receta) como el punto central del diseño. Esto con fre
cuencia le asegura al personal de operación que al menos una parte de las corridas del experimento
van a realizarse bajo condiciones familiares, y por lo tanto es improbable que los resultados obteni
dos (por lo menos para estas corridas) sean peores que los que se obtienen típicamente.
2. Cuando el punto central de un experimento factorial corresponde con las condiciones de opera
ción actuales, el experimentador puede usar las respuestas observadas en el punto central para
proporcionar una verificación aproximada de si algo "inusual" ocurrió durante el experimento.
Es decir, las respuestas del punto central deberán ser muy similares a las respuestas observadas
históricamente en la operación rutinaria del proceso. Con frecuencia el personal de operación
llevará una carta de control para monitorear el desempeño del proceso. En ocasiones las res
puestas de los puntos centrales pueden graficarse directamente en Ja carta de control como una
verificación de la forma en que estuvo operando el proceso durante el experimento.
3. Considere correr las réplicas del punto central en orden no aleatorio. Específicamente, deberán
correrse uno o dos puntos centrales en o cerca del principio del experimente, uno o dos cerca de
la parte media, y uno o dos cerca del final. Al separar los puntos centrales en el tiempo, el experi
mentador tiene una verificación aproximada de la estabilidad del proceso durante el experimen
to. Por ejemplo, si ha ocurrido una tendencia en la respuesta mientras se realizaba el
experimento, graficar las respuestas de los puntos centra)es contra el tiempo puede poner de ma
nifiesto esta situación.
4. En ocasiones los experimentos tienen que realizarse en situaciones en las que la información pre
via acerca de la variabilidad del proceso es escasa o nula. En estos casos, correr dos o tres puntos
centrales como las primeras corridas en el experimento puede ser de suma utilidad. Estas corridas
pueden proporcionar una estimación preliminar de la variabilidad. Si la magnitud de la variabili
dad parece razonable, se continúa; por otra parte, si la variabilidad observada es mayor que la anti
cipada (io que la razonable!), habrá que detenerse. Con frecuencia es muy provechoso estudiar la
cuestión de por qué es tan grande la variabilidad antes de proceder con el resto del experimento.
5. Generalmente, se utilizan puntos centrales cuando todos los factores del diseño son cuantitati
vos. Sin embargo, en ocasiones habrá una o más variables cualitativas o categóricas y varias cuan
276 CAPÍTULO 6 DISENOFACTORIAL2k
'
1
ii!!b
!
1
'1
1
1
1
o
1
1
1 o
.a
1
'' ~ "(1111<'~ '
,.
1
1
i!
1 Tipo da
1
catalizador
________ ..._1
1
Figura 637 Un diseño 23 con un factor cualitativo y puntos

centrales.
titativas. Sigue siendo posible emplear los puntos centrales en estos casos. Para ilustrar este
punto, considere un experimento con dos factores cuantitativos, el tiempo y la temperatura, cada
uno con dos niveles, y un solo factor cualitativo, el tipo de catalizador, también con dos niveles
(orgánico e inorgánico). En la figura 637 se muestra el diseño 23 para estos factores. Observe
que los puntos centrales se colocan en las caras opuestas del cubo que incluyen los factores cuan
titativos. En otras palabras, los puntos centrales pueden correrse con las combinaciones de los
tratamientos en los niveles alto y bajo de los factores cualitativos, siempre y cuando esos subespa
cios incluyan únicamente factores cuantitativos.
6~7 PROBLEMAS
61. Un ingeniero está interesado en los efectos de la velocidad de corte (A), la geometría de la herramienta (B) y
el ángulo de corte (C) sobre la vida (en horas) de una máquina herramienta. Se eligen dos niveles de cada
factor y se corren tres réplicas de un diseño factorial 23. Los resultados fueron los siguientes:
Combinación de Réplica
A B e tratamientos 1 11 III
(1) 22 31 25
+ a 32 43 29
+ b 35 34 50
+ + ab 55 47 46
+ e 44 45 38
+ + ae 40 37 36
+ + be 60 50 54
+ + + abe 39 41 47
a) Estimar los efectos de los factores. ¿Qué efectos parecen ser grandes?
b) Usar el análisis de varianza para confirmar las conclusiones del inciso a.
e) Escribir un modelo de regresión para predecir la vida de la herramienta (en horas) con base en los resul
tados de este experimento.
d) Analizar los residuales. ¿Hay algún problema evidente?
e) Con base en el análisis de las gráficas de los efectos principales y las interacciones, ¿cuáles serían los ni
veles de A, B y C que se recomendaría utilizar?
62. Considere nuevamente el inciso e del problema 61. Utilizar el modelo de regresión para generar las gráficas
de la superficie de respuesta y de contorno de la respuesta, la vida de la herramienta. Interpretar estas gráfi
cas. ¿ofrecen alguna idea respecto de las condiciones de operación deseables para este proceso?
6 7 PROBLEMAS 2 77
63. Encontrar el error estándar de los efectos de los factores y aproximar los límites de confianza de 95% para los
efectos de los factores en el problema 61. lLos resultados de este análisis concuerdan con las conclusiones
del análisis de varianza?
64. Representar los efectos de los factores del problema 61 en una gráfica relativa a una distribución t escalada
apropiadamente. lEn esta representación gráfica se identifican de manera adecuada los factores importan
tes? Comparar las conclusiones de esta gráfica con los resultados del análisis de varianza.
65. Se usa una máquina para hacer ranuras de localización en una tarjeta de circuitos impresos. El nivel de vibra
ción en la superficie de la tarjeta cuando se hacen las ranuras se considera una fuente principal de variación
dimensional de las ranuras. Se piensa que dos factores influyen en la vibración: el tamaño de las ranuras (A) y
t
la velocidad de corte (B). Se seleccionan dos tamaños de las ranuras (Í6Y de pulgada) y dos velocidades (40 y
90 rpm), y se hacen ranuras en cuatro tarjetas con cada conjunto de condiciones que se muestran abajo. La
variable de respuesta es la vibración medida como el vector resultante de tres acelerómetros (x, y y z) en cada
tarjeta de prueba.
Combinación de Réplica
A B tratamientos I II 111 IV
(1) 18.2 18.9 12.9 14.4
+ a 27.2 24.0 22.4 22.5
+ b 15.9 14.5 15.1 14.2
+ + ab 41.0 43.9 36.3 39.9
a) Analizar los datos de este experimento.

b) Construir una gráfica de probabilidad normal de los residuales, y graficar los residuales contra el nivel de
vibración predicho. llnterpretar estas gráficas. ·
e) Hacer la gráfica de la interacciónAB. Interpretar esta gráfica. lQué niveles del tamaño de las ranuras y
la velocidad se recomendarían para la operación rutinaria?
66. Considere nuevamente el experimento descrito en el problema 61. Suponga que el experimentador efectuó
únicamente ocho ensayos de la réplica l. Además, corrió cuatro puntos centrales y obtuvo los siguientes valo
res de la respuesta: 36, 40, 43, 45.
a) Estimar los efectos de los factores. lQué efectos son grandes?
b) Efectuar un análisis de varianza, incluyendo una verificación de la curvatura cuadrática pura. lA qué
conclusiones se llega?
e) Escribir un modelo apropiado para predecir la vida de la herramienta, con base en los resultados de este
experimento. lEste modelo difiere en alguna forma sustancial del modelo del problema 61, inciso e?
d) Analizar los residuales.
e) lA qué conclusiones se llegaría acerca de las condiciones de operación apropiadas para este proceso?
6 7. Se llevó a cabo un experimento para mejorar el rendimiento de un proceso químico. Se seleccionaron cuatro
factores y se corrieron dos réplicas de un experimento completamente aleatorizado. Los resultados se pre
sentan en la tabla siguiente:
Combinación Réplica Combinación Réplica

de tratamientos 1 ll de tratamientos 1 11
(1) 90 93 d 98 95
a 74 78 ad 72 76
b 81 85 bd 87 83
ab 83 80 abd 85 86
e 77 78 cd 99 90
ac 81 80 acd 79 75
be 88 82 bcd 87 84
abe 73 70 abcd 80 80
2 78 CAPÍTULO 6 DISEÑO FACTORIAL »
a) Estimar los efectos de los factores.
b) Construir la tabla del análisis de varianza y determinar cuáles factores son importantes para explicar el
rendimiento.
e) Escribir un modelo de regresión para predecir el rendimiento, suponiendo que los cuatro factores se hi
cieron variar en el rango de 1 a + 1 (en unidades codificadas).
d) Graficar los residuales contra el rendimiento predicho y en una escala de probabilidad normal. lEl análi
sis residual parece ser satisfactorio?
e) Dos interacciones de tres factores,ABC y ABD, aparentemente tienen efectos grandes. Trazar una gráfi
ca de cubo en los factores A, By C con los rendimientos promedio indicados en cada vértice. Repetir lo
anterior utilizando los factores A, By D. lBstas dos gráficas ayudan en la interpretación de los datos?
lDónde se recomendaría que se corriera el proceso con respecto a las cuatro variables?
68. Un bacteriólogo está interesado en los efectos de dos medios de cultivo diferentes y dos tiempos diferentes
sobre el crecimiento de un virus particular. Realiza seis réplicas de un diseño 22, haciendo las corridas de ma
nera aleatoria. Analizar los datos del crecimiento viral que se presentan enseguida y sacar las conclusiones
apropiadas. Analizar los residuales y comentar la adecuación del modelo.
Medio de cultivo
Tiempo,h 1 2
21 22 25 26
12 23 28 24 25
20 26 29 27
37 39 31 34
18 38 38 29 33
35 36 30 35
69. Un ingeniero industrial empleado por una compañía refresquera está interesado en los efectos de dos dife
rentes tipos de botellas de 32 onzas sobre el tiempo de entrega de cajas de 12 botellas del producto. Los dos
tipos de botellas son de vidrio y de plástico. Se usan dos empleados para realizar una tarea que consiste en
mover 40 cajas del producto 50 pies en una plataforma de carga estándar y acomodarlas en un estante de ven
ta. Se hacen cuatro réplicas de un diseño factorial 22 y los tiempos observados se enlistan en la siguiente tabla.
Analizar los datos y sacar las conclusiones apropiadas. Analizar los residuales y comentar la adecuación del
modelo.
Empleado
Tipo de botella 1 2
Vidrio 5.12 4.89 6.65 6.24
4.98 5.00 5.49 5.55
Plástico 4.95 4.95 5.28 4.91
4.27 4.25 4.75 4.71
610. En el problema 69, el ingeniero también estuvo interesado en las diferencias en la fatiga potencial que resul
ta de los tipos de botellas. Como una medida de la cantidad de esfuerzo requerido, midió el aumento del rit
mo cardiaco (pulso) inducido por Ja tarea. Los resultados se presentan a continuación. Analizar tos datos y
sacar conclusiones. Analizar los residuales y comentar la adecuación del modelo.
67 PROBLEMAS 279
Empleado
Tipo de botella 1 2
Vidrio 39 45 20 13
58 35 16 11
Plástico 44 35 13 10
42 21 16 15
611. Calcular los límites de confianza aproximados para los efectos de los factores del problema 610. lLos resul
tados de este análisis concuerdan con el análisis de varianza realizado en el problema 610?
612. En un artículo deAT&T Technical Joumal (vol. 65, pp. 3950) se describe la aplicación de diseños factoriales
de dos niveles en la fabricación de circuitos integrados. Un paso básico del procesamiento es hacer crecer
una capa epitaxial sobre obleas de silicio pulidas. Las obleas se montan en un susceptor, se colocan en el inte
rior de una campana de cristal y se introducen vapores químicos. El susceptor se hace girar y se aplica calor
hasta que la capa epitaxial tiene el espesor suficiente. Se corrió un experimento utilizando dos factores: rapi
dez de flujo de arsénico (A) y tiempo de deposición (B). Se corrieron cuatro réplicas y se midió el espesor de
la capa epitaxial (en µm). Los datos se muestran a continuación:
Réplica Niveles de factores

A B 1 11 IIl IV Bajo() Alto(+)
14.037 16.165 13.972 13.907 A 55% 59%
+ 13.880 13.860 14.032 13.914
+ 14.821 14.757 14.843 14.878 B Corto Largo
+ + 14.888 14.921 14.415 14.932 (lOmin) (15 min)
a) Estimar los efectos de los factores.

b) Conducir un análisis de varianza. lQué factores son importantes?
e) Escribir una ecuación de regresión que podría usarse para predecir el espesor de la capa epitaxial en la
región de la velocidad! de flujo del arsénico y el tiempo de deposición utilizado en este experimento.
d) Analizar los residuales. lSe observa algún residual que debiera causar preocupación?
e) Comentar la forma en que se podría resolver el punto atípico potencial encontrado en el inciso d.
613. Continuaci6n del problema 6-12. Usar el modelo de regresión del inciso e del problema 612 para generar una
gráfica de contorno de la superficie de respuesta para el espesor epitaxial. Suponga que es de importancia
crítica obtener un espesor de la capa de 14.5 µm. lQué ajustes de la velocidad de flujo del arsénico y del tiem
po de deposición se recomendarían?
614. Continuaci6n del problema 6-13. lEn qué forma cambiaría la respuesta dada en el problema 613 si la veloci
dad de flujo del arsénico fuera niás difícil de controlar en el proceso que el tiempo de deposición?
615. Se utiliza una aleación de níquel y titanio para fabricar componentes de los motores de turbina de aviones.
La formación de fisuras es un problema potencialmente serio de las piezas terminadas, ya que pueden provo
car fallas irreversibles. Se realiza una prueba de las piezas para determinar el efecto de cuatro factores sobre
las fisuras. Los cuatro factores son la temperatura de vaciado (A), el contenido de titanio (B), el método de
tratamiento térmico (C) y la cantidad de refinador de grano usada (D). Se hacen dos réplicas de un diseño 24
y se mide la longitud de las fisuras (en mm x 102) inducidas en un ejemplar de prueba de muestra sometido a
una prueba estándar. Los datos se muestran en la siguiente tabla:
Combinaciónde Réplica
A B e D tratamientos 1 11
(1) 7.037 6.376
+ a 14.707 15.219
+ b 11.635 12.089
+ + ab 17.273 17.815
+ e 10.403 10.151
+ + ac 4.368 4.098
+ + be 9.360 9.253
+ + + abe 13.440 12.923
+ d 8.561 8.951
+ + ad 16.867 17.052
+ + bd 13.876 13.658
+ + + abd 19.824 19.639
+ + cd 11.846 12.337
+ + + acd 6.125 5.904
+ + + bcd 11.190 10.935
+ + + + abcd 15.653 15.053
a) Estimar los efectos de los factores. lQué efectos de los factores parecen ser grandes?
b) Conducir un análisis de varianza. lAlguno de los factores afecta la formación de fisuras? Utilizar a =
0.05.
e) Escribir un modelo de regresión que pueda usarse para predecir la longitud de las fisuras como una fun
ción de los efectos principalesy las interacciones significativasque se han identificado en el incisob.
d) Analizar los residuales de este experimento.
e) lHay algún indicio de que alguno de los factores afecte la variabilidad de la formación de fisuras?
f) lQué recomendaciones se harían respecto de las operaciones del proceso? Utilizar gráficas de las inte
racciones y/o de los efectos principales como ayuda para sacar conclusiones.
616. Continuaci6n del problema 6-15. Una de las variables del experimento descrito en el problema 615, el método
de tratamiento térmico (C), es una variable categórica. Suponga que los demás factores son continuos.
a) Escribir dos modelos de regresión para predecir la longitud de las fisuras, uno para cada nivel de la varia
ble método de tratamiento térmico. lQué diferencias, en caso de haberlas, se observan en estas dos
ecuaciones?
b) Generar las gráficas de contorno apropiadas de la superficie de respuesta para los dos modelos de regre
sión del inciso a.
e) lQué conjunto de condicionesse recomendaría para los factoresA, By D si se utiliza el método de trata
miento térmico e = +?
d) Repetir el inciso e suponiendo que quiere usarse el método de tratamiento térmico C = .
617. Un experimentador corre una sola réplica de un diseño 24• Se calcularon las siguientes estimaciones de los
efectos:
A= 76.95 AB =51.32 ABC =2.82

B = 67.52 AC = 11.69 ABD =6.50
e= 7.84 AD= 9.78 ACD = 10.20
D = 18.73 BC= 20.78 BCD= 7.98
BD = 14.74 ABCD = 6.25
CD= 1.27
a) Construir una gráfica de probabilidad normal de estos efectos.

b) Identificar un modelo tentativo, con base en la gráfica de los efectos del inciso a.
6 7 PROBLEMAS 281
618. En un artículo de Solid State Technology ("Disefio ortogonal para optimización de procesos y su aplicación en
el grabado químico con plasma") se describe la aplicación de diseños factoriales en el desarrollo de un proce
so de grabado químico con nitrurosen un dispositivo de grabado químico con plasma para una sola oblea. El
proceso usa C2F6 como gas de reacción. Cuatro factores son de interés: el entrehierro ánodocátodo (A), la
presión en la cámara del reactor (B), el flujo del gas CiF 6 ( C) y la potencia aplicada al cátodo (D). La respues
ta de interés es la rapidez de grabado para el nitruro de silicio. Se corre una sola réplica de un diseño 24; los
datos se muestran enseguida:
Número de Orden real de Rapidez de grabado Niveles de los factores

corrida la corrida A B e D (Á/min) Bajo() Alto(+)
1 13 550 A (cm) 0.80 1.20
2 8 + 669 B (mTurr) 450 550
3 12 + 604 C(SCCM) 125 200
4 9 + + 650 D(W) 275 325
5 4 + 633
6 15 + + 642
7 16 + + 601
8 3 + + + 635
9 1 + 1037
10 14 + + 749
11 5 + + 1052
12 10 + + + 868
13 11 + + 1075
14 2 + + + 860
15 7 + + + 1063
16 6 + + + + 729
a) Estimar los efectos de los factores. Considere una gráfica de probabilidad normal de los efectos de los
factores. lQué efectos parecen ser grandes?
b) Efectuar un análisis de varianza para confirmar los resultados obtenidos en el inciso a.
e) lCuál es el modelo de regresión que relaciona la rapidez de grabado con las variables significativas del
proceso?
d) Analizar los residuales de este experimento. Comentar la adecuación del modelo.
e) Si no todos los factores son importantes, hacer la proyección del diseño 24 en un diseño 2t con k < 4 y
conducir el análisis de varianza.
f) Trazar gráficas para interpretar cualquier interacción significativa.
g) Graficar los residuales contra el orden real de las corridas. lQué problemas podrían ponerse de mani
fiesto en esta gráfica?
619. Continuación del problema 6-18. Considere el modelo de regresión obtenido en el inciso e del problema 618.
a) Construir las gráficas de contorno de la rapidez de grabado utilizando este modelo.
b) Suponga que fuera necesario operar este proceso con una rapidez de 800 Á/min. lCuáles serían los ajus
tes de las variables del proceso que se recomendarían?
620. Considere la réplica única del diseño 24 del ejemplo 62. Suponga que se decidió arbitrariamente analizar los
datos suponiendo que las interacciones de tres y cuatro factores eran insignificantes. Conducir este análisis y
comparar los resultados con los que se obtuvieron en el ejemplo. lPiensa el lector que es una buena idea su
poner de manera arbitraria que las interacciones son insignificantes incluso cuando sean de orden relativa
mente alto?
621. Se realizó un experimento en una fábrica de semiconductores en un esfuerzo para incrementar el rendimien
to. Se estudiaron cinco factores, cada uno con dos niveles. Los factores (y los niveles) fueron:A =ajuste de
apertura (pequeña, grande), B = tiempo de exposición (20% abajo del nominal, 20% arriba del nominal),
282 CAPÍTULO 6 DISEÑO FACTORIAL »
=
C tiempo de desarrollo (30 s, 45 s ), D = tamaño de la máscara (pequeña, grande) y E = tiempo de grabado
(14.5 min, 15.5 min). Se corrió el diseño 25 no replicado que se muestra a continuación.
(1) = 7 d=8 e=B de= 6

a=9 ad= 10 ae = 12 ade 10=
b = 34 bd = 32 be= 35 bde = 30
ab = 55 abd = 50 abe= 52 abde = 53
e= 16 cd = 18 ce= 15 cde = 15
ac = 20 aed = 21 aee = 22 aede = 20
be= 40 bcd = 44 bce 45= bede = 41
abe =60 =
abed 61 abee = 65 abede= 63
a) Construir una gráfica de probabilidad normal de las estimaciones de los efectos. lQué efectos parecen
ser grandes?
b) Efectuar un análisis de varianza para confirmar los resultados obtenidos en el inciso a.
e) Escribir el modelo de regresión que relacione el rendimiento con las variables significativas del proceso.
d) Graficar los residuales en papel probabilidad normal. lLa gráfica es satisfactoria?
e) Graficar los residuales contra los rendimientos predichos y contra cada uno de los cinco factores. Co
mentar las gráficas.
f) Interpretar cualquier interacción significativa.
g) lQué recomendaciones se harían respecto de las condiciones de operación del proceso?
h) Hacer la proyección del diseño 25 de este problema en un diseño 2k en los factores importantes. Esque
matizar el diseño e indicar el promedio y el rango de los rendimientos en cada corrida. lEs de ayuda este
esquema para interpretar los resultados de este experimento?
622. Continuaci6n del problema 6-21. Suponga que el experimentador corrió cuatro puntos centrales además de Jos
32 ensayos del experimento original. Los rendimientos obtenidos en las corridas de los puntos centrales fue
ron 68, 74, 76 y 70.
a) Analizar de nuevo el experimento, incluyendo una prueba para la curvatura cuadrática pura.
b) Comentar cuál sería el siguiente paso.
623. Se estudiaron cuatro factores, cada uno con dos niveles, en un estudio del rendimiento de un proceso: el
tiempo (A), la concentración (B), la presión (C) y la temperatura (D). Se corrió una sola réplica de un diseño
24 y los datos obtenidos se muestran en la siguiente tabla:
Número de Orden real de Rendimiento Niveles de los factores

corrida la corrida A B e D (lbs) Bajo j) Alto(+)
1 5 12 A (h) 2.5 3
2 9 + 18 B(%) 14 18
3 8 + 13 e (psi) 60 80
4 13 + + 16 D (ºC) 225 250
5 3 + 17
6 7 + + 15
7 14 + + 20
8 1 + + + 15
9 6 + 10
10 11 + + 25
11 2 + + 13
12 15 + + + 24
13 4 + + 19
14 16 + + + 21
15 10 + + + 17
16 l2 + + + + 23
6 7 PROBLEMAS 283
a) Construir una gráfica de probabilidad normal de las estimaciones de los efectos. lQué factores parecen
tener efectos grandes?
b) Efectuar un análisis de varianza utilizando la gráfica de probabilidad normal del inciso a como guía para
formar el término del error. lA qué conclusiones se Jlega?
e) Escribir un modelo de regresión que relacione el rendimiento con las variables importantes del proceso.
d) Analizar los residuales de este experimento. lEl análisis indica algún problema potencial?
e) lEs posible plegar este diseño a un diseño 23 con dos réplicas? De ser así, esquematizar el diseño con el
promedio y el rango del rendimiento indicados en cada punto del cubo. Interpretar los resultados.
6-24. Continuación del problema 6-23. Usar el modelo de regresión del inciso e del problema 6-23 para generar una
gráfica de contorno de la superficie de respuesta del rendimiento. Analizar el valor práctico de esta gráfica
de superficie de respuesta.
6-25. El experimento del brownie (pastelito) exquisito. El autor es un ingeniero hecho en la práctica y un firme creyen
te de aprender haciendo las cosas. Durante muchos años ha impartido el curso de diseño experimental a una
amplia variedad de audiencias y siempre asigna la planeación, realización y análisis de un experimento real a
los participantes de la clase. Los participantes parecen disfrutar esta experiencia práctica y siempre
aprenden mucho de ella. En este problema se utilizan los resultados de un experimento realizado por Gret
chen Krueger en la Universidad Estatal de Arizona.
Existen muchas formas diferentes de hornear brownies. El propósito de este experimento fue determinar
la forma en que el material del molde, la marca de la harina para brownies y el método de batido afectan la
exquisitez de los brownies. Los niveles de los factores fueron:
Factor Bajo() Alto(+)

A = material del molde Vidrio Aluminio
B = método de batido Cuchara Batidora
e = marca de la harina Cara Barata
La variable de respuesta fue la exquisitez, una medida subjetiva derivada de un cuestionario aplicado a los
sujetos que hicieron el muestreo de cada lote de brownies. (Este cuestionario incluía aspectos como el sabor,
la apariencia, la consistencia, el aroma, etc.) Un panel de prueba integrado por ocho personas hizo el mues
treo de cada lote y llenó el cuestionario. La matriz del diseño y los datos de la respuesta se presentan a conti
nuación:
Lote de Resultados del panel de prueba

brownies A B e 1 2 3 4 5 6 7 8
1 11 9 10 10 11 10 8 9
2 + 15 10 16 14 12 9 6 15
3 + 9 12 11 11 11 11 11 12
4 + + 16 17 15 12 13 13 11 11
5 + 10 11 15 8 6 8 9 14
6 + + 12 13 14 13 9 13 14 9
7 + + 10 12 13 10 7 7 17 13
8 + + + 15 12 15 13 12 12 9 14
a) Analizar los datos de este experimento como si se tratara de ocho réplicas de un diseño 23. Comentar Jos
resultados.
b) lEl análisis del inciso a es el enfoque correcto? Hay únicamente ocho lotes; lse tienen en realidad ocho
réplicas de un diseño factorial 23?
e) Analizar el promedio y la desviación estándar del puntaje de la exquisitez. Comentar los resultados.
lEste análisis es más apropiado que el del inciso a? lPor qué sí o no?
626. Se condujo un experimento en un proceso químico para producir un polímero. Los cuatro factores estudia
dos fueron la temperatura (A), la concentración del catalizador (B), el tiempo (C) y la presión (D). Se obser
varon dos respuestas, el peso molecular y la viscosidad. La matriz del diseño y los datos de la respuesta se
presentan a continuación:
Número Orden real de Peso Niveles de los factores

de corrida las corridas A B e D molecular Viscosidad Bajo() Alto(+)
1 18 2400 1400 A (°C) 100 120
2 9 + 2410 1500 B(%) 4 8
3 13 + 2315 1520 e (min) 20 30
4 8 + + 2510 1630 D (psi) 60 75
5 3 + 2615 1380
6 11 + + 2625 1525
7 14 + + 2400 1500
8 17 + + + 2750 1620
9 6 + 2400 1400
10 7 + + 2390 1525
11 2 + + 2300 1500
12 10 + + + 2520 1500
13 4 + + 2625 1420
14 19 + + + 2630 1490
15 15 + + + 2500 1500
16 20 + + + + 2710 1600
17 1 o o o o 2515 1500
18 5 o o o o 2500 1460
19 16 o o o o 2400 1525
20 12 o o o o 2475 1500
a) Considere únicamente la respuesta del peso molecular. Graficar las estimaciones de los efectos en una
escala de probabilidad normal. lQué efectos parecen ser importantes?
b) Usar un análisis de varianza para confirmar los resultados del inciso a. lHay algún indicio de curvatura?
e) Escribir un modelo de regresión para predecir el peso molecular como una función de las variables im
portantes.
d) Analizar los residuos y comentar la adecuación del modelo.
e) Repetir los incisos a-d utilizando la respuesta de la viscosidad.
627. Continruu:i6ndelproblema 6-26. Utilizar los modelos de regresión del peso molecular y la viscosidad para res
ponder las preguntas siguientes.
a) Construir una gráfica de contorno de la superficie de respuesta para el peso molecular. lEn qué direc
ción se ajustarían las variables del proceso a fin de incrementar el peso molecular?
b) Construir una gráfica de contorno de la superficie de respuesta para la viscosidad. lEn qué dirección se
ajustarían las variables del proceso para disminuir la viscosidad?
67 PROBLEMAS 285
e) lQué condiciones de operación se recomendarían si fuera necesario producir un producto con peso mo
lecular entre 2400 y 2500, y con la viscosidad más baja posible?
628. Considere una sola réplica del diseño 24 del ejemplo 62. Suponga que se hicieron cinco corridas de puntos en
el centro (O, O, O, O) y que se observaron las respuestas siguientes: 73, 75, 71, 69 y 76. Probar la curvatura en
este experimento. Interpretar los resultados.
629. Un valor faltante en un diseño factorial P. No es raro encontrar que falta una de las observaciones de un diseño
2k debido a un equipo de medición defectuoso, una prueba fallida, o alguna otra razón. Si el diseño se hace
con n réplicas (n > 1 ), puede emplearse alguna de las técnicas estudiadas en el capítulo 5. Sin embargo, para
un diseño factorial sin réplicas (n = 1) debe usarse otro método. Un enfoque lógico es estimar el valor faltan
te con un número que haga cero el contraste de la interacción de orden más alto. Aplicar esta técnica al expe
rimento del ejemplo 62, suponiendo que falta la corrida ah. Compare los resultados obtenidos con Jos del
ejemplo 62.
630. Un ingeniero realizó un experimento para estudiar el efecto de cuatro factores sobre la aspereza superficial
=
de una pieza maquinada. Los factores (y sus niveles) sonA ángulo de la herramienta (12, 15º), B = viscosi
dad del fluido de corte (300, 400), C = velocidad de alimentación (10, 15 pulg/min) y D = enfriador del fluido
de corte usado (no, sí). Los datos de este experimento (con los factores codificados en los niveles usuales 1,
+ 1) se muestran a continuación.
Corrida A B e D Rugosidad superficial

1 0.00340
2 + 0.00362
3 + 0.00301
4 + + 0.00182
5 + 0.00280
6 + + 0.00290
7 + + 0.00252
8 + + + 0.00160
9 + 0.00336
10 + + 0.00344
11 + + 0.00308
12 + + + 0.00184
13 + + 0.00269
14 + + + 0.00284
15 + + + 0.00253
16 + + + + 0.00163
a) Estimar los efectos de los factores. Representar las efectos de los factores en una gráfica de probabilidad
normal y seleccionar un modelo tentativo.
b) Ajustar el modelo identificado en el inciso a y analizar los residuales. lHay algún indicio de que el mode
lo no sea adecuado?
e) Repetir el análisis de los incisos a y b utilizando 1~ como la variable de respuesta. lHay algún indicio de
que la transformación ha sido útil?
d) Ajustar un modelo en términos de las variables codificadas que pueda usarse para predecir la rugosidad
superficial. Convertir esta ecuación de predicción en un modelo en las variables naturales.
631. La resistividad de una oblea de silicio está influida por varios factores. Los resultados de un experimento fac
torial 24 realizado durante un paso crítico del procesamiento se muestran en la tabla siguiente:
Corrida A B e D Resistividad
1 1.92
2 + 11.28
3 + 1.09
4 + + 5.75
5 + 2.13
6 + + 9.53
7 + + 1.03
8 + + + 5.35
9 + 1.60
10 + + 11.73
11 + + 1.16
12 + + + 4.68
13 + + 2.16
14 + + + 9.11
15 + + + 1.07
16 + + + + 5.30
a) Estimar los efectos de los factores. Representar las efectos de los factores en una gráfica de probabilidad
normal y seleccionar un modelo tentativo.
b) Ajustar el modelo identificado en el inciso a y analizar los residuales. lHay algún indicio de que el mode
lo no sea adecuado?
e) Repetir el análisis de los incisos a y b utilizando In (y) como la variable de respuesta. lHay algún indicio
de que la transformación haya sido útil?
d) Ajustar un modelo en términos de las variables codificadas que pueda usarse para predecir la resistivi
dad.
632. Continuación del problema 6-31. Suponga que el experimentador corrió también cuatro puntos centrales jun
to con las 16 corridas del problema 631. Las mediciones de la resistividad en los puntos centrales son: 8.15,
7.63, 8.95 y 6.48. Analizar de nuevo el experimento incorporando los puntos centrales. lQué conclusiones
pueden sacarse ahora?
633. Es frecuente usar el modelo de regresión ajustado de un diseño factorial 2k para hacer predicciones en pun
tos de interés del espacio del diseño.
a) Encontrar la varianza de la respuesta predicha y en un puntox..x; ... ,xk del espacio del diseño. Sugeren-
cia: recuerde que lasx están codificadas, y suponga un diseño 2k conel mismo número de réplicas nen
p
cada punto del disefio, de tal modo que la varianza de un coeficiente de regresión sea a2/(n2k) y que la
covarianza entre cualquier par de coeficientes de regresión sea cero.
b) Usar el resultado del inciso a para encontrar la ecuación de un intervalo de confianza de 100(1a) por
ciento para la verdadera respuesta media en el punto X¡, x2' ... , xk del espacio del diseño.
634. Modelos jerárquicos. Se ha usado varias veces el principio de jerarquía para seleccionar un modelo; es decir,
se han incluido términos de orden inferior no significativos en un modelo porque eran factores que estaban
incluidos en términos de orden superior significativos. Ciertamente, la jerarquía no es un principio absoluto.
que deba seguirse en todos los casos. Para ilustrar esto, considere el modelo que resultó en el problema 61,
el cual requirió que se incluyera un efecto principal no significativo para respetar la jerarquía. Utilizar los da
tos del problema 61.
a) Ajustar el modelo jerárquico y el modelo no jerárquico.
b) Calcular el estadístico PRESS, la R2 ajustada y el cuadrado medio del error para ambos modelos.
e) Encontrar un intervalo de confianza de 95% para la estimación de la respuesta media en el vértice de un
cubo (x1 = x2 = x3 = ±1). Sugerencia: usar los resultados del problema 633.
d) Con base en 'los análisis que se han realizado, lqué modelo preferiría el lector?
Formación de
bloques y confusión
en el diseño
factorial 2k
7 .. ¡ INTRODUCCIÓN
Hay múltiples situaciones en las que es imposible efectuar todas las corridas de un experimento factorial
2k bajo condiciones homogéneas. Por ejemplo, un lote de materia prima podría no ser suficiente para ha
cer todas las corridas requeridas. En otros casos, podría ser conveniente modificar deliberadamente las
condiciones experimentales para asegurar que los tratamientos tengan la misma efectividad (es decir, que
sean robustos) en diversas situaciones que es posible encontrar en la práctica. Por ejemplo, un ingeniero
químico puede correr un experimento en una planta piloto con varios lotes de materia prima porque sabe
que en el proceso real a gran escala posiblemente se usarán diferentes lotes de materia prima con diversos
grados de calidad.
La técnica de diseño utilizada en estas situaciones es la formación de bloques. Este capítulo se enfoca
en algunas técnicas especiales para separar en bloques un diseño factorial 2k.
7 .. 2 FORMACIÓN DE BLOQUF.S DE UN DISEÑO FACTORIAL 2• CON RÉPLICAS

Suponga que se han corrido n réplicas del diseño factorial 2". Esta situación es idéntica a la que se estudió
en el capítulo 5, donde se indicó cómo correr un diseño factorial general en bloques. Si hay n réplicas, en
tonces cada conjunto de condiciones no homogéneas define un bloque, y cada réplica se corre en uno de
los bloques. Las corridas de cada bloque (o réplica) se harían de manera aleatoria. El análisis del diseño
Tabla 7·1 Experimento del proceso químico en tres bloques

Bloque 1 Bloque 2 Bloque 3
(1)=28 (1)=25 (1)=27
a = 36 a = 32 a = 32
b = 18 =
b 19 b = 23
ab = 31 ab == 30 ab = 29
Tutales de los bloques
287
288 CAPÍTULO 7 FORMACIÓN DE BLOQUES Y CONFUSIÓN EN EL DISEÑO FACTORIAL z•
Tabla 7·2 Análisis de varianza del experimento del proceso químico en tres bloques
Bloques uo 2 3~
A (concentración) 208.33 1 208.33 50.32 0.0004
B (catalizador) ~ro 1 ~m 18.12 0.0053
AB 8.33 1 8.33 2.01 0.2060
Error 24.84 6 4.14
Tutal 323.00 11
es similar al de cualquier experimento factorial separado en bloques; por ejemplo, véase la revisión de la
sección 56.
EJEMPLO 7 -1 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Considere el experimento del proceso químico que se describió en la sección 62. Suponga que sólo pue
den hacerse cuatro ensayos experimentales con un solo lote de materia prima. Por lo tanto, se necesitarán
tres lotes de materia prima para correr las tres réplicas de este diseño. En la tabla 71 se muestra el diseño
donde cada lote de materia prima corresponde a un bloque.
En la tabla 72 se muestra el análisis de varianza de este diseño separado en bloques. Todas las sumas
de cuadrados se calculan exactamente igual que en un diseño 2k estándar sin formación de bloques. La
suma de cuadrados de los bloques se calcula a partir de los totales de los bloques. Sea que B¡, B2 y B3 re
presenten los totales de los bloques (ver la tabla 71). Entonces
B2
¡ ~Z
. 3 2
SSBloques =L
/;l
= (113)2 +(106)2 +(111)2 (330)2

4 12
=6.50
Hay dos grados de libertad entre los tres bloques. La tabla 72 indica que las conclusiones de este análisis,
si el diseño se hubiera corrido en bloques, son idénticas a las de la sección 62 y que el efecto de los blo
...................................................•
ques es relativamente pequeño .
. .
73 CONFUSIÓN DEL DISEÑO FACTORIAL 2k
Hay muchos problemas en los que es imposible realizar una réplica completa de un diseño factorial en un
bloque. La confusión (o mezclado) es una técnica de diseño mediante la cual un experimento factorial
completo se distribuye en bloques, donde el tamaño del bloque es menor que el número de combinacio
nes de los tratamientos de una réplica. La técnica hace que la información acerca de ciertos efectos de los
tratamientos (por lo general las interacciones de orden superior) sea indistinguible de los bloques o esté
confundida con los bloques. En este capítulo la atención se centra en los sistemas de confusión (o mezcla
do) para el diseño factorial 2k. Observe que aun cuando los diseños que se presentan son diseños de blo
ques incompletos, ya que cada bloque no contiene todos los tratamientos o las combinaciones de los
tratamientos, la estructura especial del sistema factorial 2k permite un método de análisis simplificado.
Se considera la construcción y el análisis del diseño factorial 2k en 2!' bloques incompletos, donde
p < k. Por consiguiente, estos diseños pueden correrse en dos bloques, en cuatro bloques, en ocho blo
ques, etcétera.
7.4 CONFUSIÓN DEL DISEÑO FACTORIAL 2k EN DOS BLOQUES 289
7 ..4 CONFUSIÓN DEL DISEÑO FACTORIAL l" EN DOS BLOQUES

Suponga que quiere correrse una sola réplica del diseño 22• Cada una de las 22 = 4 combinaciones de los
tratamientos requiere una cantidad de materia prima, por ejemplo, y cada lote de materia prima sólo al
canza para probar dos combinaciones de tratamientos. Por lo tanto, se necesitan dos lotes de materia pri
ma. Si los lotes de materia prima se consideran como bloques, entonces deben asignarse a cada bloque
dos de las cuatro combinaciones de tratamientos.
En la figura 71 se muestra lllDO de los diseños posibles para este problema. La vista geométrica, figu
ra 7 la, indica que las combinaciones de tratamientos localizadas en diagonales opuestas se asignan a blo
ques diferentes. Observe, por la figura 7lb, que el bloque 1 contiene las combinaciones de los
tratamientos (1) y ab y que el bloque 2 contiene a y b. Desde luego, el orden en que se corren las combina
ciones de los tratamientos dentro de un bloque se determina aleatoriamente. También se decidirá aleato
riamente cuál de los bloques se correrá primero. Suponga que los efectos principales deA y B se estiman
como si no se hubiera hecho la formación de bloques. Por las ecuaciones 61 y 62 se obtiene
A= t(ab+a-b-(1)]
B= t(ab+b-a-(1)]
Observe que ni A ni B son afectados por la formación de bloques, debido a que en cada estimación hay
una combinación de un tratamiento positivo y uno negativo de cada bloque. Es decir, cualquier diferencia
entre el bloque 1 y el bloque 2 se cancela.
Considere ahora la interacción AB
AB= t(ab+(l)-a-b]
Puesto que las dos combinaciones de tratamientos con signo positivo [ab y (1)] están en el bloque 1 y las
dos con signo negativo (a y b) están en el bloque 2, el efecto de los bloques y la interacciónAB son idénti
cos. Es decir, AB está confundido (o mezclado) con los bloques.
La razón de esto es evidente en la tabla de signos positivos y negativos del diseño 22• Se presentó origi
nalmente en la tabla 62, pero por conveniencia se repite como la tabla 73. A partir de esta tabla se observa
que todas las combinaciones de tratamientos que tienen signo positivo para AB se asignan al bloque 1,
+o·
• = Corrida en el bloque 1
B
o • Corrida en el bloque 2
+
A
al Vista geométriclil
Bloque 1 Bloque 2
~
L:J D
b) Asignación de las cuatro
corridas en dos bloques
Figura 7·1 Diseño 22 en dos bloques.

290 CAPÍTULO 7 FORMACIÓN DE BLOQUES Y CONFUSIÓN EN EL DISEÑO FACTORIAL z
Tabla 7.3 Tabla de signos positivos y negativos para el disefio 22

tratamientos I A B AB
(1) + +
a + +
b + +
ab + + + +
mientras que todas las combinaciones de tratamientos que tienen signo negativo para AB se asignan al
bloque 2. Este enfoque puede usarse para confundir o mezclar cualquier efecto (A, B o AB) con los blo
ques. Por ejemplo, si (1) y b se hubieran asignado al bloque 1 y a y ab al bloque 2, el efecto principal de A
se habría confundido con los bloques. La práctica usual es confundir la interacción de orden más alto con
los bloques.
Este esquema puede usarse para confundir o mezclar cualquier diseño 2k en dos bloques. Como un
segundo ejemplo, considere un diseño 23 que se corre en dos bloques. Suponga que se quiere confundir la
interacción de los tres factoresABC con los bloques. Por la formación de signos positivos y negativos de la
tabla 7~4, las combinaciones de tratamientos que son negativas paraABC se asignan al bloque 1 y las que
son positivas paraABC al bloque 2. El diseño resultante se muestra en la figura 72. De nueva cuenta se
resalta que las combinaciones de tratamientos dentro de un bloque se corren de manera aleatoria.
Otros métodos para construir bloques
Se cuenta con otro método para construir estos disefios. El método utiliza la combinación lineal
(71)
donde r, es el nivel del factor iésimo que aparece en una combinación de tratamientos particular y a; es el
exponente que aparece en el factor iésimo para el efecto que va a confundirse. Para el sistema 2\ se tiene
a;= O o 1 yx; =O (nivel bajo) o r, = 1 (nivel alto). Ala ecuación 71 se le llama la definición de contrastes.
Las combinaciones de tratamientos que producen el mismo valor de L (mod 2) se colocarán en el mismo
bloque. Puesto que los únicos valores posibles deL (mod 2) son Oy 1, con esto las 2k combinaciones de tra
tamientos se asignarán a exactamente dos bloques.
Tabla 7.4 Tabla de signos positivos y negativos para el disefi.o l3

tratamientos I A B AB e AC BC ABC
(1) + + + +
a + + + +
b + + + +
ab + + + +
e + + + +
ae + + + +
be + + + +
abe + + + + + + + +
74 CONFUSIÓN DEL DISEÑO FACTORIAL Zk EN DOS BLOQUES 291
• ~ Corrida en el bloque 1
O .. COrrida en el bloque 2
1
1
et¿
1
.. ..
J
A
a) Vista geométrica
Bloque 1 Bloque 2
(1) a
ab b
ac e
be abe
b) Asignación de las ocho

corridas en dos bloques
Figura 72 El disefio2' en dos bloques conABC confun

dido.
Para ilustrar este enfoque, considere un diseño 23 conABC confundido con los bloques. En este caso,
x1 corresponde aA,x2aB,x3 aCya1 = a2 = a3 =l. Porlotanto, la definición del contraste correspondien
te aABC es
L=x1 +x2 +x3
La combinación de tratamientos (1) se escribe 000 en la notación (O, 1); por ·10 tanto,
L= 1(0)+1(0)+1(0)= O= O (mod 2)
De manera similar, la combinación de tratamientos a es 100, obteniéndose
L= 1(1)+ 1(0)+ 1(0) = 1=1 (mod 2)
Por lo tanto, (1) y a se correrían en bloques diferentes. Para el resto de las combinaciones de tratamientos
se tiene ·
b: L= 1(0)+1(1)+1(0)= 1=1(mod2)
ab: L= 1(1)+1(1)+1(0)= 2= O (mod 2)
e: L= 1(0)+1(0)+1(1)= 1=1 (mod 2)
ac: L= 1(1)+1(0)+1(1)= 2= O (mod 2)
be: L= 1(0)+1(1)+1(1)= 2= O (mod 2)
abe L= 1(1)+1(1)+1(1)= 3= 1 (mod 2)
Por lo tanto, (1 ), ab, ac y be se corren en el bloque 1 y a, b, e y abe se corren en el bloque 2. Se trata del mis
mo diseño que se ilustró en la figura 72, el cual se generó con la tabla de signos positivos y negativos.
Puede usarse otro método para construir estos diseños. Al bloque que contiene la combinación de
tratamientos (1) se le llama el bloque principal.Las combinaciones de los tratamientos incluidas en este
bloque poseen una útil propiedad de la teoría de grupos; a saber, forman un grupo con respecto a la multi
292 CAPÍTULO 7 FORMACIÓN DE BLOQUES Y CONFUSIÓN EN EL DISEÑO FACTORIAL 2'
plicación módulo 2. Esto implica que cualquier elemento [con excepción de (1)] del bloque principal pue
de generarse multiplicando otros dos elementos del bloque principal módulo 2. Por ejemplo, considere el
bloque principal del diseño 23 conABC confundido, como se muestra en la figura 72. Observe que
ab ·ae= aibc =be
ab ·be = ab 2 e= ac
ae·bc= abe' = ab
Las combinaciones de tratamientos del otro bloque (o bloques) pueden generarse multiplicando uno de
los elementos del nuevo bloque por cada uno de los elementos del bloque principal módulo 2. Para el di
seño 23 conABC confundido, puesto que el bloque principal es (1 ), ab, ac y be, se sabe que b está en el otro
bloque. Por lo tanto, los elementos de este segundo bloque son
b·(l) =b
b·ab= ab? =a
b·ae =abe
b·be= b2e =e
Estos resultados concuerdan con los que se obtuvieron anteriormente.
Estimación del error
Cuando el número de variables es pequeño, por ejemplo k = 2 o 3, por lo general es necesario hacer répli
cas del experimento a fin de obtener una estimación del error. Por ejemplo, suponga que un diseño facto
rial 23 debe correrse en dos bloques con ABC confundido, y el experimentador decide hacer cuatro
réplicas del diseño. El diseño resultante podría verse CO:t\10 el de la figura 73. Observe queABC está con
fundido en cada réplica.
En la tabla 75 se muestra el análisis de varianza de este diseño. Hay 32 observaciones y 31 grados de
libertad. Además, puesto que hay ocho bloques, siete grados de libertad deben asociarse con estos blo
ques. En la tabla 75 se presenta la descomposición de esos siete grados de libertad. La suma de cuadra
dos del error se compone en realidad de las interacciones de dos factores entre las réplicas, y cada uno de
los efectos (A, B, C, AB, AC, BC). Por lo general es seguro considerar que las interacciones son cero y tra
tar el cuadrado medio resultante como una estimación del error. Los efectos principales y las interaccio
nes de dos factores se prueban contra el cuadrado medio del error. Cochran y Cox [25b] hacen notar que
el cuadrado medio del bloque oABC podría compararse con el error del cuadrado medioABC, que es en
realidad réplicas x bloques. Esta prueba suele tener una sensibilidad muy baja.
Si se cuenta con recursos suficientes para hacer réplicas de un diseño confundido, por lo general es
mejor usar un método ligeramente diferente para diseñar los bloques en cada réplica. Este enfoque con
siste en confundir un efecto diferente en cada réplica para obtener cierta información sobre todos los
Réplica l Réplica 11 Réptlcam Réplica IV
Bloque 1 Bloque2 Bloque 1 Bloque 2 Bloque 1 Bloque 2 Bloque 1 Bloque 2
(1) abe 11) abe (1) abe (1) abe

ac a ac a ac a ac a
ab b ab b ab b ab b
be e be e be e be e
Figura 7.3 Cuatro réplicas del diseño 23 con ABC confundido.

74 CONFUSIÓN DEL DISEÑO FACTORIAL Zl EN 005 BLOQUES 293
Tabla 75 Análisis de varianza de cuatro réplicas de un

disefio 23 con ABC confundido
Grados de
Fuente de variación libertad
Réplicas 3
Bloques (ABC) 1
Error deABC (réplicas x bloques) 3
A .1
B 1
e 1
AB 1
AC 1
BC 1
Error (o réplicas x efectos) 18
Total 31
efectos. A este procedimiento se le llama confusión (o mezclado) parcial, y se estudia en la sección 77. Si
k es moderadamente grande, por ejemplo k ~ 4, con frecuencia sólo es posible hacer una réplica. El expe
rimentador suele suponer que las interacciones de órdenes superiores son insignificantes y combina sus
sumas de cuadrados como el error. La gráfica de probabilidad normal de los efectos de los factores puede
ser muy útil a este respecto.
EJEMPLO 7 -2 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Considere la situación descrita en el ejemplo 62. Recuerde que se estudian cuatro factoresla tempera
tura (A), la presión (B), la concentración de formaldehído (C) y la velocidad de agitación (D}- en una
planta piloto para determinar su efecto sobre el índice de filtración del producto. Se usará este experi
mento para ilustrar las ideas de la formación de bloques y la confusión en un diseño no replicado. Se in
troducirán dos modificaciones al experimento original. Primera, suponga que no es posible correr las
24 = 16 combinaciones de tratamientos utilizando un solo lote de materia prima. El experimentador
puede correr ocho combinaciones de los tratamientos con un solo lote de material, por lo que un diseño
24 confundido en dos bloques parece apropiado. Es lógico confundir la interacción de orden más alto
ABCD con los bloques. La definición del contraste es
y es sencillo verificar que el diseño es como el que se ilustra en la figura 74. De manera alternativa, puede
examinarse la tabla 612 y observar que las combinaciones de los tratamientos que son + en la columna
ABCD se asignan al bloque 1 y que las que son en la columna ABCD, están en el bloque 2.
La segunda modificación que se hará es introducir un efecto de los bloques para que pueda demos
trarse la utilidad de la formación de bloques. Suponga que cuando se seleccionan los dos lotes de materia
prima que se necesitan para correr el experimento, uno de ellos es de calidad mucho más baja y, como re
sultado, todas las respuestas serán 20 unidades menores en este lote de material que en el otro. El lote de
calidad menor se convierte en el bloque 1 y el lote de buena calidad se convierte en el bloque 2 (no es rele
vante a cuál de los dos lotes se le llama bloque 1 o bloque 2). Entonces todas las pruebas del bloque 1 se
realizan primero (las ocho corridas del bloque se hacen, desde luego, de manera aleatoria), pero las res
puestas son 20 unidades más bajas que las que se habrían obtenido si se hubiera usado el material de bue
na calidad. En la figura 7-4b se muestran las respuestas resultantes; observe que éstas se han encontrado
294 CAPÍTULO 7 FORMACIÓN DE BLOQUES Y CONFUSIÓN EN EL DISEÑO FACTORIAL 2k
D
+
• = Corridas en el bloque 1
o Corridas en el bloque 2
el¿
A
a) Vista geométrica
Bloque 1 Bloque2
(1) "'25 a71

ab~45 b,.48
oc~40 c-68
bc~60 d~43
ad .. so abe =66
bd<>25 bcd=70
cd55 acd=86
abcd-76 abd » 104
b) Asignación de las 16 corridas

en los dos bloqullS
Figura 74 El diseño 2• en dos bloques para el ejemplo 72.
restando el efecto del bloque de las observaciones originales dadas en el ejemplo 62. Es decir, la respues
ta original de la combinación de tratamientos (1) fue 45, y en la figura 74b se consigna como (1) = 25 ( =
45 20). Las demás respuestas de este bloque se obtienen de manera similar. Después de que se realizan
las pruebas del bloque 1, se prosigue con las ocho pruebas del bloque 2. No hay ningún problema con la
materia prima de este lote, por lo que las respuestas son exactamente como fueron originalmente en el
ejemplo 62.
En la tabla 76 se muestran las estimaciones de los efectos para esta versión "modificada" del ejemplo
62. Observe que las estimaciones de los cuatro efectos principales, de las seis interacciones de dos facto
res y de las cuatro interacciones de tres factores son idénticas a las estimaciones de los efectos obtenidas
en el ejemplo 62, donde no hubo ningún efecto de bloques. Cuando se construye una gráfica de probabili
dad normal de estas estimaciones de los efectos, los factoresA, C, D y las interaccionesAC y AD aparecen
como los efectos importantes, justo como en el experimento original. (El lector deberá verificar esto.)
lQué puede decirse del efecto de la interacción ABCD? La estimación de este efecto en el experi
mento original (ejemplo 62) fueABCD = 1.375. En el presente ejemplo, la estimación del efecto de la in
=
teracción AH CD esABCD 18.625. Puesto queABCD está confundido con los bloques, la interacción
ABCD estima el efecto de la interacción original (1.375) más el efecto de bloque (20), de dondeABCD =
1.375 + (20) = 18.625. ( lPuede el lector ver por qué el efecto del bloque es 20?) El efecto del bloque
7 4 CONFUSIÓN DEL DISEÑO FACTORIAL 2• EN DOS BLOQUES 295
Tabla 76 Estimaciones de los efectos para el diseño 24 separado en bloques del
ejemplo 7Z
Término del Coeficiente Estimación Suma de Contribución
modelo de regresión · del efecto cuadrados porcentual
A 10.81 21.625 1870.5625 26.30
B 1.56 3.125 39.0625 0.55
e 4.94 9.875 390.0625 5.49
D 7.31 14.625 855.5625 12.03
AB 0.062 0.125 0.0625 <0.01
AC 9.06 18.125 1314.0625 18.48
AD 8.31 16.625 1105.5625 15.55
BC 1.19 2.375 22.5625 0.32
BD 0.19 0.375 0.5625 <0.01
CD 0.56 1.125 5.0625 0.07
ABC 0.94 1.875 14.0625 0.20
ABD 2.06 4.125 68.0625 0.96
ACD 0.81 1.625 10.5625 0.15
BCD 1.31 2.625 27.5625 0.39
Bloques (ABCD) 18.625 1387.5625 19.51
también puede calcularse directamente como la diferencia en la respuesta promedio entre los dos blo
ques, o
Efecto del bloque = Y111oquo 1 YBioque 2
406 555
=
8 8
149
=
8
= 18.625
Desde luego, este efecto es en realidad la estimación de Bloques + ABCD.

En la tabla 77 se resume el análisis de varianza de este experimento. Los efectos que tienen estima
ciones grandes están incluidos en el modelo, y la suma de cuadrados de los bloques es
SS
Bloques
= (406) 2 +(555)2
8
~!)
(9 2 = 1387.5625
Tabla 7.7 Análisis de varianza del ejemplo 7 • 2

Bloques (ABCD) 1387.5625 1
A 1870.5625 1 1870.5625 89.76 <0.0001
e 390.0625 1 390.0625 18.72 0.0019
D 855.5625 1 855.5625 41.05 0.0001
AC 1314.0625 1 1314.0625 63.05 <0.0001
AD 1105.5625 1 1105.5625 53.05 <0.0001
Error 187.5625 9 20.8403
Thtal 7111.4375 15
· ·······
296 CAPÍTULO 7 FORMACIÓN DE BLOQUES Y CONFUSIÓN EN EL DISEÑO FACTORIAL z•

Las conclusiones de este experimento coinciden exactamente con las del ejemplo 62, donde no estuvo
presente ningún efecto de bloques. Observe que si el experimento no se hubiera corrido en bloques, y si
un efecto de magnitud20 hubiera afectado los 8 primeros ensayos (los cuales se habrían seleccionado de
manera aleatoria, ya que los 16 ensayos se habrían corrido en orden aleatorio en un diseño sin formación
de bloques), los resultados pudieron haber sido muy diferentes.
75 CONFUSIÓN DEL DISEÑO FACTORIAL 2k EN CUATRO BLOQUES

Es posible construir diseños factoriales 2k confundidos en cuatro bloques con 2k - 2 observaciones cada
uno. Estos diseños son particularmente útiles en situaciones en las que el número de factores es modera
damente grande, por ejemplo k ~ 4, y el tamaño de los bloques es relativamente pequeño.
Como un ejemplo, considere el diseño 25• Si cada bloque incluirá únicamente ocho corridas, entonces
deberán usarse cuatro bloques. La construcción de este diseño es relativamente directa. Se seleccionan
dos efectos para confundirlos con los bloques, por ejemplo.AD E y BCE. Estos efectos tienen las dos defi
niciones de contrastes
t; =X¡ +X4 +x5
L2 = X2 +X3 +X5
asociadas con ellos. Entonces cada combinación de tratamientos producirá un par particular de valores
deL1(mod2) y L2 (mod 2), es decir, cualquiera de (L¡,L2) =(O, O), (O, 1), (1, O) o bien (1, 1). Las combina
ciones de tratamientos que producen los mismos valores de (L1, L2) se asignan al mismo bloque. En el
ejemplo tratado aquí se encuentra
L; = O, L2 = O para (1 ), ad, be, abcd, abe, ace,' cde, bde
L; = 1, L2 = O para a, d, abe, bcd, be, abde, ce, acde
4 = O, L2 = 1 para b, abd, e, acd, ae, de, abce, bcde
T
''!
=l '
L 2 =1 para e,ade,bce,abcde,ab,bd,ac,cd
Estas combinaciones de tratamientos se asignarían a bloques diferentes. En la figura 75 se muestra el di
seño completo.
Con un poco de reflexión, nos damos cuenta de que otro efecto además deADE y BCE debe confun
dirse con los bloques. Puesto que hay cuatro bloques con tres grados de libertad entre ellos, y puesto que
ADE y BCE tienen un solo grado de libertad cada una, es evidente la necesidad de confundir un efecto
adicional con un grado de libertad. Este efecto es la interacción generalizada deADE y BCE, la cual se
Bloque 1 Bloque 2 Bloque 3 Bloque 4

L, =0 L1; 1 L1 eO L1; 1
Li=º L2 =O L2 = 1 L2~1
(1) abe a be b abe e e abcde

ad ace d abde abd ae ade bd
be cde abe ce e bcde bce ac
abcd bde bcd acde acd de ab cd
Flgura 75 El diseño 25 en cuatro bloques e-0nADE,

BCE y ABCD confundidos.
76 CONFUSIÓN DEL DISEÑO FACTORIAL 2• EN 2P BLOQUES 297
define como el producto deADE y BCE módulo 2. Por lo tanto, en el ejemplo tratado aquí la interacción
generalizada (ADE)(BCE) = ABCDE2 = ABCD también está confundido con los bloques. Es sencillo ve
rificar esto refiriéndose a la tabla de signos positivos y negativos del diseño 25, como en Davies [36]. La
inspección de esta tabla revela que las combinaciones de los tratamientos se asignan a los bloques de la si
guiente manera:
Combinaciones de los
tratamíentos en el SignodeADE Signo deBCE Signo deABCD
Bloque 1 +
Bloque 2 +
Bloque 3 +
Bloque 4 + + +
Observe que el producto de los signos de dos efectos cualesquiera de un bloque particular (por ejemplo
ADE y BCE) produce el signo del otro efecto de ese bloque (en este caso, ABCD). Por lo tanto, ADE, ·
BCE y ABCD están confundidos con los bloques.
Las propiedades de la teoría de grupos del bloque principal mencionadas en la sección 74 siguen
siendo válidas. Por ejemplo, se observa que el producto de dos combinaciones de tratamientos del bloque
principal produce otro elemento del bloque principal. Es decir,
ad ·be= abcd y abe·bde = ab2de2 =ad
etcétera. Para construir otro bloque se selecciona una combinación de tratamientos que no esté en el blo
que principal (por ejemplo b), y b se multiplica por todas las combinaciones de tratamientos del bloque
principal. Se obtiene así
b·(l)= b b·ad=abd b ·abcd = abí cd = acd

etcétera, lo que producirá las ocho combinaciones de tratamientos del bloque 3. En la práctica, el bloque
principal puede obtenerse a partir de la definición de contrastes y de la propiedad de la teoría de grupos, y
los demás bloques pueden determinarse a partir de estas combinaciones de los tratamientos aplicando el
método que se presentó anteriormente.
El procedimiento general para construir un diseño 2t confundido en cuatro bloques consiste en elegir
dos efectos para generar los bloques, confundiéndose automáticamente un tercer efecto que es la interac
ción generalizada de las dos primeras. Después se construye el diseño utilizando las dos definiciones de
contrastes (L1, L2) y las propiedades de la teoría de grupos del bloque principal. Al seleccionar los efectos
que van a confundirse con los bloques, debe tenerse cuidado de obtener un diseño en el que no estén con
fundidos efectos que pueden ser de interés. Por ejemplo, en un diseño 25 podría elegirse confundir
ABCDE y ABD, con lo cual se confunde automáticamente CE, un efecto que es de posible interés. Una
mejor elección es confundir ADE y BCE, con lo cual se confunde automáticamenteABCD. Es preferible
sacrificar información en las interacciones de tres factoresADE y BCE en lugar de la interacción de dos
factores CE.
76 CONFUSIÓN DEL DISEÑO FACTORIAL 2k EN 2" BLOQUES

Los métodos descritos antes pueden extenderse a la construcción de un diseño factorial 2k confundido (o
mezclado) en 2P bloques (p < k), donde cada bloque contiene exactamente 2k-P corridas. Se seleccionanp
efectos independientes que van a confundirse, donde por "independientes" se entiende que ninguno de
los efectos elegidos es la interacción generalizada de los demás. Los bloques pueden generarse mediante
298
77 CONFUSIÓN PARCIAL 299
el uso de las p definiciones de contrastes L1, L2, ••• , LP asociadas con estos efectos. Asimismo, se confundi
rán otros 'lJ' - p 1 efectos con los bloques, siendo éstos las interacciones generalizadas de los p efectos in
dependientes elegidos inicialmente. Deberá tenerse cuidado al seleccionar los efectos que van a
confundirse para que no se sacrifique información sobre los efectos que pueden ser de interés potencial.
El análisis estadístico de estos diseños es directo. Las sumas de cuadrados de todos los efectos se
calculan como si no se hubiera hecho la formación de bloques. Después, la suma de cuadrados de los blo
ques se encuentra sumando las sumas de cuadrados de todos los efectos confundidos con los bloques.
Obviamente, la elección de los p efectos usados para generar el bloque es crítica, ya que la estructura
de la confusión (o mezclado) del diseño depende directamente de ellos. En la tabla 78 se presenta una
lista de diseños útiles. Para ilustrar el uso de esta tabla, suponga que quiere construirse un diseño 26 con
= =
fundido en 23 8 bloques con 23 8 corridas cada uno. La tabla 78 indica que se elegiríanABE.F, ABCD
yACE como los p = 3 efectos independientes para generar los bloques. Los 'lJ' - p - 1 = 23 3 1 = 4 efec
tos restantes que están confundidos son las interacciones generalizadas de estos tres; es decir,
(ABEF)(ABCD) = A2 B2CDEF= CDEF
(ABEF)(ACE) =A 2 BCE2 F= BCF
( ABCD)( ACE) =A 2
BC2 ED = BDE
(ABEF)(ABCD)(ACE) =A 3 B2C2 DE2 F= ADF
En el problema 711 se le pide al lector que genere los ocho bloques de este diseño.
7 .. 7 CONFUSIÓN PARCIAL
En la sección 74 se subrayó que, a menos que los experimentadores cuenten con una estimación previa
del error o que estén dispuestos a suponer que ciertas interacciones son insignificantes, deben hacer ré
plicas del diseño para obtener una estimación del error. En la figura 73 se muestra un diseño factorial 23
en dos bloques conABC confundido, con cuatro réplicas. Por el análisis de varianza de este diseño, el cual
se presenta en la tabla 75, se observa que no puede sacarse información acerca de la interacciónABC de
bido a queABC está confundido con los bloques en todas las réplicas. Se dice que este diseño está comple
tamente confundido (o mezclado).
Considere la alternativa que se presenta en la figura 76. De nueva cuenta hay cuatro réplicas del di
seño 23, pero en cada réplica se ha confundido una interacción diferente. Es decir,ABC está confundido en
la réplica I,AB está confundido en la réplica 11, BC está confundido en la réplica 111 y AC está confundido
en la réplica IV. Como resultado puede obtenerse información deABC a partir de los datos de las.réplicas
11, 111 y IV; información deAB puede obtenerse de las réplicas I, lli y IV; información deAC puede obte
Réplica! Réplica n Réplicam Réplic¡iN

ABC Confundido AB Confundido BC Confundido AC Confundido
(1) a m a (1) b 111 a

ab b e b a e b e
ac e ab ac be ab ac ab
be abe abe be abe abe be
Figura 76 Confusión parcial en el diseño 23•

300 CAPÍTULO 7 FORMACIÓN DE BLOQUES Y CONFUSIÓN EN EL DISEÑO FACTORIAL Zk
Tubla 7.9 Análisis de varianza de un disefio Z3 parcialmente confundido

Grados de
Réplicas 3
Bloques dentro de réplicas [oABC (rép. 1) + AB (rép. 11)
+ BC (rép, III) + AC (rép. IV)] 4
A 1
B 1
e 1
AB (de las réplicas 1, III y IV) 1
A C (de las réplicas 1, 11 y III) 1
BC (de las réplicas 1, 11 y IV) 1
ABC (de las réplicas 1, III y IV) 1
Error 17
Tutal 31
nerse de las réplicas I, 11y111; e información de BC puede obtenerse de las réplicas I, 11 y IV. Se dice que
pueden obtenerse tres cuartas partes de la información de las interacciones porque no están confundidas
en sólo tres réplicas. Yates [113bJ llama a la relación 3/4 la información relativa de los efectos confundi
dos. Se dice que este diseño está parcialmente confundido (o mezclado).
En la tabla 79 se muestra el análisis de varianza de este diseño. Para calcular las sumas de cuadrados
de las interacciones, sólo se usan los datos de las réplicas en las que no está confundida una interacción.
La suma de cuadrados del error consta de las sumas de cuadrados de réplicas x sumas de cuadrados de
efecto principal, más las sumas de cuadrados de réplicas x sumas de cuadrados de interacción para cada
réplica en la que esa interacción no está confundida (por ejemplo, réplicas x ABC para las réplicas 11, III
y IV). Además, hay siete grados de libertad entre los ocho bloques. Es común hacer la partición de tres
grados de libertad para las réplicas y cuatro grados de libertad para los bloques dentro de las réplicas. La
composición de la suma de cuadrados de los bloques se muestra en la tabla 79 y se sigile directamente de
la elección del efecto confundido en cada réplica.
'Ej'EMPLO 7 -3 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Un diseño V con confusión parcial
Considere el ejemplo 61, en el que se realizó un estudio para determinar el efecto del porcentaje de car
bonatación (A), la presión de operación (B) y la velocidad de línea (C) sobre la altura de llenado de una
bebida carbonatada. Suponga que cada lote de jarabe alcanza sólo para probar cuatro combinaciones de
tratamientos. Por lo tanto, cada réplica del diseño 23 debe correrse en dos bloques. Se corren dos réplicas,
con ABC confundido en la réplica 1 y AB confundido en la réplica 11. Los datos son los siguientes:
Réplica I Réplica 11
ABC confundido AB confundido
(1) = 3 a= O (1) = 1 a =1
ab= 2 b=1 e= O b=O
ac= 2 c=1 ab= 3 ac=l
be= 1 abe= 6 abe= 5 be= 1
78 PROBLEMAS 301
Tabla 7.10 Análisis de varianza del ejemplo 73
Réplicas 1.00 1 1.00
Bloques dentro de las réplicas 2.50 2 1.25
A •36.00 1 36.00 48.00 0.0001
B 20.25 1 20.25 27.00 0.0035
e 12.25 1 12.25 16.33 0.0099
AB (sólo en la réplica 1) 0.50 1 0.50 0.67 0.4503
AC 0.25 1 0.25 0.33 0.5905
BC 1.00 1 1.00 1.33 0.3009
ABC (sólo en la réplica 11) 0.50 1 0.50 0.67 0.4503
Error 3.75 5 0.75
Tu tal 78.00 15
Las sumas de cuadrados de A, B, C, AC y BC pueden calcularse de la manera usual, utilizando las 16

observaciones. Sin embargo, SSABc debe encontrarse utilizando únicamente los datos de la réplica 11 y
SSAB utilizando únicamente los datos de la réplica 1 de la siguiente manera:
SS = [a+b+c+abc-ab-ac-bc-(1))2
ABC n2'''
[1 +0+0+5311(1))2
= (1)(8) =o.so
S = [(l)+abc-ac+c-a-b+ab-bc]2
AB n2.t
= [3+62+(1)0(1)+21]2 =o.so
(1 )(8)
La suma de cuadrados de las réplicas es, en general,
R2 y2
L
n
SSRep = 2:
~=l
N
= (6)2 +(10)2 (16)2 = 1 00
8 16 .
donde R11 es el total de las observacionesen la réplica hésima. La suma de cuadrados de los bloques es la
suma de SSABc de la réplica 1 y SSAB de la réplica 11, o SSmaqn•• = 2.50.
En la tabla 710se resume el análisis de varianza. Los tres efectos principales son importantes .
... .., .
7 .. 5 PROBLEMAS
71. Considere el experimento descrito en el problema 61. Analizar este experimento suponiendo que cada ré
plica representa un bloque de un solo turno de producción.
72. Considere el experimento descrito en el problema 65. Analizar este experimento suponiendo que cada una
de las cuatro réplicas representa un bloque.
73. Considere el experimento de la formación de fisuras en la aleación de níquel y titanio descrito en el problema
615. Suponga que sólo pudieron hacerse 16 corridas en un solo día, por lo que cada réplica se trató como un
bloque. Analizar el experimento y sacar conclusiones.
302 CAPÍTULO 7 FORMACIÓN DE BLOQUES Y CONFUSIÓN EN EL DISEÑO FACTORIAL »
74. Considere los datos de la primera réplica del problema 61.Suponga que no fue posible correr todas estas ob
servaciones utilizando barras del mismo lote. Establecer un diseño para correr estas observaciones en dos
bloques de cuatro observaciones cada uno con ABC confundido. Analizar los datos.
75. Considere los datos de la primera réplica del problema 67. Construir un diseño con dos bloques de ocho ob
servaciones cada uno con ABCD confundido. Analizar los datos.
76. Repetir el problema 75 suponiendo que se requieren cuatro bloques. ConfundirABD y ABC (y por consi
guiente CD) con los bloques.
77. Utilizando los datos del diseño 2s del problema 621, construir y analizar un diseño en dos bloques con
ABCDE confundido con los bloques.
78. Repetir el problema 77 suponiendo que se necesitan cuatro bloques. Sugerir un esquema de confusión (o
mezclado) razonable.
79. Considere los datos del diseño 25 del problema 621.Suponga que fue necesario correr este diseño en cuatro
bloques con ACDE y BCD (y por consiguienteABE) confundidos. Analizar los datos de este diseño.
710. Diseñar un experimento para confundir un diseño factorial 26 en cuatro bloques. Sugerir un esquema de con
fusión apropiado, diferente del que se ilustró en la tabla 78.
711. Considere el diseño 26 en ocho bloques con ocho corridas cada uno conABCD,ACE yABEF como los efec
tos independientes elegidospara confundirloscon los bloques. Generar el diseño. Encontrar los demás efec
tos confundidos con los bloques.
712. Considere el diseño Z2 en dos bloques conAB confundido. Hacer la demostración algebraica de que SSAB =
SSBloquer
713. Considere los datos del ejemplo 72.Supongaque todas las observacionesdel bloque 2 se incrementan en 20.
Analizar los datos que resultarían. Estimar el efecto de bloque. lPuede el lector explicarsu magnitud? lLos
bloques parecen ser ahora un factor importante? lHay otras estimacionesde los efectos que sufran el impac
to de este cambio hecho en los datos?
714. Suponga que en el problema 61 se confundióABC en la réplica l,AB en la réplica 11 y BC en la réplica III.
Calcular las estimaciones de los efectos. Construir la tabla del análisis de varianza.
715. Repetir el problema 61 suponiendo que ABC se confundió con los bloques en todas las réplicas.
716. Suponga que en el problema 67 ABCD se confundió en la réplica 1 yABC se confundió en la réplica 11. Reali
zar el análisis estadístico de este diseño,
717. Construir un diseño 23 conABC confundido en las dos primeras réplicas y BC confundido en la tercera répli
ca. Delinear el análisis de varianza y comentar la información obtenida.
Diseños factoriales
fraccionados de dos niveles
s. 1 INTRODUCCIÓN
Cuando el número de factores de un diseño factorial 2k se incrementa, el número de corridas necesarias

para realizar una réplica completa del diseño rebasa con rapidez los recursos de la mayoría de los experí
mentadores. Por ejemplo, una réplica completa de un diseño 26 requiere 64 corridas. En este diseño, sólo
6 de los 63 grados de libertad corresponden a los efectos principales, y sólo 15 a las interacciones de dos
factores. Los 42 grados de libertad restantes se asocian con las interacciones de tres o más factores.
Si el experimentador puede suponer razonablemente que ciertas interacciones de orden superior son
insignificantes, es posible obtener información de los efectos principales y las interacciones de orden infe
rior corriendo únicamente una fracción del experimento factorial completo. Estos diseños factoriales
fraccionados se encuentran entre los tipos de diseños de uso más generalizado en el diseño de productos y
procesos y en el mejoramiento de procesos. ·
Una de las principales aplicaciones de los diseños factoriales fraccionados es en los experimentos de
tamizado o exploración. Se trata de experimentos en los que se consideran muchos factores y el objetivo
es identificar aquellos factores (en caso de haberlos) que tienen efectos grandes. Los experimentos de ta
mizado suelen realizarse en las etapas iniciales de un proyecto, cuando es posible que muchos de los fac
tores considerados en un principio tengan un efecto reducido o nulo sobre la respuesta. Entonces los
factores que se identifican como importantes se investigan con mayor detalle en experimentos subsecuentes.
El uso exitoso de los diseños factoriales fraccionados se basa en tres ideas clave:
l. El principio tú efectos esparcidos o escasez de efectos. Cuando hay varias variables, es posible que el
sistema o proceso esté dominado principalmente por algunos de los efectos principales y las in
teracciones de orden inferior.
2. La propiedad tú proyección. Los diseños factoriales fraccionados pueden proyectarse en diseños
más fuertes (más grandes) en el subconjunto de los factores significativos.
3. Experimentación secuencial. Es posible combinar las corridas de dos (o más) diseños factoriales
fraccionados para ensamblar secuencialmente un diseño más grande para estimar los efectos de
los factores y las interacciones de interés.
303
304 CAPÍTIJLO 8 DISEÑOS FACTORIALES FRACCIONAOOS DE DOS NNELES
Este capítulo se enfoca en estos principios, los cuales se ilustran con varios ejemplos.
s. 2 LA FRACCIÓN UN MEDIO DEL DISEÑO 2"
Considere una situación en la que tres factores, cada uno con dos niveles, son de interés, pero los experi
=
mentadores no están en posición de correr las 23 8 combinaciones de tratamientos. Sin embargo, pue
den llevar a cabo cuatro corridas. Esto sugiere una fracción un medio de un diseño 23• Puesto que el
=
diseño contiene 23.1 4 combinaciones de tratamientos, es común llamar diseño 23 1 a una fracción un
medio del diseño 23•
En la tabla 81 se muestra la agrupación de signos positivos y negativos del diseño 23• Suponga que se
seleccionan las cuatro combinaciones de tratamientos a, b, e y abecomo la fracción un medio con la que se
trabajará. Estas corridas se muestran en la parte superior de la tabla 81 y en la figura 8la.
Observe que el diseño 23.1 se forma seleccionando sólo las combinaciones de tratamientos que tienen
signo positivo en la columnaABC. Por lo tanto, aABC se le llama el generador de esta fracción particular.
En ocasiones se hará referencia a un generador, por ejemploABC, como una palabra. Además, la colum
na identidad I también es siempre positiva, por lo que a
l=ABC
se le llama la relación de definición del diseño. En general, la relación de definición de un diseño factorial
fraccionado será siempre el conjunto de todas las columnas que son iguales a la columna identidad I,
Las combinaciones de tratamientos del diseño 23.1 producen tres grados de libertad que pueden usar
se para estimar los efectos principales. Con referencia a la tabla 81, se observa que las combinaciones li
neales de las observaciones usadas para estimar los efectos principales de A, B y C son
LA =t(a-b-c+abc)
l8 = t(-a+b-c+abc)
fe= t(-a-b+c+abc)
También es sencilJo verificar que las combinaciones lineales de las observaciones usadas para estimar las
interacciones de dos factores son
l se= t(a-b-c+abc)
l AC = t(-a+b-c+abc)
lAB =t(-a-b+c+abc)
Tabla 81 Signos positivos y negativos del diseño factorial Z1

tratamientos I A B e AB AC BC ABC
a + + + +
b + + + +
e + + + +
abe + + + + + + + +
ab + + + +
ac + + + +
be + + + +
(1) + + + +
82 LA FRACCIÓN UN MEDIO DEL DISEÑO 2k 305
1
1
1
.....~
.....
el¿
.....
a
alla fracción principal,/• +ABC A
be
1
1
1
.....
..... ..... ' ab
(1)
b) La fracción alterna, I - -ABC
Figura 8·1 Las dos fracciones un medio del di

seño 2'.
Por lo tanto, fA = fBc• fB= fAc y fe = fAB; por consiguiente, es imposible diferenciar entre A y BC, entre By
AC y entre C y AB. De hecho, cuando se estimanA, By C, se están estimando en realidad A + BC, B + AC
y C + AB. A dos o más efectos que tienen esta propiedad se les llama alias. En el ejemplo tratado aquí,A y
BC son alias, By AC son alias y C y AB son alias. Esto se indica con la notación LA -+A + BC, LB-+ B + AC y
fe-+ C + .AB.
La estructura de los alias para este diseño puede determinarse con facilidad utilizando la relación de
=
definición I ABC. Al multiplicar cualquier columna (o efecto) por la relación de definición se obtienen
los alias de esa columna (o efecto). En el ejemplo tratado aquí se encuentra que el alias de A es
A·I= A·ABC= A2BC
o, puesto que el cuadrado de cualquier columna es la identidad I,
A=BC
De manera similar, se encuentra que los alias de B y C son
B·l=B·ABC
B=AB2C=AC
y
C·I=C·ABC
C=ABC2 =AB
A esta fracción un medio, con I =
+ABC, suele llamársele la fracción principal.
Suponga ahora que se eligió la otra fracción un medio, es decir, las combinaciones de tratamientos de
la tabla 81 asociadas con los signos negativos de la columnaABC. Esta fracción un medio alterna o com
306 CAPÍ11JLO 8 DISEÑOS FACTORIALESFRACCIONAOOS DE OOS NIVELES
plementaria (la cual se compone de las corridas (1), ab, ac y be) se ilustra en la figura 8lb. La relación de
definición de este diseño es
I=-ABC
De la combinación lineal de fas observaciones, por ejemplo f' A• R.' By l' 0 de la fracción alterna se obtiene
c. -A-BC
l~ -+B-AC
f.~ -+C-AB
Por lo tanto, cuando se estiman A, B y C con esta fracción particular, en realidad se están estimando
A-BC, B-AC y C-AB.
En la práctica, no importa cuál de las fracciones se usa. Ambas fracciones pertenecen a la misma fa
milia; es decir, las dos fracciones un medio forman un diseño 23 completo. Esto puede observarse con fa
cilidad con referencia a los incisos a y b de la figura 81.
Suponga que después de correr una de las fracciones un medio del diseño 23, también se corrió la
otra. Por lo tanto, se cuenta ahora con las ocho corridas asociadas con el diseño 23 completo. Pueden ob
tenerse entonces las estimaciones sin alias de todos los efectos analizando las ocho corridas como un dise
ño 23 completo en dos bloques de cuatro corridas cada uno. Esto también podría hacerse sumando y
restando la combinación lineal de los efectos de las dos fracciones individuales. Por ejemplo, considere
lA-+ A + BC y l'A -+A - BC. Esto implica que
i(lA +l~)= t(A+BC+A-BC)-+ A
y que
t(lA -f~)=t(A+BC-A+BC)-+BC
Por lo tanto, para los tres pares de combinaciones lineales se obtendría lo siguiente:
A A BC
B B AC
e e AB
Resolución del diseño

Al diseño 231 precedente se le llama diseño de resolución m. En este diseño, los efectos principales son
alias de las interacciones de dos factores. Un disefio es de resolución R cuando ningún efecto del factor p
es alias de otro efecto que contiene menos de R -p factores. Por lo general se emplea un subíndice con un
numeral romano para denotar la resolución del diseño; por lo tanto, la fracción un medio del diseño 23
con la relación de definición I = ABC (o I = -ABC) es un diseño 2¡1¡1•
Los diseños de resolución 111, IV y V son particularmente importantes. A continuación se presentan
las definiciones de estos diseños y un ejemplo de cada uno:
l. Diseños de resolución m. Se trata de diseños en los que ninguno de los efectos principales es alias
de ningún otro efecto principal, pero los efectos principales son alias de las interacciones de dos
factores, y algunas de las interacciones de dos factores pueden ser alias entre sí. El diseño 231 de
la tabla 81 es un diseño de resolución m (2~1).
2. Diseños de resoluci6n W.Se trata de diseñ.os en los que ninguno de los efectos principales es alias
de ningún otro efecto principal ni de las interacciones de dos factores, pero las interacciones de
82 LA FRACCIÓN UN MEDIO DEL DISEÑO z~ 307
dos factores son alias entre sí. Un diseño 241 con I = ABCD es un diseño de resolución IV
c2:;•).
3. Diseños de resolución V. Se trata de diseños en los que ninguno de los efectos principales ni de las
interacciones de dos factores son alias de otro efecto principal o interacción de dos factores, pero
las interacciones de dos factores son alias de las interacciones de tres factores. Un diseño 251 con
I = ABCDE es un diseño de resolución V (2~i).
En general, la resolución de un diseño factorial fraccionado de dos niveles es igual al menor número
de letras en cualquier palabra de la relación de definición. Por consiguiente, los diseños precedentes po
drían denominarse diseños de tres, cuatro y cinco letras, respectivamente. Por lo común, es preferible em
plear diseños fraccionados que tengan la resolución más alta posible que sea consistente con el grado de
fraccionamiento requerido. Entre más alta sea la resolución, menos restrictivos serán los supuestos que
se requieren respecto de cuáles de las interacciones son insignificantes para obtener una interpretación
única de los datos.
Construcción de fracciones un medio
Una fracción un medio del diseño 2k de la resolución más alta puede construirse apuntando el diseño bá
sico, que consta de las corridas de un diseño factorial 2t1 completo, y agregándole después el factor kési
mo identificando sus niveles positivo y negativo con los signos positivo y negativo de la interacciónABC ···
(K 1) del orden más alto. Por lo tanto, el diseño factorial fraccionado 2~~1 se obtiene apuntando el dise
ño 22 completo como diseño básico e igualando después el factor C con la interacciónAB. La fracción al
terna se obtendría igualando el factor C con la interacción -AB. Este enfoque se ilustra en la tabla 82.
Observe que el diseño básico siempre tiene el número correcto de corridas (renglones), pero le falta una
=
columna. El generador I ABC ··· K se resuelve entonces para la columna faltante (K), de tal modo que K
= ABC ··· (K - 1) define el producto de los signos positivos y negativos que deberá usarse en cada renglón
para producir los niveles del factor késimo.
Observe que podría usarse cualquier efecto de interacción para generar la columna del factor kési
mo. Sin embargo, al utilizarse cualquier efecto que no seaABC ··· (K1 ), no se producirá el diseño con la
resolución más alta posible.
Otra forma de visualizar la construcción de una fracción un medio es mediante la partición de las co
rridas en dos bloques con la interacción de orden más alto ABC ··· K confundida. Cada bloque es un dise
ño factorial fraccionado 2tt con la resolución más alta.
Proyección de fracciones en diseños factoriales
Cualquier diseño factorial fraccionado de resolución R contiene diseños factoriales completos (posible
mente diseños factoriales con réplicas) en cualquier subconjunto de R - 1 factores. Éste es un concepto
importante y útil. Por ejemplo, si un experimentador tiene varios factores de interés potencial pero piensa
Tabla 82 Las dos fracciones un medio del diseño Z3

Diseño factorial
22completo
(diseño
básico) 2~',I=ABC 2~1,I=-ABC
Corrida A B A B C=AB A B C=-AB
1 +
2 + + + +
l + + + +
4 + + + + + + +
308 CAPÍTULO 8 DISEÑOS FACTORIALESFRACCIONAOOS DE DOS NIVELES
•s
1
1 / /
1 // /
1 / 1/
~::::::~- ~l~ ~!~-~

lh=-~z== 7 r 1
.: v
/ e 1 1 1
/ 1 1 1 1
Y
Figura 82 Proyecciónde un diseño
2~1 en tres diseños22•
que sólo R - 1 de ellos tienen efectos importantes, entonces un diseño factorial fraccionado de resolución
R es la elección de diseño apropiada. Si el experimentador está en lo correcto, el diseño factorial fraccio
nado de resolución R se proyectará en un diseño factorial completo en los R - 1 factores significativos.
Este proceso se ilustra en la figura 82 para el diseño 2~1, el cual se proyecta en un diseño 22 en cada sub
conjunto de dos factores.
Puesto que la máxima resolución posible de una fracción un medio del diseño 21c es R = k, todos los di
seños 2ki se proyectarán en un factorial completo en (k1) cualquiera de los k factores originales. Además,
un diseño 2ki puede proyectarse en dos réplicas de un factorial completo en cualquier subconjunto de k- 2
factores, cuatro réplicas de un factorial completo en cualquier subconjunto de k- 3 factores, etcétera.
EJEMPLO 8-1 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · • · • · · · · · · · • · · · · · · · · · · · · · · · ·
Considere el experimento del índice de filtración del ejemplo 62. El diseño original, ilustrado en la tabla
610, es una sola réplica del diseño 24• En ese ejemplo se encontró que los efectos principales de A, C y D y
las interaccionesAC y AD eran diferentes de cero. Se retoma ahora este experimento y se simula lo que
habría ocurrido si se hubiera corrido una fracción un medio del diseño 24 en vez del diseño factorial com
pleto.
Se usará el diseño 241 con! =ABCD, ya que esta elección del generador dará como resultado un di
seño con la resolución más alta posible (IV). Para construir el diseño, primero se apunta el diseño básico,
el cual es un diseño 23, como se muestra en las tres primeras columnas de la tabla 83. Este diseño básico
tiene el número necesario de corridas (ocho) pero sólo tres columnas (factores). Para encontrar los nive
les del cuarto factor, se resuelve! =ABCD paraD, oD =ABC. Por lo tanto, el nivel deD de cada corrida
Tabla 83 El diseñ.o2t1 con la relación de definición I =ABCD

Diseño básico Combinación de índice de
Corrida A B e D =ABC tratamientos filtración
1 (1) 45
2 + + ad 100
3 + + bd 45
4 + + ab 65
5 + + cd 75
6 + + ac 60
7 + + be 80
8 + + + + abcd 96
B·Z lA FRACCIÓN UN MEDIO DEL DISEÑO z~ 309
D
1 1
1
, _
1
1 1
,,,. ,,,. ob=65 ,,,.

bd~45~
,,,. ,,,. ,,,.
(1) =45 ad100
Figura 8~3 El diseño 2~1 para el experimento del índice de filtración del ejemplo B·l.
es el producto de los signos positivos y negativos de las columnasA, By C. El proceso se ilustra en la tabla
83. Puesto que el generador ABCD es positivo, este diseño 2~1 es la fracción principal. El diseño se ilus
tra gráficamente en la figura 83.
Utilizando la relación de definición, se observa que cada uno de los efectos principales es alias de una
interaccióndetresfactores;esdecir,A =A2BCD =BCD,B =AB2CD =ACD,C =ABC2D =ABDyD =
ABCD2 = ABC. Además, cada interacción de dos factores es alias de otra interacción de dos factores.
= =
Estas relaciones de los alias sonAB CD,AC BD y BC =AD. Los cuatro efectos principales más los
tres pares de alias de interacciones de dos factores representan los siete grados de libertad del diseño.
En este punto, normalmente se aleatorízarían las ocho corridas y se llevaría a cabo el experimento.
Puesto que se ha corrido ya en diseño 24 completo, simplemente se seleccionan los ocho índices de filtra·
ción observados del ejemplo 62 que corresponden a las corridas del diseño 2~1• Estas observaciones se
muestran en la última columna de la tabla 83, así como en la figura 8·3.
En la tabla 84 se muestran las estimaciones de Jos efectos obtenidas de este diseño 2~1• Para ilustrar
los cálculos, la combinación lineal de las observaciones asociadas con el efecto de A es
l A = t{45+10045+65 75+60 80+96) = 19.00 ..... A+ BCD
mientras que para el efecto AB se obtendría
l AB = t( 4510045+65+7560 80+96)= r.ce AB+cn

Por la inspección de la información de la tabla 84, no es irrazonable concluir que los efectos principales
de A, C y D son grandes. Además, si A, C y D son los efectos principales importantes, entonces es lógico
concluir que las dos cadenas de alias de interaccionesAC + BD yAD + BC tienen efectos grandes, ya que
Tabla 84 Estimaciones de los efectos

y los alias del ejemplo 81 a
Estimación Estructura de los alias
(. = 19.00 lA -A+BCD
la = 1.50 l8-B+ACD
le = 14.00 le -c+ABD
lJ) ; 16.50 lv ... D+ABC
lAB = 1.00 lAB ... AB+CD
(K ""18.50 ' « -AC+BD
l,w = 19.00 l,w -AD+BC
ºLos efectos significativos se indican en negritas.
310 CAPÍTULO 8 DISEÑOS FACTORIALES FRACCIONADOS DE DOS NIVELES
75 96
60
Alta
1
1
1
1
7~10::~
1
,.__:
1 46 _ 100
... ... ...

/
/ 0ct~v;gitación)
/
... »: ~
Baja
46t<'.......65 Baja
Baja A (temperatura)Alta
Figura 84 Proyeccióndel diseno 2~1 en un diseño 23 enA, C

y D para el ejemplo 81.
las interaccionesAC y AD también son significativas. En otras palabras, si A, C y D son significativos, en
tonces lo más posible es que las interacciones significativas seanA C yAD. Se trata de una aplicación de la
navaja de Ockham (en honor de Guillermo de Ockham ), un principio científico que establece que cuan
do uno se confronta con varias interpretaciones posibles de un fenómeno, la interpretación más simple
suele ser la correcta. Observe que esta interpretación concuerda con las conclusiones del análisis del dise
ño 24 completo del ejemplo 62.
Puesto que el factor B no es significativo, puede sacarse de consideración. Por consiguiente, este dise
ño 2:;1 puede proyectarse en una sola réplica del diseño 23 en los factoresA, C y D, como se muestra en la
figura 84. El examen visual de esta gráfica de cubo nos hace sentimos más cómodos con las conclusiones
a las que se llegó antes. Observe que si la temperatura (A) está en el nivel bajo, la concentración (C) tiene
un efecto positivo grande, mientras que si la temperatura está en el nivel alto, la concentración tiene un
efecto muy pequeño. Esto se debe probablemente a una interacciónAC. Además, si la temperatura está
en el nivel bajo, el efecto de la velocidad de agitación (D) es insignificante, mientras que si la temperatura
está en el nivel alto, la velocidad de agitación tiene un efecto positivo grande. Esto se debe probablemente
a la interacción AD que se identificó de manera tentativa unos párrafos antes.
Con base en el análisis anterior, puede obtenerse ahora un modelo para predecir el índice de filtra
ción en la región experimental. Este modelo es
y= Po +'/31X1 +P3X3 +'/34X4 +'/313X1X3 +'/314X1X4
dondex.,«, yx4 son variables codificadas (1 s x1 s +1) que representan aA, Cy D, y las Pson coeficien
tes de regresión que pueden obtenerse a partir de las estimaciones de los efectos como se hizo anterior
mente. Por lo tanto, la ecuación de predicción es
Recuerde que la ordenada al origen '/30 es el promedio de todas las respuestas en las ocho corridas del di
seño. Este modelo es muy similar al que resultó del diseño factorial. 21c completo del ejemplo 62.
82 LA FRACCIÓN UN MEDIO DEL DISEÑO Zk 311
EJEMPLO 8.- 2 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Un diseiío 2s.1 usado para mejorarun proceso
Se investigaron cinco factores en un proceso de manufactura de un circuito integrado en un diseño 251
con el objetivo de mejorar el rendimiento del proceso. Los cinco factores fueronA = ajuste de apertura
(pequeña, grande), B = tiempo de exposición (20% abajo del nominal, 20% arriba del nominal), C =
tiempo de desarrollo (30 s, 45 s ), D = tamaño de la máscara (pequeña, grande) y E = tiempo de grabado
(14.5 min, 15.5 min). En la tabla 85 se muestra la construcción del diseño 251• Observe que el diseño se
construyó apuntando el diseño básico que tiene 16 corridas (un diseño 24 enA, B, Cy D), seleccionando
ABCDE como generador, y ajustando después los niveles del quinto factor E = ABCD. En la figura 85 se
presenta una representación geométrica del diseño.
La relación de definición del diseño es I = ABCDE. Por consiguiente, todos los efectos principales
son alias de una interacción de cuatro factores (por ejemplo, lA -A + BCDE), y cada una de las interac
ciones de dos factores son alias de una interacción de tres factores (por ejemplo, R.AB -AB + CDE). Por lo
tanto, el diseño es de resolución V. Se esperaría que este diseño 2si proporcionara excelente información
respecto de los efectos principales y las interacciones de dos factores.
La tabla 86 contiene las estimaciones de los efectos, las sumas de cuadrados y los coeficientes del
modelo de regresión para los 15 efectos de este experimento. En la figura 86 se presenta la gráfica de
probabilidad normal de las estimaciones de los efectos de este experimento. Los efectos principales de A,
By C y la interacciónAB son grandes. Recuerde que, debido a los alias, estos efectos son en realidad A +
BCDE, B + ACDE, C + ABDE y AB + CDE. Sin embargo, puesto que parece plausible que las interac
ciones de tres factores y de órdenes superiores sean insignificantes, uno siente seguridad en concluir que
sólo A, B, C y AB son los efectos importantes.
En la tabla 8 7 se resume el análisis de varianza de este experimento. La suma de cuadrados del
=
modelo es SSModcto SSA + SS8 + SSc + SSAB = 5747.25, y esto explica más de 99% de la variabilidad
total del rendimiento. En la figura 8 7 se presenta la gráfica de probabilidad normal de los residuales
Tabla 8·5 Un diseño zs._i para el ejemplo 82

Diseño básico Combinación de
Corrida A B e D E=ABCD tratamientos Rendimiento
1 + e 8
2 + a 9
3 + b 34
4 + + + abe 52
5 + e 16
6 + + + a ce 22
7 + + + bce 45
8 + + + abe 60
9 + d 6
10 + + + ad.e 10
11 + + + bde 30
12 + + + abd 50
13 + + + cde 15
14 + + + acd 21
15 + + + bcd 44
16 + + + + + abcde 63
312 CAPÍTIJLO 8 DISEÑOS FACTORIALES FRACCIONAOOS DE DOS NIVELES
D +
1 1
1 1
+
1 1
......
......
1
. J
...... bde =30
...... .......
em8 ack10
E
abe"' 60 bcb·44
e m 16
1
1
1
bm3,_ __
.......
...... .......
...... .......
a=9 d .. a
ckB A
Figura 85 El diseño 2~1 del ejemplo 82.
Tabla 86 Efectos, coeficientes de regresión y sumas de cuadrados del ejemplo 82
Variable Nombre Nivel1 Nivel +1
A Apertura 1.000 1.000
B Tiempo de desarrollo 1.000 1.000
C Tiempo de exposición 1.000 1.000
D Tamaño de la máscara 1.000 1.000
E Tiempo de grabado 1.000 1.000
Variable Coeficiente de regresión Efecto estimado Suma de cuadrados
Promedio global 30.3125
A 5.5625 11.1250 495.062
B 16.9375 33.8750 4590.062
e 5.4375 10.8750 473.062
D 0.4375 0.8750 3.063
E 0.3125 0.6250 1.563
AB 3.4375 6.8750 189.063
AC 0.1875 0.3750 0.563
AD 0.5625 1.1250 5.063
AE 0.5625 1.1250 5.063
BC 0.3125 0.6250 1.563
BD 0.0625 0.1250 0.063
BE 0.0625 0.1250 0.063
CD 0.4375 0.8750 3.063
CE 0.1875 0.3750 0.563
DE 0.6875 1.3750 7.563
99
5
•
B 95
o
~ 10 eA 90
X
ec
~-- 20
1 •
AB
80
70
!:. 30 C>
¡¡; C>
~
..,e:
50 50 ';
~
..,"' 70 30
:a 80 20
~ 90 10
95 5
99
o 5 10 15 20 25 30
Estimaciones de los efectos
Figura 86 Gráfica de probabilidad normal de los efectos del ejemplo 82.
Tabla s. 7 Análisis de variaru:a del ejemplo 82

Fuente de variación cuadrados libertad medio Valor P
A (Apertura) 495.0625 1 495.0625 193.20 <0.0001
B (Tiempo de exposición) 4590.0625 1 4590.0625 1791.24 <0.0001
C (Tiempo de desarrollo) 473.0625 1 473.0625 184.61 <0.0001
AB 189.0625 1 189.0625 73.78 <0.0001
Error 28.1875 11 2.5625
Tutal 5775.4375 15
99
5
• 95
...
8
X
10 90
~ ... 20 80
1
!:. 30 70
¡¡; 8
e 50;;
o
e:
'O
70
50
JO
~
;g"'
:e 80 20
Bo
d: 90 10
95 5
99
-3 -2 -1 o 2
Residuales
313
2 •
• • • • •
.,"' • •
Gj
;;;J
e o • •
'il
a:
• •
1
•
• •
-2
•
30
Rendimiento predicho
Figura 88 Gráfica de los residuales contra el rendimiento predicho

para el ejemplo 82.
y la figura 88 es una gráfica de los residuales contra los valores predichos. Ambas gráficas son satis
factorias.
Los tres factores A, By C tienen efectos positivos grandes. La interacción aperturatiempo de exposi
ción oAB se grafica en la figura 89. Esta gráfica confirma que el rendimiento es más alto cuando tantoA ·
como B están en el nivel alto.
63
B+
B+
a------------------~
Btijo Alto
Figura 89 Interacción aperturatiempo de exposición del ejemplo 82.

82 LA FRACCIÓN UN MEDIO DEL DISENO Zk 315
61.5
+
1
1
,(~---~:/·
1
115.5 21.5
B
+
A
Figura 810 Proyección del diseño 2~1 del
ejemplo 82 en dos réplicas de un diseño 23 en
los factores A, B y C.
El diseño 251 se reducirá a dos réplicas de un diseño 23 en tres cualesquiera de los cinco factores origi
nales. (Observar la figura 8 5 ayuda a visualizar esto.) Lafigura 810 es una gráfica de cubo en los factores
A, By C con los rendimientos promedio superpuestos en los ocho vértices. Es evidente por la inspección
de la gráfica de cubo que los rendimientos más altos se consiguen conA, By C en el nivel alto. Los factores
D y E tienen un efecto pequeño sobre el rendimiento promedio del proceso y pueden ajustarse en los va
lores que optimicen otros objetivos (como el costo) .
• • • • • • • • • e •• A • A •• a •• A • D •• A A • A ••• A A •• A •• e • a a e e e •••• e ••• e e •• e •••• e ••• a e • a ••
Secuencias de diseños factoriales fraccionados

El uso de los diseños factoriales fraccionados lleva con frecuencia a una gran economía y eficiencia en la
experimentación, en particular si las corridas pueden hacerse secuencialmente. Por ejemplo, suponga
=
que se están investigando k 4 factores (24 16 corridas). Casi siempre es preferible correr un diseño =
fraccionado 2~1 (ocho corridas), analizar los resultados y después decidir cuál es la mejor serie de corri
das que deberá correrse después. Si es necesario resolver ambigüedades, siempre puede correrse la frac
ción alterna y completar el diseño 24• Cuando se usa este método para completar el diseño, ambas
fracciones un medio representan bloques del diseño completo con las interacciones de orden superior
confundidas con los bloques (en este casoABCD estaría confundida). Por lo tanto, la experimentación se
cuencial tiene como resultado la pérdida de información sólo en la interacción de orden más alto. Su ven
taja es que en muchos casos se saca información suficiente de la fracción un medio para proceder a la
siguiente etapa de la experimentación, lo cual podría implicar la incorporación o eliminación de factores,
el cambio de las respuestas, o la variación de algunos de los factores en nuevos rangos. Algunas de estas
posibilidades se ilustran gráficamente en la figura 811.
Ej"EMPLO 8-3 . . . . . . . . . . ID • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • •
Considere nuevamente el experimento del ejemplo 81. Se ha usado un diseño 2~1 y se ha hecho la identi
ficación tentativa de los tres efectos principales grandes: A, C y D. Hay dos efectos grandes asociados con
interacciones de dos factores,AC + BD y AD + BC. En el ejemplo 82 se utilizó el hecho de que el efecto
principal de B era insignificante para concluir de manera tentativa que las interacciones importantes eran
316 CAPiTuLo 8 DISEÑOS FACTORIALES FRACCIONADOS DE DOS NIVELES
1 1
• 1 1 ~
1 1
~ ),,
' /
a) Moverse a una nueva

' /
b) Agregar otra fracción

localización para explorar Diseño inicial pera resolver las
una tendencia ambigüedades de la
aparente a la respuesta fracción original
1 •
/
/
>-------
e) Reescalar algunos factores
porque pueden haberse
hecho veriar un los
fl Hacer un aumento para· rangos inapropiados
modelar la curvatura
81)11rente
1 t : •
~ 1
l ),,----
1 ••
1 ;f
}----
/ ~.l<f
··
/
e) Hacer una réplica para mujorar

las estimaciones de los efectos o
Temperatura l>
d) Eliminar y agregar
porque algunas corridas se factores porque el factor
hicieron incorrec1amen1e original correspondiente
a la velocidad de alimentación
del catalizador es insignificante
Flpni ~11 Posibilidades para el seguimiento de la experimentación después de un

experimento factorial fraccionado (adaptado de Box ("Sequential Bxperimentation and
Sequential Assembly of Designs") con permiso del editor].
AC y AD. En ocasiones el experimentador tendrá que procesar conocimientos que puedan ayudarle a dis
criminar entre las interacciones que probablemente sean importantes. Sin embargo, siempre es posible
aislar la interacción significativa corriendo la fracción alterna, dada por I -ABCD. Es directa la demos =
tración de que el diseño y las respuestas son los siguientes:
Diseño básico Combinación de índice de

Corrida A B e D=-ABC tratamientos filtración
1 + d 43
2 + a 71
3 + b 48
4 + + + abd 104
5 + e 68
6 + + + acd 86
7 + + + bcd 70
8 + + + abe 65
B3 LA FRACCIÓN UN CUARTO DEL DISE!ÍIO z• 317
Las combínacíones lineales de las observaciones obtenidas a partir de esta fracción alterna son
l'A = 24.25 ..., A- BCD
i', = 4.15-+B-ACD
l~ = 5.75 -+C-ABD
l~ = 1215...,.D-ABC
l'AB = 1.25 + AB- CD
l~c =17.75 .... AC-BD
l',.n = 14.25 -+AD- BC
Estas estimaciones pueden combinarse con las que se obtuvieron de la fracción un medio original para
obtener las siguientes estimaciones de los efectos:
A 21.63 A -2.63 BCD

B 3.13 B -1.63 ACD
e 9.88 C 4.13 ABD
D 14.63 D 1.88 ABC
AB 0.13 AB 1.13 CD
AC 18.13 AC 0.38 BD
AD 16.63 AD 2.38 BC
Estas estimaciones concuerdan exactamente con las del análisis original de los datos como una sola répli
ca de un diseño factorial 24, como se consigna en el ejemplo 62. Evidentemente, son las interaccionesAC
y AD las que son grandes .
.........................................................................
Agregar la fracción alterna a la fracción principal puede considerarse como un tipo de experimento
de confirmación, por cuanto proporciona información que permitirá fortalecer las conclusiones iniciales
acerca de los efectos de la interacción de dos factores. En la sección 85 se investigarán otros aspectos de
la combinación de diseños factoriales fraccionados para aislar las interacciones. En ocasiones un experi
mento de confirmación no es tan elaborado como éste. Por ejemplo, podría usarse la ecuación del modelo
para predecir la respuesta en un punto de interés dentro del espacio del diseño (no uno de los puntos del
diseño actual), correr después realmente ese ensayo (quizá varias veces) y usar la comparación entre la
respuesta predicha y la observada para confirmar los resultados.
83 LA FRACCIÓN UN CUARTO DEL DISEÑO 2l
Para un número moderadamente grande de factores, con frecuencia son útiles fracciones menores del di
seño ». Considere una fracción un cuarto del diseño 2". Este diseño contiene 2"2 corridas y es común lla
marlo diseño factorial fraccionado 2•2•
El diseño zkz puede construirse apuntando primero un diseño básico compuesto por las corridas aso
ciadas con un diseño factorial completo en k- 2 factores y asociando después las dos columnas adiciona
les con las interacciones elegidas apropiadamente que incluyan los primeros k - 2 factores. Por lo tanto,
318 CAPÍTIJLO 8 DISEÑOS FACTORIALES FRACCIONADOS DE DOS NIVELES
una fracción un cuarto del diseño 2k tiene dos generadores. Si P y Q representan los generadores escogi
= =
dos, entonces a I P e I Q se les llama las relaciones generadoras del diseño. Los signos de P y Q ( +
o ) determinan cuál de las fracciones un cuarto se produce. Las cuatro fracciones asociadas con la elec
ción de los generadores ±P y ± Q pertenecen a la misma familia. La fracción para la que tanto P como Q
son positivas es la fracción principal.
La relación de definición completa del diseño está compuesta por todas las columnas que son iguales
a la columna identidad l. Éstas constarán de P, Q y su interacción generalizadaPQ; es decir, la relación de
=
definición es I = P Q = PQ. A los elementos P, Q y PQ de la relación de definición se les denomina pa
labras. Los alias de cualquier efecto se obtienen mediante la multiplicación de la columna de ese efecto
por cada palabra de la relación de definición. Evidentemente, cada efecto tiene tres alias. El experimenta
dor deberá estar atento al elegir los generadores para que los efectos potencialmente importantes no
sean alias entre sí.
Como un ejemplo, considere el diseño 2<>2• Suponga que se escogen I = ABCE e I = BCDF como los
generadores del diseño. Entonces la interacción generalizada de los generadores ABCE y BCDF es
ADEF; por lo tanto, la relación de definición completa de este diseño es
I = ABCE = BCDF = ADEF
Por consiguiente, se trata de un diseño de resolución IV. Para encontrar los alias de cualquier efecto (por
ejemplo de A), se multiplica ese efecto por cada palabra de la relación de definición. ParaA, esto produce
A= BCE = ABCDF = DEF
Es sencillo verificar que todos los efectos principales son alias de interacciones de tres y cinco factores,
mientras que las interacciones de dos factores son alias entre sí y de interacciones de órdenes superiores.
Por lo tanto, cuando se estimaA, por ejemplo, en realidad se está estimando A + BCE + DEF + ABCDF.
En la tabla 88 se muestra la estructura completa de los alias de este diseño. Si las interacciones de tres
factores y de órdenes superiores son insignificantes, este diseño produce estimaciones claras de los efec
tos principales.
Para construir este diseño se anota primero el diseño básico, el cual consiste en las 16 corridas para
un diseño completo 2<>2 = 24 enA, B, C y D. Después se añaden los dos factores E y F, asociando sus nive
les más y menos con los signos más y menos de la interacciónABC y BCD, respectivamente. Este procedi
miento se muestra en la tabla 89.
Otra forma de construir este diseño es deduciendo los cuatro bloques del diseño 26 con ABCE y
BCDF confundidas y eligiendo después el bloque con las combinaciones de tratamientos que son positi
vas paraABCE y BCDF. Se trataría de un diseño factorial fraccionado 2<>2 con relaciones generadoras I =
ABCE e I = BCDF, y puesto que los dos generadoresABCE y BCDF son positivos, se trata de la fracción
principal.
Tabla 88 Estructura de los alias del diseño 2;2

con I = ABCE = BCDF = ADEF
A = BCE = DEF = ABCDF AB = CE = ACDF = BDEF
B = ACE = CDF = ABDEF =
AC =BE ABDF = CDEF
C =ABE= BDF = ACDEF AD = EF = BCDE = ABCF
D = BCF = AEF = ABCDE AE = BC = DF =ABCDEF
E =ABC = ADF = BCDEF AF =DE = BCEF = ABCD
F =BCD = ADE ABCEF = =
BD= CF ACDE = ABEF
ABD = CDE = ACF = BEF BF = CD =ACEF = ABDE
=
ACD = BDE ABF = CEF
83 LA FRACCIÓN UN CUARTO DEL DISEÑO z• 319
Tabla 89 Construcción del diseño ztyi con los generadores I = ABCE e I = BCDF
Diseño básico
Corrida A B e D E=ABC F=BCD
1
2 + +
3 + + +
4 + + +
5 + + +
6 + + +
7 + +
8 + + + +
9 + +
10 + + + +
11 + + +
12 + + +
13 + + +
14 + + +
15 + + + +
16 + + + + + +
Hay, desde luego, tres fracciones alternas de este diseño 2~2 particular. Se trata de las fracciones
= =
con las relaciones generadoras I ABCE e I -BCDF; I = -ABCE e I BCDF; e I -ABCE e I = = =
-BCDF. Es sencillo construir estas fracciones con el método que se muestra en la tabla 89. Por ejemplo,
si quiere encontrarse la fracción para la que I = ABCE e I = -BCDF, entonces en la última columna de la
tabla 89 se hace F = -BCD, y la columna de los niveles del factor F queda como
++----++--++++--
La relación de definición completa de esta fracción alterna es I ABCE =
-BCDF -ADEF. Ahora = =
ciertos signos en la estructura de los alias de la tabla 89 se han cambiado; por ejemplo, los alias de A son
= = =
A BCE -DEF -ABCDF. Por lo tanto, la combinación lineal de las observaciones lA estima en reali
dad A + BCE - DEF -ABCDF.
Por último, observe que el diseño factorial fraccionado 2~2 se proyectará en una sola réplica de un
diseño 24 en cualquier subconjunto de cuatro factores que no sea una palabra de la relación de definición.
También se pliega en una fracción un medio con una réplica de un diseño 24 en cualquier subconjunto de
cuatro factores que sea una palabra de la relación de definición. Por lo tanto, el diseño de la tabla 89 se
convierte en dos réplicas de un diseño 241 en los factoresABCE, BCDFy ADEF, porque éstas son las pa
labras de la relación de definición. Hay otras 12 combinaciones de los seis factores, comoABCD,ABCF,
etc., para las que el diseño se proyecta en una sola réplica del diseño 24• Este diseño también se pliega en
dos réplicas de un diseño 23 en cualquier subconjunto de tres de los seis factores o en cuatro réplicas de un
diseño 22 en cualquier subconjunto de dos factores.
En general, cualquier diseño factorial fraccionado 2"2 puede plegarse en un diseño factorial comple
to o bien en un diseño factorial fraccionado en algún subconjunto de r :S k - 2 de los factores originales.
Estos subconjuntos de variables que forman diseños factoriales completos no son palabras de la relación
de definición completa.
EJ'~W 84 · · · · · • · · · • · · · · · · · · · · · · · · · · · • · · · · · · · · · · · · · · · • • · · • · · · · · · · · · · • · ·
Las piezas fabricadas en un proceso de moldeo por inyección están presentando una contracción excesi
va. Esto está ocasionando problemas en las operaciones de ensamblaje que se realizan después del mol
deo por inyección. Un equipo de mejoramiento de calidad ha decidido llevar a cabo un experimento
320 CAPITuLO 8 DISEÑOS FACTORIALES FRACCIONAOOS DE DOS NIVELES
diseñado para estudiar el proceso de moldeo por inyección a fin de poder reducir la contracción. El equi
po decide investigar seis factores la temperatura de moldeo (A), la velocidad del enroscado (B), el
tiempo de retención (C), la duración del ciclo (D), el tamaño del vaciadero (E) y la presión de la retención
(F)- con dos niveles cada uno, con el fin de saber cómo se afecta la contracción debido a cada factor, así
como para obtener información preliminar acerca de la forma en que los factores interactúan.
El equipo decide usar el diseño factorial fraccionado de 16 corridas con dos niveles de la tabla 89. El
diseño se muestra de nuevo en la tabla 810, junto con la contracción observada ( x 10) en la pieza de
prueba producida en cada una de las 16 corridas del diseño. En la tabla 811 se muestran las estimaciones
de los efectos, las sumas de cuadrados y los coeficientes de regresión de este experimento.
En la figura 812 se presenta la gráfica de probabilidad normal de las estimaciones de los efectos de
este experimento; Los únicos efectos grandes son A (temperatura de moldeo), B (velocidad del enrosca
do) y la interacciónAB. A la luz de las relaciones de los alias de la tabla 88, parece razonable adoptar es
tas conclusiones de manera tentativa. La gráfica de la interacción AB de la figura 813 indica que el
proceso muestra una alta insensibilidad a Ja temperatura si la velocidad del enroscado está en el nivel
bajo, pero que es muy sensible a la temperatura si la velocidad del enroscado está en el nivel alto. Con la"°
velocidad del enroscado en el nivel bajo, el proceso deberá producir una contracción promedio de alrede
dor de 10%, independientemente del nivel de temperatura elegido.
Con base en este análisis inicial, el equipo decide hacer el ajuste de la temperatura de moldeo y la ve
locidad del enroscado en el nivel bajo. Este conjunto de condiciones reducirá la contracción media de las
piezas en alrededor de 10%. Sin embargo, la variabilidad de la contracción de una pieza a otra sigue sien
do un problema potencial. De hecho, la contracción media puede reducirse adecuadamente mediante las
modificaciones anteriores; sin embargo, la variabilidad de la contracción de una pieza a otra en una corri
da de producción podría seguir causando problemas en el ensamblaje. Una manera de abordar esta cues
tión es investigando si alguno de los factores del proceso afecta la variabilidad de la contracción de las
piezas.
En la figura 814 se presenta la gráfica de probabilidad normal de los residuales. Esta gráfica parece
ser satisfactoria. Se construyeron después las gráficas de los residuales contra cada factor. En la figura
Tabla s10 Un disefioZ;2 para el experimento del moldeo por inyección del ejemplo 84
Diseño básico Contracción
Corrida A B e D E=ABC F=BCD observada ( x 10)
1 6
2 + + 10
3 + + + 32
4 + + + 60
5 + + + 4
6 + + + 15
7 + + 26
8 + + + + 60
9 + + 8
10 + + + + 12
11 + + + 34
12 + + + 60
13 + + + 16
14 + + + 5
15 + + + + 37
16 + + + + + + 52
8J 1AFRACCIÓNUNCUARTODELDISEÑ02• 321
Tabla 811 Efectos, sumas de cuadrados y coeficientes de regresión del ejemplo 84
Variable Nombre Nivel 1 Nivel +l
A temperatura_moldeo 1.000 1.000
B velocidad enroscado 1.000 1.000
e duración retención 1.000 1.000
D duración ciclo 1.000 1.000
E tamaño vaciadero 1.000 1.000
F presión=retención 1.000 1.000
Variable" Coeficiente de regresión Efecto estimado Suma de cuadrados
A 6.9375 13.8750 770.062
B 17.8125 35.6250 5076.562
e 0.4375 0.8750 3.063
D 0.6875 1.3750 7.563
E 0.1875 0.3750 0.563
F 0.1875 0.3750 0.563
AB+CE 5.9375 11.8750 564.063
AC+BE 0.8125 1.6250 10.562
AD+EF 2.6875 5.3750 115.562
AE+BC+DF 0.9375 1.8750 14.063
AF+DE 0.3125 0.6250 1.563
BD+CF 0.0625 0.1250 0.063
BF+CD 0.0625 0.1250 0.063
ABD 0.0625 0.1250 0.063
ABF 2.4375 4.8750 95.063
•sólo los efectos principales y las interacciones de dos factores.
99
B
5
• 96
A
5! 10 AB• 90
X
¡¡;. . 20 • 80
~ 30 70
8
s
¡¡
e:
50
50;
ia:....
i 70
"O
30
~ 80 20
1l
i: 90 10
95 5
99
5 o 5 10 15 20 25 30 35 40
Elitim1eiones de 106 @fect06
Figura B12 Gráfica de probabilidad normal de los efectos del ejemplo 84.
322 CAPÍTIJLO 8 DISEÑOS FACTORIALES FRACCIONADOS DE DOS NIVELES
60
B+
~
~
e
Q
·¡:;
<J B+
~
;:
o
u
B -----------B-
Baja Alta
Temperatura de moldeo, A
Figura 813 Gráfica de la interacciónAB (temperatura de mol

deovelocidad del enroscado) para el ejemplo 84.
815 se muestra una de estas gráficas, la de los residuales contra el factor C (tiempo de retención). La grá
fica revela que hay una dispersión sensiblemente menor en los residuales con el tiempo de retención bajo
que con el tiempo de retención alto. Estos residuales se obtuvieron de la manera usual a partir del modelo
de la contracción predicha:
J= Po +P1X1 +P2x2 +P12X1X2
= 27.3125+6.9375x1 +17.8125x 2 +5.9375x1x2
99
5
•
95
o
....
o 10 90
X
;¡;. 20 80
1
!:. 30 70
s
e
1ii
50 50;
o
e: ~...
"i 70 30
~
:e 80 20
..8o
d: 90 10
96 5
•
99
-6 -3 o 3 6
Residuales
83 LA FRACCIÓN UN CUARTO DEL DISEÑO Zk 323
6
•
4 1
."'
2 •
O!
.a 1:
·m
a: 01
1
-2
•
•
4 •
Baja Alta
Tiempo de retención (Cl
Figura 815 Residuales contra el tiempo de retención (C) para el

ejemplo 8·4.
dondex¡,x2 y x¡X2 son las variables codificadas que corresponden a los factoresA y By a la interacciónAB.
Entonces los residuales son
e= y-y
El modelo de regresión usado para producir los residuales elimina, en esencia, los efectos de localización
de A, By AB de los datos; por lo tanto, los residuales contienen información acerca de la variabilidad no
explicada. La figura 815 indica que existe un patrón en la variabilidad y que la variabilidad de la contrac
ción de las piezas puede ser menor cuando el tiempo de retención está en el nivel bajo (recuerde que en el
capítulo 6 se señaló que los residuales sólo transmiten información acerca de los efectos de dispersión
cuando es correcto el modelo de localización o la media).
Lo anterior se observa con mayor claridad en el análisis de los residuales que se presenta en la tabla
812. En esta tabla, los residuales se ordenan en los niveles bajo() y alto ( +) de cada factor, y se ha calcu
lado la desviación estándar de los residuales en los niveles bajo y alto de cada factor. Observe que la des
viación estándar de los residuales con C en el nivel bajo [S(C) = 1.63] es considerablemente menor que la
desviación estándar de los residuales con C en el nivel alto (S(C+) = 5.70].
En el último renglón de la tabla 812 se presenta el estadístico
F" =In S2(i+)
, si(i-)
Recuerde que si las varianzas de los residuales en los niveles alto (+)y bajo () del factor i son iguales, en
tonces este cociente sigue una distribución aproximadamente normal con media cero, y puede usarse
para evaluar la diferencia en la variabilidad de la respuesta en los dos niveles del factor i. Puesto que el
cociente F~ es relativamente grande, se concluiría que la aparente dispersión o efecto de variabilidad ob
servado en la figura 815 es real. Por lo tanto, ajustar el tiempo de retención en su nivel bajo contribuiría a
reducir la variabilidad de una pieza a otra durante una corrida de producción. En la figura 816 se presen
ca
:§ ~~~8~º~8~~1(!8~~1(!8
~ ~c:¡ic:¡iN1~'fN9...;...;cfr·'.v¡i~'f
~
11+11+1++11++1+11+
~
00 N ...<
00 In <">
11++++11++11 11++<"iic:¡i
e
~
e11 ++++ 1 1 1 1 1 1 1 1 ++++

~
1++11++1+11++11+
~ ............ ~
ov
il ++11++1111++11++<fic:¡i
~
~
11 +1+1+1+11+1+1+1+
~
v~.<
1 1 1 1 1 1 1 1 + + + + + + + + ~~d
~<nv
1++ I+ 1I+1++ I+ 1 I+ .<NO
-<i -<i '9
++1111++++1111++..,j~9 :G~~
1111++++1111++++
............ ~
ov
11++11++11++ 1++ --i --i '9
~~~
<"i~;i
· ·
,.,,...._
+
t:;'t:;' ~
1 •
324
83 LA FRACCIÓN UN CUARTO DEL DISEÑO Zk 325
99.9
99
C•
~ 5 95
X
;¿.
=
1 20 80
o
¡¡; ~
50 50 X
~e: ~~
.
...,
;g 80 20
:e
.2l
...!;! 5
99
99.9 .01
0.4 0.1 0.6 2.1 2.6
Figura 816 Gráfica de probabilidad normal de los efectos de dispersión F/ del ejemplo 84.
ta una gráfica de probabilidad normal de los valores F;º de la tabla 812; ésta también indica que el factor
e tiene un efecto de dispersión grande.
En la figura 817 se muestran los datos de este experimento proyectados en un cubo en los factoresA,
By C. La contracción promedio observada y el rango de la contracción observada se indican en cada vérti
ce del cubo. Por la inspección de la figura se observa que correr el proceso con la velocidad del enroscado
(B) en el nivel bajo es la clave para reducir la contracción promedio de las piezas. Si B está en el nivel bajo,
virtualmente cualquier combinación de la temperatura (A) y el tiempo de retención ( C) resultará en valo
res bajos de la contracción promedio de las piezas. Sin embargo, al examinar los rangos de los valores de
la contracción en cada vértice del cubo, es claro de inmediato que ajustar el tiempo de retención (C) en el
nivel bajo es la única elección razonable si se quiere mantener baja la variabilidad de la contracción de
.........................................................................
una pieza a otra en una corrida de producción .
_,_ ...,.y"' 56.0

1y"'31.5 R,,,8
1 R ª 11
1
1
y e 33.0 1 y.o60.0
R·2 1 R"'O
1
1
Y~ 10,0 : Ym 10,0
R - 1z.a R • 11
_Y_·_7_.o_"_"_,._"_y__1_1
......
0 r ~ C. tle:po de retención
~ R .. 2 Re2 ~1,;,uei
+
A. temperatura de moldeo
Figura 817 Contracción promedio y rango de la contracción en los

factores A, B y C para el ejemplo 84.
326 CAPÍTULO 8 DISEÑOS FACTORIALESFRACCIONADOS DE OOS NIVELES
s..4 EL DISEÑO FACTORIAL FRACCIONADO zk;i GENERAL
A un diseño factorial fraccionado 2k que contiene 2k-P corridas se le llama fracción 1/2!' del diseño 2k o, de
manera más simple, diseño factorial fraccionado 21P. En estos diseños deben seleccionarse p generadores
independientes. La relación de definición de este diseño se compone de los p generadores elegidos ini
cialmente y sus 2!' -p - 1 interacciones generalizadas. En la presente sección se estudia la construcción y el
análisis de estos diseños.
La estructura de los alias puede encontrarse multiplicando la columna de cada efecto por la relación
de definición. Deberá prestarse atención al elegir los generadores para que los efectos de interés poten
cial no sean alias entre sí. Cada efecto tiene 2!' - 1 alias. Para valores moderadamente grandes de k, es co
mún suponer que las interacciones de órdenes superiores (por ejemplo, de tercero y cuarto orden y
superiores) son insignificantes, con lo cual se simplifica en gran medida la estructura de los alias.
Es importante seleccionar los p generadores de un diseño factorial fraccionado 2k-P de tal modo que
se obtengan las mejores relaciones de los alias posibles. Un criterio razonable es seleccionar los genera
dores para que el diseño 2k-P resultante tenga la resolución más alta posible. Para ilustrar, considere el di
seño 2~2 de la tabla 89, donde se usaron los generadores E =ABCy F =BCD, con lo cual se produce un
diseño de resolución IV. Éste es el diseño con la resolución más alta. Si se hubieran seleccionado E =
ABC y F = ABCD, la relación de definición completa hubiera sido I = ABCE = ABCDF = DEF, y el dise
ño habría sido de resolución 111. Se trata, evidentemente, de una elección inferior porque sacrifica de ma
nera innecesaria información acerca de las interacciones.
En. ocasiones la resolución por sí sola no es suficiente para distinguir entre los diseños. Por ejemplo,
considere los tres diseños 2~2 de la tabla 813. Todos estos diseños son de resolución IV, pero tienen es
tructuras de los alias muy diferentes (se ha supuesto que las interacciones de tres factores y las de órdenes
superiores son insignificantes) con respecto a las interacciones de dos factores. Evidentemente, el diseño
A es el que tiene más alias y el diseño C el que tiene menos, por lo que el diseño C sería una buena elección
para un diseño 2;~z.
Las tres palabras del diseño A tienen longitud 4; es decir, el patrón de la longitud de las palabras es
{ 4, 4, 4}. Para el diseño B es { 4, 4, 6} y para el diseño Ces { 4, 5, 5}. Observe que la relación de definición
del diseño C tiene una sola palabra de cuatro letras, mientras que los demás diseños tienen dos o tres. Por
lo tanto, el diseño C minimiza el número de palabras de la relación de definición que son de longitud mí
nima. A un diseño como éste se le llama diseño de aberración mínima. Minimizar la aberración en un di
seño de resolución R asegura que el diseño tiene el número mínimo de efectos principales que son alias de
Tabla 813 Tres elecciones de generadores para el diseño 2~2

Generadores del diseño A: Generadores del diseño B: Generadores del diseño C:
F =ABC, G =BCD F =ABC, G =ADE F = ABCD, G = ABDE
l = ABCF = BCDG = ADFG I = ABCF = ADEG = BCDEFG I = ABCDF = ABDEG = CEFG
Alias (interacciones de dos factores) Alias (interacciones de dos factores) Alias (interacciones de dos factores)
AB=CF AB=CF CE=FG
AC=BF AC=BF CF=EG
AD=FG AD=EG CG=EF
AG=DF AE=DG
BD=CG AF=BC
BG=CD AG=DE
AF=BC=DG
84 EL DISEÑO FACTORIAL FRACCIONADO zi..• GENERAL 32 7
interacciones de orden R1, el número mínimo de interacciones de dos factores que son alias de interac
ciones de orden R - 2, etcétera. Referirse a Fries y Hunter [ 46] para mayores detalles.
En la tabla 814 se presenta una selección de diseños factoriales fraccionados 2k-P para k :S 15 factores
y hasta n :S 128 corridas. Los generadores sugeridos en esta tabla resultarán en un diseño con la resolu
ción más alta posible. Son también los diseños con aberración mínima.
Las relaciones de los alias para todos los diseños de la tabla 814 para los que n :S 64 se presentan en
la tabla XII( aw) del apéndice. Las relaciones de los alias incluidas en esta tabla se enfocan en los efectos
principales y las interacciones de dos y tres factores. Se da la relación de definición completa para cada di
seño. Esta tabla del apéndice hace muy sencillo seleccionar un diseño con la resolución suficiente para
asegurar que cualesquiera interacciones de interés potencial puedan estimarse.
E)'EMPLO s . 5 · · · · · · · · · Jll • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • •
Para ilustrar el uso de la tabla 814, suponga que se tienen siete factores y que el interés se encuentra en
estimar los siete efectos principales y hacerse una idea aproximada de las interacciones de dos factores.
Estamos dispuestos a suponer que las interacciones de tres factores y de órdenes superiores son insignifi
cantes. Esta información sugiere que un diseño de resolución IV sería apropiado.
La tabla 814 muestra que se cuenta con dos fracciones de resolución IV: la 2~2 con 32 corridas y la
2{~3 con 16 corridas. La tabla XII del apéndice contiene las relaciones de los alias completas para estos
dos diseños. Los alias para el diseño 2~3 de 16 corridas se encuentran en la tabla XII(i) del apéndice.
Observe que los siete efectos principales son alias de interacciones de tres factores. Las interacciones
de dos factores son alias en grupos de tres. Por lo tanto, este diseño satisfará los objetivos del problema;
es decir, permitirá la estimación de los efectos principales y dará cierta idea respecto de las interacciones
de dos factores. No es necesario correr el diseño 2~2, el cual requeriría 32 corridas. La tabla XIl(j) del
apéndice indica que este diseño permitiría la estimación de los siete efectos principales y que 15 de las 21
interacciones de dos factores también podrían estimarse de manera única. (Recuerde que las interaccio
nes de tres factores y de órdenes superiores son insignifícantes.) Ésta es más de la información necesaria
acerca de las interacciones. El diseño completo se muestra en la tabla 815. Observe que se construyó em
pezando con la corrida 16 del diseño 24 en A, B, C y D como el diseño básico y agregando después las tres
columnas E = ABC, F =BCD y G = ACD. Los generadores son I = ABCE,J BCDF e/= ACDG (tabla =
=
814). La relación de definición completa es I ABCE = BCDF = ADEF ACDG = BDEG CEFG = = =
ABFG .
.........................................................................
Análisis de los diseños factoriales fraccionados 24

Hay varios programas de computadora que pueden usarse para analizar el diseño factorial fraccionado
2k-P. Por ejemplo, el programa Design-Expert ilustrado en el capítulo 6 tiene esta capacidad.
E] diseño también puede analizarse recurriendo a los principios básicos; el efecto zésimo se estima con
f._= 2(Contraste¡) =Contraste¡

' N (NI~
donde el Contraste¡ se encuer..tra utilizando los signos positivos y negativos de la columna i y donde
N = 2k-P es el número total de observaciones. El diseño 2"P sólo permite la estimación de 2k-P 1 efectos (y
sus alias).
Tabla 814 Diseños factoriales fraccionados 24 seleccionados
Número de Número de Generadores
factores, k Fracción corridas del diseño
3 231 4 C= ±AB
m
4 2~1 8 D= ±ABC
5 2s1
V 16 E= ±ABCD
2s1 8 D= ±AB
m
E= ±AC
6 26l 32 F= ±ABCDE
VI
262 16 E= ±ABC
IV
F= ±BCD
263 8 D= ±AB
m
E= ±AC
F= ±BC
7 271 64 G= ±ABCDEF
VII
212
N 32 F= ±ABCD
G= ±ABDE
273
m 16 E= ±ABC
F= ±BCD
G= ±ACD
274 8 D= ±AB
m
E= ±AC
F= ±BC
G= ±ABC
8 282 64 G= ±ABCD
V
H= ±ABEF
283
]V 32 F= ±ABC
G= ±ABD
H= ±BCDE
2s.4
N 16 E= ±BCD
F= ±ACD
G= ±ABC
H= ±ABD
9 292 128 H= ±ACDFG
VI
J= ±BCEFG
293 64 G= ±ABCD
IV
H= ±ACEF
l= ±CDEF
294
N 32 F= ±BCDE
G= ±ACDE
H= ±ABDE
l= ±ABCE
295 16 E= ±ABC
JU
F= ±BCD
G= ±ACD
H= ±ABD
I= ±ABCD
10 2103
V 128 H= ±ABCG
J= ±ACDE
K= ±ACDF
328
TablaS14 (continuación)
factores, k Fracción corridas del diseño
2104
IV 64 G= ±BCDF
H= ±ACDF
l= ±ABDE
K= ±ABCE
zi0-s
IV 32 F= MBCD
G=MBCE
H= ±ABDE
l= ±ACDE
K= ±BCDE
2106 16 E= ±ABC
m
F= ±BCD
G = ±ACD
H= ±ABD
l= ±ABCD
K= ±AB
11 2115
IV 64 G= ±CDE
H = 'ZABCD
I = 'ZABF
K= ±BDEF
L = 'ZADEF
2116
IV 32 F= ±ABC
G= ±BCD
H= ±CDE
J= ±ACD
K= 'ZADE
L = ±BDE
zn7 16 E= ±ABC
111
F= ±BCD
G= ±ACD
H= ±ABD
J= ±ABCD
K= ±AB
L= ±AC
12 212S
m 16 E= ±ABC
F= ±ABD
G= ±ACD
H= ±BCD
l= ±ABCD
K= ±AB
L= ±AC
M=±AD
13 2139 16 E= ±ABC
w
F= ±ABD
G = 'ZACD
H= ±BCD
l= ±ABCD
K=±AB
329
330 CAPÍTULO 8 DISEÑOS FACTORIALES FRACCIONAOOS DE DOS NIVELES

factores,k Fracción corridas del diseño
L= ±AC
M=±AD
N=±BC
21410
14 m 16 E= ±ABC
F= ±ABD
=
G ±ACD
H= ±BCD
J= ±ABCD
K= ±AB
L= ±AC
M=±AD
N=±BC
O= ±BD
15 z1su 16 E= ±ABC
lII
F= 'ZABD
G = ±ACD
H= ±BCD
l= ±ABCD
K= ±AB
L= ±AC
M=±AD
N=±BC
O= ±BD
P= ±CD
Tabla 815 Un diseño factorial fraccionado ZJy3

Diseño básico
Corrida A B c D E=ABC F=BCD G=ACD
1
2 + + +
3 + + +
4 + + + +
5 + + + +
6 + + +
7 + + +
8 + + + +
9 + + +
10 + + + +
11 + + + +
12 + + +
13 + + +
14 + + + +
15 + + + +
16 + + + + + + +
84 EL DISEÑO FACTORIAL FRACCIONADO 2""' GENERAL 331
Proyección del diseño factorial fraccionado 24
El diseño 2k-P se reduce a un factorial completo o bien a un factorial fraccionado en cualquier subconjunto
de r s k - p de los factores originales. Esos subconjuntos de factores que producen diseños factoriales
fraccionados son subconjuntos que aparecen como palabras en la relación de definición completa. Esto
resulta de particular utilidad en los experimentos de tamizado cuando se sospecha desde el principio del
experimento que la mayoría de los factores originales tendrán efectos pequeños. El diseño factorial frac
cionado 2k-P puede proyectarse entonces en un factorial completo, por ejemplo, en los factores de mayor
interés. Las conclusiones a que se llegue con diseños de este tipo deberán considerarse tentativas y some
terse a análisis adicional. Por lo general es posible encontrar explicaciones alternativas de los datos que
intervienen en interacciones de órdenes superiores.
Como un ejemplo, considere el diseño 2~3 del ejemplo 85. Se trata de un diseño con 16 corridas en
el que intervienen siete factores. Se proyectará en un factorial completo en cuatro cualesquiera de los sie
te factores originales que no sean una palabra de la relación de definición. Hay 35 subconjuntos de cuatro
factores, siete de los cuales aparecen en la relación de definición completa (ver la tabla 815). Por lo tanto,
hay 28 subconjuntos de cuatro factores que formarían diseños 24• Una combinación que es obvia al ins
peccionar la tabla 815 es A, B, C y D.
Para ilustrar apropiadamente la utilidad de esta proyección, suponga que se realiza un experimento
para mejorar la eficiencia de un molino de bolas y los siete factores son los siguientes:
l. Velocidad del motor

2. Muesca
3. Modo de alimentación
4. 'Iamaño de la alimentación
5. Tipo de material
6. Ángulo de la criba
7. Nivel de vibración de la criba
Se tiene una certeza razonable de que la velocidad del motor, el tamaño de la alimentación y el tipo de
material afectarán la eficiencia y que además estos factores pueden interactuar. Se sabe menos del papel
de los otros tres factores, pero es probable que sean insignificantes. Una estrategia razonable sería asig
nar la velocidad del motor, el modo de alimentación, el tamaño de la alimentación y el tipo de material a
las columnas A, B, C y D, respectivamente, de la tabla 815. La muesca, el ángulo de la criba y el nivel de
vibración de la criba se asignarían a las columnas E, F y G, respectivamente. Si se está en lo correcto y las
"variables menores" E, Fy G son insignificantes, quedará un diseño 24 completo en las variables clave del
proceso.
Separación en bloques de diseños factoriales fraccionados
Ocasionalmente, un diseño factorial fraccionado requiere tantas corridas que no es posible realizarlas to
das bajo condiciones homogéneas. En estas situaciones, los diseños factoriales fraccionados pueden con
fundirse o mezclarse en bloques. La tabla XII del apéndice contiene los arreglos recomendados para la
separación en bloques de varios de los diseños factoriales.fraccionados de la tabla 814. El tamaño míni
mo de los bloques para estos diseños es de ocho corridas.
Para ilustrar el procedimiento general, considere el diseño factorial fraccionado 2~2 con la relación
de definición I = ABCE = BCDF = ADEF que se muestra en la tabla 810. Este diseño fraccionado con
tiene 16 combinaciones de tratamientos. Suponga que quiere correrse este diseño en dos bloques con
ocho combinaciones de tratamientos cada uno. Al seleccionar una interacción para confundirla con los
bloques, se observa por el examen de la estructura de los alias de la tabla XII(f) del apéndice que hay dos
332 CAPÍTULO 8 DISEÑOS FACTORIALESFRACCIONADOS DE DOS NIVELES
Bloque1 Bloque2
(1) ae
abf acf
ce( bef
abce be
abef df
bde abd
acd cde
bcdf abcdef
Figura 818 El diseño 2~2

en dos bloques con ABD con
fundida.
series de alias que incluyen únicamente interacciones de tres factores. La tabla sugiere seleccionar ABD
(y sus alias) para confundirla con los bloques. Se obtendrían así los dos bloques que se muestran en la fi
gura 818. Observe que el bloque principal contiene las combinaciones de tratamientos que tienen un nú
mero igual de letras en común conABD. Son también las combinaciones de tratamientos para las que
L = x1 + x2 + x4 = O (mod 2).
'EJEMPLO 8.-6 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Se usa una máquina CNC de cinco ejes para maquinar un propulsor utilizado en un motor de turbina. Los
perliles de los álabes son una característica importante de la calidad. Específicamente, es de interés la
desviación del perfil del álabe del perfil especificado en el plano de ingeniería. Se corre un experimento
para determinar cuáles son los parámetros de la máquina que afectan la desviación del perfil. Los ocho
factores seleccionados en el diseño son los siguientes:
Factor Nivel bajo H Nivel alto ( +)

A = desviación en el eje x (0.001 pulg) o 15
B = desviación en el eje y (0.001 pulg] o 15
C = desviación en el eje z (0.001 pulg) o 15
D = fabricante de la herramienta 1 2
E = desviación del eje a (0.001 grados) o 30
F =velocidad del areómetro (%) 90 110
G = altura de la plantilla sujetadora (0.001 pulg) o 15
H = velocidad de alimentación (%) 90 110
Se selecciona un álabe de prueba en cada pieza para inspeccionarlo. La desviación del perfil se mide utili
zando una máquina de medición coordenada, y la desviación estándar de la diferencia entre el perfil real y
el perfil especificado se usa como la variable de respuesta.
La máquina tiene cuatro areómetros. Puesto que puede haber diferencias en los areómetros, los in
genieros del proceso piensan que éstos deberán tratarse como bloques.
Los ingenieros se sienten confiados de que las interacciones de tres o más factores no son muy impor
tantes, pero están renuentes a ignorar las interacciones de dos factores. Por la tabla 814, inicialmente dos
84 EL DISEÑO FACTORIAL FRACCIONADO 2,._. GENERAL 333
diseños parecen ser apropiados: el diseño 2~4 con 16 corridas y el diseño 2~3 con 32 corridas. La tabla
XII(l) del apéndice indica que si se usa el diseño con 16 corridas, habrá un número considerable de alias
con interacciones de dos factores. Además, este diseño no puede correrse en cuatro bloques sin confundir
cuatro interacciones de dos factores con los bloques. Por lo tanto, los experimentadores deciden usar el
diseño 2~3 en cuatro bloques. En este diseño se confunden con los bloques una cadena de alias de in
teracciones de tres factores y una interacción de dos factores (EH) y sus alias de interacciones de tres fac
tores. La interacción EH es la interacción entre la desviación del eje a y la velocidad de alimentación, y los
ingenieros consideran que una interacción entre estas dos variables es altamente improbable.
La tabla 816 contiene el diseño y las respuestas resultantes en términos de desviación estándar x 103
pulg. Puesto que la variable de respuesta es una desviación estándar, con frecuencia es mejor efectuar el
análisis después de una transformación logarítmica. En la tabla 817 se muestran las estimaciones. de los
efectos. La figura 819 es una gráfica de probabilidad normal de las estimaciones de los efectos, utilizando
In (desviación estándar X 103) como la variable de respuesta. Los únicos efectos grandes son A = desvia
ción del ejex, B = desviación del eje y, y la cadena de alias que incluye AD + BG. Ahora bien,AD es la in
Tabla 816 zs

El diseño 3 en cuatro bloques del ejemplo 86
Diseño básico Orden real Desviación estándar
Corrida A B e D E F=ABC G =ABD H=BCDE Bloque de las corridas (X 103 pulg)
1 + 3 18 2.76
2 + + + + 2 16 6.18
3 + + + 4 29 2.43
4 + + 1 4 4.01
5 + + 1 6 2.48
6 + + + 4 26 5.91
7 + + + + 2 14 2.39
8 + + + + + 3 22 3.35
9 + + 1 8 4.40
10 + + + 4 32 4.10
11 + + + + 2 15 3.22
12 + + + + + 3 19 3.78
13 + + + + + 3 24 5.32
14 + + + + 2 11 3.87
15 + + + 4 27 3.03
16 + + + + + + 1 3 2.95
17 + 2 10 2.64
18 + + + + 3 21 5.50
19 + + + + + 1 7 2.24
20 + + + + 4 28 4.28
21 + + + + 4 30 2.57
22 + + + + + 1 2 5.37
23 + + + + 3 17 2.11
24 + + + + + 2 13 4.18
25 + + + + 4 25 3.96
26 + + + + + 1 1 3.27
27 + + + + 3 23 3.41
28 + + + + + 2 12 4.30
29 + + + + + 2 9 4.44
30 + + + + 3 20 3.65
31 + + + + + 1 5 4.41
32 + + + + + + + + 4 31 3.40
334 CAPÍTIJLO 8 DISEÑOS FACTORIALESFRACCIONADOS DE DOS NIVELES
Tabla 817 Estimaciones de los efectos, coeficientes de regresión y sumas de cuadrados del ejemplo 86
Variable Nombre Nivel 1 Nivel+ 1
A Desviación del eje x O 15
B Desviación del eje y O 15
C Desviación del eje z O 15
D Fabricante de la herramienta 1 2
E Desviación del eje a O 30
F Velocidad del areómetro 90 110
G Altura de la plantilla sujetadora O 15
H Velocidad de alimentación 90 110
A 0.14513 0.29026 0.674020
B 0.10027 0.20054 0.321729
e 0.01288 0.02576 0.005310
D 0.05407 0.10813 0.093540
E 2.531E04 5.063E04 2.050E06
F 0.01936 0.03871 0.011988
G 0.05804 0.11608 0.107799
H 0.00708 0.01417 0.001606
AB + CF+DG 0.00294 0.00588 2.767E04
AC+BF 0.03103 0.06206 0.030815
AD+BG 0.18706 0.37412 1.119705
AE 0.00402 0.00804 5.170E04
AF+BC 0.02251 0.04502 0.016214
AG+BD 0.02644 0.05288 0.022370
AH 0.02521 0.05042 0.020339
BE 0.04925 0.09851 0.077627
BH 0.00654 0.01309 0.001371
CD+FG 0.01726 0.03452 0.009535
CE 0.01991 0.03982 0.012685
CG+DF 0.00733 0.01467 0.001721
CH 0.03040 0.06080 0.029568
DE 0.00854 0.01708 0.002334
DH 0.00784 0.01569 0.001969
EF 0.00904 0.01808 0.002616
EG 0.02685 0.05371 0.023078
EH 0.01767 0.03534 0.009993
FH 0.01404 0.02808 0.006308
GH 0.00245 0.00489 1.914E04
ABE 0.01665 0.03331 ·0.008874
ABH 0.00631 0.01261 0.001273
ACD 0.02717 0.05433 0.023617
ºSólo los efectos principales y las interacciones de dos factores.
84 EL DISEÑO FACTORIAL FRACCIONADO 2~ GENERAL 335
•
A 99
5 95
~ 10 90
X
¡;:. 20 80
1
s 30 70
e
¡¡; e
E 50 50 ';
o O:.'"'
...,e:
70 30
:2 20
80
~
e
" 90 10
B
95
AD
• 5
99
•
.40 -.30 -.20 -.10 o .10 .20 .30
Estimaciones de los efectos
Figura 819 Gráfica de probabilidadnormal de las estimacionesde los efectos

del ejemplo 86.
teracción desviación del eje xfabricante de la herramienta, y BG es la interacción desviación del eje
yaltura de la plantilla sujetadora, y como estas dos interacciones son alias es imposible separarlas con
base en los datos del experimento en curso. Puesto que ambas interacciones incluyen un efecto principal
grande, también es difícil aplicar cualquier simplificación lógica "obvia" en esta situación. Si se contara
con algún conocimiento de ingeniería o del proceso que arrojara luz sobre la situación, entonces quizá po
dría hacerse una elección entre las dos interacciones; en caso contrario, se necesitarán más datos para se
parar estos dos efectos (el problema de agregar corridas en un diseño factorial fraccionado para separar
los alias de las interacciones, se estudia en la sección 85 y en el material suplementario de este capítulo).
Suponga que el conocimiento del proceso sugiere que posiblemente la interacción apropiada seaAD.
La tabla 818 es el análisis de varianza resultante para el modelo con los factoresA, B, D y AD (el factor D
se incluyó para preservar el principio de jerarquía). Observe que el efecto del bloque es pequeño, lo cual
sugiere que los areómetros de la máquina no son muy diferentes.
La figura 820 es una gráfica de probabilidad normal de los residuales de este experimento. Esta grá
fica sugiere la presencia de colas ligeramente más gruesas que las normales, por lo que posiblemente de

A 0.6740 1 0.6740 39.42 <0.0001
B 0.3217 1 0.3217 18.81 0.0002
D 0.0935 1 0.0935 5.47 0.0280
AD 1.1197 1 1.1197 65.48 <0.0001
Bloques 0.0201 3 0.0067
Error 0.4099 24 0.0171
Tu tal 2.6389 31
336 CAPÍ1ULO 8 DISEÑOS FACTORIALES FRACCIONADOS DE DOS NIVELES
• 99
5 95
o
~ 10 90
X
ii:""
1
20 80
!:: 30 70
o
o
o;
E 50 50-;;
,,g 30
¡¡;"'
;g'" 70
:s 80 20
i 90 10
95 5
99 •
-0.25 o 0.25
Residuales
1.825
0.75
Baja Alta
Desviación del eje x (A)
Figura 821 Gráfica de la interacción AD para el ejemplo 8·6.

85 DISEÑOS DE RESOLUCIÓN III 33 7
1.247 1.273
1
1
1
1
1 1.504 1.310
Desviacióndel eje y-B
l'l'l'l'l'•·~rl2cantede
1'0_9595 1.745 ~a,;;;;amlenta.D

o
1
o +15
Desviacióndel eje x, A
Figura 822 El diseño 2~3 del ejemplo 86 proyectado en cuatro

réplicas de un diseño 23 en los factores A, B y D.
ban considerarse otras transformaciones. La gráfica de la interacción AD se presenta en la figura 821.

Observe que el fabricante de la herramienta (D) y la magnitud de la desviación del ejex (A) tienen un im
pacto profundo en la variabilidad, del perfil del álabe, de las especificaciones de diseño. Correr A en el ni
vel bajo (O desviación) y comprar las herramientas al fabricante 1 produce los mejores resultados. En la
figura 822 se muestra la proyección de este diseño 2:i.;3 en cuatro réplicas de un diseño 23 en los factores
A, By D. La mejor combinación de las condiciones de operación esA en el nivel bajo (O desviación), Ben
el nivel alto (0.015 en desviación) y D en el nivel bajo (fabricante de herramientas 1 ).
s. 5 DISEÑOS DE RESOLUCIÓN llI
Como se señaló anteriormente, el uso secuencial de los diseños factoriales fraccionados es muy útil, lle
vando con frecuencia a una gran economía y eficiencia de la experimentación. Se ilustran ahora estas
ideas utilizando la clase de los diseños de resolución 111.
Es posible construir diseños de resolución 111 para investigar hasta k = N 1 factores en sólo N corri
das, donde N es un múltiplo de 4. Con frecuencia estos diseños son útiles en la experimentación indus
trial. Los diseños en los que N es una potencia de 2 pueden construirse con los métodos presentados
anteriormente en este capítulo, y éstos se presentan primero. De particular importancia son los diseños
que requieren 4 corridas para hasta 3 factores, 8 corridas para hasta 7factoresy16 corridas para hasta 15
factores. Si k = N - 1, se dice que el diseño factorial fraccionado está saturado.
Un diseño para analizar hasta tres factores en cuatro corridas es el diseño 2~~1, el cual se presentó en
la sección 82. Otro diseño factorial fraccionado saturado muy útil es el diseño para estudiar siete factores
en ocho corridas, es decir, el diseño 2~4• Este diseño es una fracción un dieciseisavo del diseño 27• Puede
construirse apuntando primero los niveles positivos y negativos de un diseño 23 completo en A, B y C
como el diseño básico, y asociando después los niveles de cuatro factores adicionales con las interacciones
= = =
de los tres factores originales de la siguiente manera: D AB, E AC, F BC y G ABC. Por lo tanto, =
=
los generadores de este diseño son I = ABD,l = ACE,l BCF e I = ABCG. El diseño se muestra en la ta
bla 819.
Tabla 819 El diseño z~ 4 con los generadores 1 = ABD, I = ACE, l = BCF e I == ABCG
Disefio básico
Corrida A B e D=AB E=AC F=BC G=ABC
1 + + + def
2 + + + afg
3 + + + beg
4 + + + abd
5 + + + cdg
6 + + + a ce
7 + + + bcf
8 + + + + + + + abcdefg
La relación de definición completa de este diseño se obtiene multiplicando entre sí los cuatro genera
doresABD, A CE, BCFy ABCG de dos en dos, de tres en tres y los cuatro a la vez, de donde se obtiene
I= ABD= ACE= BCF= ABCG= BCDE= ACDF= CDG
= ABEF= BEG= AFG= DEF= ADEG= CEFG""" BDFG= ABCDEFG
Para encontrar los alias de cualquier efecto, simplemente se multiplica el efecto por cada palabra de la re
lación de definición. Por ejemplo, los alias de B son
B= AD= ABCE= CF= ACG== CDE= ABCDF= BCDG= AEF= EG
= ABFG= BDEF = ABDEG= BCEFG= DFG= ACDEFG
Este diseño es una fracción un dieciseisavo, y como los signos elegidos para los generadores son posi
tivos, se trata de la fracción principal. Es también de resolución 111 porque el número menor de letras de
cualquier palabra de la definición de contraste es tres. Cualquiera de los 16 diferentes diseños 2¡1¡4 de esta
familia podría construirse utilizando los generadores con 1 de los 16 arreglos posibles de los signos en
I = ±ABD, I = ±ACE, I = ±BCF, I = ±ABCG.
Los siete grados de libertad de este diseño pueden usarse para estimar los siete efectos principales.
Cada uno de estos efectos tiene 15 alias; sin embargo, si se supone que las interacciones de tres o más fac
tores son insignificantes, se consigue entonces una simplificación considerable en la estructura de los alias.
Estableciendo este supuesto, cada una de las combinaciones lineales asociadas con los siete efectos
principales de este disefio es en realidad una estimación del efecto principal y las tres interacciones de dos
factores:
RA -A+BD+CE+FG
R8 -B+AD+CF+EG
Re -c+AE+BF+DG
Rv -D+AB+CG+EF (81)
fE -E+AC+BG+DF
fF -F+BC+AG+DE
RG -G+CD+BE+AF
Estos alias se encuentran en la tabla XII(h) del apéndice, ignorando las interacciones de tres factores y de
órdenes superiores.
85 DISEÑOS DE RESOLUCIÓN III 339
El diseño saturado 2ri~4 de la tabla 819 puede usarse para obtener diseños de resolución 111 para es
tudiar menos de siete factores en ocho corridas. Por ejemplo, para generar un diseño para seis factores en
ocho corridas, simplemente se elimina cualquiera de las columnas de la tabla 819, digamos la G. Se obtie
ne así el diseño que se muestra en la tabla 820.
Es sencillo verificar que este diseño es también de resolución 111; de hecho es un diseño 2~113, o una
fracción un octavo, del diseño 26• La relación de definición del diseño 2~fi3 es igual a la relación de defini
ción del diseño 2 ril4 original, con las palabras que incluyen la letra G eliminadas. Por lo tanto, la relación
de definición del nuevo diseño es
I = ABD = ACE = BCF = BCDE = ACDF = ABEF = DEF

En general, cuando se eliminan d factores para producir un nuevo diseño, la nueva relación de definición
se obtiene de las palabras de la relación de definición original que no contienen ninguna de las letras eli
minadas. Cuando se construyen diseños con este método, deberá prestarse atención para obtener el me
jor arreglo posible. Si se eliminan las columnas B, D, F y G de la tabla 819, se obtiene un diseño para tres
factores en ocho corridas, no obstante que las combinaciones de tratamientos corresponden a dos répli
cas de un diseño 23• Probablemente el experimentador preferiría correr un diseño 23 completo enA, C y E.
'Iambién es posible obtener un diseño de resolución 111 para estudiar hasta 15 factores en 16 corridas.
Este diseño Z~f¡11 saturado puede generarse apuntando primero las 16 combinaciones de tratamientos
asociadas con un diseño 24 enA,B, C y De igualando después 11 nuevos factores con las interacciones de
dos, tres y cuatro factores de los cuatro factores originales. En este diseño, cada uno de los 15 efectos prin
cipales es alias de siete interacciones de dos factores. Puede usarse un procedimiento similar para el dise
ño 2~26, lo cual permite el estudio de hasta 31 factores en 32 corridas.
Ensamblaje secuencial de fracciones para separar efectos

Mediante la combinación de diseños factoriales fraccionados en los que se han intercambiado ciertos sig
nos, es posible aislar de manera sistemática los efectos de interés potencial. A este tipo de experimento
secuencial se le llama doblez o plegado (fold over) del diseño original. La estructura de los alias de cual
quier fracción con los signos de uno o más de los factores invertidos se obtiene haciendo el cambio de sig
no apropiado en los factores de la estructura de los alias de la fracción original.
TablaS20 El disefio 2ti¡3 con los generadores I = ABD, I = ACE e I = BCF

Diseño básico
Corrida A B e D=AB E=AC F=BC
1 + + + def
2 + + af
3 + + be
4 + + + abd
5 + + cd
6 + + + a ce
7 + + + bcf
8 + + + + + + abcdef
Considere el diseño 2~~4 de la tabla 819. Suponga que junto con esta fracción principal se corre tam
bién un segundo diseño fraccionado con los signos invertidos en la columna del factor D. Es decir, la co
lumna de D de la segunda fracción es
-++--++-
Los efectos que pueden estimarse a partir de la primera fracción se muestran en la ecuación 81, y a partir
de la segunda fracción se obtiene
f.~ -A-BD+CE+FG
P.~ - B-AD+CF+ EG
P.~ - C+AE+BF-DG
es decir, P.~ - D-AB-
CG- EF (82)
r.; --D+AB+CG+EF
f.~ -E+AC+BG-DF
P.~ -F+BC+AG-DE
r; -G-CD+BE+AF
suponiendo que no son significativas las interacciones de tres factores y de órdenes superiores. Ahora
bien, a partir de las dos combinaciones lineales de los efectos t(f.¡ + f';) y t(f.; f.';) se obtiene
De!((+ f'.)
A A+CE+FG BD
B B + CF+EG AD
e C+AE+BF DG
D D AB+CG +EF
E E+AC+BG DF
F F+BC+AG DE
G G +BE +AF CD
Por lo tanto, se ha aislado el efecto principal de D y todas sus interacciones de dos factores. En gene
ral, si a un diseño fraccionado de resolución III o mayor se le agrega una fracción adicional con los signos
de un solo factor invertidos, entonces el diseño combinado producirá las estimaciones del efecto principal
de ese factor y sus interacciones de dos factores.
Suponga ahora que a un diseño fraccionado de resolución III se le agrega una segunda fracción en la
que los signos de todos los factores están invertidos. Este tipo de doblez (llamado en ocasiones doblez com
pleto o reflexión) rompe los vínculos de alias entre los efectos principales y las interacciones de dos facto
res. Es decir, puede usarse el diseño combinado para estimar todos los efectos principales quitados de
todas las interacciones de dos factores. En el siguiente ejemplo se ilustra la técnica.
Ej"EMPLO 8-7 · · · · · · · · · • · • • • • · · • • · • · • • · • • • · · • · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Un analista de desempeño humano conduce un experimento para estudiar el tiempo de enfoque del ojo y
ha construido un aparato en el que pueden controlarse varios factores durante la prueba. Los factores
que considera importantes inicialmente son la agudeza o claridad visual (A), la distancia del objetivo al
ojo (B), la forma del objetivo (C), el nivel de iluminación (D), el tamaño del objetivo (E), la densidad del
objetivo (F) y el sujeto (G). Se consideran dos niveles de cada factor. El analista sospecha que sólo algu
nos de estos siete factores son de importancia principal y que pueden omitirse las interacciones de órde
85 DISEÑOS DE RESOLUCIÓN III 341
Tabla 821 Diseño 2 ~~4 para el experimento del tiempo de enfoque del ojo
Diseño básico
Corrida A B e D=AB E=AC F=BC G=ABC Tiempo
1 + + + def 85.5
2 + + + afg 75.1
3 + + + beg 93.2
4 + + + abd 145.4
5 + + + cdg 83.7
6 + + + a ce 77.6
7 + + + bcf 95.0
8 + + + + + + + abcdefg 141.8
nes superiores entre los factores. Con base en este supuesto, el analista decide correr un experimento de
tamizado para identificar los factores más importantes para después enfocar el estudio en los mismos.
Para explorar estos siete factores, el experimentador corre las combinaciones de tratamientos del diseño
2;¡¡4 de la tabla 819 de manera aleatoria, obteniendo los tiempos de enfoque en milisegundos, como se
muestra en la tabla 821.
A partir de estos datos pueden estimarse siete efectos principales y sus alias. Por la ecuación 81 se
observa que los efectos y sus alias son
f.A = 20.63-+A+BD+CE+FG
f.B= 38.38-B+AD+CF+EG
le= -0.28-C+AE+BF+DG
fD = 28.88-D+AB+CG+EF
e, = -0.28-E+AC+BG+DF
P.F = -0.63-+F+BC+AG+DE
P.G = -243-+G+CD+BE+AF
• Por ejemplo,
f. A= i(85.5+75.1 93.2+145.4 83.7+77.6 95.0+141.8) = 20.63
Los tres efectos más grandes son f.A, f.B y f.D. La interpretación más simple de los datos es que los efectos
principales de A, By D son todos significativos. Sin embargo, esta interpretación no es única, ya que otra
conclusión lógica sería que A, By la interacciónAB, o quizá B, D y la interacción BD, o tal vez A, D y la in
teracción AD son los verdaderos efectos.
Observe queABD es una palabra en la relación de definición de este diseño. Por lo tanto, este diseño
2;¡;4 no se proyecta en un factorial 23 enABD; en cambio, se proyecta en dos réplicas de un diseño 23i,
como se ilustra en la figura 823. Puesto que el diseño 2>1 es de resolución 111,A será alias de BD, B será
alias de AD y D será alias deAB, por lo que no es posible separar las interacciones de los efectos principa
les. En este caso, quizá el analista haya tenido mala suerte. Si hubiera asignado el nivel de iluminación a C
en lugar de aD, el diseño se habría proyectado en un diseño 23 completo, y la interpretación podría haber
sido más sencilla.
Para separar los efectos principales y las interacciones de dos factores, se corre una segunda fracción
con todos los signos invertidos. Este doblez del diseño se muestra en la tabla 822, junto con las respuestas
observadas, Note que cuando se hace el doblez de un diseño de resolución 111 de esta manera, de hecho se
342 . CAPÍTULO 8 DISEÑOS FACTORIALES FRACCIONAOOS DE DOS NIVELES
+
1
1
1
,. , . . . . . . . __ __ 0+
D 1
+
A
Figura 8·23 El diseño 2i;¡4 proyectado en
dos réplicas de un diseño 2~1 enA,B y D.
cambian los signos de los generadores que tienen un número impar de letras. Los efectos estimados por
esta fracción son
E.~ =17.68 _,,.A-BD-CE-FG
E.~= 37.73....,,.B-AD-CF-EG
.e~= -3.33....,,.C-AE-BF-DG
.e~= 29.88....,,. D-AB- CG EF
.e~= 0.53....,,. E-AC-BG-DF
E.~= 1.63....,,. F-BC-AG- DE
.e~ = 2.68 . . , . G CD- BE- AF
Al combinar esta segunda fracción con la original se obtienen las siguientes estimaciones de los efectos:
A A= 1.48 BD + CE + FG = 19.15
B B = 38.05 AD + CF + EG = 0.33
·e e= 1.80 AE + BF + DG = 1.53
D D = 29.38 AB + CG + EF = O.SO
E E= 0.13 AC + BG + DF = 0.40
F F = 0.50 BC +AG +DE =1.53
G G = 0.13 CD +BE + AF = 2.55
Tabla 822 Un doblez del diseño Ziñ~ en el experimento del tiempo de enfoque del ojo
Diseño básico
Corrida A B e D=-AB E=-AC F=-BC G=ABC Tiempo
1 + + + + abcg 91.3
2 + + + + bcde 136.7
3 + + + + acdf 82.4
4 + + + + cefg 73.4
5 + + + + abef 94.1
6 + + + + bdfg 143.8
7 + + + + adeg 87.3
8 (1) 71.9
85 DISEÑOS DE RESOLUCIÓN Ill 343
Los dos efectos más grandes son By D. Además, el tercer efecto más grande es BD + CE + FG, por lo
que parece razonable atribuir esto a la interacción BD. El analista usó los dos factores, distancia (B) y ni
vel de iluminación (D), en experimentos subsecuentes con los demás factoresA, C, E y F en ajustes están
dar, y verificó los resultados obtenidos aquí. Decidió usar los sujetos como bloques en estos nuevos
experimentos en lugar de ignorar el efecto potencial del sujeto debido a que fue necesario utilizar varios
sujetos diferentes para completar el experimento .
.................................................... .
La relación de definición para un diseño de doblez
La combinación de diseños factoriales fraccionados por medio de un doblez, como la que se hizo en el
ejemplo 8 7, es una técnica muy útil. Con frecuencia es de interés conocer la relación de definición del di
seño combinado. Puede determinarse con facilidad. Cada fracción separada tendrá L + U palabras usa
das como generadores: L palabras con el mismo signo y U palabras con signos diferentes. En el diseño
combinado se usaránL + U1 palabras como generadores. Éstas serán lasL palabras con el mismo signo
y las U 1 palabras que constan de productos pares independientes de las palabras que tienen signos dife
rentes. (Los productos pares son las palabras tomadas de dos en dos, de cuatro en cuatro, etcétera.)
Para ilustrar este procedimiento, considere el diseño del ejemplo 87. Para la primera fracción, los ge
neradores son
I= ABD, l= ACE, I= BCF e l= ABCG
y para la segunda fracción son
I = -ABD, I = -ACE, 1 = -BCF e I = ABCG
Observe que en la segunda fracción se han intercambiado los signos de los generadores con un número
impar de letras. Asimismo, observe que L + U= 1 + 3 = 4. El diseño combinado tendrá!= ABCG (lapa
labra con el mismo signo) como generador y dos palabras que son productos pares independientes de las
palabras con signos diferentes. Por ejemplo, tómese I = ABD e I = ACE; entonces I = (ABD)(ACE) =
BCDE es un generador del diseño combinado. Asimismo, tómese I =
ABD e I = BCF; entonces
I = (ABD)(BCF) = ACDF es un generador del diseño combinado. La relación de definición completa
para el diseño combinado es
I= ABCG= BCDE= ACDF= ADEG= BDFG= ABEF= CEFG
Diseños de PlackettBurman
Estos diseños, atribuidos a Plackett y Burman, son diseños factoriales fraccionados de dos niveles para es
tudiar k = N 1 variables en N corridas, donde N es un múltiplo de 4. Si N es una potencia de 2, estos dise
ños son idénticos a los que se presentaron anteriormente en esta sección. Sin embargo, para N = 12, 20,
24, 28 y 36, los diseños de PlackettBurman en ocasiones son de interés. Puesto que estos diseños no pue
den representarse como cubos, en ocasiones se les llama diseños no geométricos.
En la mitad superior de la tabla 823 se presentan los renglones de signos positivos y negativos que se
usan para construir los diseños de PlackettBurman para N = 12, 20, 24 y 36, mientras que en la mitad in
ferior de la tabla se presentan los bloques de signos positivos y negativos para construir el diseño paraN =
28. Los diseños para N = 12, 20, 24 y 36 se obtienen escribiendo el renglón apropiado de la tabla 823
como una columna (o renglón). Entonces se genera una segunda columna (o renglón) a partir de la pri
mera moviendo los elementos de la columna (o renglón) hacia abajo (o hacia la derecha) una posición y
colocando el último elemento en la primera posición. Una tercera columna (o renglón) se produce a par
tir de la segunda de manera similar, y el proceso se continúa hasta que se genera la columna (o renglón) k.
344 CAPÍTIJLO 8 DISEÑOS FACTORIALES FRACCIONAOOS DE DOS NIVELES
Tabla 823 Signos positivos y negativos para los diseños de PlackettBurman

k =11, N =11++++++
k =19, N=20++++++++++
k = 23, N = 24++++++++++++
k = 35, N = 36++++++++++++++++++
k=27,N=28
+++++ +++ ++++++
+++++ +++ ++++++
+++++ +++ ++++++
+++++ +++ ++++++
+++++ +++ ++++++
+++++ +++ ++++++
+++++ +++ ++++++
+++++ +++ ++++++
+++++ +++ ++++++
Después se agrega un renglón de signos negativos, completándose así el diseño. ParaN = 28, los tres blo
ques x;
Y y Z se apuntan en el orden
XYZ
ZXY
YZX
y se agrega un renglón de signos negativos a estos 27 renglones. El diseño para N = 12 corridas y k = 11
factores se muestra en la tabla 824.
Los diseños no geométricos de PlackettBurman paraN = 12, 20, 24, 28 y 36 tienen estructuras de los
alias muy intrincadas. Por ejemplo, en el diseño de 12 corridas, todos los efectos principales son alias par·
ciales de cada una de las interacciones de dos factores en los que no están incluidos. Por ejemplo, la in
teracción AB es alias de los nueve efectos principales C, D, ... , K. Además, cada uno de los efectos
principales son alias parciales de 45 interacciones de dos factores. En diseños más grandes, la situación es
todavía más compleja. Se recomienda al experimentador usar estos diseños con mucho cuidado.
Tabla 824 Diseño de PlackettBurman para N = 12, k = 11

Corrida A B e D E F G H I J K
1 + + + + + +
2 + + + + + +
3 + + + + + +
4 + + + + + +
5 + + + + + +
6 + + + + + +
7 + + + + + +
8 + + + + + +
9 + + + + + +
10 + + + + + +
11 + + + + + +
12
85 DISEÑOS DE RESOLUCIÓN 111 345
•
1
1
1
¡_ __
,,.. /
/
•
a1 Proyección en tres factores
1
1
1
1 _
/
/
/
b1 Proyección en cuatro factores
Figura 824 Proyeccióndel diseño de PlackettBurman de 12 corridas

en diseños de tres y cuatro factores.
Las propiedades proyectivas de los diseños no geométricos de PlackettBurman no son avasalladora

mente atractivas. Por ejemplo, considere el diseño de 12 corridas de la tabla 824. Este diseño se proyecta
rá en tres réplicas de un diseño 22 completo en dos cualesquiera de los 11 factores originales. Sin embargo,
en tres factores, el diseño proyectado es un diseño 23 completo más un factorial fraccionado 2~1~1 (ver la fi
gura 824a). Por lo tanto, el diseño de PlackettBurman de resolución 111 tiene proyectividad 3, lo cual sig
nifica que se plegará en un diseño factorial completo en cualquier subconjunto de tres factores. El diseño
2~1? sólo tiene proyectividad 2. Las proyecciones de cuatro dimensiones se muestran en la figura 824b.
Observe que estas proyecciones de tres y cuatro factores no son diseños balanceados.
'E]"EMPLO 8-8 · • • • • • • · · · · · · · · · · · · · · • • • • · · · · · · · · · · · · · • • • • • • • · • • • • · • • • · · · · · · ·
Se ilustrarán algunas de las dificultades potenciales asociadas con los diseños de PlackettBurman utilí
zando el diseño de 11 variables con 12 corridas y un conjunto de datos simulados. Se supondrá que el pro
ceso tiene tres efectos principales significativos (A, B, D) y dos interacciones significativas de dos factores
(AB y AD). El modelo es
y= 200+8x1 +10x2 +12x4 l2x1x2 +9x1x4 +e
donde cada X; es una variable codificada definida en el intervalo 1, + 1 y e es un término NID(O, 9) del
error aleatorio. Por lo tanto, tres de los k = 11 factores son grandes, y hay dos interacciones grandes; la si
tuación no está fuera de razón.
En la tabla 825 se presenta el diseño de PlackettBurman con 12 corridas y las respuestas simuladas.
Este diseño luce diferente al diseño de 12 corridas de la tabla 824 porque se construyó utilizando el ren
Tabla 825 Diseño de PlackettBurman para el ejemplo 88

Corrida A B e D E F G H J K L Respuesta
1 + + + + + + 231
2 + + + + + + 207
3 + + + + + + 230
4 + + + + + + 217
5 + + + + + + 175
6 + + + + + + 176
7 + + + + + + 183
8 + + + + + + 185
9 + + + + + + 181
10 + + + + + + 220
11 + + + + + + 229
12 168
glón de signos para k = 11, N = 12 de la tabla 823 como renglón. En la tabla 826 se muestran las estima
ciones de los efectos. Observe que hay siete efectos grandes:A, B, C, D, E, J y K (y, desde luego, sus alias).
No es evidente de inmediato que algunos de estos efectos podrían ser interacciones. Parte de esta ambi
güedad podría resolverse haciendo el doblez del diseño. Con esto por lo general se resolverán los efectos
principales, pero con frecuencia sigue dejando al experimentador con la incertidumbre acerca de los efec
tos de las interacciones.
La dificultad para interpretar un diseño de PlackettBurman, ilustrada en el ejemplo anterior, ocurre

con mucha frecuencia en la práctica. Si la elección está entre un diseño geométrico 2~~¡7 con 16 corridas o
un diseño de PlackettBurman con 12 corridas que quizá tenga que doblarse (para lo cual se requerirían
24 corridas), el diseño geométrico puede resultar una mejor elección. Para mayores detalles ver Montgo
mery, Borror y Stanley [81]. Bajo ciertas condiciones, los alias de un diseño no geométrico de Plac
Tabla 826 Estimaciones de los efectos, coeficientes de regresión y sumas de cuadrados del ejemplo 88
A 6.333 12.667 481.333
B 6.667 13.333 533.333
e 6.833 12.667 560.333
D 17.000 34.000 3468.000
E 6.833 13.667 560.333
F 0.500 1.000 3.000
G 1.167 2.333' 16.333
H l.500 3.000 27.000
J 6.333 12.667 481.333
K ~.833 11.667 408.333
L 0.167 0.333 0.333
ªTudoslos efectos principalesson alias parciales de 45 interacciones de dos factores.
86 DISEÑOS DE RESOLUCIÓN IV Y V 34 7
kettBurman pueden desenredarse utilizando técnicas de construcción de modelos de regresión. Esto se
analiza en Hamada y Wu [53].
86 DISEÑOS DE RESOLUCIÓN IV Y V
Un diseño factorial fraccionado 2k-P es de resolución IV si los efectos principales están separados de las
interacciones de dos factores y algunas interacciones de dos factores son alias entre sí. Por lo tanto, si se
suprimen las interacciones de tres factores y de órdenes superiores, los efectos principales pueden esti
marse directamente en un diseño 2~~P. Un ejemplo es el diseño 2~2 de la tabla 810. Además, las dos
fracciones combinadas del diseño 2;;¡4 del ejemplo 87 producen un diseño 2~3•
Cualquier diseño 2~ P debe incluir al menos 2k corridas. A los diseños de resolución IV que contie
nen exactamente 2k corridas se les llama diseños mínimos. Los diseños de resolución IV pueden obte
nerse a partir de diseños de resolución III por el proceso de doblado. Recuerde que para hacer el doblez
de un diseño 2;?, simplemente se agrega a la fracción original una segunda fracción con todos los sig
nos invertidos. Entonces los signos positivos en la columna identidad I de la primera fracción podrían
intercambiarse en la segunda fracción, y el factor (k + 1)ésimo podría asociarse con esta columna. El
resultado es un diseño factorial fraccionado 2::
1-p. El proceso se muestra en la tabla 827 para el diseño
2~1• Es sencillo verificar que el diseño resultante es un diseño 2~1 con la relación de definición
I =ABCD.
También es posible hacer el doblez de diseños de resolución IV para separar las interacciones de dos
factores que son alias entre sí. Montgomery y Runger [83c] hacen notar que un experimentador puede te
ner varios objetivos al hacer el doblez de un diseño de resolución IY, como 1) romper tantas cadenas de
alias de interacciones de dos factores como sea posible, 2) romper las interacciones de dos factores en una
cadena de alias específica, o 3) romper las interacciones de dos factores que incluyen un factor específico.
Una manera de hacer el doblez de un diseño de resolución IV es corriendo una segunda fracción en la que
se invierte el signo de todos los generadores del diseño que tienen un número impar de letras. Para ilus
trar, considere el diseño 2~2 usado en el experimento del moldeo por inyección del ejemplo 84. Los ge
neradores del diseño de la tabla 810 son I = ABCE e I = BCDF. La segunda fracción usaría los
Tabla 827 Diseño 2~1 obtenido por doblez

D
l A B C
Diseño 2;1 orginal con l = ABC
+ +
+ +
+ +
+ + + +
Segundo disefio 2~1 con los signos intercambiados
+ +
+ +
+ +
generadores 1 = -ABCE e I = -BCDF, y el generador único para el diseño combinado sería I = ADEF.
Por lo tanto, el diseño combinado sigue siendo un diseño factorial fraccionado de resolución IV. Sin em
bargo, las relaciones de los alias serán mucho más sencillas que en el diseño 2;2 original. De hecho, las
únicas interacciones de dos factores que tendrán alias sonAD = EF, AE = DFy AF =DE. Todas las de
más interacciones de dos factores pueden estimarse a partir del diseño. combinado.
Como otro ejemplo, considere el diseño 2~3 con 32 corridas. La tabla 814 indica que el mejor con
junto de generadores para este diseño es 1 = ABCF, I = ABDG e I = BCDEH. En la tabla XII(m) del
apéndice se muestran los alias para este diseño. Observe que hay seis pares de interacciones de dos facto
res y un grupo de tres interacciones de dos factores que son alias. Si se hace el doblez de este diseño, la se
gunda fracción tendría los generadores I = -ABCF, 1 = -ABDG e I =BCD EH. El diseño combinado tiene
los generadores I = CDFG e I = BCDEH, y la relación de definición completa es
I = CDFG= BCDEH = BEFGH
El diseño combinado es de resolución IV, pero las únicas interacciones de dos factores que siguen tenien
do alias son CD = FG, CF = DG y CG = DF. Se trata de una simplificación considerable de los alias de la
fracción original.
Observe que cuando se empieza con un diseño de resolución III, el procedimiento de doblez garanti
za que el diseño combinado será de resolución IV, con lo cual se asegura que todos los efectos principales
pueden separarse de sus alias en interacciones de dos factores. Cuando se hace el doblez de un diseño de
resolución IV, no necesariamente se separarán todas las interacciones de dos factores. De hecho, si la
fracción original tiene una estructura de los alias con más de dos interacciones de dos factores en cual
quier cadena de alias, el doblez no separará completamente todas las interacciones de dos factores.
Ambos ejemplos anteriores, el 2~z y el 2~3, tienen al menos una de tales cadenas de alias de interaccio
nes de dos factores. Montgomery y Runger [83c] dan una tabla de diseños hechos doblez recomendados
para fracciones de resolución IV con 6 s k :-;;; 10 factores.
Los diseños de resolución V son factoriales fraccionados en los que los efectos principales y las in
teracciones de dos factores no tienen como alias otros efectos principales u otras interacciones de dos fac
tores. Estos diseños son muy poderosos, permitiendo la estimación única de todos los efectos principales
y las interacciones de dos factores, siempre que todas las interacciones de tres factores y de órdenes supe
riores sean insignificantes. La palabra más pequeña de la relación de definición de tal diseño debe tener
z
cinco letras. El diseño 51 con la relación de definición I = ABCDE es de resolución V. Otro ejemplo es el
diseño 2~z con las relaciones de definición I = ABCDG e I = ABEFH. Ejemplos adicionales de estos di
seños se presentan en Box y Hunter [17c].
Debido a que los diseños estándar de resolución V son diseños grandes cuando el número de factores
es moderadamente grande, existe cierto interés práctico en los diseños factoriales fraccionados irregula
res de resolución V. Se cuenta con diseños útiles para 4 s k s 9 factores. El diseño de 24 corridas para
k = 5 factores se muestra en la tabla 828. Puesto que se trata de un diseño de resolución V, es posible esti
mar los cinco efectos principales y las 10 interacciones de dos factores, suponiendo que las interacciones
de tres factores y órdenes superiores son insignificantes. El diseño para k = 4 factores tiene 12 corridas y
se comenta en el problema 822. Para k = 6, 7 y 8, estos diseños tienen 48 corridas, y el diseño de nueve
factores tiene 96 corridas. El paquete de software Design-Expert contiene todos estos diseños.
Por último, cabe señalar que un doblez completo de un diseño de resolución IV o V suele ser innece
sario. En general, sólo hay una o dos (o muy pocas) interacciones con alias que son de interés potencial.
Los alias de estas interacciones pueden por lo general separarse agregando un número pequeño de corri
87 RESUMEN 349
TablaS28 La fracción irregular de
resolución V para cinco factores
en 24 corridas
A B e D E
+
+ +
+
+ +
+ +
+
+ +
+ + +
+ + +
+ + +
+ + + +
+
+ +
+ + +
+ + +
+ + +
+ + + +
+ +
+ + +
+ + + +
+ + +
+ + + +
+ + + +
das a la fracción original. Esta técnica se denomina en ocasiones doblez parcial. Para formarse una idea
de cómo se hace esto, referirse al ejemplo 105 y al material suplementario del texto de este capítulo.
s. 7 RESUMEN
En este capítulo se introdujo el diseño factorial fraccionado 2k-P. Se ha hecho hincapié en el uso de estos
diseños en experimentos de tamizado para identificar de manera rápida y eficaz el subconjunto de facto
res que están activos, así como para proporcionar cierta información sobre las interacciones. La propie
dad de proyección de estos diseños hace posible en muchos casos examinar los factores activos con mayor
detalle. El ensamblaje secuencial de estos diseños por medio de un doblez es una manera muy eficaz de
obtener información adicional acerca de las interacciones que pueden identificarse como de posible im
portancia en un experimento inicial.
En la práctica, los diseños factoriales fraccionados 2k-P con N = 4, 8, 16 y 32 corridas son muy útiles.
En la tabla 829 se resumen estos diseños, identificando cuántos factores pueden usarse con cada diseño
para obtener diferentes tipos de experimentos de tamizado. Por ejemplo, el diseño de 16 corridas es un
factorial completo para 4 factores, una fracción un medio para 5 factores, una fracción de resolución IV
para 6 u 8 factores y una fracción de resolución 111 para 9 a 15 factores. Tudas estos diseños pueden cons
truirse utilizando los métodos explicados en este capítulo, y muchas de sus estructuras de los alias se
muestran en la tabla XII del apéndice.
350 CAPÍTIJLO 8 DISEÑOS FACTORIALESFRACCIONADOS DE DOS NIVELES
Tabla 8·29 Disefiosfactoriales y factoriales fraccionadosútiles del

sistema 24. Los números en las celdas son el número
de factores del experimento
Número de corridas
Tipo de diseño 4 8 16 32
Factorial completo 2 3 4 5
Fracción un medio. 3 4 5 6
Fracción de resolución IV 4 68 716
Fracción de resolución m 3 57 915 1731
88 PROBLEMAS
81. Suponga que en el experimento del desarrollo del proceso químico descrito en el problema 6 7 sólo pudo co
rrerse una fracción un medio del diseño 24• Construir el diseño y llevar a cabo el análisis estadístico utilizando
los datos de la réplica l.
82. Suponga que en el problema 615 sólo pudo correrse una fracción un medio del diseño 24• Construir el diseño
y llevar a cabo el análisis utilizando los datos de la réplica l.
83. _Considere el experimento del grabado con plasma del problema 618. Suponga que sólo pudo correrse una
fracción un medio del diseño. Establecer el diseño y analizar los datos.
84. En el problema 621 se describe el estudio para mejorar un proceso durante la manufactura de un circuito in
tegrado. Suponga que sólo pudieron hacerse ocho corridas de este proceso. Establecer un diseño 252 apro
piado y encontrar la estructura de los alias. Utilizar las observaciones apropiadas del problema 621 como las
observaciones de este diseño y estimar los efectos de los factores. ¿Qué conclusiones pueden sacarse?
85. Continuaci6n del problema 8-4. Suponga que ha hecho las ocho corridas del diseño 252 del problema 84.
¿Qué corridas adicionales se necesitarían para identificar los efectos de los factores que son de interés?
¿cuáles son las relaciones de los alias en el diseño combinado?
86. R.O. Snee ("Experimentación con un número grande de variables", en Experiments in Industry: Design;
Analysis and Interpretation of Results, de R.O. Snee, L.B. Hare y J.B. Trout, editores, ASQC) describe un ex
perimento en el que se usó un diseño 2s1 con I = ABCDE para investigar los efectos de cinco factores sobre
el color de un producto químico. Los factores son A = solvente/reactivo, B = catalizador/reactivo, C tem =
peratura, D = pureza del reactivo y E = pH del reactivo. Los resultados obtenidos fueron los siguientes:
e= 0.63 d =6.79
a= 2.51 ade = 5.47
b = 2.68 bde = 3.45
abe= 1.66 abd = 5.68
e= 2.06 cde = 5.22
ace = 1.22 acd = 4.38
bce =2.09 bcd = 4.30
abe= 1.93 abcde = 4.05
a) Construir una gráfica de probabilidad normal de los efectos. ¿Qué efectos parecen estar activos?
b) Calcular los residuales. Construir una gráfica de probabilidad normal de los residuales y graficar los resi
duales contra los valores ajustados. Comentar las gráficas.
e) Si algunos de los factores son insignificantes, plegar el diseño 251 a un diseño factorial completo en los
factores activos. Comentar el diseño resultante e interpretar los resultados.
8 7. En un artículo de J.J. Pignatiello, Jr. y J.S. Ramberg delloumalof Quality Technology (vol. 17, pp. 198206) se
describe el uso de un diseño factorial fraccionado con réplicas para investigar el efecto de cinco factores so
bre la altura libre de los resortes de hojas utilizados en una aplicación automotriz. Los factores sonA = tem
88 PROBLEMAS 351
peratura del horno, B = tiempo de calentamiento,C = tiempo de transferencia, D = tiempo de retención y
E = temperatura del aceite de templado. Los datos se presentan a continuación:
A B e D E Altura libre
7.78 7.78 7.81
+ + 8.15 8.18 7.88
+ + 7.50 7.56 7.50
+ + 7.59 7.56 7.75
+ + 7.54 8.00 7.88
+ + 7.69 8.09 8.06
+ + 7.56 7.52 7.44
+ + + + 7.56 7.81 7.69
+ 7.50 7.25 7.12
+ + + 7.88 7.88 7.44
+ + + 7.50 7.56 7.50
+ + + 7.63 7.75 7.56
+ + + 7.32 7.44 7.44
+ + + 7.56 7.69 7.62
+ + + 7.18 7.18 7.25
+ + + + + 7.81 7.50 7.59
a) Escribir la estructura de los alias de este diseño. lQué resolución tiene este diseño?
b) Analizar los datos. lQué factores influyen en la altura libre promedio?
e) Calcular el rango y la desviaciónestándar de la altura libre para cada corrida. lHay algún indicio de que
cualquiera de estos factores afecta la variabilidad de la altura libre?
d) Analizar los residuales de este experimento y comentar los resultados.
e) lEste diseño es el mejor posible para cinco factores en 16 corridas? Específicamente, les posible encon
trar un diseño fraccionado para cinco factores en 16 corridas con una resolución más alta que la de este
diseño?
88. En un artículo de Industrial and Engineering Chemistry ("Información adicional acerca de la planeación de
experimentospara aumentar la eficienciade la investigación")se utiliza un diseño 252 para investigarel efec
to deA = temperatura de condensación,B = cantidad del material 1, C = volumen del solvente,D = tiempo
de condensación y E = cantidad del material 2 sobre el rendimiento. Los resultados obtenidos son los si
guientes:
e= 23.2 ad =16.9 cd = 23.8 bde = 16.8
ab =15.5 be =16.2 ace = 23.4 abcde = 18.1
a) Verificar que los generadores que se utilizaron en el diseño fueron I = ACE e I = BDE.
b) Apuntar la relación de definición completa y los alias de este diseño.
e) Estimar los efectos principales.
d) Elaborar la tabla del análisis de varianza. Verificarque las interaccionesAB yAD están disponiblespara
usarlas como error.
e) Graficar los residuales contra los valores ajustados. Construir también la gráfica de probabilidad normal
de los residuales. Comentar los resultados.
89. Considere el experimento con el resorte de hojas del problema 87. Supongaque el factor E (temperatura del
aceite de templado) es muy difícil de controlar durante la manufactura. lCuál sería el ajuste de los factores
A, B, C y D para reducir la variabilidad de la altura libre tanto como sea posible, independientemente de la
temperatura del aceite de templado usada?
810. Construir un diseño 272 seleccionando dos interacciones de dos factores como los generadores independien
tes. Apuntar la estructura de los alias completa de este diseño. Delinear la tabla del análisis de varianza.
lCuál es la resolución de este diseño?
· .. · ······· . ····
811. Considere el diseño 25 del problema 621. Suponga que sólo pudo correrse una fracción un medio. Además
se requirieron dos días para hacer las 16 observaciones, y fue necesario confundir el diseño 251 en dos blo
ques. Construir el diseño y analízar los datos.
812. =
Analizar los datos del problema 623 como si provinieran de un diseño 2t:;;1 con I ABCD. Proyectar el dise
ño en un factorial completo en el subconjunto de los cuatro factores originales que parecen ser significativos.
813. Repetir el problema 812 utilizando I = -ABCD. lEl uso de la fracción alterna modifica la interpretación de
los datos?
814. Proyectar el diseño 2t:;;1 del ejemplo 81 en dos réplicas de un diseño Z2 en los factoresA y B. Analizar los da
tos y sacar conclusiones.
815. Construir un diseño 2;3• Determinar los efectos que pueden estimarse si se corre una segunda fracción de
este diseño con todos los signos invertidos.
816. Considere el diseño 2;3 del problema 815. Determinar los efectos que pueden estimarse si se corre una se
gunda fracción de este diseño con los signos del factor A invertidos.
817. Hacer el doblez del diseño 2ii¡4 de la tabla 819para producir un diseño de ocho factores. Verificar que el di
seño resultante sea 2~4• lSe trata de un diseño mínimo?
818. Hacer el doblez de un diseño 2~2 para producir un diseño de seis factores. Verificar que el diseño resultante
sea 2~2• Comparar este diseño con el diseño 2~2 de la tabla 810.
819. Un ingenieroíndustrial realiza un experimento utilizando un modelo de simulación Montecarlo de un siste
ma de inventario. Las variables independientes de su modelo son la cantidad del pedido (A), el punto de un
nuevo pedido (B), el costo de organización (C), el costo del refrendo de pedidos (D) y la tarifa de transporta
ción (E). La variable de respuesta es el costo anual promedio. Para ahorrar tiempo de computadora, el inge
niero decide investigar estos factores utilizando un diseño 2~2 con I = ABD e I = BCE. Los resultados que
obtiene son de = 95, ae = 134, b = 158, abd = 190, cd = 92, ac = 187, bce = 155 y abcde = 185.
a) Verificar que las combinaciones de tratamientos dadas sean correctas. Estimar los efectos suponiendo
que las interacciones de tres factores y de órdenes superiores son insignificantes.
b) Suponga que se agrega una segunda fracción a la primera, por ejemplo, ade "" 136, e = 93, ab = 187, bd =
153, acd = 139, e = 99, abce = 191 y bcde = 150. lC6mo se obtuvo esta segunda fracción? Incorporar es
tos datos a la fracción original y estimar los efectos.
e) Suponga que se corrió la fracción abe= 189, ce= 96, bcd = 154, acde = 135, abe= 193, bde = 152, ad=
137 y (1) = 98. lCómo se obtuvo esta fracción? Incorporar estos datos en la fracción original y estimar
los efectos.
820. Construir un diseño 2s1• Indicar cómo puede correrse el diseño en dos bloques de ocho observaciones cada
uno. lAlguno de los efectos principales o de las interacciones de dos factores están confundidos con los blo
ques?
821. Construir un diseño 272• Indicar cómo puede correrse el diseño en cuatro bloques de ocho observaciones
cada uno. lAlguno de los efectos principales o de las interacciones de dos factores están confundidos con los
bloques?
822. Fracciones irregulares del diseño 2k (John [61d]). Considere un diseño 24• Tienen que estimarse los cuatro efec
tos principales y las seis interacciones de dos factores, pero no puede correrse el factorial 24 completo. El ta
maño del bloque más grande posible contiene íz corridas. Estas 12 corridas pueden obtenerse de las cuatro
réplicas un cuarto definidas por I = ±AB = ±ACD = ±BCD omitiendo la fracción principal. Indicar cómo
pueden combinarse las tres fracciones 2+2 restantes para estimar los efectos requeridos, suponiendo que las
interacciones de tres factores y de órdenes superiores son insignificantes. Este diseño podría considerarse
como una fracción tres cuartos.
823. Los ánodos de carbono utilizados en un proceso de fundición se fabrican en un horno anular. Se corre un ex
perimento en el horno para determinar cuáles son los factores que influyen en el peso del material de empa
que que se adhiere a los ánodos después de la cocción. Seis variables son de interés, cada una con dos niveles:
A= relación paso/finos (0.45, 0.55),B =tipo de material de empaque (1, 2), C =temperatura del material de
=
empaque (ambiente, 325ºC), D localización de la chimenea (adentro, afuera), E = temperatura del foso
(ambiente, 195ºC) y F =tiempo de retraso antes del empaque (cero, 24 horas). Se corre un diseño 263 y se
88 PROBLEMAS 353
obtienen tres réplicas en cada uno de los puntos del diseño. El peso del material de empaque adherido a los
ánodos se mide en gramos. Los datos en el orden de las corridas son los siguientes: abd = (984, 826, 936);
abcdef = (1275, 976, 1457); be = (1217, 1201, 890); af = (1474, 1164, 1541); def = (1320, 1156, 913); cd =
(765, 705, 821); ace = (1338, 1254, 1294) y bcf = (1325, 1299, 1253). Se desea minimizar la cantidad de mate
rial de empaque adherido.
a) Verificar que las ocho corridas correspondan a un diseño 2~¡;3• lCuál es la estructura de los alias?
b) Usar el peso promedio como respuesta. lQué factores parecen tener influencia?
e) Usar el rango de los pesos como respuesta. lQué factores parecen tener influencia?
d) lQué recomendaciones podrían hacerse a los ingenieros del proceso?
824. Se corrió un experimento de 16 corridas en una planta de manufactura de semiconductores para estudiar los
efectos de seis factores sobre la curvatura o combadura de los dispositivos del sustrato producidos. Las seis
variables y sus niveles se presentan a continuación:
Duración Punto de
Temperatura de Tiempo de Presión de Temperatura del ciclo de rocío de
laminación laminación laminación de cocción cocción la cocción
Corrida (°C) (s) (tn) (°C) (h) (ºC)
1 55 10 5 1580 17.5 20
2 75 10 5 1580 29 26
3 55 25 5 1580 29 20
4 75 25 5 1580 17.5 26
5 55 10 10 1580 29 26
6 75 10 10 1580 17.5 20
7 55 25 10 1580 17.5 26
8 75 25 10 1580 29 20
9 55 10 5 1620 17.5 26
10 75 10 5 1620 29 20
11 55 25 5 1620 29 26
12 75 25 5 1620 17.5 20
13 55 10 10 1620 29 20
14 75 10 10 1620 17.5 26
15 55 25 10 1620 17.5 20
16 75 25 10 1620 29 26
Se hicieron cuatro réplicas de cada corrida, y se hizo una medición de la combadura del sustrato. Los datos se
presentan enseguida:
Combadura por réplica (pulg/pulg) Tutal Media Desviación

Corrida 1 2 3 4 (11)4 pulg/pulg) (11)4 pulg/pulg) estándar
1 0.0167 0.0128 0.0149 0.0185 629 157.25 24.418
2 0.0062 0.0066 0.0044 0.0020 192 48.00 20.976
3 0.0041 0.0043 0.0042 0.0050 176 44.00 4.083
4 0.0073 0.0081 0.0039 0.0030 223 55.75 25.025
5 0.0047 0.0047 0.0040 0.0089 223 55.75 22.410
6 0.0219 0.0258 0.0147 0.0296 920 230.00 63.639
7 0.0121 0.0090 0.0092 0.0086 389 97.25 16.029
8 0.0255 0.0250 0.0226 0.0169 900 225.00 39.42
9 0.0032 0.0023 0.0077 0.0069 201 50.25 26.725
10 0.0078 0.0158 0.0060 0.0045 341 85.25 50.341

Combadura por réplica (pulg/pulg) Tu tal Media Desviación

Corrida 1 2 3 4 (1<>4 pulg/pulg) (1<>4 pulgfpulg) estándar
11 0.0043 0.0027 0.0028 0.0028 126 31.50 7.681
12 0.0186 0.0137 0.0158 0.0159 640 160.00 20.083
13 0.0110 0.0086 0.0101 0.0158 455 113.75 31.12
14 0.0065 0.0109 0.0126 0.0071 371 92.75 29.51
15 0.0155 0.0158 0.0145 0.0145 603 150.75 6.75
16 0.0093 0.0124 0.0110 0.0133 460 115.00 17.45
a) ¿Qué tipo de diseño utilizaron los experimentadores?

b) ¿Cuáles son las relaciones de los alias en este diseño?
e) ¿Alguna de las variables del proceso afecta la combadura promedio?
d) ¿Alguna de las variables del proceso afecta la variabilidad de las mediciones de la combadura?
Tabla 830 Datos para el problema 825

A B C D E F Espesor del recubrimiento protector
Corrida Volumen Lote Tiempo, s Velocidad Aceleración Cubierta Izq. Centro Der. Prom. Rango
1 5 Lote 2 14 7350 5 Sin 4531 4531 4515 4525.7 16
2 5 Lote 1 6 7350 5 Sin 4446 4464 4428 4446 36
3 3 Lote 1 6 6650 5 Sin 4452 4490 4452 4464.7 38
4 3 Lote2 14 7350 20 Sin 4316 4328 4308 4317.3 20
5 3 Lote 1 14 7350 5 Sin 4307 4295 4289 4297 18
6 5 Lote 1 6 6650 20 Sin 4470 4492 4495 4485.7 25
7 3 Lote 1 6 7350 5 Con 4496 4502 4482 4493.3 20
8 5 Lote2 14 6650 20 Sin 4542 4547 4538 4542.3 9
9 5 Lote 1 14 6650 5 Sin 4621 4643 4613 4625.7 30
10 3 Lote 1 14 6650 5 Con 4653 4670 4645 4656 25
11 3 Lote2 14 6650 20 Con 4480 4486 4470 4478.7 16
12 3 Lote 1 6 7350 20 Sin 4221 4233 4217 4223.7 16
13 5 Lote 1 6 6650 5 Con 4620 4641 4619 4626.7 22
14 3 Lote 1 6 6650 20 Con 4455 4480 4466 4467 25
15 5 Lote2 14 7350 20 Con 4255 4288 4243 4262 45
16 5 Lote2 6 7350 5 Con 4490 4534 4523 4515.7 44
17 3 Lote2 14 7350 5 Con 4514 4551 4540 4535 37
18 3 Lote 1 14 6650 20 Sin 4494 4503 4496 4497.7 9
19 5 Lote2 6 7350 20 Sin . 4293 4306 4302 4300.3 13
20 3 Lote2 6 7350 5 Sin 4534 4545 4512 4530.3 33
21 5 Lote 1 14 6650 20 Con 4460 4457 4436 4451 24
22 3 Lote2 6 6650 5 Con 4650 4688 4656 4664.7 38
23 5 Lote 1 14 7350 20 Sin 4231 4244 4230 4235 14
24 3 Lote2 6 7350 20 Con 4225 4228 4208 4220.3 20
25 5 Lote 1 14 7350 5 Con 4381 4391 4376 4382.7 15
26 3 Lote2 6 6650 20 Sin 4533 4521 4511 4521.7 22
27 3 Lote 1 14 7350 20 Con 4194 4230 4172 4198.7 58
28 5 Lote2 6 6650 5 Sin 4666 4695 4672 4677.7 29
29 5 Lote 1 6 7350 20 Con 4180 4213 4197 4196.7 33
30 5 Lote2 6 6650 20 Con 4465 4496 4463 4474.7 33
31 5 Lote2 14 6650 5 Con 4653 4685 4665 4667.7 32
32 3 Lote2 14 6650 5 Sin 4683 4712 4677 4690.7. 35
88 PROBLEMAS 355
e) Si es importante reducir la combadura tanto como sea posible, lqué recomendaciones se harían?
825. Se usa un revestimiento por centrifugado para aplicar un recubrimiento fotoprotector en una oblea de silicio
natural. Esta operación suele hacerse en las fases iniciales del proceso de fabricación de semiconductores, y
el espesor promedio del recubrimiento protector y la variabilidad del espesor del mismo tienen un impacto
importante en los pasos subsecuentes de manufactura. Seis variables se usan en el experimento. Las varia
bles y sus niveles alto y bajo se presentan a continuación:
Factor Nivel bajo Nivel alto

Velocidad de centrifugado final 7350 rpm 6650rpm
Índice de aceleración 5 20
Volumen de recubrimiento protector aplicado 3 ce 5 ce
Tiempo del centrifugado 14 s 6s
Variación del lote del recubrimiento protector Lote 1 Lote2
Presión de descarga Sin cubierta Con cubierta
El experimentador decide usar un diseño 261 y hacer tres lecturas del espesor del recubrimiento protector en
cada oblea de prueba. Los datos se muestran en la tabla 830.
a) Verificar que se trata de un diseño 261• Discutir las relaciones de los alias de este diseño.
b) lQué factores parecen afectar el espesor promedio del recubrimiento protector?
e) Considerando que el volumen del recubrimiento protector aplicado tiene un efecto reducido sobre el es
pesor promedio, ¿tiene esto alguna implicación práctica importante para los ingenieros del proceso?
d) Proyectar este diseño en un diseño menor que incluya únicamente los factores significativos. Presentar
los resultados gráficamente. lAyuda esto en la interpretación?
e) Usar el rango del espesor del recubrimiento protector como variable de respuesta. lHay algún indicio de
que alguno de estos factores afecte Ja variabilidad del espesor del recubrimiento protector?
f) lDónde se recomendaría que corrieran el proceso los ingenieros?
826. Harry y Judy PetersonNedry (dos amigos del autor) son propietarios de un viñedo y una fábrica vinícola en
Newberg, Oregon. Cultivan varias variedades de uvas y fabrican vino. Harry y Judy han usado diseños facto
riales para el desarrollo de procesos y productos en el segmento de fabricación vinícola de su negocio. Este
problema describe el experimento realizado para su Pinot Noir 1985. Originalmente se estudiaron ocho va
riables, las cuales se muestran en este experimento:
Variable Nivel bajo () Nivel alto ( +)

A = Clon de Pinot Noir Pommard Wadenswil
B = Tipo de roble Allier 'Ironcais
=
C Edad de la barrica Vieja Nueva
=
D Levadura/contacto con la piel Champagne Montrachet
E= Vapores Ninguno Todos
=
F Tostado de las barricas Ligero Medio
G = Racimos completos Ninguno 10%
H = Tumperatura de fermentación Baja (75ºF máx.) Alta (92ºF máx.)
Harry y Judy decidieron usar un diseño 2~4 con 16 corridas, El vino fue catado por un panel de expertos el 8
de marzo de 1986. Cada experto calificó las 16 muestras de vino catadas, siendo la calificación 1 la mejor. El
diseño y los resultados del panel de catadores se muestra en la tabla 831.
a) lCuáles son las relaciones de los alias en el diseño seleccionado por Harry y Judy?
b) Usar las calificaciones promedio (Y) como variable de respuesta. Analizar los datos y sacar conclusiones.
Se encontrará útil examinar una gráfica de probabilidad normal de las estimaciones de los efectos.
i:::
~~~8~~~~~~~~~~~8~
(")(")C'l....;....;,....;,....;ddc-l(").....;("),....;..,¡,....;
o
J \000\0NOOONNOOOOO\O.,,,.N\O
~~dN~~~~~N~~N~N~N
...lT"""'t "'"""' ~ ...!
:i:: i++ 1 1++ 1+ 1 1++ 1 1+
Cj 1++ 1+ 1 1+ 1++ 1+ 1 1+
o
·~
Ol ¡;¡,,, 1+ 1++ 1+ 1+ 1+ 1 1+ 1+
'O
"'
,.D
~
o. o f.l¡ 1++++ 1 1++ 1 1 1 1++
.ó'l
11) ~
'Ll ·~
o ;.>
~
e
·¡::
Q 1 1 1 1 1 1 1++++++++
~
11) CJ 1 1 1 1++++ 1 1 1++++
Ol
'O
...,~ Q::¡ 1++ 1 1++ 1 1++ 1 1++

f'l
1
....
11)
p,
o ~ 1+ 1+ 1+ 1+ 1+ •+ 1+ 1+
,¡:::
11)
8
.....
!"'l
·e"'
r;}; 'O
.!3
,.Q
~ 8 ...<N<'l.,,,.V'l\01:'000'I,....,_.
0...<N<'l.,,,.V'l\O
...< ...<
356
88 PROBLEMAS 357
e) Usar la desviación estándar de las calificaciones (o alguna transformación apropiada tal como log s)
como variable de respuesta. ¿Qué conclusiones pueden sacarse acerca de los efectos de las ocho varia
bles sobre Ja variabilidad de la calidad del vino?
d) Después de mirar los resultados, Harry y Judy coincidieron en que uno de los miembros del panel
(DCM) sabía más de cerveza que de vino, por lo que decidieron eliminar su calificación. ¿Qué efecto
tendría esto en los resultados y las conclusiones de los incisos b y e?
e) Suponga que justo antes de empezar el experimento, Harry y Judy se enteraron de que las ocho nuevas
barricas que ordenaron de Francia para usarlas en el experimento no llegarían a tiempo, y que las 16 co
rridas tendrían que hacerse con las barricas viejas. Si Harry y Judy simplemente eliminan la columna C
de su diseño, Zqué ocurre con las relaciones de los alias? ¿Es necesario que empiecen de nuevo y cons
truyan otro diseño?
f) Harry y Judy saben por experiencia que es improbable que algunas de las combinaciones de tratamientos
produzcan buenos resultados. Por ejemplo, la corrida con las ocho variables en el nivel alto generalmen
te resulta en un vino con una calificación baja. Esto se confirmó el 8 de marzo de 1986 en Ja prueba del
vino. Quieren establecer un nuevo diseño para su Pinot Noir 1986 utilizando estas mismas ocho varia
bles, pero no quieren correr el experimento con los ocho factores en el nivel alto. ¿Qué diseño sugeriría
el lector?
8-27. En un artículo de Qualil.y Engineering ("Una aplicación de los diseños experimentales factoriales fracciona
dos", vol. 1, pp. 19-23) M.B. Kilgo describe un experimento para determinar el efecto de la presión del C02
(A), la temperatura del C02 (B), la humedad del cacahuate (C), la velocidad de flujo del C02 (D) y el tamaño
de las partículas de cacahuate (E) sobre el rendimiento total del aceite por lote de cacahuates (y). Los niveles
que usó para estos factores son los siguientes:
A, B, e, D, E,
Nivel presión temperatura humedad flujo tamaño de las
codificado (bar) (ºC) (%por peso) (litros/min) partículas (mm)
-1 415 25 5 40 1.28
1 550 95 15 60 4.05
Kilgo realizó el experimento factorial fraccionado con 16 corridas que se muestra a continuación.
A B e D E y
415 25 5 40 1.28 63
550 25 5 40 4.05 21
415 95 5 40 4.05 36
550 95 5 40 1.28 99
415 25 15 40 4.05 24
550 25 15 40 1.28 66
415 95 15 40 1.28 71
550 95 15 40 4.05 54
415 25 5 60 4.05 23
550 25 5 60 1.28 74
415 95 5 60 1.28 80
550 95 5 60 4.05 33
415 25 15 60 1.28 63
550 25 15 60 4.05 21
415 95 15 60 4.05 44
550 95 15 60 1.28 96
a) ¿Qué tipo de diseño se ha utilizado? Identificar la relación de definición y las relaciones de los alias.
b) Estimar Jos efectos de los factores y usar una gráfica de probabilidad normal para hacer la identificación
tentativa de los factores importantes.
e) Efectuar el análisis estadístico apropiado para probar las hipótesis de que los factores identificados en el
inciso b anterior tienen un efecto significativo sobre el rendimiento del aceite de .cacahuate,
· d) Ajustar un modelo que pueda usarse para predecir el rendimiento del aceite de cacahuate en términos
de los factores que se han identificado como importantes.
e) Analizar los residuales de este experimento y comentar la adecuación del modelo.
828. Los ingenieros de la planta Essex Aluminum de Ford Motor Company llevaron a cabo un experimento facto
rial fraccionado en 10 factores con 16 corridas para el vaciado en arena de tubos múltiples para motor, el cual
se describe en el artículo "Estudio del proceso de vaciado evaporativo para múltiples de adnúsión de 3.0 li
tros 'Poor Sandfill'", de D. Becknell (Fourth Symposium on Taguchi Methods, American Supplier Institute,
Dearborn, MI, pp. 120130). El objetivo fue determinar cuáles de Jos 10 factores tienen un efecto sobre la
proporción de vaciados defectuosos. El diseño y la proporción resultante de vaciados no defectuosos p que
se observaron en cada corrida se presentan enseguida. Se trata de una fracción de resolución 111 con genera
=
dores E = CD, F BD, G = BC, H =AC, J = AB y K = ABC. Suponga que el número de vaciados hechos en
cada corrida del diseño es 1000.
Modificación
Corrida A B e D E F G H J K p arcsen..JP deF&T
1 + + + + + 0.958 1.364 1.363
2 + + + + + 1.000 1.571 1.555
3 + + + + 0.977 1.419 1.417
4 + + + + 0.775 1.077 1.076
5 + + + + 0.958 1.364 1.363
6 + + + + 0.958 1.364 1.363
7 + + + 0.813 1.124 1.123
8 + + + + + + + 0.906 1.259 l.259
9 + + + + 0.679 0.969 0.968
10 + + + + 0.781 1.081 1.083
11 + + + + + 1.000 1.571 1.556
12 + + + + + 0.896 1.241 1.242
13 + + + + + 0.958 1.364 1.363
14 + + +· + + 0.818 1.130 1.130
15 + + + + + + 0.841 1.161 1.160
16 + + + + + + + + + + 0.955 1.357 1.356
a) Encontrar la relación de definición y las relaciones de los alias de este diseño.

b) Estimar los efectos de los factores y usar una gráfica de probabilidad normal para hacer la identificación
e) Ajustar el modelo apropiado utilizando los factores identificados en el inciso b anterior.
d) Grafícar los residuales de este modelo contra la proporción predicha de vaciados no defectuosos. Cons
truir también una gráfica de probabilidad normal de los residuales. Comentar la adecuación de estas grá
ficas.
e) El lector habrá notado en el inciso d un indicio de que la varianza de la respuesta no es constante (consi
derando que la respuesta es una proporción, esto debería haberse anticipado). La tabla anterior también
muestra una transformación de p, arcsen de la raíz cuadrada de p, que es de uso generalizado como
transjormacián para estabilizar la varianza de los datos de la proporción (referirse a Ja discusión de las
transformaciones para estabilizar la varianza del capítulo 3). Repetir los incisos a al d anteriores utilizan
88 PROBLEMAS 359
do la respuesta transformada y comentar los resultados. Específicamente, lson mejores ahora las gráfi
cas de los residuales?
f) Hay una modificación de la transformación arcsen de la raíz cuadrada, propuesta por Freeman y Thkey
("1l:ansfonnaciones relacionadas con ángulos y la raíz cuadrada", Annals of Mathematical Statistics, vol.
21, pp. 607611) que mejora su desempeño en las colas. La modificación de F&T es:
[arcsen.Jnp/ (n+ 1) + arcsen.J(nft+ 1 )/ (n+ 1) ]/ 2
Resolver de nuevo los incisos a al d utilizando esta transformación y comentar los resultados. (Para una
interesante discusión y análisis de este experimento, referirse a ''Análisis de experimentos factoriales con
defectos o partes defectuosas como respuesta", de S. Bisgaard y H.T. Fuller, Quality Engineering, vol. 7,
pp. 429443.)
829. Un experimento factorial fraccionado en nueve factores y 16 corridas fue conducido por el departamento
Chrysler Motors Engineering y se describe en el artículo "Mejoramiento del proceso compuesto de moldeo
de planchas", de P.I. Hsieh y O.E. Goodwin (Fourth Symposium on Taguchi Methods, American Supplier
Institute, Dearborn, MI, pp. 1321). El objetivo era reducir el número de defectos en el acabado de rejillas de
planchas moldeadas de recuadros abiertos. El diseño y el número resultante de defectos, e, observados en
cada corrida se muestran a continuación. Se trata de una fracción de resolución 111 con generadores E = BD,
F = BCD, G = AC, H = ACD y J = AB.
Modificación
Corrida A B e D E F G H J e JC deF&T
1 + + + 56 7.48 7.52
2 + + + 17 4.12 4.18
3 + + + 2 1.41 1.57
4 + + + + + 4 2.00 2.12
5 + + + + + 3 1.73 1.87
6 + + + + + 4 2.00 2.12
7 + + + 50 7.07 7.12
8 + + + + + 2 1.41 1.57
9 + + + + + 1 1.00 1.21
10 + + + o 0.00 0.50
11 + + + + + 3 1.73 1.87
12 + + + + + 12 3.46 3.54
13 + + + 3 1.73 1.87
14 + + + + + 4 2.00 2.12
15 + + + + + o 0.00 0.50
16 + + + + + + + + + o 0.00 0.50
a) Encontrar la relación de definición y las relaciones de los alias de este diseño.

b) Estimar los efectos de los factores y usar una gráfica de probabilidad normal para hacer la identificación
e) Ajustar un modelo apropiado utilizando los factores identificados en el inciso b anterior.
d) Graficar los residuales de este modelo contra el número predicho de defectos. Asimismo, construir una
gráfica de probabilidlad normal de los residuales. Comentar la adecuación de estas gráficas.
360 CAPÍTULO 8 DISEÑOS FACTORIALESFRACCIONADOS DE DOS NIVELES
e) El lector habrá notado en el inciso d un indicio de que la varianza de la respuesta no es constante ( consi
derando que Ja respuesta es un conteo, esto debería haberse anticipado). La tabla anterior también in
cluye una transformación de e, la raíz cuadrada, que es una transformacián para estabilizar la varianza de
uso generalizado con datos de conteos (referirse a la exposición de las transformaciones para estabilizar
la varianza del capítulo 3). Repetir los incisos a al d utilizando la respuesta transformada y comentar los
resultados. Específicamente, Zhan mejorado ahora las gráficas de los residuales?
f) Hay una modificación de la transformación de la raíz cuadrada, propuesta por Freeman y Tukey
("'Itansformaciones relacionadas con ángulos y raíz cuadrada",Annals of Mathematical Statistics, vol.
21, pp. 607611) que mejora su desempeño. La modificación de F&T de la transformación de la raíz
cuadrada es:
[.JC +.J(c+l)]/ 2
Resolver de nuevo los incisos a al d utilizando esta transformación y comentar los resultados. (Para una
interesante discusión y análisis de este experimento, referirse a 'Análisis de experimentos factoriales con
defectos o partes defectuosas como respuesta", de S. Bisgaard y H.T. Fuller, Quality Engineering, vol. 7,
pp. 429443.)
830. Se corre un experimento en una fábrica de semiconductores para investigar el efecto de seis factores sobre la
amplificación del transistor. El diseño seleccionado es el 2~;;;2 que se muestra a continuación:
Orden Orden de
estándar las corridas A B e D E F Amplificación
1 2 1455
2 8 + +· 1511
3 5 + + + 1487
4 9 + + + 1596
5 3 + + + 1430
6 14 + + + 1481
7 11 + + 1458
8 10 + + + + 1549
9 15 + + 1454
10 13 + + + + 1517
11 1 + + + 1487
12 6 + + + 1596
13 12 + + + 1446
14 4 + + + 1473
15 7 + + + + 1461
16 16 + + + + + + 1563
a) Usar una gráfica normal de los efectos para identificar los factores significativos.
b) Conducir las pruebas estadísticas apropiadas para el modelo identificado en el inciso a.
e) Analizar los residuales y comentar los resultados.
d) éEs posible encontrar un conjunto de condiciones de operación que produzca una amplificación de 1500
± 25?
831. El tratamiento térmico es de uso común para carbonizar piezas metálicas, como engranes. El espesor de la
capa carbonizada es una variable de salida crítica de este proceso, y suele medirse realizando un análisis de
carbono del paso del engrane (la cara superior del diente del engrane). Se estudiaron seis factores en un dise
ño 2~;;;2:A = temperatura del horno, B = duración del ciclo, C = concentración de carbono, D = duración del
88 PROBLEMAS 361
ciclo de carbonización, E = concentración de carbono del ciclo difuso y F = duración del ciclo difuso. El ex
perimento se presenta a continuación:
Orden Orden de
estándar las corridas A B e D E F Paso
1 5 74
2 7 + + 190
3 8 + + + 133
4 2 + + + 127
5 10 + + + 115
6 12 + + + 101
7 16 + + 54
8 1 +•+ + + 144
9 6 + + 121
10 9 + + + + 188
11 14 + + + 135
12 13 + + + 170
13 11 + + + 126
14 3 + + + 175
15 15 + + + + 126
16 4 + + + + + + 193
a) Estimar los efectos de los factores y representarlos en una gráfica de probabilidad normal. Seleccionar
un modelo tentativo.
b) Efectuar las pruebas estadísticas apropiadas en el modelo.
e) Analizar los residuales y comentar la adecuación del modelo.
d) Interpretar los resultados de este experimento. Suponer que es deseable un espesor de la capa de entre
140 y 160.
832. Se estudian cinco factores en el diseño factorial fraccionado irregular de resolución V mostrado enseguida:
Orden Orden de
estándar las corridas A B e D E y
1 1 16.33
2 10 + 18.43
3 5 + + 27.07
4 4 + 16.95
5 15 + + 14.58
6 19 + + 19.12
7 16 + 18.96
8 7 + + 23.56
9 8 + + + 29.15
10 3 + + + 15.74
11 13 + + + 20.73
12 11 + + + + 21.52
13 12 + 15.58
14 20 + + 21.03
15 9 + + + 26.78
362 CAPÍTIJLO 8 DISENOS FACTORIALES FRACCIONADOS DE DOS NNELES
Orden Orden de
estándar las corridas A B e D E y
16 22 + + + 13.39
17 21 + + + 18.63
18 6 + + + + 19.01
19 23 + + 17.96
20 18 + + + 20.49
21 24 + + + + 29.31
22 17 + + + 17.62
23 2 + + + + 16.03
24 14 + + + + 21.42
a) Analizar los datos de este experimento. lQué factores influyen en la respuesta y?

b) Analizar los residuales. Comentar la adecuación del modelo. ·
Diseños factoriales y
factoriales fraccionados
con tres niveles y con
niveles mixtos
Las series con dos niveles de los diseños factoriales y factoriales fraccionados que se comentaron en los
capítulos 6, 7 y 8 son de uso generalizado en la investigación y el desarrollo industrial. Hay algunas exten
siones y variantes de estos diseños que en ocasiones son útiles, como los diseños para los casos en que to
dos los factores están presentes con tres niveles. Estos diseños 3k se analizan en este capítulo. Se
consideran también los casos en que algunos de los factores tienen dos niveles y otros factores tienen ya
sea tres o cuatro niveles.
9.. 1 DISEÑO FACTORIAL Jk
9 .. 1.1 Notación y motivación del diseño Jk

Se estudia ahora el diseño factorial 3k; es decir, un arreglo factorial de k factores que tienen tres niveles
cada uno. Se usarán letras mayúsculas para denotar los factores y las interacciones. Se hará referencia a
los tres niveles de los factores como bajo, intermedio y alto. Hay varias notaciones diferentes que se usan
para representar estos niveles de los factores; una posibilidad es representar los niveles de los factores
con los dígitos O (bajo), 1 (intermedio) y 2 (alto). Cada combinación de tratamientos del diseño 3k se de
notará por k dígitos, donde el primer dígito indica el nivel del factor A, el segundo dígito indica el nivel del
factor B, ... ,y el dígito késimo indica el nivel del factor K. Por ejemplo, en un diseño 32, 00 denota la com
binación de tratamientos correspondiente aA y B ambos en el nivel bajo, y 01 denota la combinación de
tratamientos correspondiente aA en el nivel bajo y Ben el nivel intermedio. En las figuras 91y92 se
muestra la representación geométrica de los diseños 32 y 33, respectivamente, utilizando esta notación.
Este sistema de notación pudo haberse usado en los diseños 2k presentados anteriormente, utilizando
O y 1 en lugar del 1 negativo y el 1 positivo, respectivamente. En el diseño 2k se prefirió la notación ± 1 por
que facilita la vista geométrica del diseño y porque puede aplicarse directamente al modelado de regre
sión, la separación en bloques y la construcción de factoriales fraccionados.
En el sistema de los diseños 3\ cuando los factores son cuantitativos, es común denotar los niveles
bajo, intermedio y alto con1, O y + 1, respectivamente. Con esto se facilita el ajuste de un modelo de re
363
364 CAPÍTULO 9 DISEÑOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES
2
02 12 22
o;¡
~ 1
...~ 01 11 21
o 00 10 20
o 2
Factor A
Figura 9·1 Combinaciones de tratamientos en un

diseño 3•.
gresión que relaciona la respuesta con los niveles de los factores. Por ejemplo, considere el diseño 32 de la
figura 91, y sea que r¡ represente al factor A y que r, represente al factor B. Un modelo de regresión que
relaciona la respuesta y con x1 y x2 que se basa en este diseño es
(91)
Observe que la adición de un tercer nivel de los factores permite que la relación entre la respuesta y los
factores del diseño se modele como un modelo cuadrático.
El diseño 3k es ciertamente una elección posible para un experimentador que se preocupa por la cur
vatura en la función de respuesta. Sin embargo, es necesario tomar en consideración dos puntos:
1. El diseño 3k no es la forma más eficiente de modelar una relación cuadrática; los diseños de su·
perficie de respuesta que se exponen en el capítulo 11 son alternativas superiores.
022 122 222.
•112
021
tl
.
• 111
~
... 1
201
•110
o o
000 100 200
o 2
Factor A
Fignra 92 Combinaciones de tratamientos en un diseño 33•

91 DISEÑOFACTORIALJ~ 365
2. El diseño 2k aumentado con los puntos centrales, como se analizó en el capítulo 6, es una forma
excelente de obtener una indicación de la curvatura. Permite cons_ervar reducido el tamaño y la
complejidad del diseño y al mismo tiempo permite obtener cierta protección contra la curvatura.
Entonces, si la curvatura es importante, el diseño de dos niveles puede aumentarse con corridas
axiales para obtener un diseño central compuesto, como se ilustra en la figura 636. Esta estrate
gia secuencial de experimentación es más eficiente, por mucho, que correr un diseño factorial 3k
con factores cuantitativos.
9.. 1.2 El diseño 32
El diseño más simple del sistema 3k es el diseño 32, el cual tiene dos factores, cada uno con tres niveles. Las
combinaciones de tratamientos de este diseño se mostraron en la figura 91. Puesto que están presentes
=
32 9 combinaciones de tratamientos, hay ocho grados de libertad entre estas combinaciones de trata·
mientos. Los efectos principales de A y B tienen dos grados de libertad cada uno, y la interacciónAB tiene
cuatro grados de libertad. Si hay n réplicas, habrá n32 1 grados de libertad totales y 32(n 1) grados de li
bertad del error.
Las sumas de cuadrados de A, By AB pueden calcularse mediante los métodos usuales para los dise
ños factoriales analizados en el capítulo 5. Cada efecto principal puede representarse con un componente
lineal y uno cuadrático, cada uno con un solo grado de libertad, como se observa en la ecuación 91. Desde
luego, esto sólo tiene sentido si el factor es cuantitativo.
La partición de la interacción de dos factores AB puede hacerse de dos maneras. El primer método
consiste en subdividir AB en los cuatro componentes con un solo grado de libertad que corresponden a
ABL x L•ABL x Q,ABQ x L yABQ" Q· Esto puede hacerse ajustando los términosP1riXz,P1~1xid~n~?x2y
Pu~? xi,
respectivamente, como se indicó en el ejemplo 55. Para los datos de la vida de la herramienta
=
de ese ejemplo seobtieneSSABLxL = 8.00, SSABLxQ = 42.61,SSABQxL 2.61ySSABQxQ = 8.00. Puesto que
se trata de una partición ortogonal deAB, observe que SSAB = SSABL x L + SSABL "Q + SSABQ "L + SSABQxQ
= 61.34.
El segundo método se basa en los cuadrados latinos ortogonales. Considere los totales de las combi
naciones de los tratamientos para los datos del ejemplo 55. Estos totales se muestran en la figura 93
como los números encerrados en círculos dentro de los cuadrados. Los dos factoresA y B corresponden a
los renglones y las columnas, respectivamente, de un cuadrado latino 3 x 3. En la figura 93 se muestran
dos cuadrados latinos 3 x 3 particulares, superpuestos en los totales de las celdas.
Estos dos cuadrados latinos son ortogonales; es decir, si uno de los cuadrados se superpone en el otro,
cada letra del primer cuadrado aparecerá exactamente una vez con cada letra del segundo cuadrado. Los
=
totales de las letras en el cuadrado a son Q 18, R = 2 y S = 8, y la suma de cuadrados entre estos totales
o
Factor B
o ,
Factor B
e
1 2 2
o
Q
0) R
0) s © o
Q
0) R s ©
e
~ l
"' R 0 s 0 Q
G s 0 Q
0 R
G
e e e
u,
s 8 s 0
2
Q
0) R
2
R Q
a) bl
Figura 9.3 lbtales de las combinaciones de los tratamientos del ejemplo 55
con dos cuadrados latinos superpuestos.
es [182 + (2)2 + 82]/(3)(2) [242/(9)(2)]= 33.34, con dos grados de libertad. De manera similar, los tota
les de las letras en el cuadrado b son Q = O, R = 6 y S = 18, y la suma de cuadrados entre estos totales es [02
+ 62 + 182]/(3)(2) [242/(9)(2)] = 28.00, con dos grados de libertad. Observe que la suma de estos dos
componentes es
33.34+ 28.00 = 61.34 =SS AB
con 2 + 2 = 4 grados de libertad.

En general, a la suma de cuadrados calculada con el cuadrado a se le llama el componenteAB de la in
teracción, y a la suma de cuadrados calculada con el cuadrado b se le llama el componenteAB2 de la inte
racción. Cada uno de los componentes AB y AB2 tiene dos grados de libertad. Se usa esta terminología
porque si los niveles (O, 1, 2) de A y B se denotan por x1 y x2, respectivamente, entonces se encuentra que
las letras ocupan celdas de acuerdo con el siguiente patrón:
Cuadrado a Cuadradob
Q:x1+x2 =O(mod3) Q: x1 + 2x2 =O (mod 3)
R: x1 + x2 = 1(mod3) S: xi+ 2x2 '= 1 (mod 3)
S: x1+x2=2(mod 3) R:x1+2x2 = 2 (mod 3)
Por ejemplo, en el cuadrado b se observa que la celda de en medio corresponde ax1 = 1 y x2.,,; 1; por lo
tanto.z¡ + 2x2 = 1 + (2)(1) = 3 =O (mod 3), yQ ocuparía la celda de en medio. Cuando se consideran ex
presiones de la formaA1'Bq, se establece la convención de que el único exponente permitido en la primera
letra es 1. Si el exponente de la primera letra no es 1, la expresión completa se eleva al cuadrado y los ex
ponentes se reducen al módulo 3. Por ejemplo, A2B es lo mismo que AB2 porque
A2 B= (A2 B)2 = A4 B2 = AB2
Los componentesAB y AB2 de la interacciónAB no tienen significado real y por lo general no se in
cluyen en la tabla del análisis de varianza. Sin embargo, esta partición en gran medida arbitraria de la
interacciónAB en dos componentes ortogonales con dos grados de libertad es muy útil para construir di
seños más complicados. Además, no hay relación entre los componentesAB y AB2 de la interacción y las
sumas de cuadrados de ABL x L• ABL x Q• ABQ x L y ABQ x Q·
Los componentesAB yAB2 de la interacción pueden calcularse de otra manera. Considere los totales
de las combinaciones de los tratamientos en cualquiera de los cuadrados de la figura 93. Si se hace la
suma de los datos en las diagonales hacia abajo de izquierda a derecha, se obtienen los totales3 + 41 =
O, 3 + 10 1 = 6 y 5 + 11 + 2 = 18. La suma de cuadrados entre estos totales es 28.00 (AB2). En forma si
milar, los totales de la diagonal hacia abajo de derecha a izquierda son 5 + 41 = 8, 3 + 21 = 2 y3 +
11 + 10 = 18. La suma de cuadrados entre estos totales es 33.34 (AB). Yates llamó a estos componentes
de la interacción los componentes I y J de la interacción, respectivamente. Se usarán aquí indistintamente
las dos notaciones; es decir,
I(AB)= AB2
J(AB)= AB
91 DISEÑO FACTORJALJk 367
9-1.3 El diseño 33
Suponga ahora que hay tres factores (A, By C) bajo estudio, y que cada factor tiene tres niveles dispuestos
en un experimento factorial. Se trata de un diseño factorial 33, y la disposición experimental y la notación
de las combinaciones de los tratamientos se presentaron anteriormente en la figura 92. Las 27 combina
ciones de tratamientos tienen 26 grados de libertad. Cada efecto principal tiene 2 grados de libertad, cada
interacción de dos factores tiene 4 grados de libertad y la interacción de tres factores tiene 8 grados de li
bertad. Si se hacen n réplicas, hay n33 1 grados de libertad totales y 33(n 1) grados de libertad del error.
Las sumas de cuadrados pueden calcularse utilizando los métodos estándares para los diseños facto
riales. Además, si los factores son cuantitativos, es posible hacer la partición de los efectos principales en
un componente lineal y uno cuadrático, cada uno con un solo grado de libertad. Las interacciones de dos
factores pueden descomponerse en efectos lineal x lineal, lineal x cuadrático, cuadrático x lineal y cua
drático x cuadrático. Por último, puede hacerse la partición de la interacción de tres factores ABC en
ocho componentes con un solo grado de libertad que corresponden a lineal x lineal x lineal, lineal x li
neal x cuadrático, etcétera. Esta descomposición de la interacción de tres factores no es por lo general de
gran utilidad.
También es posible hacer la partición de las interacciones de dos factores en sus componentes I y J.
Éstos se designarían AB, AB2, AC, AC2, BC y BC2, y cada componente tendría dos grados de libertad.
Como en el diseño 32, estos componentes no tienen significación física.
Es posible hacer la partición de la interacción de tres factoresABC en cuatro componentes ortogona
les con dos grados de libertad, a los que suele denominarse los componentes W, X, Y y Z de la interacción.
También se hace referencia a ellos como los componentes AB2C2, AB2C, ABC2 y ABC de la interacción
ABC, respectivamente. Las dos notaciones se usan indistintamente; es decir,
W(ABC)= AB2C2
X(ABC)= AB2C
Y(ABC)= ABC2
Z(ABC)=ABC
Observe que ninguna de las primeras letras puede tener un exponente diferente de l. Al igual que los
componentes I y J, los componentes W, X, Y y Z no tienen ninguna interpretación práctica. Sin embargo,
son útiles para construir diseños más complejos.
EJEMPLO 9-1 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Se usa una máquina para llenar contenedores metálicos de 5 galones con jarabe para una bebida gaseosa.
La variable de interés es la cantidad de jarabe perdida debido al espumeo. Se piensa que tres factores in
fluyen en el espumeo: el diseño de la boquilla (A), la velocidad del llenado (B) y la presión de operación
( C). Se seleccionan tres boquillas, tres velocidades de llenado y tres presiones, y se corren dos réplicas de
un experimento factorial 33• En la tabla 91 se muestran los datos codificados.
El análisis de varianza de los datos de la pérdida de jarabe se muestra en la tabla 92: Las sumas de
cuadrados se calcularon con los métodos usuales. Se observa que la velocidad de llenado y la presión de
operación son estadísticamente significativas. Las tres interacciones de dos factores también son signifi
cativas. En la figura 94 se analizan gráficamente las interacciones de dos factores. El nivel intermedio de
la velocidad produce el mejor desempeño, mientras que las boquiJlas tipo 2 y 3, y la presión baja (10 psi) o
bien alta (20 psi) parecen ser las más efectivas para reducir la pérdida de jarabe. ·
..........................................................................
Tabla 91 Daros de la pérdida de jarabe del ejemplo 91 (las unidades son centímetros cúbicos 70)
Tipo de boquilla (A)
1 2 3
Velocidad (en rpm) (B)
Presión (en psi) ( C) 100 120 140 100 120 140 100 120 140
10 35 45 40 17 65 20 39 55 15
-25 60 15 24 58 4 35 67 30
15 110 10 80 55 -55 110 90 28 110
75 30 54 120 44 44 113 26 135
20 4 40 31 23 64 -20 30 61 54
5 30 36 5 62 31 55 52 4
El ejemplo 91 ilustra una situación en la que el diseñ.o de tres niveles suele encontrar cierta aplica
ción; uno o más de los factores es cualitativo, asumiendo desde luego tres niveles, y los demás factores son
cuantitativos. En este ejemplo, suponga que sólo hay tres diseños de la boquilla que son de interés. Se tra
ta evidentemente, entonces, de un factor cualitativo que requiere tres niveles. La velocidad de llenado y la
presión de operación son factores cuantitativos. Por lo tanto, podría ajustarse un modelo cuadrático
como el de la ecuación 91 en los dos factores, velocidad y presión, con cada nivel del factor boquilla.
En la tabla 93 se muestran estos modelos de regresión cuadráticos. Las p de estos modelos se estima
ron usando un programa de computadora de regresión lineal estándar. (En el capítulo 10 se analizará con
mayor detalle la regresión de mínimos cuadrados.) En estos modelos, las variablesx, y x2 están codificadas
en los niveles 1, O, + 1, como se estudió anteriormente, y se supusieron los siguientes niveles naturales
para la presión y la velocidad:
Nivel codificado Velocidad (rpm) Presión (psi)

1 100 10
o 120 15
+1 140 20
En la tabla 93 se presentan estos modelos tanto en términos de estas variables codificadas como en tér
minos de los niveles naturales de la velocidad y la presión.
Tabla 92 Análisis de varianza de los datos de la pérdida de jarabe

A, boquilla 993.77 2 496.89 1.17 0.3256
B, velocidad 61,190.33 2 30,595.17 71.74 <0.0001
e, presión 69,105.33 2 34,552.67 81.01 <0.0001
AB 6,300.90 4 1,575.22 3.69 0.0383
AC 7,513.90 4 1,878.47 4.40 0.0222
BC 12,854.34 4 3,213.58 7.53 0.0025
ABC 4,628.76 8 578.60 1.36 0.2737
Error 11,515.50 27 426.50
Tutal 174,102.83 53
91 DISEÑO FACTORIAL J• 369
400 400
......_ /C15
~ 200 ,___.,._ / B>40 ~ 200 ~

~
.
e
°8 o ~B~100 8
1!
"'.,.
e ~ O \. ,A Co2G
~ 200
I'"
~200 ~c10
B~ 120
2 3 2 ,3
Tipo de boquilla IA) Tlpo de boquilla IA)
a) bl
C15
~ c~20
~ o
.!!
lll Ca 10
1;I
.
m
...
~ 200
100 120 140

Velocidad en rpm (B)
el
Figura 94 Interacciones de dos factores del ejemplo 91.
Tabla 9.3 Modelos de regresión para el ejemplo 91

Tipo de boquilla =
x1 = velocidad (S), x2 Presión (P) en unidades codificadas
~ = 22.1+3.Sxl + 16.3X2 + 51.7X¡2 71.8xi + 2.9X1X2
1
~ = 1217.331.256S+ 86.017P+ 0.1291782 2.8733P2 + 0.0287SSP
J = 25.622.SX¡ 12.3x2+14.lx{56.9xi0.7x1x2
2
J = 180.19.47iH 66.75P+0.035S2 2.2767P2 0.0075SP
j = 15.1 + 20.3X¡ + 5.9X2 + 75.8x12 94.9xi + l0.5x1X2
3
J = 194ü.l 40.058S+ 102.48P+ 0.18958S2 17967P2 + O.lOSSP
3 70 CAPÍTULO 9 DISEÑOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES
En la figura 95 se muestran las gráficas de contorno de las superficies de respuesta de la pérdida de
jarabe constante, como una función de la velocidad y la presión para cada tipo de boquilla. Estas gráficas
revelan información de considerable utilidad acerca del desempeño de este sistema de llenado. Puesto
que el objetivo es minimizar la pérdida de jarabe, se preferiría la boquilla tipo 3, ya que los contornos ob
servados más pequeños (60) sólo aparecen en esta gráfica. Deberán usarse la velocidad de llenado cerca
del nivel intermedio de 120 rpm y el nivel de presión ya sea bajo o alto.
Cuando se construyen gráficas de contorno para un experimento que tiene una mezcla de factores
cuantitativos y cualitativos, no es raro encontrar que las formas de las superficies de respuesta de los fac
tores cuantitativos son muy diferentes en cada nivel de los factores cualitativos. Esto puede observarse en
cierta medida en la figura 95, donde la forma de la superficie para la boquilla tipo 2 es considerablemente
alargada en comparación con las superficies de las boquillas tipo 1 y 3. Cuando esto ocurre, implica que
las condiciones de operación óptimas (y otras conclusiones importantes) en términos de los factores
cuantitativos son muy diferentes en cada nivel de los factores cualitativos.
Es sencillo mostrar la partición numérica de la interacciónABC en sus cuatro componentes ortogo
nales con dos grados de libertad utilizando los datos del ejemplo 91. El procedimiento general ha sido
descrito por Cochran y Cox [26] y Davies [36]. Primero se seleccionan dos cualesquiera de los tres facto
res, por ejemplo AB, y se calculan los totales I y J de la interacción AB en cada nivel del tercer factor C.
Estos cálculos se presentan a continuación:
A Tutales
e B 1 2 3. I J
100 -60 41 -74 -198 -222
10 120 -105 -123 -122 -106 -79
140 -25 24 -15 -155 -158
100 185 175 203 331 238
15 120 20 -99 -54 255 440
140 134 154 245 377 285
100 9 -28 -85 -59 -144
20 120 -70 -126 -113 -74 -40
140 67 -51 58 -206 -155
Después, los totales I(AB) y J(AB) se arreglan en una tabla de dos vías con el factor C, y se calculan los to
tales de las diagonales I y J de esta nueva disposición: ·
Tu tales Totales
e l(AB) I J e J(AB) I J
10 -198 -106 -155 -149 41 10 -222 -79 -158 63 138
15 331 255 377 212 19 15 238 440 285 62 4
20 -59 -74 -206 102 105 20 -144 -40 -155 40 23
Los totales de las diagonales I y J calculados arriba son en realidad los totales que representan las cantida
des I[I(AB) X C] = AB2C2, J[I(AB) X C] = AB2C, I[J(AB) X C] = ABC2 y l[l(AB) X C] = ABC, o los
componentes W, X, Yy Z deABC. Las sumas de cuadrados se encuentran de la manera usual; es decir,
91 DISEÑO FACTORIALJ• 371
20.00
18.33
16.67
e
o
15.00
~
13.33
11.67
10.00
100.0 106.7 113.3 120.0 126.7 133.3 140.0
Velocidad
al Boquilla tipo 1
20.00
40.00
18.33 20.00
16.67 0.000
5·¡¡¡
15.00
l!! 20.00
a..
13.33
0.000
11.67
20.00
10.00
100.0 106.7 113.3 .·120.0 126.7 133.3 140.0
Velocidad
bl Boquillatipo 2
20.00
18.33
5·¡¡¡
.,
et
13.33
11.67
10.00 """.....,,;____¡...::.,_""'==''"""'."" .........

1 DO.O 106. 7 113.3 120.0 126.7 133.3 140.0
Velocidad
e) Boquilla tipo 3
Figura 95 Contornos de la pérdida de jarabe constante

(unidades: ce 70) como una función de la velocidad y la
presión para las boquillas tipo 1, 2 y 3, ejemplo 91.
3 72 CAPÍTULO 9 DISEÑOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES
I[I(AB)xC]= AB2C2 = W(ABC)

= (149)2 +(212)2 +(102)2
<165)2 = 3804.11
18 54
l[I(AB)xC]= AB2C = X(ABC)
(41)2 +(19)2 +(105)2 (165)2 = 221. 77
18 54
I[J(AB)xC]= ABC2 = Y(ABC)
(63)2 +(62)2 +(40)2 (165)2 = 18.77
18 54
J(J(AB)xC]= ABC= Z(ABC)
= (138) 2 +( 4)2 +(23)2
(l~i2 = 584.11
18
Aun cuando se trata de una partición ortogonal de SSABc, se señala de nuevo que no se acostumbra pre
sentarla en la tabla del análisis de varianza. En secciones subsecuentes se analiza la necesidad ocasional
de calcular uno o más de estos componentes.
9.. i.4 Eldiseño general Jk

Los conceptos utilizados en los diseños 32 y 33 pueden extenderse de inmediato al caso de k factores, cada
uno con tres niveles, es decir, a un diseño factorial 3k. Se emplea la notación digital usual para las combi
naciones de tratamientos, por lo que 0120 representa una combinación de tratamientos en un diseño 34
conA y Den los niveles bajos, Ben el nivel intermedio y C en el nivel alto. Hay 3k combinaciones de trata
mientos, con 3k 1 grados de libertad entre ellas. Estas combinaciones de tratamientos permiten deter
minar las sumas de cuadrados de k efectos principales, cada uno con dos grados de libertad; ( ~)
interacciones de dos factores, cada una con cuatro grados de libertad; ... ;y una interacción de k factores
con 2k grados de libertad. En general, una interacción de h factores tiene 2h grados de libertad. Si se ha
cen n réplicas, hay n3k - 1 grados de libertad totales y 3k(n - 1) grados de libertad del error.
Las sumas de cuadrados de los efectos y las interacciones se calculan con los métodos usuales para los
diseños factoriales. De manera típica, no se hace ninguna descomposición adicional de las interacciones
de tres factores y de órdenes superiores. Sin embargo, cualquier interacción de h factores tiene 2h1 com
ponentes ortogonales con dos grados de libertad. Por ejemplo, la interacción de cuatro factores ABCD
tiene 241 = 8 componentes ortogonales con dos grados de libertad, denotados por ABCD2, ABC2D,
AB2CD,ABCD,ABC2D2,AB2C2D,AB2CD2 y AB2C2D2• Al escribirse estos componentes, observe que el
único exponente permitido en la primera letra es l. Si el exponente de la primera letra no es 1, entonces la
expresión completa debe elevarse al cuadrado y los exponentes deben reducirse al módulo 3. Para ilustrar
lo anterior, considere
Estos componentes de la interacción no tienen ninguna interpretación física, pero son útiles para cons
truir diseños más complejos.
El tamaño del diseño se incrementa rápidamente con k. Por ejemplo, un diseño 33 tiene 27 combina
ciones de tratamientos por réplica, un diseño 34 tiene 81, un diseño 35 tiene 243, etcétera. Por lo tanto, con
frecuencia sólo se considera una sola réplica del diseño 3\ y las interacciones de órdenes superiores se
combinan para proporcionar una estimación del error. Como una ilustración, si las interacciones de tres
92 CONFUSIÓN EN EL DISEÑO FACTORIALJk 373
factores y de órdenes superiores son insignificantes, entonces una sola réplica del diseño 33 proporciona 8
grados de libertad del error, y una sola réplica del diseño 34 proporciona 48 grados de libertad del error.
Estos diseños siguen siendo grandes para k O? 3 y, por consiguiente, son de escasa utilidad.
9.. 2 CONFUSIÓN EN El DISEÑO FACTORIAL Jk
Incluso cuando se considera una sola réplica del diseño 3\ ésta requiere tantas corridas que es improba
ble que puedan hacerse las 3k corridas bajo condiciones uniformes. Por lo tanto, con frecuencia es necesa
rio hacer la confusión (o mezclado) en bloques. El diseño 3k puede confundirse en Y' bloques
incompletos, donde p < k, Por lo tanto, estos diseños pueden confundirse en tres bloques, nueve bloques,
etcétera.
92.1 El diseño factorial Jk en tres bloques

Suponga que se quíere confundir el diseño 3k en tres bloques incompletos. Estos tres bloques tienen dos
grados de libertad entre ellos; por lo tanto, debe haber dos grados de libertad confundidos con los blo
ques. Recuerde que en la serie factorial 3k cada efecto principal tiene dos grados de libertad. Además,
cada interacción de dos factores tiene cuatro grados de Jibertad y puede descomponerse en dos compo
nentes de la interacción (por ejemplo, AB y AB2), cada uno con dos grados de libertad; cada interacción
de tres factores tiene ocho grados de libertad y puede descomponerse en cuatro componentes de la in·
teracción (por ejemplo,ABC,ABC2,AB2C y AB2C2), cada uno con dos grados de libertad; y así sucesiva
mente. Por lo tanto, es conveniente confundir un componente de interacción con los bloques.
El procedimiento general consiste en construir una definición de contrastes
(92)
donde a; representa el exponente del factor iésimo en el efecto que va a confundirse y X; es el nivel del fac
tor iésimo en una combinación de tratamientos particular. Para la serie 3k se tiene a; = O, 1 o 2, donde la
primera a; diferente de cero es la unidad, y x, = O (nivel bajo), 1 (nivel intermedio) o 2 (nivel alto). Las
combinaciones de tratamientos del diseño 3k se asignan a los bloques con base en el valor de L (mod 3).
Puesto queL (mod 3) sólo puede asumir los valores O, 1o2, tres bloques están definidos de manera única.
Las combinaciones de tratamientos que satisfacen L = O (mod 3) constituyen el bloque principal. Este
bloque incluirá siempre la combinación de tratamientos 00 ... O.
Por ejemplo, suponga que quiere construirse un diseño factorial 32 en tres bloques. Cualquiera de los
componentes de la interacciónAB,AB oAB2, puede confundirse con los bloques. Al elegir arbitrariamen
te AB2, se obtiene la definición de contrastes '
El valor de L (mod 3) de cada combinación de tratamientos puede encontrarse de la siguiente manera:
00: L= 1(0)+2(0)= O= O (mod 3) 11: L= 1(1)+2(1)= 3= O(mod 3)

01: L= 1(0)+2(1)= 2= 2 (mod 3) 21: L= 1(2)+2(1) = 4=1(mod3)
02: L=1(0)+2(2)=4=1 (mod3) 12: L=l(1)+2(2)=5=2(mod3)
10: L= 1(1)+2(0)= 1=1(mod3) 22: L= 1(2)+2(2)= 6= O(mod 3)
20: L= 1(2)+2(0) = 2= 2(mod 3)
En la figura 96 se muestran los bloques.
L
374 CAPÍTIJLO 9 DISEÑOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES
Bloque1 Bloque2 Bloque3
~ Gl 8
~ ~ ~
al Asignación de las combinaciones
de tratamientoa los bloques
2
02 12 22
01 11 21
•·Bloque 1
o~ Bloque2
CI ~Bloque 3
o 00 10 20
o 2
Factor A
b) Vista geométrica
Figura 9·6 El diseño 32 en tres bloques conAB2 con

fundida.
Los elementos del bloque principal forman un grupo con respecto a la adición módulo 3. Con refe
rencia a la figura 96, se observa que 11 + 11 = 22 y 11 + 22 = OO. Las combinaciones de tratamientos de
los otros dos bloques pueden generarse sumando, en módulo 3, cualquier elemento del nuevo bloque con
los elementos del bloque principal. Por lo tanto, para el bloque 2 se usa 10 para obtener
10+00= 10 10+11=21 y 10+22= 02
Para generar el bloque 3, al utilizar 01, se encuentra
01+00 = 01 01+11 = 12 y 01+22 = 20
EJEMPLO 9-2 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
El análisis estadístico del diseño 32 confundido en tres bloques se ilustra empleando los datos siguientes,
los cuales provienen de la réplica única del diseño 32 que se muestra en la figura 96.
[]
Bloque 2 Bloque 3
10=2 01 = 5
21 = 1 12 =5
02 = 8 20= o
'Iotales de los bloques = O 7 o
Al aplicar los métodos convencionales para el análisis de factoriales, se encuentra que SSA = 131.56 y
SSB = 0.22.
92 CONFUSIÓN EN EL DISEÑO FACTORIAL Jk 3 75
Tabla 94 Análisis de varianza de los datos del
ejemplo 92
variación cuadrados libertad
Bloques (A.IP) 10.89 2
A 131.56 2
B 0.22 2
AB 2.89 2
Tu tal 145.56 8
Se encuentra también que
( 0)2 +(7)2 +(0)2 (7)2

SS Bloques = 3 9 = 10.89
Sin embargo, SSnioques es exactamente igual al componenteAB2 de la interacción. Para ver esto, las obser
vaciones se escriben de la siguiente manera:
Factor B
o 1 2
o 4 5 8
Factor A 1 -2 4 -5
2 o 1 o
Recuerde, por la sección 91.2, que el componente I oAB2 de la interacciónAB puede encontrarse calcu
lando la suma de cuadrados entre los totales de la diagonal de izquierda a derecha de la representación
anterior. Se obtiene así
( 0)2 +(0)2 +(7)2 (7)2

SS AB' = 3 9= 10.89
valor que es idéntico a SSnioques·

El análisis de varianza se presenta en la tabla 94. Puesto que hay una sola réplica, no puede hacerse
una prueba formal. No es una buena idea utilizar el componenteAB de la interacción como una estima
ción del error.
Se considera ahora un diseño un poco más complicado; un diseño factorial 33 confundido en tres blo
ques con nueve corridas cada uno. El componenteAB2C'1 de la interacción de tres factores se confundirá
con los bloques. La definición de contrastes es
L= x1 +2x2 +2x3
Es sencillo verificar que las combinaciones de tratamientos 000, 012 y 101 se encuentran en el bloque
principal. Las corridas restantes del bloque principal se generan de la siguiente manera:
(1) 000 (4)101+101= 202 (7) 101+021 = 122
(2) 012 (5) 012+012= 021 (8) 012+202= 211
(3) 101 (6) 101+012=110 (9) 021+202 = 220
3 76 CAPÍTULO 9 DISENOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES
Para encontrar las corridas de otro bloque se observa que la combinación de tratamientos 200 no está en
el bloque principal. Por lo tanto, los elementos del bloque 2 son
(1) 200+ 000 == 200 ( 4) 200+ 202=102 (7) 200+122= 022
(2) 200+012= 212 (5) 200+021 = 221 (8) 200+211=111
(3) 200+101 = 001 (6) 200+110=010 (9) 200+220= 120
Observe que todas estas corridas satisfacenL = 2 (mod 3). El último bloque se encuentra observando que
100 no pertenece al bloque 1 ni al bloque 2. Al usar 100 como arriba, se obtiene
(1) 100+000= 100 (4) 100+202= 002 (7) 100+ 122 = 222
(2) 100+012= 112 (5) 100+021==121 (8) 100+211= 011
(3) 100+101 = 201 (6) 100+ 110 == 210 (9) 100+220= 020
Los bloques se ilustran en la figura 97.

000 200 100

012 212 112
101 001 201
202 102 002
021 221 121
110 010 210
122 022 222
211 111 011
220 120 020
a) Asignación de Ias combinacionesde

tratamientos a los bloques
022 122 222

•~Bloque 1
o~ Bloque 2
()•Bloque 3 <»112
2
221
021
e;;¡
0111
~.,
u.. 1
201
2 220
~ '\!>
<c~t':-º 1 •110
o o
000 100 200
o 2
Factor A
Figura 97 El diseno 33 en tres bloques con AB2C2 confundida.

9Z CONFUSIÓN EN EL DISEÑO FACTORIAL 3k 3 77
Tabla 95 Análisis de varianza de un diseño 33
con AB2CZ confundida
Grados de
Bloques (AB2C2) 2
A 2
B 2
e 2
AB 4
AC 4
BC 4
Error (ABC +AB2C +ABCZ) 6
Total 26
En la tabla 95 se presenta el análisis de varianza de este diseño. Al utilizar este esquema de confusión
(o mezclado), se cuenta con información acerca de todos los efectos principales y las interacciones de dos
factores. Los componentes restantes de la interacción de tres factores (ABC,AB2C y ABC2) se combinan
como una estimación del error. La suma de cuadrados de esos tres componentes podría obtenerse por
sustracción. En general, para el diseño 3k en tres bloques se seleccionaría siempre un componente de la
interacción de orden más alto para confundirlo con los bloques. Los demás componentes de esta interac
ción que no están confundidos pueden obtenerse calculando la interacción de k factores de la manera
usual y restando de esta cantidad la suma de cuadrados de los bloques.
9.. 2.2 El diseño factorial 31en nueve bloques

En algunas situaciones experimentales puede ser necesario confundir el diseño 3k en nueve bloques. Por
lo tanto, ocho grados de libertad se confundirán con los bloques. Para construir estos diseños se eligen dos
componentes de interacción y, como resultado, dos más se confundirán automáticamente, produciendo
los ocho grados de libertad requeridos. Estos dos son las interacciones generalizadas de los dos efectos
elegidos originalmente. En el sistema 3\ las interacciones generalizadas de dos efectos (es decir, P y Q) se
definen como PQ y PQ2 (o l'2Q).
Los dos componentes de interacción elegidos inicialmente producen dos definiciones de contrastes
L¡ = a1x1 +a2x2 + ··· +akxk =u (mod 3) u= O, 1, 2

(93)
L2 = {3 x
1 1 +{32x2 + ··· +t,», = h (mod 3) h= O, 1, 2
donde {a;} y {/3¡} son los exponentes de la primera y la segunda interacciones generalizadas, respectiva
mente, con la convención de que las primeras a¡ y pi diferentes de cero son la unidad. Las definiciones de
contrastes de la ecuación 93 implican nueve ecuaciones simultáneas especificadas por el par de valores
para L1 y L2• Las combinaciones de tratamientos que tienen el mismo par de valores para (L1, L2) se asig
nan al mismo bloque.
El bloque principal consta de las combinaciones de tratamientos que satisfacen L, = L2 =O (mod 3).
Los elementos de este bloque forman un grupo con respecto a la adición módulo 3; por lo tanto, el esque
ma presentado en la sección 92.1 puede usarse para generar los bloques.
3 78 CAPÍTULO 9 DISEÑOS FACTORIALES Y FACTORlALES FRACCIONADOS CON TRES NIVELES
Como un ejemplo, considere el diseño factorial 34 confundido en nueve bloques con nueve corridas
cada uno. Suponga que se elige confundir ABC y AB2D2. Sus interacciones generalizadas
(ABC)(AB2 D2 )= A2 B3CD2 = (A2 B3CD2 )2 = AC2 D

(ABC)(AB2 D2 )2 = A3 B5CD4 = B2CD= (B2CD)2 = BC2 D2
también están confundidas con los bloques. Las definiciones de contrastes de ABC y AB2D2 son
L¡_ = X1 +z, +x3 (94)

L2 = x1 +2x2 +2x4
Los nueve bloques pueden construirse utilizando las definiciones de contrastes (ecuación 94) y la propie
dad de la teoría de grupos del bloque principal. El diseño se muestra en la figura 98.
Para el diseño 3k en nueve bloques habrá cuatro componentes de interacción confundidos. Los demás
componentes de estas interacciones que no están confundidos pueden determinarse restando la suma de
cuadrados del componente confundido de la suma de cuadrados de la interacción completa. El método
descrito en la sección 91.3 puede ser útil para calcular los componentes de interacción.
92.3 El diseño factorial Jk en 3P bloques

El diseño factorial 3" puede confundirse en Y' bloques con 3k-p observaciones cada uno, donde p < k. El
procedimiento consiste en seleccionar p efectos independientes que habrán de confundirse con los blo
ques. Como resultado, exactamente otros (Y 2p - 1 )/2 efectos se confunden de manera automática.
Estos efectos son las interacciones generalizadas de los efectos elegidos originalmente.
Como una ilustración, considere un diseño 37 que va a confundirse en 27 bloques. Puesto que p = 3, se
seleccionarían tres componentes de interacción independientes y se confundirían automáticamente otros
[33 2(3)1 ]/2 = 10. Suponga que se eligenABC2DG, BCE2PG y BDEFG. A partir de estos efectos pue
Bloque 1 · Bloque2 Bloque 3 Bloque 4 Bloque 5 Bloque 6 Bloque7 Bloque 8 81oque9
0000 0001 2(100 0200 0020 0010 1000 0100 0002

0122 0120 2122 0022 0112 0102 1122 0222 0121
0211 0212 2211 0111 0201 0221 1211 0011 0210
1021 1022 0021 0221 1011 1001 2021 1121 1020
1110 1111 0110 1010 1100· 1120 2110 1210 1112
1202 1200 0202 , 102 1222 1212 2202 1002 1201
2012 2010 1012 2212 2002 2022 0012 2112 2011
2101 2012 1101 2-001 2121 2111 0101 2201 2100
2220 2221 1220 2120 2210 2200 0220 2020 2222
(L1, L2) ~ (O.O) (0,1) (2,2) (2,0) (2,1) (1,2) (1, 1) (1,0) (0,2)
Figura 98 El diseño 34 en nueve bloques con ABC, AB2IJ2, AOD y BC2D2 confundidas.
93 RÉPLICAS FRACCIONADAS DEL DISEÑO FACTORIAL Jl 379
den construirse tres definiciones de contrastes, y los 27 bloques pueden generarse con los métodos descri
tos anteriormente. Los otros 10 efectos confundidos con los bloques son
(ABC2 DG)(BCE2 F2G)= AB2 DE2 F2G2

(ABC2 DG)(BCE2 F2G)2 = AB3C4 DE4 F4G3 = ACDEF
(ABC2 DG)(BDEFG)= AB2C2 D2 EFG2
(ABC2 DG)(BDEFG)2 = AB3C2 D3 E2 F2G3 = AC2 E2 F2
(BCE2 F2G)(BDEFG)= B2CDE3 F3G2 = BC 2 D2G
(BCE2 F2G)(BDEFG)2 = B3CD2 E4 F4G3 = CD2EF
(ABC2 DG)(BCE2 F2G)(BDEFG)= AB3C3 D2 E3 F3G3 = AD2
(ABC2 DG)2(BCE2 F2G)(BDEFG)= A2 B4C5 D3G4 = AB2CG2
(ABC2 DG)(BCE2 F2G)2(BDEFG)= ABCD2 E2 F2G
(ABC2 DG)(BCE2 F2G)(BDEFG)2 = ABC3 D3 E4 F4G4 = ABEFG
Se trata de un diseño enorme que requiere 37 = 2187 observaciones dispuestas en 27 bloques con 81 ob
servaciones cada uno.
9.. 3 RÉPLICAS FRACCIONADAS DEL DISEÑO FACTORIAL 31
El concepto de réplica fraccionada puede extenderse a los diseños factoriales 3k. Debido a que una réplica
completa del diseño 3k puede requerir un número bastante grande de corridas incluso para valores mode
rados de k, las réplicas fraccionadas de estos diseños son de interés. Sin embargo, como se verá más ade
lante, algunos de estos diseños tienen estructuras de alias complicadas.
93.1 La fracción un tercio del diseño factorial 31

La fracción más grande del diseño 3k es la fracción un tercio que contiene 3kt corridas. Por consiguiente,
se hace referencia a él como el diseño factorial fraccionado 3k1• Para construir un diseño factorial fraccio
nado 3t1 se selecciona un componente de interacción con dos grados de libertad (generalmente, la in
teracción de orden más alto) y se hace la partición del diseño 3k completo en tres bloques. Cada uno de los
tres bloques resultantes es un diseño fraccionado 3kt y puede seleccionarse cualquiera de los bloques
para usarlo. Si ABª2 Cª' · · · Kª• es el componente de interacción utilizado para definir los bloques, enton
ces a I = ABª' Cª' · · · Kª• se le llama la relación de definición del diseño factorial fraccionado. Cada efec
to principal o componente de interacción estimado a partir del diseño 3kt tiene dos alias, los cuales
pueden encontrarse multiplicando el efecto tanto por I como por I2 módulo 3.
Como un ejemplo, considere una fracción un tercio del diseño 33• Puede seleccionarse cualquiera de
los componentes de la interacciónABC para construir el diseño, es decir,ABC,AB2C,ABC2 0AB2C2. Por
lo tanto, hay en realidad 12 fracciones un tercio diferentes del diseño 33 definidas por
x1 +a2x2 +a3x3 =u (mod 3)

= =
donde a 1 o 2 y u O, 1 o 2. Suponga que se selecciona el componente deAB2C2. Cada fracción del dise
ño 331 resultante contendrá exactamente 32 = 9 combinaciones de tratamientos que deben satisfacer
donde u = O, 1 o 2. Es sencillo verificar que las tres fracciones un tercio son las que se muestran en la figu
ra 99.
Si se corre cualquiera de los diseños 331 de la figura 99, la estructura de los alias resultante es
A= A(AB2C2)= = ABC
A2 B2C2
A= A(AB2C2)2 = A3 B4C4 = BC
B= B(AB2C2)= AB3C2 = AC2
B = B(AB2C2 )2 = A2 B5 C4 = ABC2
C= C(AB2C2)= AB2C3 = AB2
C= C(AB2C2)2 = A2 B4C5 = AB2C
AB= AB(AB2C2)= A2 B3C2 = AC
AB= AB(AB2C2)2 = A3 B5C4 = BC2
Por consiguiente, los cuatro efectos que en realidad se estiman a partir de los ocho grados de libertad
del diseño sonA + BC + ABC, B + AC2 + ABC2, C + AB2 + AB2C y AB + AC + BC2• Este diseño sólo
tendría valor práctico si todas las interacciones fueran pequeñas en comparación con los efectos principa
les. Puesto que los efectos principales son alias de las interacciones de dos factores, se trata de un diseño
de resolución m. Observe lo complejas que son las relaciones de los alias en este diseño. Cada efecto
principal es alias de un componente de interacción. Si, por ejemplo, la interacción de dos factores BC es
grande, esto distorsionará potencialmente la estimación del efecto principal de A y hará que sea muy
complicada la interpretación del efecto deAB + AC + BC2• Es muy difícil ver cómo este diseño podría ser
de utilidad, a menos que se suponga que todas las interacciones son insignificantes.
Disel'\o1 Dlselio1 Dlseíío 1

u~O um1 u-2
000 100 200
012 112 212
101 201 001
202 002 102
021 121 221
110 210 010
122 222 022
211 011 111
220 020 120
a) Combinaciones de tratamientos
~A
/
. /
)---
u'"' o u~1
Figura 99 Las tres fracciones un tercio del diseiío 3l con la relación de definición/ ""ABZCZ.
93 RÉPLICAS FRACCIONADAS DEL DISEÑO FACTORIAL 3• 381
=
Antes de dejar el diseño 3~11, observe que para el diseño con u O (ver la figura 99), si se hace que A
denote el renglón y B la columna, entonces el diseño puede escribirse como
000 012 021

101 110 122
202 211 220
que es un cuadrado latino 3 x 3. El supuesto de las interacciones insignificantes requerido para la inter
pretación única del diseño 3:111 tiene su paralelo en el diseño del cuadrado latino. Sin embargo, los dos di
seños surgen por motivos diferentes, uno como consecuencia de la réplica fraccionada y el otro de las
restricciones sobre la aleatorización. Por la tabla 413 se observa que sólo hay 3 x 3 cuadrados latinos y
que cada uno corresponde a uno de los doce diferentes diseños factoriales fraccionados 331•
Las combinaciones de tratamientos en un diseño 3kt con la relación de definición
I = ABª Cª' ···Kª• pueden construirse utilizando un método similar al que se empleó en la serie 2k-P.
2
Primero se escriben las 3kt corridas para un diseño factorial de tres niveles completo en k- 1 factores, con
la notación común O, 1, 2. Éste es el diseño básico en la terminología del capítulo 8. Después se introduce
el factor késimo igualando sus xk niveles con el componente apropiado de la interacción de orden más
alto, por ejemplo ABª2 Cª' ... (K- lt'1, mediante la relación
(95)
=
donde Pi (3ak)a; (mod 3) para 1 :S i :S k-1. Se obtiene así un diseño con la resolución más alta posible.
Como una ilustración, se usa este método para generar el diseño 3~1 con la relación de definición
I = AB2CD que se muestra en Ja tabla 96. Es sencillo verificar que los tres primeros dígitos de cada com
hinación de tratamientos de esta tabla son las 27 corridas de un diseño 33 completo. Se trata del diseño bá
= = =
sico. ParaAB2CD se tiene a1 = a3 = a4 1 y a2 2. Esto implica que p1 (31 )a1 (mod 3) (31 )(1) = =
=
2,P2 = (3 l)a2 (mod 3) = (31)(2) = 4 = 1(mod3) y P3 = (3 l)a3 (mod 3) = (31)(1) 2. Por lo tan
to, la ecuación 95 queda como
(96)
Los niveles del cuarto factor satisfacen la ecuación 96. Por ejemplo, se tiene 2(0) + 1(0) + 2(0) = O, 2(0)
+ 1(1) + 2(0) = 1, 2(1) + 1(1) + 2(0) = 3 = O, etcétera.
El diseño 3t~1 resultante tiene 26 grados de libertad que pueden usarse para calcular las sumas de
cuadrados de los 13 efectos principales y los componentes de las interacciones (y sus alias). Los alias
Tabla 96 Un diseño 3:;1 con

I =AB2CD
0000 0012 2221
0101 0110 0021
1100 0211 0122
1002 1011 0220
0202 1112 1020
1201 1210 1121
2001 2010 1222
2102 2111 2022
2200 2212 2120
382 CAPÍ11JLO 9 DISEÑOS FACTORIALESY FACTORIALESFRACCIONADOS CON TRES NIVELES
de cualquier efecto se encuentran de la manera usual; por ejemplo, los alias de A son A(AB2CD) =
ABc2D2 y A(AB2CD)2 = Bc2D2• Puede verificarse que los cuatro efectos principales están separados de
cualquier componente de interacciones de dos factores, pero que algunos componentes de interacciones
de dos factores son alias entre sí. Una vez más se observa la complejidad de la estructura de los alias. Si
cualquiera de las interacciones de dos factores es grande, probablemente será muy difícil aislarla con este
diseño.
El análisis estadístico de un diseño 3kl se lleva a cabo con los procedimientos usuales del análisis de
varianza para experimentos factoriales. Las sumas de cuadrados de los componentes de interacciones
pueden calcularse como en la sección 91. Cuando interprete los resultados, recuerde que los componen
tes de las interacciones no tienen ninguna interpretación práctica.
93.2 Otros diseños factoriales fraccionados Jkfl
Para moderar los valores grandes de k, es deseable un fraccionamiento todavía mayor del diseño 3k. En
general, puede construirse una fracción (tf del diseño 3k parap < k, donde la fracción contiene 3k-P corri
das. A este diseño se le llama el diseño factorial fraccionado 3k-P_ Por lo tanto, un diseño 3k2 es una frac
ción un noveno, un diseño 3k-3 es una fracción un veintisieteavo, etcétera.
El procedimiento para construir un diseño factorial fraccionado 3k-P consiste en seleccionar p compo
nentes de interacciones y usar estos efectos para hacer la partición de las 3k combinaciones de tratamien
tos en 3P bloques. Entonces cada bloque es un diseño factorial fraccionado 3k-p. La relación de definición I
de cualquier fracción consta de los p efectos elegidos inicialmente y sus (31' 2p - 1 )/2 interacciones gene
ralizadas. El alias de cualquier efecto principal o componente de interacción se obtiene con la multiplica
ción módulo 3 del efecto por I e I2.
Las corridas que definen un diseño factorial fraccionado 3k-p también pueden generarse anotando
primero las combinaciones de tratamientos de un diseño factorial 3k-P completo e introduciendo después
los p factores adicionales igualándolos con los componentes de las interacciones, como se hizo en la sec
ción 93.1.
El procedimiento se ilustrará construyendo un diseño 342, es decir, una fracción un noveno del dise
ño 34• SeanAB2C y BCD los dos componentes de interacciones elegidos para construir el diseño. Sus in
teracciones generalizadas son (AB2C)(BCD) = Ac2D y (AB2C)(BCD)2 = ABD2• Por lo tanto, la relación
de definición de este diseño es I :: AB2C = BCD = AC2D = ABD2, y el diseño es de resolución 111. Las
nueve combinaciones de tratamientos del diseño se encuentran apuntando un diseño 32 en los factores A
y B, y agregando después dos nuevos factores haciendo
X3 =2x1+X2
X4 = 2xz +2x3
Tabla9·7 Un disefio 3~~2

conl =AB2C
el =BCD
0000 0111 0222
1021 1102 1210
2012 2120 2201
94 DISEÑOS FACTORIALES CON NIVELES MIXTOS 383
Tabla 9..S Estructura de los alias del diseño 3~;2 de la tabla 97
Efecto Alias
I /2
A ABC2 ABCD ACD2 AB2D BC2 AB2C2D2 CD2 BD2
B AC BC2D2 ABC2D AB2D2 ABC CD AB2C2D ADz
e AB2C2 BC2D AD ABCD2 ABz BD ACD ABC2D2
D ÁB2CD BCD2 AC2D2 AB AB2CD2 BC AC2 ABD
Esto es equivalente a usar AB2C y BCD para hacer la partición del diseño 34 completo en nueve bloques y
luego seleccionar uno de estos bloques como la fracción deseada. El diseño completo se muestra en la ta
bla 97.
Este diseño tiene ocho grados de libertad que pueden usarse para estimar cuatro efectos principa
les y sus alias. Los alias de cualquier efecto pueden encontrarse multiplicando el efecto módulo 3 por
AB2C, BCD, AC2D, ABD2 y sus cuadrados. En la tabla 98 se presenta la estructura de los alias completa
del diseño.
Por la estructura de los alias se observa que este diseño sólo es útil en ausencia de interacciones. Ade
más, siA denota los renglones y B las columnas, entonces al examinar la tabla 97 se observa que el diseño
3:1;2 también es un cuadrado grecolatino.
El escrito de Connory Zelen [28] contiene una extensa selección de diseños para 4 s k s 10. Este escri
to se elaboró para la National Bureau of Standards y es la tabla más completa disponible de los planes 3k"1'.
En esta sección se ha hecho notar en varias ocasiones la complejidad de las relaciones de los alias de
los diseños factoriales fraccionados 3k"1'. En general, si k es moderadamente grande, por ejemplo k ~ 4 o
5, el tamaño del diseño 3k llevará a muchos experimentadores a considerar fracciones bastante pequeñas.
Desafortunadamente, estos diseños tienen relaciones de alias que incluyen alias parciales de componen
tes de interacciones con dos grados de libertad. Esto, a su vez, resulta en un diseño cuya interpretación
será difícil, si no imposible, si las interacciones no son insignificantes. Además, no hay esquemas de au
mento simples (como el doblez) que puedan usarse para combinar dos o más fracciones a fin de aislar las
interacciones significativas. El uso del diseño 3k suele sugerirse cuando hay curvatura presente. Sin em
bargo, hay alternativas más eficientes (ver el capítulo 11). Por estas razones, se puede concluir que los di
seños factoriales fraccionados 3k"1' son soluciones que causan problemas; no son, en general, buenos
diseños.
9..4 DISEÑOS FACTORIALES CON NIVELES MIXTOS
Se han resaltado los diseños factoriales y factoriales fraccionados en los que todos los factores tienen el
mismo número de niveles. El sistema con dos niveles revisado en los capítulos 6, 7 y 8 es de particular utili
dad. El sistema de tres niveles presentado en este capítulo es de utilidad mucho menor debido a que los
diseños son relativamente grandes incluso para un número modesto de factores, y la mayoría de las frac
ciones pequeñas tienen relaciones de alias complejas que requerirían supuestos muy restrictivos respecto
de las interacciones para ser útiles.
Estamos convencidos de que los diseños factoriales y factoriales fraccionados de dos niveles deberán
ser la piedra angular de la experimentación industrial para el desarrollo de productos y procesos, detec
ción de defectos y mejoramiento. Sin embargo, existen situaciones en las que es necesario incluir un tac
tor (o algunos factores) que tiene más de dos niveles. Esto suele ocurrir cuando hay factores tanto
cuantitativos como cualitativos en el experimento, y el factor cualitativo tiene (por ejemplo) tres niveles.
384 CAPITuLO 9 DISEÑOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES
Tabla 99 Uso de factores con dos niveles para formar

un factor con tres niveles
Factores con dos niveles Factores con tres niveles
B e X
X¡
+ Xz
+ Xz
+ + X3
Si todos los factores son cuantitativos, entonces deberán usarse diseños de dos niveles con puntos centra
les. En esta sección se indica cómo pueden incorporarse factores con tres y cuatro niveles en un diseño r:
9..4.1 Factores con dos y tres niveles

Los diseños en los que algunos factores tienen dos niveles y otros tres niveles pueden derivarse de la tabla
de signos positivos y negativos del diseño 2k usual. El procedimiento general se ilustra mejor con un ejem
plo. Suponga que se tienen dos variables, donde A tiene dos niveles y X tres. Considere la tabla de signos
positivos y negativos del diseño 23 usual con ocho corridas. Los signos de las columnas By C tienen el pa
trón que se muestra en el lado izquierdo de la tabla 99. Sea que los niveles de X estén representados por
x1,x2 y x3• En el lado derecho de la tabla 99 se muestra cómo se combinan los patrones de los signos de By
e para formar los niveles del factor con tres niveles.
Entonces el factor X tiene dos grados de libertad, y si el factor es cuantitativo, es posible hacer su par
tición en un componente lineal y uno cuadrático, con cada componente teniendo un grado de libertad. En
la tabla 910 se muestra un diseño 23 con las columnas rotuladas para indicar los efectos reales que esti
man, donde XL y XQ denotan los efectos lineal y cuadrático, respectivamente, deX. Observe que el efecto
lineal de X es la suma de las estimaciones de los dos efectos calculadas a partir de las columnas asociadas
generalmente conB y C, y que el efecto deA sólo puede calcularse a partir de las corridas donde X está en
el nivel bajo o bien en el alto, es decir, las corridas 1, 2, 7 y 8. De manera similar, el efecto A X XL es la
suma de los dos efectos que se habrían calculado a partir de las columnas rotuladas generalmente AB y
Tabla 910 Un factor con dos niveles y un factor con rres niveles en un diseño 23
Combinaciones de
A XL XL A xXL A xXL Xa A XXa tratamientos reales
Corrida A B e AB AC BC ABC A X
1 + + + Bajo Bajo
2 + + + Alto Bajo
3 + + + Bajo Intermedio
4 + + + Alto Intermedio
5 + + + Bajo Intermedio
6 + + + Alto Intermedio
7 + + + Bajo Alto
8 + + + + + + + Alto Alto
9.4 DISEÑOS FACTORIALES CON NIVELES MIXTOS 385
Tabla 911 Análisis de varianza del diseño de la tabla 910
A SSA 1 MSA
X(XL +XQ) SSx 2 MSB
AX (A X XL +A X XQ) SSAX 2 MSAX
Error (a partir de las corridas 3 y 5 SSE 2 MSE
y de las corridas 4 y 6)
Total 7
AC. Además, observe que las corridas 3 y 5 son réplicas. Por lo tanto, puede hacerse una estimación del
error con un grado de libertad del error utilizando estas dos corridas. De manera similar, las corridas 4 y 6
son réplicas, y esto llevaría a una segunda estimación del error con un grado de libertad. La varianza pro
medio de estos dos pares de corridas podría usarse como cuadrado medio del error con dos grados de li
bertad. En la tabla 911 se resume el análisis de varianza completo.
Si se está dispuesto a suponer que las interacciones de dos factores y de órdenes superiores son insig
nificantes, el diseño de la tabla 910 puede convertirse en una fracción de resolución 111 con hasta cuatro
factores con dos niveles y un solo factor con tres niveles. Esto se conseguiría asociando los factores de dos
niveles con las columnasA,AB,AC y ABC. La columnaBC no puede usarse para un factor de dos niveles
porque contiene el efecto cuadrático del factor X de tres niveles.
Puede aplicarse el mismo procedimiento en los diseños 2t de 16, 32 y 64 corridas. Para 16 corridas es
posible construir factoriales fraccionados de resolución V con dos factores de dos niveles y con dos o tres
factores de tres niveles. También puede obtenerse una fracción con 16 corridas de resolución V con 3 fac
tores de dos niveles y un factor de tres niveles. Si se incluyen cuatro factores de dos niveles y un solo factor
de tres niveles en 16 corridas, el diseño será de resolución 111. Los diseños de 32 y 64 corridas permiten
arreglos similares. Para un estudio adicional de algunos de estos diseños, ver Addleman [lb].
94.2 Factores con dos y cuatro niveles

Es muy sencillo incorporar un factor con cuatro niveles en un diseño zt.
El procedimiento para hacerlo
implica el uso de dos factores con dos niveles para representar el factor con cuatro niveles. Por ejemplo,
suponga que A es un factor de cuatro niveles con los niveles a1, a2, a3 y a4• Considere dos columnas de la ta
bla usual de signos positivos y negativos, por ejemplo las columnas P y Q. El patrón de los signos de estas
dos columnas se muestra en el lado izquierdo de la tabla 912. El lado derecho de esta tabla muestra cómo
estos cuatro patrones de signos corresponderían con los cuatro niveles del factor A. Los efectos represen
Tabla 912 El factor A con cuatro niveles expresado como dos

factores con dos niveles
Factores con dos niveles Factores con cuatro niveles
Corrida p Q A
1 º1
2 + Oz
3 + 03
4 + + 04
11++++1 1++1111++
e++++ 1 1 1 1 1 1 1 1 ++++
~ ++1 1++1111++1 1++
~ +1+1+1+11+1+1+1+
~ ++ 1 1 1 1 ++++ 1 1 1 1 ++
1 1 1 1 1 1 1 1++++++++
t 1 1 1 ++++ 1 1 1 1 ++++
~ 11++11++11++11++
83..
u
1+1+1+1+1+1+1+1+
~
:5
386
95 PROBLEMAS 387
tados por las columnas Py Q y la interacción PQ son mutuamente ortogonales y corresponden al efecto de
A con tres grados de libertad.
Para ilustrar esta idea con mayor detalle, suponga que se tiene un factor de cuatro niveles y dos facto
res de dos niveles y que es necesario estimar todos los efectos principales y las interacciones en las que in
tervienen estos factores. Esto puede hacerse con un diseño de 16 corridas. En la tabla 913 se presenta la
tabla usual de signos positivos y negativos del diseño 24 con 16 corridas, donde las columnas A y B se usan
para formar el factor de cuatro niveles, por ejemplo X, con los nivelesx1,x2,x3 y x4• Se calcularían las sumas
de cuadrados de cada columnaA, B, ... ,ABCD exactamente igual que en el sistema 2" usual. Después las
sumas de cuadrados de todos los factores X, C, D y sus interacciones se forman de la manera siguiente:
ss, = ss, ss, +ssAB (3 grados de libertad)

SSe= SSc (1 grado de libertad)
= SSD
SSD (1 grado de libertad)
SSCD = SSCD (1 grado de libertad)
SSXC =SS AC +SSBC +SS ABC ( 3 grados de libertad)
SS XD =SS AD +SSBD +SS ABD ( 3 grados de libertad)
SS XCD = SSACD +SS BCD +SS ABCD ( 3 grados de libertad)
A este diseño podría llamársele 4 x 22• Si uno está dispuesto a ignorar las interacciones de dos factores,
pueden asociarse hasta nueve factores adicionales de dos niveles con la columna de la interacción de dos
factores (exceptoAB), la columna de la interacción de tres factores y la columna de la interacción de cua
tro factores.
9.. 5 PROBLEMAS
91. Se estudian los efectos de la fuerza del revelador (A) yel tiempo de revelado (B) sobre la densidad de la pelí
cula de placa fotográfica. Se usan tres fuerzas y tres tiempos, y se corren cuatro réplicas de un experimento
factorial 32• Los datos de este experimento se presentan a continuación. Analizar los datos utilizando los mé
todos estándares para experimentos factoriales.
Tiempo de revelado (minutos)

Fuerza del revelador 10 14 18
1 o 2 1 3 2 5
5 4 4 2 4 6
2 4 6 6 8 9 10
7 5 7 7 8 5
3 7 10 10 10 12 10
8 7 8 7 9 8
92. Calcular los componentes I y J de la interacción de dos factores del problema 91.
93. Se llevó a cabo un experimento para estudiar el efecto de tres tipos diferentes de botellas de 32 onzas (A) y
tres tipos diferentes de aparadores de venta (B)anaqueles permanentes lisos, aparadores al final del pasi
llo con anaqueles enrejados y refrigeradores para refrescos sobre el tiempo que toma acomodar diez cajas
de 12 botellas en los aparadores. Se usaron tres empleados (factor C) en el experimento, y se corrieron dos
réplicas de un diseño factorial 33. Los datos del tiempo observado se muestran en la tabla siguiente. Analizar
los datos y sacar conclusiones.
· ·· ··
388 CAPÍTULO 9 DISENOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES
Réplica 1 Réplica II
Tipo de Final del Final del
Empleado botella Permanente pasillo Refrigerador Permanente pasillo Refrigerador
Plástico 3.45 4.14 5.80 3.36 4.19 5.23
1 Vidrio de 28 mm 4.07 4.38 5.48 3.52 4.26 4.85
Vidrio de 38 mm 4.20 4.26 5.67 3.68 4.37 5.58
Plástico 4.80 5.22 6.21 440 4.70 5.88
2 Vidrio de 28 mm 4.52 5.15 6.25 444 4.65 6.20
Vidrio de 38 mm 4.96 5.17 6.03 4.39 4.75 6.38
Plástico 4.08 3.94 5.14 3.65 4.08 4.49
3 Vidrio de 28 mm 4.30 4.53 4.99 4.04 4.08 4.59
Vidrio de 38 mm 4.17 4.86 4.85 3.88 4.48 4.90
94. Un investigador médico estudia el efecto de la lidocaína sobre el nivel de enzimas en el músculo cardiaco de
perros beagle, En el experimento se usan tres marcas comerciales de lidocaína (A), tres dosis (B) y tres perros
(C), y se corren dos réplicas de un diseño factorial 33. Los niveles de enzimas observados se presentan a conti
nuación. Analizar los datos de este experimento.
Réplica 1 Réplica 11
Marca de Fuerza de Perro Perro

lidocaína la dosis 1 2 3 1 2 3
1 96 84 85 84 85 86
1 2 94 99 98. 95 97 90
3 101 106 98 105 104 103
1 85 84 86 80 82 84
2 2 95 98 97 93 99 95
3 108 114 109 110 102 100
1 84 83 81 83 80 79
3 2 95 97 93 92 96 93
3 105 100 106 102 111 108
95_ Calcular los componentes I y J de las interacciones de dos factores del ejemplo 10L
96 Se realiza un experimento en un proceso químico utilizando un diseño factorial 32• Los factores del diseño
son la temperatura y la presión, y la variable de respuesta es el rendimiento. Los datos que resultan de este
experimento se presentan a continuación:
Presión, psig
Tumperatura, ºC 100 120 . 140
80 47.58, 48.77 64.97, 69.22 80.92, 72.60
90 5186, 82.43 88.47, 84.23 93.95, 88.54
100 71.18, 92.77 96.57, 88.72 76.58, 83.04
a) Analizar los datos de este experimento conduciendo un análisis de varianza. lQué conclusiones pueden
sacarse?
b) Analizar gráficamente los residuales. lHay algún motivo de preocupación respecto de los supuestos sub
yacentes o de la adecuación del modelo?
95 PROBLEMAS 389
e) Verificar que si se hace que los niveles bajo, intermedio y alto de ambos factores de este diseño asuman
los niveles1, O y + 1, entonces un ajuste de mínimoscuadrados de un modelo de segundo orden del ren
dimiento es
y= 86.81+10.4x1 +8.42x2 7.17x? 7.86xi 7.69x1x2
d) Confirmar que el modelo del inciso e puede escribirse en términos de las variables naturales la tempe
ratura (7) y la presión (P)- como
y= 1335.63+ 18.56T+8.59P-0.072T2 -0.0l96P2 0.0384TP
e) Construir una gráfica de contorno del rendimiento como una función de la presión y la temperatura.
Con base en el examen de esta gráfica, ¿dónde se recomendaría operar este proceso?
97. a) Confundir un diseño 33 en tres bloques utilizando el componenteABC2de la interacción de tres factores.
Comparar los resultados obtenidos con el diseño de la figura 9 7.
b) Confundir un diseño 33 en tres bloques utilizando el componenteAB2Cde la interacción de tres factores.
Comparar los resultados con el diseño de la figura 9 7.
e) Confundir un diseño 33 en tres bloques utilizando el componenteABC de la interacción de tres factores.
Comparar los resultados obtenidos con el diseño de la figura 9 7.
d) Después de observar los diseños de los incisosa, by e y la figura 9 7, Zqué conclusionespueden sacarse?
98. Confundir un diseño 34 en tres bloques utilizando el componenteAB2CDde la interacción de cuatro factores.
99. Considere los datos de la primera réplica del problema 93. Suponiendo que no fue posible hacer las 27 ob
servacionesel mismo día, establecer un diseño para conducir el experimento en tres días conAB2C confundi
da con los bloques. Analizar los datos.
910. Delinear la tabla del análisisde varianza del diseño 34 en nueve bloques. ¿se trata de un diseño práctico?
911. Considere los datos del problema 93. SiABC está confundida en la réplica 1 yABCZ está confundida en la ré
plica 11, realizar el análisis de varianza.
912. Considere los datos de la réplica 1 del problema 93. Suponga que sólo se corre una fracción un tercio de este
diseño con I = ABC. Construir el diseño, determinar la estructura de los alias y analizar los datos.
913. Por el examen de la figura 99, ¿qué tipo de diseño quedaría si después de completar las nueve primeras co
rridas pudiera eliminarse uno de los tres factores?
914. Construir un diseño 3~1 con I = ABCD. Escribir la estructura de los alias de este diseño.
915. Verificar que el diseño del problema 914 es un diseño de resolución IV.
916. Construir un diseño 352 con/ =ABC el= CDE. Escribir la estructura de los alias de este diseño. i.Cuál es la
resolución de este diseño?
917. Construir un diseño 396 y verificar que es un diseño de resolución 111.
918. Construir un diseño 4 x 23 confundido en dos bloques con 16 observacionescada uno. Delinear el análisisde
varianza de este diseño.
919. Delinear la tabla del análisis de varianza de un diseño factorial 2232• Comentar la manera en que este diseño
puede confundirse en bloques.
920. Empezando con un diseño 24 de 16 corridas, indicar cómo pueden incorporarse dos factores de tres niveles
en este experimento. ¿cuántosfactores de dos nivelespueden incluirse si se quiere cierta información sobre
las interacciones de dos factores?
921. Empezando con un diseño 24 de 16 corridas, indicar cómo pueden incorporarse un factor con tres niveles y
tres factores con dos niveles, de tal modo que siga siendo posible la estimación de las interacciones de dos
factores.
922. En el problema 826 el lector conoció a Harryy Judy PetersonNedry, dos amigos del autor que son propieta
rios de un viñedo y una fábrica vinícola en Newberg, Oregon. En ese problema se describió la aplicación de
diseños factoriales fraccionados de dos niveles en su producto Pinot Noir 1985. En 1987quisieron conducir
otro experimento Pinot Noir. Las variables de este experimento fueron
390 CAPíTuLO 9 DISEÑOS FACTORIALESY FACTORIALESFRACCIONADOS CON TRES NIVELES
Variable Niveles
Clon de Pinot Noir Wadenswil, Pommard
Tamaño de la uva Pequeño, grande
Temperatura de fermentación SOºF, 85ºF, 90/80ºF, 90ºF
Uva completa Ninguno, 10%
Tiempo de maceración 10 días, 21 días
Tipo de levadura Assmanhau, Champagne
Tipo de roble Troncáis, Allier
Harry y Judy decidieron usar un diseño factorial fraccionado de dos niveles con 16 corridas, tratando los cua
tro niveles de la temperatura de fermentación como dos variables de dos niveles. Como en el problema 8·26,
utilizaron las calificaciones de un panel de catadores como variable de respuesta. El diseño y las calificado·
nes promedio resultantes se presentan enseguida:
Tamaño Temperatura de Uva Tiempo de Tipo de Tipo de Calificación
Corrida Clon de la uva fermentación completa maceración levadura roble promedio
1 4
2 + + + + 10
3 + + + + 6
4 + + + + 9
5 + + + + 11
6 + + + + 1
7 + + + + 15
8 + + + + 5
9 + + + + 12
10 + + + + 2
11 + + + + 16
12 + + + + 3
13 + + + + 8
14 + + + + 14
15 + + + + 7
16 + + + + + + + + 13
a) Describir los alias de este diseño.

b) Analizar los datos y sacar conclusiones.
e) lQué comparaciones pueden hacerse entre este experimento y el experimento del Pinot Noir 1985 del
problema 8·26?
923. En un artículo de W.D. Baten publicado en el volumen de 1956 de Industrial Quality Control se describe un
experimento para estudiar el efecto de tres factores sobre la longitud de unas barras de acero. Cada barra se
sometió a uno de dos procesos de tratamiento térmico y se cortó en una de cuatro máquinas en una de tres
horas durante el día (8 a.m., 11 a.m, o 3 p.m.), Los datos de la longitud codificada son los siguientes:
Hora del Proceso de Máquina

día tratamiento térmico 1 2 3 4
1
6 9 7 9 1 2 6 6
1 3 5 5 o 4 7 3
8a.m. 2
4 6 6 5 1 o 4 5
o 1 3 4 o 1 5 4
9-5 PROBLEMAS 391
Horade) Proceso de Máquina

día tratamiento térmico 1 2 3 4
6 3 8 7 3 2 7 9
1
1 1 4 8 1 o 11 6
lla.m. 2
3 1 6 4 2 o 9 4
1 2 1 3 1 1 6 3
1
5 4 10 11 1 2 10 5
9 6 6 4 6 1 4 8
3p.m. 2
6 o 8 7 o 2 4 3
3 7 10 o 4 -4 7 o
a) Analizar los datos de este experimento suponiendo que las cuatro observaciones de cada celda son répli
cas.
b) Analizar los residuales de este experimento. lExiste algún indicio de que hay un punto atípico en una de
las celdas? Si se encuentra un punto atípico, eliminarlo y repetir el análisis del inciso a. lA qué conclusio
nes se llega?
e) Suponga que las observaciones de las celdas son las longitudes (codificadas) de barras que se procesaron
conjuntamente en el tratamiento térmico y después se cortaron secuencialmente (es decir, en orden) en
las cuatro máquinas. Analizar los datos y determinar los efectos de los tres factores sobre la longitud pro
medio.
d) Calcular la varianza logarítmica de las observaciones de cada celda. Analizar esta respuesta. lQué con·
clusiones pueden sacarse?
e) Suponga que la hora en que se corta una barra en realidad no puede controlarse durante la producción
rutinaria. Analizar la longitud promedio y la varianza logarítmica de la longitud de cada una de las 12 ba
rras cortadas en cada combinación máquina/proceso de tratamiento térmico. lQué conclusiones pueden
sacarse?
Ajuste de
modelos de
. ,,
regresion
10~1 INTRODUCCIÓN
En muchos problemas hay dos o más variables relacionadas, y el interés se centra en modelar y explorar
esta relación. Por ejemplo, en un proceso químico el rendimiento del producto está relacionado con la
temperatura de operación. Quizá el ingeniero químico quiera construir un modelo que relacione el rendi
miento con la temperatura para usarlo después como herramienta de predicción o bien de optimización o
control del proceso.
En general, suponga que hay una sola variable dependiente o de respuesta y que depende de k varia
bles independientes o regresores, por ejemplo, x1, x2, ... , xk. La relación que existe entre estas variables se
caracteriza por un modelo matemático llamado modelo de regresión. Dicho modelo se ajusta a un con
junto de datos nrnestrales. En ocasiones el experimentador conoce la forma exacta de la verdadera rela
ción funcional entreyyx1,x2, ... ,xk, por ejemplo y= </J(x1,x2, ... ,xk)· Sin embargo, en la mayoría de los casos
no se conoce la verdadera relación funcional, y el experimentador elige una función apropiada para apro
ximar (/J. Los modelos polinomiales de orden inferior son de uso generalizado como funciones de aproxi
mación.
Existe una fuerte relación recíproca entre el diseño de experimentos y el análisis de regresión. A lo
largo de este libro se ha destacado la importancia de expresar cuantitativamente los resultados de un ex
perimento, en términos del modelo empírico, a fin de facilitar su comprensión, interpretación e imple
mentación. Los modelos de regresión constituyen la base para conseguirlo. Se ha presentado en múltiples
ocasiones el modelo de regresión que representaba los resultados de un experimento. En este capítulo se
presentan algunos aspectos del ajuste de estos modelos. Presentaciones más completas de la regresión se
encuentran en Montgomery y Peck [82] y Myers [84].
Los métodos de regresión se utilizan con frecuencia para analizar datos de experimentos no planea
dos, como podría ser el caso de la observación de fenómenos no controlados o de registros históricos. Los
métodos de regresión también son muy útiles en experimentos diseñados cuando algo "salió mal". En
este capítulo se ilustran algunas de estas situaciones.
392
102 MODELOS DE REGRESIÓN LINEAL 393
10.. 2 MODELOS DE REGRESIÓN LINEAL
La atención se centrará en el ajuste de modelos de regresión lineal. Para ilustrar, suponga que quiere de
sarrollarse un modelo empírico que relacione la viscosidad de un polímero con la temperatura y la veloci
dad de alimentación del catalizador. Un modelo que podría describir esta relación es
(101)
donde y representa la viscosidad, x1 la temperatura y x2 la velocidad de alimentación del catalizador. Se

trata de un modelo de regresión lineal múltiple con dos variables independientes. Es común llamar a las
variables independientes variables predictoras o regresores (variables de regresión). Se utiliza el térmi
no lineal porque la ecuación 101 es una función lineal de los parámetros desconocidos /30, {31 y {32. El mo
delo describe un plano en el espacio bidimensionalx.ce; El parámetro {10 define la intersección del plano
con el eje de las ordenadas. En ocasiones {11 y {12 se denominan los coeficientes de regresiónparcial, porque
{11 mide el cambio esperado en y para cada cambio unitario de x1 cuando x2 se mantiene constante, y {12
mide el cambio esperado en y para cada cambio unitario de x2 cuando x1 se mantiene constante.
En general, la variable de respuesta y puede relacionarse con k regresares. Al modelo
(102)
se le llama modelo de regresión lineal múltiple con k regresares. A los parámetros {Ji,j = O, 1, ... , k se les lla
ma los coeficientes de regresión. Este modelo describe un hiperplano en el espacio de k dimensiones de los
regresares {x). El parámetro {Ji representa el cambio esperado en la respuesta y para un cambio unitario
en xi cuando las variables independientes restantes X; (i c.;:. j) se mantienen constantes.
Con frecuencia los modelos cuya apariencia es más compleja que la ecuación 102 pueden también
analizarse mediante técnicas de regresión lineal múltiple. Por ejemplo, considere la incorporación de un
término de interacción en el modelo de primer orden en dos variables, por ejemplo
(103)
Si se hace x3 = x¡X2 y {33 = {312, entonces la ecuación 103 puede escribirse como
y= f3o +f31x1 +f12x2 +{33X3 +E (104)
que es un modelo de regresión lineal múltiple estándar con tres regresares. Recuerde que en algunos
ejemplos de los capítulos 6, 7 y 8 se presentaron varios modelos empíricos similares a las ecuaciones 102 y
104 para expresar cuantitativamente los resultados de un diseño factorial de dos niveles. Como otro
ejemplo, considere el modelo de superficie de respuesta de segundo orden en dos variables:
(105)
Si se hacex, = x{ ,x4 =xi ,x5 =x¡X2,/33 = {311,{34 = {322y{35 = {312, entonces esta expresión queda como
(106)
que es un modelo de regresión lineal. Este modelo se ha visto también en ejemplos anteriores de este li
bro. En general, cualquier modelo de regresión que es lineal en los parámetros (los valores {3) es un mode
lo de regresión lineal, independientemente de la forma de la superficie de respuesta que genera.
En este capítulo se resumirán los métodos para estimar los parámetros de los modelos de regresión li
neal múltiple. A este procedimiento suele llamársele el ajuste del modelo. Se analizarán también los mé
todos para probar hipótesis y para construir intervalos de confianza para estos modelos, así como para
394 CAPÍTIJLO 10 AJUSTE DE MODELOS DE REGRESIÓN
verificar la adecuación del ajuste del modelo. La atención se centra en los aspectos del análisis de regre
sión que son útiles en los experimentos diseñados. Para presentaciones más completas de la regresión, re
ferirse a Montgomery y Peck [82] y Myers [84].
10-3 ESTIMACIÓN DE LOS PARÁMETROS EN MODELOS

DE REGRESIÓN LINEAL
El método de mínimos cuadrados se usa de manera típica para estimar los coeficientes de regresión de un
modelo de regresión lineal múltiple. Suponga que se cuenta con n > k observaciones de la variable de res
puesta, por ejemplo,y1,y2, ···•Yn· Junto con cada respuesta observada y; se tendrá una observación de cada
uno de los regresares, y sea que X;¡ denote la observación o nivel zésimo de la variable xi. Los datos apare
cerán como en la tabla 101. Se supone que el término del error e del modelo tiene E( E) = O y V(e) = a2 y
que las {s.) son variables aleatorias no correlacionadas.
La ecuación del modelo (ecuación 102) puede escribirse en términos de las observaciones de la tabla
101 como
Y;= f3o +f11xn +f12x;2 + ··· +{1kxik +E;
k (107)
={10+ L
j~l
{Jixii+E; i=l, 2, ... , n
El método de mínimos cuadrados consiste en elegir las f1 de la ecuación 107 de tal modo que la suma de
cuadrados de los errores, e;, se minimice. La función de mínimos cuadrados es
L= !;~1
e¡
(108)
La función L debe minimizarse con respecto a {10, {11, ... , {Jk. Los estimadores de mínimos cuadrados, por
ejemplo '/3 0, '/31' ... , '/J k, deben satisfacer
(109a)
(109b)
Tabla 101 Datos de una regresión lineal múltiple

y X¡ X2 xk
Y1 Xn Xi2 X¡k
Y2 Xz¡ Xzi X2k
Y. X.i x.z xnk

103 ESTIMACIÓN DE LOS PARÁMETROS EN MODELOS DE REGRESIÓN LINEAL 395
Al simplificar la ecuación 109, se obtiene

.
+···+PkL x"'
;1 i=l
= L X11Yi
/1 /1 ..
Po .LJ + /31 .LJ

2
+P2L X¡¡X12+···+PkL X¡1Xik
A ~ A~
X11 X¡¡ (1010)

;~1 i•l i=I i~l i=l
= !
i=I
X11cY;
Estas ecuaciones se denominan ecuaciones normales de mínimos cuadrados. Observe que hay p k + 1 =
ecuaciones normales, una para cada uno de los coeficientes de regresión desconocidos. La solución de las
ecuaciones normales serán los estimadores de mínimos cuadrados de los coeficientes de regresión
Po· .81 .... , .ñk.
Es más sencillo resolver las ecuaciones normales si se expresan en la notación matricial. A continua
ció~ se presenta el desarrollo matricial de las ecuaciones normales que es análogo al desarrollo de la
ecuación 1010. El modelo en términos de las observaciones, ecuación 107, puede escribirse en notación
matricial como
l
y= X/J +B
donde
1 Xn X12 ••• Xa
1 x21 x22 • • • X2k
X=: : : : '
[
6 • • •
1 xnl x .. 2 ••• xnk
En general, y es un vector (n x 1) de las observaciones, X es una matriz (n x p) de los niveles de las varia
bles independientes, fJ es un vector (p x 1) de los coeficientes de regresión, y e es un vector (n x 1) de los
errores aleatorios.
Quiere encontrarse el vector de los estimadores de mínimos cuadrados, P, que minimice
L= ,! e; = e'e =(y
l=l
XfJ)'(y X/l)
Observe que L puede expresarse como

L= y'y/J'X'yy'X/J+/J'X'X/J (1011)
= y 'y 2/J'X 'y+ /J'X 'X{J
ya que/J'X'yes una matriz (1 x l),o un escalar,ysu transpuesta (/l'X'y)' = y'X/Jeselmismo escalar. Los
estimadores de mínimos cuadrados deben satisfacer
396 CAPITuw 10 AJUSTE DE MODEWS DE REGRESIÓN
aLI =2Xy+
, 2X"f'=O
•vil
afJ 'P
cuya simplificación es
X'x/J= X'y (1012)
La ecuación 1012 es la forma matricial de las ecuaciones normales de mínimos cuadrados. Es idéntica a
la ecuación 1010. Para resolver las ecuaciones normales, ambos miembros de la ecuación 1012 se multi
plican por la inversa de X'X. Por lo tanto, el estimador de mínimos cuadrados de fJ es
(X'Xf1X'y P= (1013)
Es sencillo ver que la forma matricial de las ecuaciones normales es idéntica a la forma escalar. Al de
sarrollar en detalle la ecuación 1012, se obtiene
.L
n
¿
n
n. L
i•l
X¡1
"
j;l
xi2
¡;::::¡
xik
i1
:¿
n n n n
LX;¡
i;;;l ;~1
xii L
/;l
X¡¡Xi2 Lj;\
X¡¡Xik
L
n n n
2: xik L xikxil xikx12 ¿" 2

xik
r1 ¡;l i•l ;~1
Si se efectúa la multiplicación matricial indicada, se obtendrá la forma escalar de las ecuaciones normales
(es decir, la ecuación 1010). En esta forma es sencillo ver que X'X es una matriz simétrica (p x p) y que
X'y es un vector columna (p x 1). Observe la estructura especial de la matriz X'X. Los elementos de la
diagonal de X'X son las sumas de cuadrados de los elementos de las columnas de X, y los elementos que
no están en la diagonal son las sumas de los productos cruzados de los elementos de las columnas de X.
Además, observe que los elementos de X'y son las sumas de los productos cruzados de las columnas de X y
las observaciones {y¡}.
y= xjJ (1014)
En notación escalar, el modelo ajustado es
k
)\ = f3o + L.J i = 1, 2, ... , n

A ~ A
fJjx;¡
i=l
La diferencia entre la observación real Y; y el valor ajustado correspondiente Y; es el residual, es decir,

e; = Y; - j\ . El vector ( n x 1) de los residuales se denota por
e=y-y (1015)
Estimación de a2
Por lo general también es necesario estimar a2. Para desarrollar un estimador de este parámetro, conside
re la suma de cuadrados de los residuales, por ejemplo
SSE =}: (Y; - Y; )2
= e'e
Al sustituir e = y y = y xjJ, se tiene
SSE = (y x/J)(y xP)

= y'y/J'X'yy'xiJ+jJ'X'x/J
= y'y2/J'X'y+jJ'X'xP
Puesto que X'xP = X'y, esta última ecuación queda como
SSE = y'y/J'X'y (1016)
A la ecuación 1016 se le llama la suma de cuadrados residual o del error, y tienen p grados de libertad
asociados con ella. Puede demostrarse que
E(SSE )= a2(n p)
por lo que un estimador insesgado de a2 está dado por

A2 SSE
<J = (1017)
n-p
Propiedades de los estimadores

El método de mínimos cuadrados produce un estimador insesgado del parámetro fJ del modelo de regre
sión lineal. Esto puede demostrarse fácilmente tomando el valor esperado de jJ de la siguiente manera:
E(P)= El(X'X)1X'y]
= E[(X'X)1(XfJ+e))
= E[(X'Xf1X'XfJ+(X Xf1X'e]1
= fJ
ya que E(e) = O y (X'Xt1X'X = l. Por lo tanto, jJ es un estimador insesgado de fJ.
iJ
La propiedad de la varianza de se expresa en la matriz de covarianza:
Cov(/J) = E{ [P E(ft) ][P E(ft) r} (1018)
que es una matriz simétrica cuyo elemento iésimo de la diagonal principal es la varianza del coeficiente
de regresión individual {3., y cuyo elemento (ij)ésimo es la covarianza entre {3. y {3 J.. La matriz de cova
,,. 1 l
rianza de fJ es
Cov(fJ) = a2(X'Xf1 (1019)
EJEMPLO 10-1 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · • • · · · · · · · · · · · · ·
En la tabla 102 se muestran 16 observaciones de la viscosidad de un polímero (v) y dos variables del pro
ceso: la temperatura de reacción (x1) y la velocidad de alimentación del catalizador (x2). Se ajustará el mo
delo de regresión lineal múltiple
Tabla 102 Datos de la viscosidad del ejemplo 101 (viscosidad en

centistokes@ lOO"C)
Temperatura Velocidad de alimentación
Observación (x1, ºC) del catalizador (x2, lb/h) Viscosidad
1 80 8 2256
2 93 9 2340
3 100 10 2426
4 82 12 2293
5 90 11 2330
6 99 8 2368
7 81 8 2250
8 96 10 2409
9 94 12 2364
10 93 11 2379
11 97 13 2440
12 95 11 2364
13 100 8 2404
14 85 12 2317
15 86 9 2309
16 87 12 2328
a estos datos. La matriz X y el vector y son
1 80 8 2256
1 93 9 2340
1 100 10 2426
1 82 12 2293
1 90 11 2330
1 99 8 2368
1 81 8 2250
1 96 10 2409
X= 1 94 y=
12 2364
1 93 11 2379
1 97 13 2440
1 95 11 2364
1 100 8 2404
1 85 12 2317
1 86 9 2309
1 87 12 2328
La matriz X'X es
1 1 80
X'X=H 93
9
87
12 ][:
93
87 ¡:]
= 1458
16 1458
133,560 14,946
164]
[ 164 14,946 1,726
y el vector X'y es
x'y= [858 9~ 871][2256]

2~40
l
9 12
2328
37,577
= [ 3,429,550
385,562
La estimación de mínimos cuadrados de fJ es
l
o
14.176004 0.129746 0.223453 ][ 37,577

jJ = 0.129746 1.429184x103 4.763947x10S 3,429,550
[0.223453 4.763947x105 2222381X102 385,562
1566.07777]
=[ 7.62129
8.58485
El ajuste de mínimos cuadrados, con los coeficientes de regresión expresados con dos cifras decimales, es
'Iiabla 1~3 Valores predichos, residuales y otros diagnósticos del ejemplo 101
Observación Valor predicho Residual Residual
Y; s. e; h;; studentizado D; R·student
1 2256 2244.5 11.5 0.350 0.87 0.137 0.87
2 2340 2352.1 12.1 0.102 0.78 0.023 0.77
3 2426 2414.1 11.9 0.177 0.80 0.046 0.79
4 2293 2294.0 1.0 0.251 0.07 0.001 0.07
5 2330 2346.4 16.4 0.077 1.05 0.030 1.05
6 2368 2389.3 21.3 0.265 1.52 0.277 1.61
7 2250 2252.1 2.1 0.319 0.15 0.004 0.15
8 2409 2383.6 25.4 0.098 1.64 0.097 1.76
9 2364 2385.5 21.5 0.142 1.42 0.111 1.48
10 2379 2369.3 9.7 0.080 0.62 0.011 0.60
11 2440 2416.9 23.1 0.278 1.66 0.354 1.80
12 2364 2384.5 20.5 0.096 1.32 0.062 1.36
13 2404 2396.9 7.1 0.289 0.52 0.036 o.so
14 2317 2316.9 0.1 0.185 0.01 0.000 <0.01
15 2309 2298.8 10.2 0.134 0.67 0.023 0.66
16 2328 2332.1 4.1 0.156 0.28 0.005 0.27
402 CAPÍTULO 10 AJUSTE DE MODELOS DE REGRESIÓN
Tabla 104 Salida de Minitab para el modelo de regresión de la viscosidad, ejemplo 101
Análisis de regresión
The regression equation is

Viscosity = 1566 + 7.62 Temp + 8.58 Feed Rate
Predictor Coef StDev T p
Constant 1566.08 61.59 25.43 0.000
Temp 7.6213 0.6184 12.32 0.000
Feed Rat 8.585 2.439 3.52 0.004
s = 16.36 R-Sq = 92.7% R-Sq(adj) = 91. 6%

Analysis of Variance
Source DF SS .. s F p
Regression 2 44157 22079 82.50 0.000
Residual Error 13 3479 268
Total 15 47636
Source DF Seq SS
Temp 1 40841
Feed Rat 1 3316
57 88
Variables del proceso Variables codificadas
Corrida Temperatura (ºC) Presión (pslg) Concentración (gil)

"''
x, ., Rendimiento,
y
1 120 40 15 1 1 1 32
2 160 40 15 1 1 1 46
3 120 80 15 1 1 57
4 160 80 15 1 65
5 120 40 30 1 1 36
6 160 40 30 1 48
7 120 80 30 1 67
B 160 80 30 1 68
9 140 80 22.5 o o o 50
10 140 60 22.6 o o o 44
11 140 60 22.6 o o o 53
12 140 60 22.5 o o o 56
X,
Tomperatura 140
20 .,
x ~~
20 .x,
= Concen1r1eión 22 S
7.S
Figura 10·5 Diseño experimental del ejemplo 102.

Ajuste de modelos de regresión en experimentos diseñados
Se ha usado con frecuencia un modelo de regresión para presentar los resultados de un experimento dise
ñado en una forma cuantitativa. Se ofrece ahora un ejemplo completo donde se indica cómo se hace esto.
Se presentan enseguida otros tres ejemplos breves que ilustran otras aplicaciones útiles del análisis de re
gresión en los experimentos diseñados.
EJEMPLO 10.. 2 • • • • • · • • · · · · • · · · • · · · · • • • • • · · · · · • • · · • • · · · • • · · • • · • · · • • · · • • · · · •
Análisis de regresión de un diseño factorial 23
Un ingeniero químico está investigando el rendimiento de un proceso. Tres de las variables del proceso
son de interés: la temperatura, la presión y la concentración del catalizador. Cada variable puede correrse
en un nivel bajo y Uno alto, y en ingeniero decide correr un diseño 23 con cuatro puntos centrales. En la fi
gura 105 se muestra el diseño y los rendimientos resultantes, donde se presentan tanto los niveles natura
les del diseño como la notación de variables codificadas + 1, 1 que se utiliza normalmente en los diseños
factoriales 2k para representar los niveles de los factores.
Suponga que el ingeniero decide ajustar un modelo que sólo incluye los efectos principales, por ejemplo
y= Po +/31X1 +/32X2 +{33x3 +e
Para este modelo, la matriz X y el vector y son

1 1 1 1 32
1 1 1 1 46
1 1 1 1 57
1 1 1 1 65
1 1 1 1 36
1 1 1 1 48
X= 1 1 y=
1 1 57
1 1 1 1 68
1 o o o 50
1 o o o 44
1 o o o 53
1 o o o 56
Es sencillo demostrar que
X'X [12
Oo o8
o Oo
8
º]o
O X'y=
[612]
¿g
o o o 8
Puesto que X'X es diagonal, el inverso que se requiere también es diagonal, y las estimaciones de mínimos
cuadrados de los coeficientes de regresión son
/J= (X'xr x'y=1

[
1/12
~
11
o
g 1/ 8
o º]
o
o
45 [51.000]
[612] 5.625
85 = 10.625
o 1/8 9 1.125
y= 51.000+5.62Sx1 +10.625x2 +1.125x3
~ª ..
Como se ha hecho uso de ellos en muchas ocasiones, los coeficientes de regresión guardan una estre
cha relación con las estimaciones de los efectos que se obtendrían por el análisis usual de un diseño 23• Por
ejemplo, el efecto de la temperatura es (referirse a la figura 105)
T=yr -.Yr
::: 56.75 45.50
= 11.25
Observe que el coeficiente de regresión de x1 es
(11.25)/ 2 = 5.625
Es decir, el coeficiente de regresión es exactamente la mitad de la estimación usual del efecto. Esto siem
pre se cumplirá para un diseño 2k. Como se señaló antes, en los capítulos 6 al 8 se empleó este resultado
para producir modelos de regresión, valores ajustados y residuales en varios experimentos de dos niveles.
Este ejemplo demuestra que las estimaciones de los efectos de un diseño 2k son estimaciones de mínimos
cuadrados.
En el ejemplo 102 es sencillo obtener la matriz inversa porque X'X es diagonal. Intuitivamente, esto
parece ofrecer ventajas, no sólo porque los cálculos se simplifican sino también porque los estimadores de
todos los coeficientes de regresión no están correlacionados, es decir, Cov(fJ¡, '/li)
= O. Si los niveles de las
variables x pueden elegirse antes de recabar los datos, quizá sea deseable diseñar el experimento de tal
modo que resulte una X'X diagonal.
En la práctica puede ser relativamente sencillo conseguir esto. Se sabe que los elementos de X'X que
están fuera de la diagonal son las sumas de los productos cruzados de las columnas en X. Por lo tanto, es
necesario hacer que el producto interior de las columnas de X sean iguales a cero; es decir, estas columnas
deben ser ortogonales. A los diseños experimentales que poseen esta propiedad para ajustar un modelo
de regresión se les llama diseños ortogonales. En general, el diseño factorial 2k es un diseño ortogonal
para ajustar el modelo de regresión lineal múltiple.
Los métodos de regresión son en extremo útiles cuando algo "sale mal" en un experimento diseñado.
Esto se ilustra en los dos ejemplos siguientes.
EJEMPLO 10·3 · · · · · · · · · · · · · · · · · · • · · · · · · · · · · · · · · · • · · · · · · · · · · · · · · · · · · · • · · · • ·
Un diseño factorial 23 con una observación faltante
Considere el diseño factorial 23 con cuatro puntos centrales del ejemplo 102. Suponga que cuando se rea
lizó este experimento, faltó la corrida con todas las variables en el nivel alto (la corrida 8 de la figura 105).
Esto puede ocurrir por varias razones: el sistema de medición puede producir una lectura incorrecta, la
combinación de los niveles de los factores quizá no sea la apropiada, la unidad experimental puede estar
dañada, etcétera.
Se ajustará el modelo de los efectos principales ·
y= flo +j3¡X¡ +f32X2 +{J3X3 +t

utilizando las 11 observaciones restantes. La matriz X y el vector y son
103 ESTIMACIÓN DE LOS PARÁMETROS EN MODEIDS DE REGRESIÓN LINEAL 405
1 1 1 1 32
1 1 1 1 46
1 1 1 1 57
1 1 1 1 65
1 1 1 1 36
X= 1 1 1 1 y= 48
1 1 1 1 57
1 o o o 50
1 o o o 44
1 o o o 53
1 o o o 56
Para estimar los parámetros del modelo se forman
X'X=
[
1
i
1
11 1
7
-1
1
1
-1 lj
1
7 1 X'y=
1
[ 23
7
544
17
59
l
y entonces
P = (X'Xt X'y 1
9.61538x 102 l.92307x102 l.92307xl02

_ l.92307x102 2.88462x102 l.92307x102]
2.88462xto [544]
23
0.15385 2
[ 1.92307x102 2.88462x102 0.15385 2.88462xl02 17
l. 92307X102 2.88462x1W2 288462x102 0.15385 59
51.2~
5.75
= [ 10.75
1.25
Por lo tanto, el modelo ajustado es

y= 51.25+5.75x1 +10.75x2 +l.25x3
Compare este modelo con el que se obtuvo en el ejemplo 102, donde se usaron las 12 observaciones. Los
coeficientes de regresión son muy símilares. Debido a la estrecha relación entre los coeficientes de regre
sión y los efectos de los factores, las conclusiones no sufrirían una alteración sustancial por la observación
faltante. Sin embargo, observe que las estimaciones de los efectos han dejado de ser ortogonales, ya que
(X'X) y su inversa ya no son diagonales .
.........................................................................
EJEMPLO 1 0 . .4 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Niveles imprecisos de los factores del diseño
Cuando se corre un experimento diseñado, en ocasiones es difícil alcanzar y mantener los niveles preci
sos de los factores requeridos por el diseño. Las discrepancias pequeñas no son importantes, pero las
grandes son motivo de preocupación potencial. Los métodos de regresión son útiles en el análisis de un
Tabla 10-5 Diseño experimental del ejemplo 10-4

Variables del proceso Variables codificadas
Temperatura Presión Concentración Rendimiento
Corrida (°C) (psig) (gil) X¡ Xz X3 y
1 125 41 14 -0.75 -0.95 -1.133 32
2 158 40 15 0.90 1 -1 46
3 121 82 15 -0.95 1.1 1 57
4 160 80 15 1 1 1 65
5 118 39 33 -1.10 -1.05 l.14 36
6 163 40 30 1.15 -1 1 48
7 122 80 30 -0.90 1 1 57
8 165 83 30 1.25 1.15 1 68
9 140 60 22.5 o o o 50
10 140 60 22.5 o o o 44
11 140 60 22.5 o o o 53
12 140 60 22.5 o o o 56
experimento diseñado cuando el experimentador no ha podido obtener los niveles requeridos de los
factores.
Para ilustrar, el experimento de la tabla 105 presenta una variación del diseño 23 del ejemplo 102,
donde muchas de las combinaciones de prueba no son exactamente las que se especifican en el diseño.
Las dificultades parecen haber ocurrido sobre todo con la variable temperatura.
Se ajustará el modelo de los efectos principales
y= Po +/31X1 +/32X2 +f33x3 +e
La matriz X y el vector y son
1 0.75 0.95 1.133 32

1 0.90 1 1 46
1 0.95 1.1 1 57
1 1 1 1 65
1 1.10 1.05 1.4 36
1 1.15 1 1 48
X= 1 0.90 1 1 y= 57
1 1.25 1.15 1 68
1 o o o 50
1 o o o 44
1 o o o 53
1 o o o 56
l
Para estimar los parámetros del modelo se necesitan
12 0.60 0.25 0.2670]

X'X _ 0.60 8.18 0.31 0.1403 1 612
77.55
[ 0.25 0.31 8.5375 0.3437 Xy= 161.50
[
0.2670 0.1403 0.3437 9.2437 19.144
Entonces
&37447X102
_ 6.09871X103
[2.33542x103
6.09871X103
0.12289
4.20766X103
233542x103
4.20766x103
0.11753
2.59833xl0 1
l.88490xl033 [612
77.55
4.37851X103 161.50
0.10845 19.144
l
2.59833x 103 l.88490xl03 4.37851X103
50.36496]
5.41932
= [ 10.16672
1.07653
El modelo de regresión ajustado, con los coeficientes reportados con dos cifras decimales, es
y= 50.36+2x +10.17x
1 2 +l.08x3
Al comparar este resultado con el modelo original del ejemplo 102, donde los niveles de los factores fue
ron exactamente los que se especificaron en el diseño, se observa muy poca diferencia. La interpretación
práctica de los resultados de este experimento no sufriría alteraciones sustanciales por la incapacidad del
experimentador para alcanzar exactamente los niveles deseados de los factores .
.........................................................................
EJE:?tf:PLO10-5 · · · · · · · · · · · · · · · ·· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Separación de alias de interacciones en un diseño factorial fraccionado
En el capítulo 8 se señaló la posibilidad de separar los alias de las interacciones de un diseño factorial
fraccionado mediante el proceso llamado doblez o plegado. Para un diseño de resolución III, un plegado
completo se construye corriendo una segunda fracción en la que los signos están invertidos respecto de
los signos de la fracción original. Entonces el diseño combinado puede usarse para separar los alias de to
dos los efectos principales de las interacciones de dos factores.
Una dificultad con el plegado es que requiere un segundo grupo de corridas de tamaño idéntico al del
diseño original. Por lo general es posible separar los alias de ciertas interacciones de interés aumentando
el diseño original con un número de corridas menor que las que se requieren en un plegado completo. Los
métodos de regresión son una forma fácil de formular este problema y de ver cómo puede resolverse.
Para ilustrar, suponga que se ha corrido un diseño 2~1. En la tabla 83 se muestra la fracción princi
pal de este diseño, en la que I = ABCD. Suponga que después de que se observaron los datos de los ocho
primeros ensayos, los efectos más grandes fueronA,B, C, D (se ignoran las interacciones de tres factores
que son alias de estos efectos principales), y la cadena de aliasAB +CD. Las otras dos cadenas de alias
pueden ignorarse, pero es claro queAB o CD o ambas interacciones de dos factores son grandes. Para di
lucidar cuáles son las interacciones importantes podría, desde luego, correrse la fracción alterna, para lo
cual se requerirían otros ocho ensayos. Entonces las 16 corridas podrían usarse para estimar los efectos
principales y las interacciones de dos factores.
Es posible separar los alias deAB y CD en un número de ensayos adicionales menor que ocho. Supon
ga que quiere ajustarse el modelo
y= /30 +/31X1 +/31X1 +/33X3 +/34X4 +/312X1X2 +f3'34x3x4 +e

dondex..x.,», y x4 son las variables codificadas que representan aA, B, Cy D. Utilizando el diseño de la ta
bla 83, la matriz X de este modelo es
X¡ X2 X3 X4 X:¡Xz X~4
1 -1 -1 -1 -1 1 1
1 1 -1 -1 1 -1 1
1 -1 1 -1 1 -1 -1
1 1 1 -1 -1 1 1
X= 1 -1 -1 1 1 1 1
1 1 -1 1 -1 -1 -1
1 1 1 1 -1 -1 1
1 1 1 1 1 1 1
donde se han anotado las variables arriba de las columnas a fin de facilitar la comprensión. Observe que la
columna r.r, es idéntica a la columnaxa, (como se anticipaba, ya queAB OX:¡X2 es alias de CD ox~4),
lo cual implica una dependencia lineal en las columnas de X. Por lo tanto, no pueden estimarse tanto {312
=
como/334 en el modelo. Sin embargo, suponga que se agrega la corrida únicax, = -l,x2 = l,x3 1 yx4 =
1 de la fracción alterna a las ocho corridas originales. Entonces la matriz X del modelo queda como
X¡ X2 X3 X4 X:¡X2 X~4
1 -1 -1 1 -1 1 1
1 1 -1 -1 1 -1 1
1 1 1 -1 1 -1 -1
1 1 1 -1 -1 1 1
X= 1 -1 -1 1 1 1 1
1 1 -1 1 -1 1 -1
1 -1 1 1 -1 -1 -1
1 1 1 1 1 1 1
1 1 -1 -1 1 1 -1
Observe que ahora las columnas x:¡X2 y x~4 ya no son idénticas, y el modelo puede ajustarse incluyendo a
las dos ínteraccíones r.r, (AB) y x~4 (CD). Las magnitudes de los coeficientes de regresión brindarán in
formación respecto a cuáles son las interacciones importantes.
Aun cuando al agregar una sola corrida se separarán los alias de las interaccionesAB y CD, este enfo
que tiene una desventaja. Suponga que existe un efecto de tiempo (o un efecto de bloque) entre las ocho
primeras corridas y la última corrida que se agregó arriba. Al agregarse una columna a la matriz X para los
bloques, se obtiene lo siguiente:
X¡ X2 X3 X4 X:i:X2 x~4 bloques

1 -1 -1 -1 1 1 1 -1
1 1 -1 -1 1 1 -1 -1
1 -1 1 1 1 1 -1 1
1' 1 1 1 -1 1 1 1
X= 1 -1 1 1 1 1 1 1
1 1 -1 1 -1 -1 -1 -1
1 -1 1 1 -1 -1 -1 -1
1 1 1 1 1 1 1 -1
1 -1 -1 -1 1 1 -1 1
104 PRUEBA DE HIPÓTESIS EN LA REGRESIÓN MÚLTIPLE 409
Se ha supuesto que el factor del bloque estaba en el nivel bajo o"" durante las ocho primeras corridas, y
en el nivel alto o "+" durante la novena corrida. Es sencillo ver que la suma de los productos cruzados de
cada columna con la columna del bloque no es cero, lo cual significa que los bloques han dejado de ser or
togonales para los tratamientos, o que el efecto del bloque afecta ahora a las estimaciones de los coefi
cientes de regresión del modelo. Para conseguir la ortogonalidad de los bloques, debe agregarse un
número par de corridas. Por ejemplo, con las cuatro corridas
X1 Xz X3 X4
1 1 1 1
1 1 1 1
1 1 1 1
1 1 1 1
se separarán los alías deAB de CD y permitirán que los bloques sean ortogonales (esto puede verse desa
rrollando la matriz X como se hizo anteriormente).
En general, suele ser directo el examen de la matriz X del modelo reducido que se obtiene de un dise
ño factorial fraccionado, así como la determinación de cuáles son las corridas que habrán de aumentarse
en el diseño original para separar los alias de las interacciones de interés potencial. Además, el impacto de
las estrategias específicas para aumentar el diseño puede evaluarse utilizando los resultados generales
de los modelos de regresión que se presentan más adelante en este capítulo. Se cuenta también con méto
dos basados en computadora para construir diseños que pueden ser útiles en el aumento del diseño para·
separar los alias de los efectos. Estos diseños generados por computadora se revisarán en el capítulo si
guiente.
10.. 4 PRUEBA DE HIPÓTESIS EN LA REGRESIÓN MÚLTIPLE
En los problemas de regresión lineal múltiple, ciertas pruebas de hipótesis acerca de los parámetros del
modelo son una ayuda para medir la utilidad del modelo. En esta sección se describen varios procedi
mientos de prueba de hipótesis importantes. Estos procedimientos requieren que los errores E¡ del mode
lo sigan una distribución normal e independiente con media cero y varianza a2, lo cual se abrevia
e - NID(O, a2). Como resultado de este supuesto, las observaciones y¡ tienen una distribución normal e in
dependiente con media {30 + ~~~iPhy varianza o'.
10.. 4.1 Prueba de significación de la regresión

La prueba de significación de la regresión es un procedimiento para determinar si existe una relación li
neal entre la variable de respuesta y y un subconjunto de los regresoresxc.e, ... ,xk. Las hipótesis apropia
das son
(1020)
para al menos una j
El rechazo de H0 de la ecuación 1020 implica que al menos uno de los regresoresx.a, ... ,xk contribuye de
manera significativa al modelo. El procedimiento de prueba incluye un análisis de varianza en el que se
hace la partición de la suma de cuadrados total SST en una suma de cuadrados debida al modelo (o a la re
gresión) y una suma de cuadrados debida a los residuales (o al error), es decir,
(1021)
Ahora bien, si la hipótesis nulaH0:,B1 = ,82 = ... = ,Bk =O es verdadera, entonces SSR/a2 se distribuye como
x;, x
donde el número de grados de libertad para 2 es igual al número de regresares del modelo. Asimis
mo, puede demostrarse que SSE/a2 se distribuye como X~tl y que SSE y SSR son independientes. El pro
cedimiento de prueba para H0:/31 = /32 = . . . = .Bt = O consiste en calcular
SSR / k MSR
Fo= SSE /(n-k-l) = MSE (1022)
y en rechazar H0 si F0 excede a Fa, k,n-k-l

• De manera alternativa, podría usarse el enfoque del valor P para
la prueba de hipótesis y, por lo tanto, rechazar H0 si el valor P del estadístico F0 es menor que a. Por lo ge
neral la prueba se resume en una tabla del análisis de varianza como la tabla 106.
Es sencillo encontrar una fórmula para calcular SSR. En la ecuación 1016 se estableció una fórmula
para calcular SSE; es decir,
SSE = y'yjJ'X'y
Ahora bien, puesto que SSr = ~7~1 y¡2 - (~7~1 y¡ )2 In= y 'y (~7~1 y¡ )2 In, la ecuación anterior puede
reescribirse como
- (~
n
Y; r iJ'X'y (~ Y,
n
r
o
Por lo tanto, la suma de cuadrados de regresión es
SS
(!
=iJ'X'y;~1
Y;)2
(1023)
R n
mientras la suma de cuadrados del error es

SSE =y'yp'X'y (1024)
Tabla 106 Análisis de varianza de la significación de la regresión en una regresión múltiple

Fuente de variación Suma de cuadrados Grados de libertad Cuadrado medio
Regresión k
Error o residual n-k-1
Total n-1
104 PRUEBA DE HIPÓTESIS EN IA REGRESIÓN MÚLTIPLE 411
y la suma de cuadrados total es
SSr = y'y
(! y.)2
....:.....1=_1_..;..._ (1025)
n
Estos cálculos casi siempre se realizan con software de regresión. Por ejemplo, en la tabla 104 se
muestra una parte de la salida de Minitab para el modelo de regresión de la viscosidad del ejemplo 101.
La sección superior de esta presentación es el análisis de varianza del modelo. La prueba de significación
de la regresión en este ejemplo incluye las hipótesis
Ho:P1=P2=0
para al menos una j
El valor P de la tabla 104 para el estadístico F (ecuación 1022) es muy pequeño, por lo que se concluiría
que al menos una de las dos variables la temperatura (x1) y la velocidad de alimentación (x2) tiene un
coeficiente de regresión diferente de cero.
En la tabla 104 se presenta también el coeficiente de determinación múltiple R2, donde
2 SSR SSE
R =SS = 1 SS (1026)
T T
Como en los experimentos diseñados, R2 es una medida de la cantidad de reducción en la variabilidad de y

que se obtiene al utilizar las variables de regresiónx¡,x2, ••• .x, en el modelo. Sin embargo, como se señaló
antes, un valor grande de R2 no implica necesariamente que el modelo de regresión sea adecuado. Siem
pre que se agregue una variable al modelo, R2 se incrementará, independientemente de que la variable
adicional sea estadísticamente significativa o no. Por lo tanto, es posible que los modelos que tienen valo
res grandes de R2 produzcan predicciones pobres de nuevas observaciones o estimaciones pobres de la
respuesta media.
Puesto que R2 siempre se incrementa cuando se agregan términos al modelo, algunos constructores
de modelos de regresión prefieren usar el estadístico lf ajustada definido como
Rz =1 SSE/(n-p)=l-(n-1 \1R2) (1027)

•Justada SST / (n1) n- p f
En general, el estadístico R2 ajustada no siempre se incrementará cuando se agreguen variables al mode
lo. De hecho, si se agregan términos innecesarios, el valor de R~u•tad• se decrementará con frecuencia.
Por ejemplo, considere el modelo de regresión de la viscosidad. La R2 ajustada para el modelo se
muestra en la tabla 104. Se calcula como
2
Rajustada = 1 (n1)

n-p
(1 R2 )
= 1G~)c10.92697)
= 0.915735
que está muy cerca de la R2 ordinaria. Cuando la diferencia entre R2 y R~ustada es considerable, existe un
buen riesgo de que se hayan incluido en el modelo términos no significativos.
10..4.2 Pruebas de los coeficientes de regresión individuales

y de grupos de coeficientes
Muchas veces el interés se centra en probar hipótesis sobre los coeficientes de regresión individuales.
Estas pruebas serían útiles para determinar el valor de cada uno de los regresares del modelo de regre
sión. Por ejemplo, el modelo podría ser más eficaz con la inclusión de variables adicionales o quizá con la
eliminación de una o más de las variables que están ya en el modelo.
Agregar una variable al modelo de regresión ocasiona siempre que la suma de cuadrados de regre
sión se incremente y que la suma de cuadrados del error se decremente. Es necesario decidir si el incre
mento de la suma de cuadrados de regresión es suficiente para garantizar el uso de la variable adicional
en el modelo. Además, agregar una variable no importante al modelo en realidad puede incrementar el
cuadrado medio del error, reduciéndose así la utilidad del modelo.
Las hipótesis para probar la significación de cualquier coeficiente de regresión individual, por ejem
plo f3i, son ·
H0:/3i=O
H1:{Jj ,t. O
SiH0:{Ji = O no se rechaza, entonces esto indica quexi puede eliminarse del modelo. El estadístico de prue
ba para esta hipótesis es
p
t = 1
(1028)
o ~a2Cii
p
donde Cjj es el elemento de la diagonal de (X'Xt1 correspondiente a t: La hipótesis nulaH0:/3i = O se re·
chaza si 1t01 > tª12 n-k-i· Observe que se trata en realidad de una prueba parcial o marginal, ya que el coefi
ciente de regresión pi depende de todos los demás regresares X; (i ,t. j) que están en el modelo.
Al denominador d: la ecuación 1028, ~a2C0, se le llama con frecuencia error estándar (se) del coe
ficiente de regresión {Ji. Es decir,
(1029)
Por lo tanto, una manera equivalente de escribir el estadístico de prueba de la ecuación 1028 es
fJ j
t0 = ~ (1030)
se({J i)
La mayoría de los programas de computadora de regresión proporcionan la prueba t para cada pará
metro del modelo. Por ejemplo, considere la tabla 104, la cual contiene la salida de Minitab para el ejem
plo 101. En la sección superior de esta tabla se da la estimación de mínimos cuadrados de cada
parámetro, el error estándar, el estadístico t y el valor P correspondiente. Se concluiría que ambas varia
bles, la temperatura y la velocidad de alimentación, contribuyen de manera significativa en el modelo.
También puede examinarse directamente la contribución de una variable particular, por ejemplo xi, a
la suma de cuadrados de regresión, dado que otrasz, variables (i :;é j) están incluidas en el modelo. El pro
cedimiento para hacer esto es la prueba general de la significación de la regresión o, como se denomina
con frecuencia, el método de suma de cuadrados extra. Este procedimiento también puede usarse para
investigar la contribución de un subconjunto de los regresares al modelo. Considere el modelo de regre
sión con k regresares:
Y= XfJ+e
104 PRUEBA DE HIPÓTESIS EN LA REGRESIÓN MÚLTIPLE 413
donde y es (n x 1 ), X es (n x p ),fJ es (p x 1 ), s. es (n x 1) y p = k + l. Querría determinarse si el subcon
junto de regresores x1, x2, ••• , x, (r < k) contribuye significativamente al modelo de regresión. Sea que se
haga la partición del vector de los coeficientes de regresión de la siguiente manera:
/l=~J
donde /J1 es (r x 1) y /J2 es [(p r) x l]. Quieren probarse las hipótesis

Ho:fl1 =O (1031)
H1:/J1 ;to O
El modelo puede escribirse como

(1032)
donde X1 representa las columnas de X asociadas con /J1 y X2 representa las columnas de X asociadas
con /l2•
Para el modelo completo (incluyendo tanto afJ1 como a/l2) se sabe que iJ = (X'Xt1X'y. Además, la
suma de cuadrados de regresión para todas las variables incluyendo la ordenada al origen es
SSR(/l) = /J'X'y (p grados de libertad)
y
MS = y'y/JX'y
E n- p
A SSR(/l) se le llama la suma de cuadrados de regresión debida a/J. Para encontrar la contribución de los
términos en/J1 a la regresión, se ajusta el modelo suponiendo que la hipótesis nulaH0:/J1 =O es verdadera.
El modelo reducido se encuentra a partir de la ecuación 1032 con /l1 O: =
y= XifJ2 +e (1033)
El estimador de mínimos cuadrados de /l2 es '/J2 = t

(X' 2x2 1X' 71, y
SSR(fl2 )= '/J;x;y (p - r grados de libertad) (1034)
La suma de cuadrados de regresión debida a /J1 dado que fJ2 está ya en el modelo es
SSR(/J1lfl2) = SSR (/J)-SSR (/J2) (1035)
Esta suma de cuadrados tiene r grados de libertad. Es la "suma de cuadrados extra" debida afJ1. Observe
que SSR(/l1 l/12) es el incremento en la suma de cuadrados de regresión debido a la inclusión de las varia
bles X¡, x2, ... , x, en el modelo.
=
Ahora bien, SSR<fli l/l2) es independiente de MSE, y la hipótesis nulafJ1 O puede probarse con el es
tadístico
(1036)
SiF0 > Fa,r,n-p• se rechazaH0,yse concluye que al menos uno delos parámetros en/J1 es diferente de cero
y, por consiguiente, al menos una de las variablesx¡,x2, ••• ,x, en X1 contribuye significativamente al modelo
de regresión. Algunos autores llaman a la prueba de la ecuación 1036 la prueba F parcial.
La pruebaF parcial es muy útil. Puede usarse para medir la contribución de r, como si fuera la última
variable que se agregó al modelo, calculando
SSR(Pjl/30, /31, ... , Pj-1' fJj+I' ... , Pk)

Éste es el incremento en la suma de cuadrados de regresión debido a que se agregaxi a un modelo que ya
contiene a r., ... ,xj-1'xj + 1' ... ,xk. Observe que la pruebaF parcial de una sola variable xi es equivalente a la
prueba t de la ecuación 1028. Sin embargo, la prueba F parcial es un procedimiento más general por
cuanto puede medir el efecto de conjuntos de variables.
EJEMPLO 1 o .. 6 · · · · · · · · · · · · · · · · · · · · · • · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Considere los datos de la viscosidad del ejemplo 101. Suponga que se quiere investigar la contribución de
la varíablez, (velocidad de alimentación) al modelo. Es decir, las hipótesis que quieren probarse son
Ho:fJ2=0
H1:P2 -:¡t:. O
Esto requerirá la suma de cuadrados extra debida a p 2, o
SS R (fJ2 I PI' Po)= SS R (Po' PI' P2 )- SS R (Po' Pi)
= SSR(P1, P2I Po) SSR (P2I Po)
Entonces, por la tabla 104, donde se probó la significación de la regresión, se tiene
SS R (P1, ,8 2 l Po)= 44,157.1
a la que se llamó en la tabla la suma de cuadrados del modelo. Esta suma de cuadrados tiene dos grados
de libertad.
El modelo reducido es
y= Po +/31X1 +E
El ajuste de mínimos cuadrados de este modelo es
y= 1652.3955+7.6397x1
y la suma de cuadrados de regresión para este modelo (con un grado de libertad) es
SSR(P11Po)=40,840.8
Observe que SS11.C/31 IPo) se muestra en la parte inferior de la salida de Minitab de la tabla 104 bajo el en
cabezado "Seq SS". Por lo tanto,
SSR(P2IP0, P1)= 44,157.140,840.8
= 3316.3
con 2 1 = 1 grado de libertad. Éste es el incremento en la suma de cuadrados de regresión que resulta de
agregar x2 a un modelo que contenía ya a r., y se muestra en la parte inferior de la salida de Minitab en la
tabla 104. Para probar H0:{32 = O, por el estadístico de prueba se obtiene
F. = SSR(fJ2l{J0, {J1)/l = 3316.3/1=12.3926
o MSE 267.604
Observe que en el denominador deF0 se usaMSE del modelo completo (tabla 104). Entonces, puesto que
Fo.os, i, 13 = 1.67, se rechazaríaH0:P2 = O y se concluiría quex, (velocidad de alimentación) contribuye signi
ficativamente al modelo.
105 INTERVALOS DE CONFIANZA EN REGRESIONES MÚLTIPLES 415
Debido a que esta prueba F parcial incluye un solo regresor, es equivalente a la prueba t porque el
cuadrado de una variable aleatoria t con v grados de libertad es una variable aleatoria F con 1 y v grados
de libertad. Para ver esto, observe, por la tabla 104, que el estadístico t paraH0'/32 = O dio como resultado
t0 = t; = =
12.3925 = F0•
.........................................................................
3.5203 y que (3.5203)2
10.. 5 INTERVALOS DE CONFIANZA EN REGRESIONES MÚLTIPLES
Con frecuencia es necesario construir estimaciones de intervalos de confianza para los coeficientes de re
gresión {/J,} y para otras cantidades de interés del modelo de regresión. El desarrollo de un procedimien
to para obtener estos intervalos de confianza requiere suponer que los errores {e1} tienen una
distribución normal e independiente con media cero y varianza a2, el mismo supuesto que se estableció en
la sección sobre la prueba de hipótesis de la sección 104.
10S.1 Intervalos de confianza para los coeficientes de regresión individuales

Puesto que el estimador de mínimos cuadrados jJ es una combinación lineal de las observaciones, se sigue
que /J tiene una distribución normal con vector medio fJ y matriz de covarianza a2(X'Xt1• Entonces cada
uno de los estadísticos
'/Jj-Pj
i= O, 1, ... , k (1037)
~¡yicu
se distribuye como t con n - p grados de libertad, donde Cii es el elemento (jj)ésimo de la matriz (X'Xt1, y
(}2 es la estimación de la varianza del error, obtenida con la ecuación 1017. Por lo tanto, un intervalo de
confianza de 100(1a) por ciento para el coeficiente de regresión {31, j =
O, 1, ... , k, es
Pj-ta/2,n-p~a2CJ/ spj spj +ta/2,n-p~(}2Cjj (1038)
Observe que este intervalo de confianza también podría escribirse como

pj -1ª12,n_pse(p1 )sP¡ spj +tan.n-pse(P¡)
~LO 10~7 · · · · · · · · · · • · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Se construirá un intervalo de confianza de 95% para el parámetro {31 del ejemplo 101. Ahora bien, p =
1
7.62129, y puesto que a2 = 267.604 y C11 = 1.429184 x 103, se encuentra que

,;;r;; <
P1 t0.025,13V{J cll
A A ~
Cu -P1 S/31 +to.025,13Vª

7.62129216~(267.604)(1.429184x103) s {31
s 7.62129+2.16~(267.604)(1.429184x103)
7.62129 216(0.6184) s p1 s 7.62129+ 2.16(0.6184)
y el intervalo de confianza de 95% para {31 es
6. 2855 s /31 s 8. 9570
....................... " .
416 CAPffiJLO 10 AJUSTE DE MODELOS DE REGRESIÓN
105.2 Intervalo de confianza para la respuesta media

También puede obtenerse un intervalo de confianza para la respuesta media en un punto particular, por
ejemplo, x01, x02, ••• , Xok· Se define primero el vector
1
Xo1
Xo = X02
La respuesta media en este punto es

µ Yl"o = Po + /J1Xo1 + /J2X02 + · .. + fJ kXOk = x~{J
La respuesta media estimada en este punto es
5(x0) = x~fl (1039
Este estimador es insesgado, ya que EU(x0 )] = E(x~fl) = x~{J= µ ylxo, y la varianza de Y(Xo) es
V[5(x0 )] = a2x~(X'Xf1x0 (1040)
Por lo tanto, un intervalo de confianza de 100(1a) por ciento para la respuesta media en el puntox0¡,x02,
••• , Xok es
(1041)
10.. 6 PREDICCIÓN DE NUEVAS OBSERVACIONES DE LA RESPUESTA
Es posible usar un modelo de regresión para predecir observaciones futuras de la respuesta y que corres
ponden a valores particulares de los regresares, por ejemplox01,x02, •.•,xOk. Si x'0 = [1,x0¡,x02, ••.,xOk], enton
ces una estimación puntual de la observación futura y0 en el punto x01, x0z, ... , xOk se calcula con la ecuación
1039:
5(x0 )= x~ft
Un intervalo de predicción de 100(1a) por ciento para esta observación futura es
5(xo ) ta/2,n-p ~(72 (1 +x~ (X'Xflxo) :;;; Yo
(1042)
s 5(x0 )+tatz,n-p ~a2 (1 +x~ (X'Xr1x0)
Cuando se predicen nuevas observaciones y se estima la respuesta media en un punto dadox0i.x02, ... ,
xük, es necesario tener cuidado para no hacer una extrapolación fuera de la región que contiene las obser
vaciones originales. Es muy posible que un modelo que se ajuste bien en la región de los datos originales
deje de hacerlo fuera de esa región.
10.. 7 DIAGNÓSTICOS DEL MODELO DE REGRESIÓN
Como se destacó en los experimentos diseñados, la verificación de la adecuación del modelo es una parte
importante en el procedimiento del análisis de datos. Es de igual importancia en la construcción de mo
delos de regresión y, como se ilustró en el ejemplo 101, en un modelo de regresión deberán examinarse
10 7 DIAGNÓSTICOS DEL MODELO DE REGRESIÓN 417
siempre las gráficas de los residuales que se usaron en los experimentos diseñados. En general, siempre
es necesario: 1) examinar el modelo ajustado para asegurarse de que proporciona una aproximación ade
cuada del verdadero sistema y 2) verificar que no se infringe ninguno de los supuestos de la regresión de
mínimos cuadrados. El modelo de regresión probablemente producirá resultados pobres o equivocados a
menos que sea un ajuste adecuado.
Además de las gráficas de los residuales, existen otros diagnósticos del modelo que con frecuencia
son útiles en la regresión. En esta sección se presenta un breve resumen de estos procedimientos. Para
análisis más completos, ver Montgomery y Peck [82] y Myers [84].
10.. 1.1 Residuales escalados y PRESS

Residuales estandarizados y studentizados
Muchos constructores de modelos prefieren trabajar con residuales escalados en lugar de los residuales
de mínimos cuadrados ordinarios. Estos residuales escalados transmiten con frecuencia más información
que los residuales ordinarios.
Un tipo de residual escalado es el residual estandarizado:
e
, ª
d.=.....!... i=l,2, ... ,n (1043)
donde por lo general se usa á = -J MS E en los cálculos. Estos residuales estandarizados tienen media cero
y varianza aproximadamente unitaria; por consiguiente, son muy útiles para buscar puntos atípicos. La
mayoría de los residuales estandarizados deberán localizarse en el intervalo 3 :S d¡ :S 3, y cualquier ob
servación con un residual estandarizado que esté fuera de este intervalo es potencialmente inusual con
respecto a su respuesta observada. Estos puntos atípicos deberán examinarse con atención, ya que pue
den representar algo tan simple como un error al registrar los datos o algo que sea motivo de mayor preo
cupación, como una región del espacio del regresar, donde el modelo ajustado es una aproximación
pobre de Ja verdadera superficie de respuesta.
El proceso de estandarización de la ecuación 1043 escala los residuales al dividirlos por su desvia
ción estándar promedio aproximada. En algunos conjuntos de datos, los residuales pueden tener desvia
ciones estándar que difieren considerablemente. A continuación se presenta una escalación que toma en
consideración esta situación.
El vector de los valores ajustados y, que corresponden a los valores observados y¡ es
y =x/J
=X(X'X)• X'y (1044)
=Hy
A la matriz n x n, H = X(X'Xt1X' se le llama generalmente la matriz "gorro" porque mapea el vector de
los valores observados en un vector de los valores ajustados. La matriz gorro y sus propiedades desempe
ñan un papel central en el análisis de regresión.
Los residuales del modelo ajustado pueden escribirse convenientemente en la notación matricial
como
e= yy
y resulta que la matriz de covarianza de los residuales es
Cov(e)= a2(1H) (1045)
La matriz 1 H no es por lo general diagonal, por lo que los residuales tienen varianzas diferentes y están
correlacionados.
Por lo tanto, la varianza del residual iésimo es

V(e;)=a2(1-hü)
donde h;; es el elemento iésimo de la diagonal de H. Puesto que O !O; hu !O; 1, al utilizar el cuadrado medio
residualMSe para estimar la varianza de los residuales en realidad se está sobreestimando V(e;)- Además,
puesto que hu es una medida de localización del punto résimo en el espacio x, la varianza de e; depende de
dónde esté el punto X;. En general, los residuales situados cerca del centro del espacio x tienen varianzas
más grandes que los residuales situados en lugares más apartados. Las violaciones de los supuestos del
modelo son más probables en los puntos remotos, y estas violaciones pueden ser difíciles de detectar por
la inspección de e; (o d¡) porque sus residuales serán por lo general más pequeños.
Se recomienda tomar en consideración esta desigualdad de la varianza cuando se escalen los residua
les. Se sugiere graficar los residuales studentizados:
i == 1, z, .. ., n (1047)
=
con fi2 = MS E en lugar de e; (o d;). Los residuales studentizados tienen varianza constante V(r;) 1 inde
pendientemente de la localización de x¡ cuando la forma del modelo es correcta. En muchas situaciones la
varianza de los residuales se estabiliza, en particular para conjuntos de datos grandes. En estos casos pue
de haber poca diferencia entre los residuales estandarizados y los studentizados. Por lo tanto, los residua
les estandarizados y studentizados transmiten con frecuencia información equivalente. Sin embargo, ya
que cualquier punto con un residual grande y una h¿ grande tiene una influencia potencialmente conside
rable sobre el ajuste de mínimos cuadrados, suele recomendarse el examen de los residuales studentiza
dos. En la tabla 103 se presentan las diagonales gorro h1; y los residuales studentizados para el modelo de
regresión de la viscosidad del ejemplo 101.
Residuales PRESS
La suma de cuadrados del error de predicción (PRESS, del inglés Prediction Error Sum of Squares) pro
porciona una útil escalación de los residuales. Para calcular la PRESS se selecciona una observación, por
ejemplo la i. Se ajusta el modelo de regresión a las n - 1 observaciones restantes y se usa esta ecuación
para predecir la observación que se apartó Y;· Al denotar este valor predicho Yu>, puede encontrarse el
error de predicción del punto i como e(i) =y; = Yu>. Al error de predicción suele llamársele el residual
PRESS iésimo. Este procedimiento se repite para cada observación i = 1, 2, ... , n, produciéndose un con
junto den residuales PRESS e<1>, ec2i, ... , e(n)· Entonces el estadístico PRESS se define como la suma de
cuadrados de los n residuales PRESS como en
n n
PRESS = L e~,, = L [Y; Yu> ]2 (1048)
1~1 ;~1
Por lo tanto, la PRESS utiliza cada subconjunto posible den 1 observaciones como un conjunto de datos
de estimación, y se utiliza una observación a la vez para formar un conjunto de datos de predicción.
Inicialmente, parecería que para calcular la PRESS es necesario ajustar n regresiones diferentes. Sin
embargo, la PRESS puede calcularse a partir de los resultados de un solo ajuste de mínimos cuadrados a
las n observaciones totales. Resulta que el residual PRESS zésimc es
(1049)
Por lo tanto, ya que la PRESS es tan sólo la suma de cuadrados de los residuales PRESS, una fórmula de
cálculo simple es
PRESS = ! (-eí )
;~1 1h;¡
2 (1050)
10 7 DIAGNÓSTICOS DEL MODELO DE REGRESIÓN 419
Por la ecuación 10A9 es sencillo ver que el residual PRESS es sólo el residual ordinario ponderado de
acuerdo con los elementos de la diagonal de la matriz gorro h;;· Los puntos de los datos para los que hu es
grande tendrán residuales PRESS grandes. Estas observaciones serán por lo general puntos de alta in
Ouencia. En general, una diferencia grande entre el residual ordinario y los residuales PRESS indicará un
'punto donde el modelo se ajusta bien a los datos, pero un modelo construido sin dicho punto producirá
predicciones pobres. En la siguiente sección se estudiarán otras medidas de influencia.
Por último, cabe señalar que la PRESS puede usarse para calcular unaR2 aproximada de predicción,
por ejemplo
2
R Predicción = l PRESS
s (1051)
»'
Este estadístico ofrece cierto indicio de la capacidad predictiva del modelo de regresión. Para el modelo
de regresión de la viscosidad del ejemplo 101, los residuales PRESS pueden calcularse utilizando los re
siduales ordinarios y el valor de hü encontrado en la tabla 103. El valor correspondiente del estadístico
PRESS es PRESS = 5207.7. Entonces
2 PRESS
RPredicción = 1 S
»'
= 1 5207.7
47,635.9
= 0.8907
Por lo tanto, podría esperarse que este modelo "explique" cerca de 89% de la variabilidad al predecir
nuevas observaciones, en comparación con el aproximadamente 93% de la variabilidad en los datos origi
nales que explica el ajuste de mínimos cuadrados. La capacidad predictiva global del modelo basado en
este criterio parece ser muy satisfactoria.
Rstudent
Es común considerar al residual studentizado r; comentado antes como el diagnóstico de un punto atípi
co. Se acostumbra usar MS E como una estimación de a2 en el cálculo de r.. Se hace referencia a este enfo
que como la escalación interna del residual, ya que MSE es una estimación de a2 generada internamente
que se obtiene del ajuste del modelo a las n observaciones. Otro enfoque sería usar una estimación de a2
basada en un conjunto de datos en el que se elimina la observación iésima. La estimación de a2 así obteni
da se denota por S~;¡. Puede demostrarse que
2 _ (n-p)MSE-e; /(lh¡¡)
s(i) n- p-l (1052)
La estimación de a2 de la ecuación 1052 se usa en lugar de MSe para producir un residual studentizado
externamente, al que es común llamar Rstudent, dado por
e.
t = ' i = 1, 2, ... , n (1053)
s ~i) (1 hü )
1
En muchas situaciones habrá una ligera diferencia entre t, y el residual studentizado r.: Sin embargo,
sila observación iésima es influyente, entonces S ~; > puede diferir significativamente de MS E• y por lo tan
to la Rstudent será más sensible a este punto. Además, bajo los supuestos usuales, t, tiene una distribu
ción tn-p-i· Por lo tanto, laRstudent ofrece un procedimiento más formal para detectar puntos atípicos a
través de la prueba de hipótesis. En la tabla 103 se muestran los valores de laRstudent para el modelo de
regresión de la viscosidad del ejemplo 101. Ninguno de esos valores es inusualmente grande.
107.2 Diagnósticos de influencia

En ocasiones se encuentra que un subconjunto pequeño de los datos ejerce una influencia desproporcio
nada sobre el modelo de regresión ajustado. Es decir, las estimaciones o predicciones de los parámetros
pueden depender más del subconjunto influyente que de la mayoría de los datos. Sería conveniente loca
lizar estos puntos influyentes y valorar su impacto en el modelo. Si estos puntos influyentes son valores
"malos", deberán eliminarse. Por otra parte, quizá no haya nada malo con estos puntos. Pero si controlan
propiedades clave del modelo, sería deseable saberlo, ya que podría afectar el uso del modelo. En esta
sección se describen e ilustran algunas medidas útiles de influencia.
Puntos de acción de palanca

La localización de los puntos en el espaciox es importante para determinar las propiedades del modelo. En
particular, las observaciones apartadas tienen potencialmente acciones o brazos de palanca desproporcio
nados sobre las estimaciones de los parámetros, los valores predichos y los estadísticos de resumen usuales.
La matriz gorro H = X(X'Xt1X' es muy útil para identificar las observaciones influyentes. Como ya
. se señaló, H determina las varianzas y covarianzas de y y e, ya que V(y) = a2H y V( e) = a2(1 H). Los ele
mentos h;¡ de H pueden interpretarse como la cantidad de acción de palanca ejercida por y1 sobre Y;. Por lo
tanto, la inspección de los elementos de H puede revelar puntos que son potencialmente influyentes en
virtud de su localización en el espacio x. La atención suele centrarse en los elementos de la diagonal hu.
Puesto que L;'=1 h;; = rango(H) = rango(X) = p, el tamaño promedio de los elementos de la diagonal de la
matriz Hes pin. Como guía aproximada, entonces, si un elemento h;; de la diagonal es mayor que 'lp/n, la
observación i es un punto con acción de palanca alta. Para aplicar lo anterior al modelo de la viscosidad
del ejemplo 101, observe que Zpln = 2(3)/16 = 0.375. En la tabla 103 se dan las diagonales gorro h;; para
el modelo de primer orden; puesto que ninguna de las h;; excede 0.375, se concluiría que no hay puntos de
acción de palanca en estos datos.
Influencia sobre los coeficientes de regresión

Las diagonales gorro identificarán los puntos potencialmente influyentes debido a su localización en el
espaciox. Es deseable considerar la localización del punto y la variable de respuesta cuando se mide la in
fluencia. Cook [32a, b] ha sugerido el uso de una medida jJ del cuadrado de la distancia entre la estima
ción de mínimos cuadrados basada en todos los n puntos y la estimación obtenida al eliminar el punto i,
por ejemplo jJ(iJ· Esta medida de la distancia puede expresarse como
D = <Pu¡ -jJ)'X'X(/J<iJ -jJ)

= 1,
i 2, ... , n (1054)
' pMSE
Un valor de referencia razonable para D, es la unidad. Es decir, en general las observaciones para las que
D; > 1 se consideran influyentes.
El estadístico D; se calcula en realidad a partir de
D = r/ V[5(x; )] = r/ h;;
i =,l, 2, ... , n (1055)
' p V(e;) p (1h¡;)
Observe que, aparte de la constante p, D; es el producto del cuadrado del residual studentizado iésimo y
h;¡/(l-h¡¡). Puede demostrarse que este cociente es la distancia del vector X; al centroide de los datos res
tantes. Por lo tanto, D; está compuesto por un componente que refleja la medida en que el modelo ajusta
108 PRUEBADEFALTADEAJUSTE 421
la observación iésima y¡ y un componente que mide qué tan alejado está ese punto del resto de los datos.
Cualquiera de los componentes (o ambos) puede contribuir a un valor grande de D¡.
En la tabla 103 se muestran los valores de D; para el ajuste del modelo de regresión a los datos de la
viscosidad del ejemplo 101. Ninguno de estos valores de D; excede 1, por lo que no hay evidencia sólida
de observaciones influyentes en estos datos.
108 PRUEBA DE FALTA DE AJUSTE
En la sección 66 se indicó cómo agregar puntos centrales a un diseño factorial 2k le permite al experimen
tador obtener una estimación del error experimental puro. Esto permite hacer la partición de la suma de
cuadrados de los residuales SSE en dos componentes; es decir,
SSE = SSPE +SSLOF
donde SSPE es la suma de cuadrados debida al error puro y SSwF es la suma de cuadrados debida a la falta
de ajuste.
Puede presentarse un desarrollo general de esta partición en el contexto de un modelo de regresión.
Suponga que se tienen n¡ observaciones de la respuesta en el nivel iésimo de los regresares X¡, i = 1, 2, ... ,
m. Seaquey¡¡denotalaobservaciónjésima de la respuesta en x.I = 1, 2, ... .m yj = 1, 2, ... ,n;. Hayn = l:;'.:.1
n¡ observaciones en total. El residual (ij)ésimo puede escribirse como
(1056)
y;
donde es el promedio de las n¡ observaciones en X¡. Al elevar al cuadrado ambos miembros de la ecua
ción 1056 y hacer la operación suma sobre i y j se obtiene
_!~ (y95';) =!! 2 (Y;1:Y;)2+_! n;(Y;5';)2 (1057)
El primer miembro de la ecuación 1057 es la suma de cuadrados de los residuales ordinaria. Los dos
componentes del segundo miembro miden el error puro y la falta de ajuste. Se observa que la suma de
cuadrados del error puro
(1058)
se obtiene calculando la suma de cuadrados corregida de las observaciones repetidas en cada nivel de x y
haciendo después la agrupación en los m niveles de x. Si se satisface el supuesto de la varianza constante,
ésta es una medida independiente del modelo del error puro, ya que para calcular SSPE sólo se usa la varia
bilidad de las y en cada nivel X¡. Puesto que hay n, - 1 grados de libertad del error puro en cada nivel X¡, el
número total de grados de libertad asociados con la suma de cuadrados del error puro es
,! (n;-l)=n-m
;~1
(1059)
La suma de cuadrados de la falta de ajuste
SSwF = !
ii•l
n1(Y; - Y; )2 (1060)
es una suma ponderada de los cuadrados de las desviaciones entre la respuesta media Y; en cada nivel X¡ y
el valor ajustado correspondiente. Si los valores ajustados Y; están cerca de las respuestas promedio Y; co
rrespondientes, entonces hay un fuerte indicio de que la función de regresión es lineal. Si las Y; se desvían
mucho de las J;, entonces es probable que la función de regresión no sea lineal. Hay m -p grados de liber
tad asociados con SSwF porque hay m niveles de x, y se pierdenp grados de libertad porque deben esti
marse p parámetros para el modelo. En lo que a los cálculos se refiere, por lo general SSwF se obtiene
restando SSPE de SSE.
El estadístico de prueba para la falta de ajuste es
F0 = SSwF l(m- p) MSwF

SSPE /(n-m)
=
MSPE
(1061)
El valor esperado de MS PE es a2, y el valor esperado de MS LOF es
(1062)
Si la verdadera función de regresión es lineal, entonces E(y;) =Po +l:~_1p ¡Xij, y el segundo término de la
ecuación 1062 es cero, dando como resultadoE(MSwF) = a2. Sin embargo, si la verdadera función de re
gresión no es lineal, entonces E(y; ):;t: Po +l:~~1P1xli y E(MSwF) > a2.Además, si la verdadera función de
regresión es lineal, entonces el estadístico F 0 sigue la distribuciónF m-p,n-m· Por lo tanto, para probar la falta
de ajuste, se calcularía el estadístico de prueba F0 y se concluiría que la función de regresión no es lineal si
Fo > Fa, m-p.n-m:
Es sencillo incorporar este procedimiento de prueba en el análisis de varianza. Si se concluye que la
función de regresión no es lineal, entonces el modelo tentativo habrá de abandonarse y deberán hacerse
intentos para encontrar una ecuación más apropiada. De manera alternativa, si F0 no excede Fa,m-1'.n-m• no
existe evidencia sólida de falta de ajuste y MSPE y MSwF se combinan con frecuencia para estimar a2. El
ejemplo 66 es una ilustración muy completa de este procedimiento, donde las réplicas de las corridas son
puntos centrales de un diseño factorial 22•
10·9 PROBLEMAS
101. La resistencia a la tensión de un producto de papel se relaciona con la cantidad de madera dura en la pulpa.
Se producen 10 muestras en la planta piloto y los datos obtenidos se presentan en la siguiente tabla.
Resistencia Porcentaje de madera dura Resistencia Porcentaje de madera dura

160 10 1.81 20
171 15 188 25
175 15 193 25
182 20 195 28
184 20 200 30
a) Ajustar un modelo de regresión lineal que relacione la resistencía con el porcentaje de madera dura.
b) Probar el modelo del inciso a para la significación de la regresión.
e) Encontrar un intervalo de confianza de 95% para el parámetro /31•
102. En una planta se destila aire líquido para producir oxígeno, nitrógeno y argón. Se piensa que el porcentaje de
impurezas en el oxígeno se relaciona linealmente con la cantidad de impurezas en el aire, medida por el
10·9 PROBLEMAS 423
"conteo de contaminación" en partes por millón (ppm). Una muestra de los datos de operación de la planta
se presenta a continuación:
Pureza(%) 93.3 92.0 92.4 91.7 94.0 94.6 93.6

Conteo de contaminación (ppm) 1.10 1.45 1.36 1.59 1.08 0.75 1.20
93.1 93.2 92.9 92.2 91.3 90.1 91.6 91.9
0.99 0.83 1.22 1.47 1.81 2.03 1.75 1.68
a) Ajustar un modelo de regresión lineal a los datos.

b) Probar Ja significación de la regresión.
e) Encontrar un intervalo de confianza de 95% para fJ1.
103. Graficar los residuales del problema 101 y comentar la adecuación del modelo.
104. Graficar los residuales del problema 102 y comentar la adecuación del modelo.
105. Utilizando los resultados del problema 101, probar el modelo de regresión para la falta de ajuste.
106. Se realizó un estudio sobre el desgastey de un cojinete y su relación conx, =viscosidad del aceite y x2 = car
ga. Se obtuvieron los siguientes datos.
y X¡ Xz
193 1.6 851
230 15.5 816
172 22.0 1058
91 43.0 1201
113 33.0 1357
125 40.0 1115
a) Ajustar un modelo de regresión lineal múltiple a los datos.

b) Probar la significaciónde la regresión.
e) Calcular el estadístico t para cada parámetro del modelo. lQué conclusiones pueden sacarse?
107. Se piensa que la potencia al freno desarrollada por el motor de un automóvilen un dinamómetro es una fun
ción de la rapidez del motor en revolucionespor minuto (rpm), el octanaje del combustibley la compresión
del motor. Se llevó a cabo un experimento en el laboratorio y los datos colectados fueron:
Potencia al freno rpm Octanaje Compresión

225 2000 90 100
212 1800 94 95
229 2400 88 110
222 1900 91 96
219 1600 86 100
278 2500 96 110
246 3000 94 98
237 3200 90 100
233 2800 88 105
224 3400 86 97
223 1800 90 100
230 2500 89 104
a) Ajustar un modelo de regresión múltiple a estos datos.

b) Probar la significación de la regresión. lQué conclusiones pueden sacarse?
e) Con base en las pruebas t, lson necesarios los tres regresores en el modelo?
108. Analizar los residuales del modelo de regresión del problema 107. Comentar la adecuación del modelo.
109. El rendimiento de un proceso químico se relaciona con la concentración del reactivo y la temperatura de
operación. Se realiza un experimento con los siguientes resultados:
Rendimiento Concentración Temperatura

81 1.00 150
89 . 1.00 180
83 2.00 150
91 2.00 180
79 1.00 150
87 1.00 180
84 2.00 150
90 2.00 180
a) Suponga que quiere ajustarse un modelo de los efectos principales a estos datos. Establecer la matriz
X'X utilizando los datos exactamente eomo aparecen en la tabla.
b) lLa matriz que se obtuvo en el inciso a es diagonal? Comentar la respuesta.
e) Suponga que el modelo se escribe en términos de las variables codificadas "usuales"
Concentración 1.5 Temperatura 165

X=--------
l 0.5 X2 = 15
Establecer la matriz X'X para el modelo en términos de estas variables codificadas. lEsta matriz es dia
gonal? Comentar la respuesta.
d) Definir un nuevo conjunto de variables codificadas
Concentración LO Temperatura 150

X¡ = l.
Ü Xz = 30
Establecer la matriz X'X para el modelo en términos de este conjunto de variables codificadas. lEsta
matriz es diagonal? Comentar la respuesta.
e) Resumir lo que se haya aprendido acerca de la codificación de variables con este problema.
1010. Considere el experimento factorial 24 del ejemplo 62. Suponga que falta la última observación. Volver a ana
lizar los datos y sacar conclusiones. lCómo se comparan estas conclusiones con las del ejemplo original?
1011. Considere el experimento factorial 24 del ejemplo 62. Suponga que faltan las dos últimas observaciones.
Volver a analizar los datos y sacar conclusiones. lCuál es el resultado de la comparación de estas conclusio
nes con las del ejemplo original?
1012. Dados los datos siguientes, ajustar el modelo de regresión polinomial de segundo orden
109 PROBLEMAS 425
y X¡ Xz
26 1.0 1.0
24 1.0 1.0
175 1.5 4.0
160 1.5 4.0
163 1.5 4.0
55 0.5 2.0
62 1.5 2.0
100 0.5 3.0
26 1.0 1.5
30 0.5 1.5
70 1.0 2.5
71 1.5 2.5
Después de que se haya ajustado el modelo, probar la significación de la regresión.

1013. a) Considere el modelo de regresión cuadrático del problema 1012. Calcular los estadísticos t de cada uno
de los parámetros del modelo y comentar las conclusiones a que se llega a partir de estas cantidades.
b) Usar el método de la suma de cuadrados extra para evaluar el valor de los términos cuadráticos 12, y x xi
x¡.x2 del modelo.
1014. Relaci6n entre el análisis de varianza y el análisis de regresién. Cualquier modelo del análisis de varianza puede
expresarse en términos del modelo lineal general y = xfJ + e, donde la matriz X se compone de ceros y unos.
Demostrar que el modelo con un solo factor y;¡=µ +<;+e;¡. i = 1, 2, 3,j = 1, 2, 3, 4 puede escribirse en la for
ma del modelo lineal general. Después
a) Escribir las ecuaciones normales (X'X)/J = X'y y compararlas con las ecuaciones normales que se encon
traron en el capítulo 3 para este modelo.
b) Encontrar el rango de X'X. lEs posible obtener (X'X)1?
e) Suponga que se elimina la primera ecuación normal y se agrega la restricción ~;_1 ni, = O. l Tiene solu
ción el sistema de ecuaciones resultante? De ser así, encontrarla. Hallar Ja suma de cuadrados de regre
siónjJ'X'yy compararla con la suma de cuadrados de los tratamientos del modelo con un solo factor.
1015. Suponga que se está haciendo el ajuste de una línea recta y se desea hacer la varianza de 'jJ1 tan pequeña como
sea posible. Al trabajar con la restricción de un número par de puntos experimentales, ldónde deberán colo
carse estos puntos para minimizar V(P1)? (Nota: usar el diseño que se pide en este ejercicio con sumo cuida
do, ya que, aun cuando minimiza V(P1), tiene propiedades indeseables; ver, por ejemplo, Myers y
Montgomery [85a]. Únicamente si se tiene una gran seguridad de que la verdadera relación funcional es li
neal deberá considerarse el uso de este diseño.)
1016. Mínimos cuadrados ponderados. Suponga que se está ajustando la línea recta y =Be+ {3¡.x + e, pero la varianza
de las y depende ahora del nivel de x; es decir,
V(ylx)=a2=-
ª2 i=l,2, ... ,n
t l wi
donde las w, son constantes desconocidas, llamadas con frecuencia ponderaciones. Demostrar que si se eli
gen las estimaciones de los coeficientes de regresión para minimizar la suma de cuadrados de los errores
ponderados dada por i~iw; (y; - f3 0 {J, X; )2, las ecuaciones normales de mínimos cuadrados resultantes son
PoL w;+P1L =L
n n n
W¡X; W;Y;
i=l
n n n
Po L + /3 LW;X; 1
i=l
W;X¡ =L W;X; Y;
1017. Considere el diseño 2~1 analizado en el ejemplo 105.

a) Suponga que se opta por aumentar el diseño con la corrida única seleccionada en ese ejemplo. Encontrar
las varianzasy las covarianzasde los coeficientesde regresión del modelo (ignorando los bloques):
y= Po +/31X1 +/32X2 +{33X3 +/34X4
+f312X1X2 +{334X3X4 +e
b) ¿Hay otras corridas de la fracción alterna que separarían los alias AB de CD?
e) Suponga que el diseño se aumenta con las cuatro corridas sugeridas en el ejemplo 105. Encontrar las va
rianzas y las covarianzas de los coeficientes de regresión (ignorando los bloques) para el modelo del
inciso a.
d) Considerando los incisos a y e, ¿qué estrategia de aumento se preferiría y por qué?
1018. Considere un diseño 2~~4• Suponga que después de correr el experimento, los efectos observados más gran
des sonA + BD, B +AD y D + AB. Quiere aumentarse el diseño original con un grupo de cuatro corridas
para separar los alias de estos efectos.
a) ¿Cuáles son las cuatro corridas que se harían?
b) Encontrar las varianzas y las covarianzas de los coeficientes de regresión del modelo
y= /30 +/31X1 +/32X2 +f34X4 +/312X1X2 +f314X1X4
+{324X2X4 +e
e) ¿Es posible separar los alias de estos efectos con menos de cuatro corridas adicionales?
Métodos de superficies
de respuesta y otros
enfoques para la
optimización de
procesos
111 INTRODUCCIÓN A LA METODOLOGÍA DE SUPERFICIES DE RESPUESTA
La metodología de superficies de respuesta, o MSR, es una colección de técnicas matemáticas y estadísti

cas útiles en el modelado y el análisis de problemas en los que una respuesta de interés recibe la influencia
de diversas variables y donde el objetivo es optimizar esta respuesta. Por ejemplo, suponga que un inge
niero químico quiere encontrar los niveles de temperatura (x1) y presión (x2) que maximicen el rendimien
to (y) de un proceso. El rendimiento del proceso es una función de los niveles de la temperatura y la
presión, por ejemplo,
y= f(xl' x2 )+E
donde E representa el ruido o error observado en la respuesta y. Si la respuesta esperada se denota por
E(y) = /(x1, x2) = r¡, entonces a la superficie representada por
r¡= f(Xp X2)
se le llama superlicie de respuesta.
Por lo general la superficie de respuesta se representa gráficamente como en la figura 111, donde r¡
se grafica contra los niveles dex, y x2• Se han visto ya gráficas de superficie de respuesta como ésta, parti
cularmente en los capítulos sobre diseños factoriales. Para ayudar a visualizar la forma de una superficie
de respuesta, con frecuencia se grafican los contornos de la superficie de respuesta, como se muestra en
la figura 112. En la gráfica de contorno se trazan las líneas de respuesta constante en el planox¡,x2• Cada
contorno corresponde a una altura particular de la superficie de respuesta. También se ha visto antes
la utilidad de las gráficas de contorno.
En la mayoría de los problemas MSR, la forma de la relación entre la respuesta y las variables inde
pendientes es desconocida. Por lo tanto, el primer paso de la MSR es encontrar una aproximación ade
cuada de la verdadera relación funcional entre y y el conjunto de variables independientes. Por lo general
se emplea un polinomio de orden inferior en alguna región de las variables independientes. Si la respues
ta está bien modelada por una función lineal de las variables independientes, entonces la función de apro
ximación es el modelo de primer orden
y= Po +fJ1X1 +fJ2X2 + ··· +{Jkxk +E (111)
427
4 28 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA
70
r::
s~
11
60
i:;;
c. 50
"'
Q)
Ee:
Q)
·¡:::
'5
e: 40
~
x1 •Temperatura (ºC) :<2 ; Presión (psi)
10
Figura 11·1 Superficie de respuesta tridimensional donde se indica el rendi
miento esperado (r¡) como una función de la temperatura (x1) y la presión (x2).
70
<="
11
sll<l 60
i
~ 50
"'"'
o
e:
:§"'
"O
e: 40
"'
a:
x, •Temperatura (°C) :ic2 ~ Presión (psi)
10
Figura 11·2 Gráfica de contorno de una superficie de respuesta.

111 INTRODUCCIÓN A LA METODOLOGÍA DE SUPERFICIES DE RESPUESTA 429
Si hay curvatura en el sistema, entonces debe usarse un polinomio de orden superior, tal como el modelo
de segundo orden
L /3;X1 + L /3;;xf + LL
k le
y= /30 + {Jiix,xi +e (112)

i<j
En casi todos los problemas MSR se usa uno de estos modelos, o ambos. Desde luego, es probable que un mo
delo polinomial sea una aproximación razonable de la verdadera relación funcional en el espacio completo de
las variables independientes, pero para una región relativamente pequeña suelen funcionar bastante bien.
El método de mínimos cuadrados, estudiado en el capítulo 10, se usa para estimar los parámetros de
los polinomios de aproximación. Después se realiza el análisis de la superficie de respuesta utilizando la
superficie ajustada. Si la superficie ajustada es una aproximación adecuada de la verdadera función de la
respuesta, entonces el análisis de la superficie ajustada será un equivalente aproximado del análisis del
sistema real. Los parámetros del modelo pueden estimarse de manera más eficiente cuando se emplean
los diseños experimentales apropiados para recolectar los datos. Los diseños para ajustar superficies de
respuesta se denominan diseños de superficie de respuesta. Estos diseños se revisan en la sección 114.
La MSR es un procedimiento secuencial. Muchas veces, cuando se está en un punto de la superficie
de respuesta que está apartado del óptimo, como en el caso de las condiciones de operación actuales de la
figura 113, el sistema presenta una curvatura moderada y el modelo de primer orden será apropiado. El
objetivo en este caso es llevar al experimentador de manera rápida y eficiente por la trayectoria del mejo
ramiento hasta la vecindad general del óptimo. Una vez que se ha encontrado la región del óptimo, puede
emplearse un modelo más elaborado, como el de segundo orden, y llevarse a cabo un análisis para locali
zar el óptimo. En la figura 113 se puede ver que el análisis de una superficie de respuesta puede conside
rarse como "el ascenso a una colina", donde la cima de ésta representa el punto de la respuesta máxima.
Si el verdadero óptimo es un punto de respuesta mínima, entonces la situación puede considerarse como
"el descenso a un valle".
El objetivo último de la MSR es determinar las condiciones de operación óptimas del sistema o de
terminar una región del espacio de los factores en la que se satisfagan los requerimientos de operación.
/
,____ Región de la
Región
del
! /
operabilldad
del proceso
óptimo
/// /
90
/
/,
85
/
/Trayectoria del
' mejoramiento
,_.___.,~ Contornos
de respuesta
constante
/80 ~5
/
/
/ //
-:
_,/Condiciones /
/ de operación ,;._,_1~
actuales
Figura 113 El carácter secuencial de la MSR.

430 CAPÍTIJLO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA
Análisis más detallados de la MSR se encuentran en Myers y Montgomery [85a], Khuri y Cornell [67] y
Box y Draper [16b].
112 MÉTODO DEL ASCENSO MÁS PRONUNCIADO
Frecuentemente la estimación inicial de las condiciones de operación óptimas del sistema estarán lejos
del óptimo real. En tales circunstancias, el objetivo del experimentador es pasar con rapidez a la vecindad
general del óptimo. Para ello desea usarse un procedimiento experimental económico y eficiente. Cuan
do se está muy lejos del óptimo, por lo general se supone que un modelo de primer orden es una aproxi
mación adecuada de la verdadera superficie en una región: pequeña de las x.
El método del ascenso más pronunciado es un procedimiento para moverse secuencialmente sobre la
trayectoria del ascenso más pronunciado, es decir, en la dirección del incremento máximo de la respuesta.
Desde luego, si lo que se pretende es una minimización, entonces esta técnica se llama método del descen
so más pronunciado. El modelo ajustado de primer orden es
k
5'= Po+ L P;x; (113)

¡ .. 1
y la superficie de respuesta de primer orden, es decir, los contornos de j), es una serie de líneas paralelas
como las que se muestran en la figura 114. La dirección del ascenso más pronunciado es aquella en la que
j) se incrementa con mayor rapidez. Esta dirección es paralela a la normal de la superficie de respuesta
ajustada. Por lo general se toma como la trayectoria del ascenso más pronunciado a la recta que pasa por
el centro de la región de interés y que es normal a la superficie ajustada. Por lo tanto, los pasos sobre la
."
mk\
Trayectoria del ascenso
_y,,,50
z,
Figura 114 Superficiede respuesta de primer orden y trayecto

ria del ascenso más pronunciado.
11·2 MÉTODO DEL ASCENSO MÁS PRONUNCIADO 431
trayectoria son proporcionales a los coeficientes de regresión {,8;}. El tamaño real del paso lo determina
el experimentador con base en el conocimiento del proceso o de otras consideraciones prácticas.
Se conducen experimentos sobre la trayectoria del ascenso más pronunciado hasta que deja de obser
varse un incremento adicional en la respuesta. Entonces puede ajustarse un nuevo modelo de primer or
den, determinarse una nueva trayectoria del ascenso más pronunciado y el procedimiento continúa. En
última instancia, el experimentador llegará a la vecindad del óptimo. En general, la falta de ajuste del mo
delo de primer orden indica que se ha llegado a ella. En este momento se realizan experimentos adiciona
les para obtener una estimación más precisa del óptimo.
EJEMPL011,,1 .
Un ingeniero químico está interesado en determinar las condiciones de operación que maximizan el ren
dimiento de un proceso. Dos variables controlables influyen en el rendimiento del proceso: el tiempo de
reacción y la temperatura de reacción. El ingeniero opera actualmente el proceso con un tiempo de reac
ción de 35 minutos y una temperatura de 155ºF, que dan como resultado rendimientos de cerca de 40%.
Puesto que es improbable que esta región contenga el óptimo, el ingeniero ajusta un modelo de primer
orden y aplica el método del ascenso más pronunciado.
El ingeniero decide que la región de exploración para ajustar el modelo de primer orden deberá ser
(30, 40) minutos de tiempo de reacción y (150, 160)ºE Para simplificar los cálculos, las variables indepen
dientes se codificarán en el intervalo usual (1, 1 ). Por lo tanto, si.; 1 denota la variable natural tiempo y .;2
la variable natural temperatura, entonces las variables codificadas son
.;1 35 s2 155
X=---
1 5 y X2 = 5
El diseño experimental se muestra en la tabla 111. Observe que el diseño usado para recabar estos datos
es un factorial 22 aumentado con cinco puntos centrales. Las réplicas del centro se usan para estimar el
error experimental y permitir la verificación de la adecuación del modelo de primer orden. Además, el di
seño está centrado alrededor de las condiciones de operación actuales del proceso.
Es posible ajustar un modelo de primer orden a estos datos por el procedimiento de mínimos cuadra
dos. Aplicando los métodos para diseños de dos niveles se obtiene el siguiente modelo en las variables co
dificadas:
~= 40.44+0.775x1 +0.325x2
Tabla 11-1 Datos del proceso para ajustar el modelo de

primer orden
Variables Variables
naturales codificadas Respuesta
s1 si X1 Xz y
30 150 -1 -1 39.3
30 160 -1 1 40.0
40 150 1 -1 40.9
40 160 1 1 41.5
35 155 o o 40.3
35 155 o o 40.5
35 155 o o 40.7
35 155 o o 40.2
35 155 o o 40.6
432 CAPÍTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA
Antes de explorar a lo largo de la trayectoria del ascenso más pronunciado, deberá investigarse la
adecuación del modelo de primer orden. El diseño 22 con puntos centrales permite al experimentador
1. Obtener una estimación del error.

2. Verificar las interacciones (o términos de productos cruzados) del modelo.
3. Verificar los efectos cuadráticos (curvatura).
Las réplicas del centro pueden usarse para calcular una estimación del error de la siguiente manera:
fj2 = '( 4_0_.3~)2_+'('40_.5')_

_+..._(4_0_. 7..2;. .)2_+_('4_0.'2)_24_0_.6')_
_+~( ___._(2_0_2.'3)_
2 5 2_/
4
= 0.0430
En el modelo de primer orden se supone que las variablesx¡ y x2 tienen un efecto aditivo sobre la respues
ta. La interacción entre las variables se representaría por el coeficiente /312 del término de un producto
cruzado x¡X2 sumado al modelo. La estimación de mínimos cuadrados de este coeficiente es simplemente
la mitad del efecto de la interacción que se calcula como en un diseño factorial 22 ordinario, o
'/312 = H(lx39.3)+(1x41.5)+(lx40.0)+{1X40.9)]
= t(0.1)
=0.025
La suma de cuadrados de la interacción con un solo grado de libertad es
(0.1)2
sslnteracción = 4
= 0.0025
Al comparar sslnteracción con á2 se obtiene el estadístico para la falta de ajuste
F = _S_S_1n_1era~ca·ó_n
. á2
0.0025
=
0.0430
= 0.058
que es pequeño, lo cual indica que la interacción es insignificante.
Otra verificación de la adecuación del modelo de línea recta se obtiene aplicando la verificación del
efecto de curvatura cuadrática pura de la sección 66. Recuerde que ésta consiste en comparar la respues
ta promedio en los cuatro puntos de la porción factorial del diseño, por ejemplo YF = 40.425, con la res·
puesta promedio en el centro del diseño, por ejemplo Ye = 40.46. Si existe curvatura cuadrática en la
y -y
verdadera función de la respuesta, entonces F e es una medida de esta curvatura. Si /311 y /322 son los coe
ficientes de los términos "cuadráticos puros" y x; x;,
entoncesjj.ji¿ es una estimación de/311 + /322' En el
ejemplo tratado aquí, una estimación del término cuadrático puro es
Pu +P22 = YF -ye
= 40.425 40.46
=0.035
112 MÉTOOO DEL ASCENSO MÁS PRONUNCIAOO 433
Tabla 112 Análisis de varianza del modelo de primer orden
Modelo (/31, /32) 2.8250 2 1.4125 47.83 0.0002
Residual 0.1772 6
(Interacción) (0.0025) 1 0.0025 0.058 0.8215
(Cuadrático puro) (0.0027) 1 0.0027 0.063 0.8142
(Error puro) (0.1720) 4 0.0430
Tu tal 3.0022 8
La suma de cuadrados con un solo grado de libertad asociada con la hipótesis nula, H0:/311 + {J22 = O, es
SS . = nFne(YF - :Ye )2
Cuadráttca pura n + ne
F
= (4)(5)(0.035)2
4+5
= 0.0027
donde nF y ne son el número de puntos de la porción factorial y el número de puntos centrales, respectiva
mente. Puesto que
SS Cuadrática pura
F=-----
fl2
0.0027
=
0.0430
= 0.063
es pequeño, no hay indicios de un efecto cuadrático puro.
En la tabla 112 se resume el análisis de varianza de este modelo. Las verificaciones de la interacción
y la curvatura no son significativas, mientras que la prueba F de la regresión global es significativa. Ade
P P
más, el error estándar de 1 y 2 es
se(P; )= ~M:E = f; = Jº~ 30 = 0.10 i = 1, 2
Ambos coeficientes de regresión p yp

1 2 son grandes en comparación con sus errores estándar. En este
punto no hay razón para cuestionar la adecuación del modelo de primer orden.
Para apartarse del centro del diseñoel punto (x1 = O,x2 = 0) sobre la trayectoria del ascenso más
pronunciado, se haría un movimiento de 0.775 unidades en la dirección r¡ por cada 0.325 unidades en la
dirección x2• Por lo tanto, la trayectoria del ascenso más pronunciado pasa por el punto (x1 = O, x2 = O) y
tiene pendiente 0.325/0. 775. El ingeniero decide usar 5 minutos de tiempo de reacción como tamaño bási
co del paso. Al utilizar la relación entre ,;1 y x1, se observa que 5 minutos de tiempo de reacción es equiva
lente a un paso en la variable codificada x1 de ax1 = l. Por lo tanto, los pasos sobre la trayectoria del
ascenso más pronunciado son ax1 = 1.0000 y ax2 = (0.325/0.775) ax1 = 0.42.
El ingeniero calcula puntos sobre esta trayectoria y observa los rendimientos en los mismos hasta que
se nota un decremento en la respuesta. En la tabla 113 se muestran los resultados tanto en variables codi
ficadas como naturales. Aun cuando la manipulación matemática de las variables codificadas es más sen
cilla, deben usarse las variables naturales cuando se corre el proceso. En la figura 115 se grafica el
Tabla 113 Experimento del ascenso más pronunciado para el ejemplo 111
Variables codificadas Variables naturales Respuesta
Pasos X¡ Xz 51 52 y
Origen o o 35 155
l:l 1.00 0.42 5 2
Origen+ A 1.00 0.42 40 157 41.0
Origen+ 2!:i. 2.00 0.84 45 159 42.9
Origen+ 3!:i. 3.00 1.26 50 161 47.1
Origen + 41:1 4.00 1.68 55 163 49.7
Origen+ 51:1 5.00 2.10 60 165 53.8
Origen+ M 6.00 2.52 65 167 59.9
Origen+ 7!:i. 7.00 2.94 70 169 65.0
Origen + 81:1 8.00 3.36 75 171 70.4
Origen + 91:1 9.00 3.78 80 173 77.6
Origen + 10/:l 10.00 4.20 85 175 80.3
Origen + 111:1 11.00 4.62 90 179 76.2
Origen + 12/:l 12.00 5.04 95 181 75.1
rendimiento en cada paso de la trayectoria del ascenso más pronunciado. Se observan incrementos de la
respuesta hasta el décimo paso; sin embargo, todos los pasos después de este punto resultan en un decre
mento del rendimiento. Por lo tanto, deberá ajustarse otro modelo de primer orden en la vecindad gene
ral del punto (.;1 = 85, .;2 = 175).
Se ajusta un nuevo modelo de primer orden alrededor del punto (.;1 = 85, .;2 = 175). La región de ex
ploración para .;1 es [80, 90] y para .;2 es [170, 180]. Por lo tanto, las variables codificadas son
85 .; 2 175
= 5 =
.; 1
X¡ y Xz 5
90
o 70
E
.s
E
~
~ 60
50
40""""---'-~__._..._.....____.__.__......................__.~..._~
2 3 4 5 6 7 8 9 10 , , 12
Pasos
Figura 115 Rendimiento contra pasos sobre la trayectoria

del ascenso más pronunciado para el ejemplo 111.
112 MÉTODO DEL ASCENSO MÁS PRONUNCIADO 435
Talbla 11·4 Datos para el segundo modelo de primer
orden
Variables Variables
naturales codificadas Respuesta
51 52 X¡ X2 y
80 170 1 1 76.5
80 180 1 1 77.0
90 170 1 1 78.0
90 180 1 1 79.5
85 175 o o 79.9
85 175 o o 80.3
85 175 o o 80.0
85 175 o o 79.7
85 175 o o 79.8
De nueva cuenta se usa un diseño 22 con cinco puntos centrales. El diseño experimental se muestra en la
tabla 114.
El ajuste del modelo de primer orden a las variables codificadas de la tabla 11 4 es
y= 78.97+1.00x 1 +0.50x2
En la tabla 115 se presenta el análisis de varianza de este modelo, incluyendo las verificaciones de la
interacción y del término cuadrático puro. Las verificaciones de la interacción y del término cuadrático
puro implican que el modelo de primer orden no es una aproximación adecuada. Esta curvatura en la ver
dadera superficie puede indicar que el experimentador se encuentra cerca del óptimo. En este punto es
necesario hacer análisis adicionales para localizar el óptimo con mayor precisión.
Por el ejemplo 111 se observa que la trayectoria del ascenso más pronunciado es proporcional a los sig-
nos y magnitudes de los coeficientes de regresión del modelo ajustado de primer orden
2: '/J;X;
k
y= Po+
i=1
Es sencillo dar un algoritmo general para determinar las coordenadas de un punto sobre la trayectoria del
ascenso más pronunciado. Suponga que el puntox, = x2 = ... = xk = O es la base o punto origen. Entonces
l. Se elige el tamaño del paso en una de las variables del proceso, por ejemplo !lx1• En general, se se
leccionaría la variable de la que se tenga mayor información, o se seleccionaría la variable que
tiene el coeficiente de regresión absoluto l '/J 1 1 más grande.
Tabla 115 Análisis de varianza del segundo modelo de primer orden

Fuente de variación cuadrados libertad medio F0 ValorP
Regresión 5.00 2
Residual 11.1200 6
(Interacción) (0.2500) 1 0.2500 4.72 0.0955
(Cuadrático puro) (10.6580) 1 10.6580 201.09 0.0001
(Error puro) (0.2120) 4 0.0530
Tu tal 16.1200 8
2. El tamaño del paso de las otras variables es
~A x. = A pi • = 1 ' 2, ... , k ;
l l• ;t:. J•
' pj I &¡
3. Se convierten las &; de variables codificadas a variables naturales.
Para ilustrar, considere la trayectoria del ascenso más pronunciado calculada en el ejemplo 111.
Puesto quex, tiene el coeficiente de regresión más grande, se selecciona el tiempo de reacción como la va
riable del paso 1 del procedimiento anterior. Cinco minutos de tiempo de reacción es el tamaño del paso
(con base en el conocimiento del proceso). En términos de las variables codificadas, éste es &1 = 1.0. Por
lo tanto, por el lineamiento 2, el tamaño del paso de la temperatura es
&2 = A P2 0.325 = 0.42

p1 ¡ &1 (0.775/ LO)
Para convertir los tamaños de los pasos codificados (&1 = 1.0 y &2 = 0.42) a las unidades naturales de
tiempo y temperatura, se usan las relaciones
& = AS1 y
l 5
que dan como resultado

~1 =dx1(5)=1.0(5)= Smin
y
A;2 = &2(5)= 0.42(5)= 2ºF
11~3 ANÁLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN
Cuando el experimentador se encuentra relativamente cerca del óptimo, por lo general se requiere un
modelo que incorpore la curvatura para aproximar la respuesta. En la mayoría de los casos, el modelo de
segundo orden
(114)
es adecuado. En esta sección se indicará cómo usar este modelo ajustado para encontrar el conjunto ópti
mo de condiciones de operación para lasx, así como para caracterizar la naturaleza de la superficie de res
puesta.
11~3.1 Localización del punto estacionario

Suponga que quieren encontrarse los niveles dex1,x2, ••• .x; que optimizan la respuesta predicha. Este pun
to, en caso de existir, será el conjunto de las x1, x2, ... , xk para las que las derivadas parciales ay/ ax1 =
ay/ ax2 = ... =ay I axk = O. A este punto, por ejemplox1,.,X2,..... ,xk,S> se le llama punto estacionario. El pun
to estacionario podría representar 1) un punto de respuesta máxima, 2) un punto de respuesta mínima, o
3) un punto silla. Estas tres posibilidades se ilustran en las figuras 116 a 118.
Las gráficas de contorno desempeñan un papel muy importante en el estudio de las superficies de
respuesta. Mediante la generación de gráficas de contorno utilizando software de computadora para el
113 ANÁLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNOO ORDEN 43 7
103.04
92.03
81.02
70.01
59
1.00
a) Superficiede respuesta
o.so
5
1"CN 0.00
•
O.SO
1.00 ..... '.....l.."""''''4

1.00 0.50 0.00 0.50 1.00
x,
bl Gráficade contorno
Figura11-6 Superficie de respuesta y gráfica de contorno que ilustran una superficie con un máximo.
438 CAPfTULO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA
t >,
al Superficie de respuesta
o.so
,f 0.00
O.SO
1.00._ ......_; ..___ .......... .___.___ __._

1.00 0.50 0.00 0.50 1.00
XI
b) Gráfica de contorno
Figura 11-7 Superficie de respuesta y gráfica de contorno que ilustran una superficie con un mínimo.
113 ANÁLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN 439
....
a1 Superficie de respuesta
0.50
>ite'>f 0.00
0.50
1.00._ __ _.___ ..__ .....c....__ __.~.__ __ ........__

1.00 0.50 0.00 0.50 1.00
x,
bl Gráfica de contorno
Figura 118 Superficie de respuesta y gráfica de contorno que ilustran una superficie con un punto silla (o minimax).
análisis de superficie de respuesta, el experimentador puede por lo general caracterizar la forma de la su
perficie y localizar el óptimo con una precisión razonable.
Es posible obtener una solución matemática general para la localización del punto estacionario. Al
escribir el modelo de segundo orden en notación matricial, se tiene
y= Po +x'b+x'Bx (115)
donde
Pu· P12J 2. ... , ~lk 12]

y B= Pw ·:·• Pik 12
[ simétrica P kk
Es decir, bes un vector (k x 1) de los coeficientes de regresión de primer orden y Bes una matriz simé
trica (k x k) cuyos elementos de la diagonal principal son los coeficientes cuadráticos puros (Pü) y cu
yos elementos que están fuera de la diagonal son la mitad de los coeficientes cuadráticos mixtos
(Pij' i # j). La derivada de y con respecto a los elementos del vector x igualada con O es
ay= b+2Bx= O (116)
ax
El punto estacionario es la solución de la ecuación 116, o
Xs =.lB
i 1b (117)
Además, al sustituir la ecuación 117 en la 115, la respuesta predicha en el punto estacionario puede en
contrarse como
(118)
113.2 Caracterización de la superficie de respuesta

Una vez que se ha encontrado el punto estacionario, generalmente es necesario caracterizar la superficie
de respuesta en la vecindad inmediata de este punto. Por caracterizar se entiende determinar si el punto
estacionario es el punto de una respuesta máxima, mínima o un punto silla, Por lo general también se de
sea estudiar la sensibilidad relativa de la respuesta a las variables x1, x2, ... , xk.
Como ya se señaló, la forma más directa de hacer esto es examinando una gráfica de contorno del
modelo ajustado. Si sólo hay dos o tres variables en el proceso (Ias r), la construcción e interpretación de
esta gráfica de contorno es relativamente sencilla. Sin embargo, incluso cuando hay un número relativa
mente reducido de variables, un análisis más formal, llamado análisis canónico, puede ser útil.
Es conveniente transformar primero el modelo en un nuevo sistema de coordenadas con el origen en
el punto estacionario x, y después hacer la rotación de los ejes de este sistema hasta que sean paralelos a
los ejes principales de la superficie de respuesta ajustada. Esta transformación se ilustra en la figura 119.
Puede demostrarse que se obtiene así el modelo ajustado
(119)
donde las {w;} son las variables independientes transformadas y las {A.¡} son constantes. A la ecuación
119 se le llama la forma canónica del modelo. Además, las {A.¡} son sólo eigenvalores o raíces caracterís
ticas de la matriz B.
Figura 11·9 Forma canónica del modelo de segundo

orden.
La naturaleza de la superficie de respuesta puede determinarse a partir del punto estacionario y de

los signos y magnitudes de las {A.;}. Primero suponga que el punto estacionario está dentro de la región de
exploración para ajustar el modelo de segundo orden. Si todas las {A,J son positivas, x, es un punto de res
puesta mínima; si todas las {A.¡} son negativas, x,. es un punto de respuesta máxima; y si las {.A¡} tienen sig
nos diferentes, x, es un punto silla. Además, la superficie presenta una inclinación mayor en la dirección
w1 para la que J.A.11 es el máximo. Por ejemplo, la figura 119 describe un sistema para el que x. es un máxi
mo (A.1 y .A.2 son negativas) con J).. 1 1 > JA.2 J .
EJEMPLO 112 · · • · · · · · · · · · · · · · · · · · · • · · • • · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Se continuará el análisis del proceso químico del ejemplo 111. No es posible ajustar un modelo de segun
do orden en las variables r. y.rj utilizando el diseño de la tabla 114. El experimentador decide aumentar
este diseño con puntos suficientes para ajustar un modelo de segundo orden.1 Obtiene cuatro observacio
nes en (x1 = O,x2 = ±1.414)y (x1 = ±l.414,x2 =O). El experimento completo se muestra en la tabla 116,y
el diseño se ilustra en la figura 1110. A este diseño se le llama diseño central compuesto (o DCC), el cual
se estudiará con mayor detalle en la sección 114.2. En esta segunda fase del estudio, dos respuestas adi
cionales fueron de interés, la viscosidad y el peso molecular del producto. Las respuestas también se
muestran en la tabla 116.
La atención se centrará en el ajuste de un modelo cuadrático para la respuesta rendimiento y1 (las
otras respuestas se analizarán en la sección 113.4). Por lo general se utiliza software de computadora
para ajustar una superficie de respuesta y construir las gráficas de contorno. La tabla 117 contiene la sali
da deDesign-Expert. Al examinar la tabla se observa que este paquete de software calcula primero las "su
mas de cuadrados extra o secuenciales" de los términos lineales, cuadráticos y cúbicos del modelo (hay un
mensaje de advertencia referente a los alias del modelo cúbico, ya que el DCC no contiene corridas sufi
cientes para apoyar un modelo cúbico completo). Con base en el valor P pequeño de los términos cuadra
1
El ingeniero corrió las cuatro observaciones adicionales aproximadamente en el mismo periodo en que corrió las nueve observacio
nes originales. Si hubiera transcurrido un lapso grande entre las dos series de corridas, habría sido necesaria la separación en bloques.
La separación en bloques en los diseños de superficie de respuesta se revisa en la sección 114.3.
Tabla 116 Diseño central compuesto para el ejmplo 112

Respuestas
Variables naturales Variables codificadas
Y1 Yz Y3
g¡ ~2 X¡ Xz (rendimiento) (viscosidad) (peso molecular)
80 170 -1 -1 76:5 62 2940
80 180 -1 1 77.0 60 3470
90 170 1 -1 78.0 66 3680
90 180 1 1 79.5 59 3890
85 175 o o 79.9 72 3480
85 175 o o 80.3 69 3200
85 175 o o 80.0 68 3410
85 175 o o 79.7 70 3290
85 175 o o 79.8 71 3500
92.07 175 1.414 o 78.4 68 3360
77.93 175 -1.414 o 75.6 71 3020
85 182.07 o 1.414 78.5 58 3630
85 167.93 o -1.414 77.0 57 3150
ticos, se decide ajustar un modelo de segundo orden a la respuesta rendimiento. La salida de

computadora muestra el modelo final en térmínos tanto de las variables codificadas como de los niveles
naturales o reales de los factores.
En la figura 1111 se muestra la gráfica de la superficie de respuesta tridimensional y la gráfica de
contorno para la respuesta rendimiento en términos de las variables del proceso tiempo y temperatura.
Es relativamente sencillo ver por el examen de estas figuras que el óptimo se encuentra muy cerca de
175ºF y 85 minutos de tiempo de reacción y que la respuesta está en un máximo en este punto. Por el exa
men de la gráfica de contorno se observa que el proceso puede ser ligeramente más sensible a los cambios
en el tiempo de reacción que a los cambios en la temperatura.
+2
(O, 1.414)
(1, 1) (1, 1)
1 1
2 (1.414, O) (0,0) (1.414, O) +2
(1, 1) (1, 1)
(O, 1.414)
2
Figura 1110 Diseno central compuesto para el ejemplo 112.

11J ANÁLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN 443
Tabla 11·7 Salida de computadora de Design- Experrpara ajustar un modelo a la respuesta
rendimiento del ejemplo 112
Response: yield
•HWARNING: The Cubic Model is Aliased!*,...
Sequential Model Sum of Squares

Sumof Mean F
Mean 80062.16 1 80062.16
Linear 10.04 2 5.02 2.69 0.1166
2FI 0.25 1 0.25 0.12 0.7350
Ouadratic 17.95 2 8.98 126.88 <0.0001 Suggested
Cubic 2.042E003 2 1.021E003 0.010 0.9897 Aliased
Residual 0.49 5 0.099
Total 80090.90 13 6160.84
"Suma de cuadrados del modelo secuencier: se selecciona el p01inomio de orden más alto
cuando los términos adicionales son significativos.
Lack of Fit Tests

Sumof Mean F
Linear 18.49 6 3.08 58.14 0.0008
2FI 18.24 5 3.65 68.82 0.0006
Ouadratic 0.28 3 0.094 1.78 0.2897 Suggested
Cubic 0.28 1 0.28 5.31 0.0826 Aliased
Pure Error 0.21 4 0.053
"~ruf!bas.de falta de ajuste" : se quiere que el modelo seleccionado no tenga falta de ajuste
s1gmficat1va.
Model Summary Statistics
Std. Adjusted Predicted
So urce Dev. RSquared RSquared RSquared PRE SS
Linear 1.37 0.3494 0.2193 0.0435 29.99
2FI 1.43 0.3581 0.1441 0.2730 36.59
Ouadratic 0.27 0.9828 0.9705 0.9184 2.35 Suggested
Cubic 0.31 0.9828 0.9588 0.3622 18.33 Aliased
"Estadfsticos de resumen del modelo"; se enfocan en el modelo que minimiza 'f'RESS" o, de

manera equivalente, que maximiza la "R CUADRADA DE PREDICCION".
Response: yield
ANOVA for Response Surface Quadratic Model
Analysis of variance table [Pairtial sum of squares]
Sum of Mean F
Modal 28.25 5 5.65 79.85 <0.0001
A 7.92 1 7.92 111.93 <0.0001
B 2.12 1 2.12 30.01 0.0009
A2 13. 18 1 13. 18 186.22 <0.0001
g2 497 1 497 98.56 <0.0001
AB 0.25 1 0.25 3.53 0.1022
Residual 0.50 7 0.071
Lack of Fít 0.28 3 0.094 1.78 0.2897
Pure Error 0.21 4 0.053
Cor Total 28.74 12


Factor Estimate DF Error Low High VIF
lntercept 79.94 1 0.12 79.66 80.22
Atíme 0.99 1 0.094 0.77 1.22 1.00
8temp 0.52 1 0.094 0.29 0.74 1.00
A2 1.38 1 0.10 1.61 1.14 1.02
92 1.00 1 0.10 1.24 0.76 1.02
AB 0.25 1 0.13 0.064 0.56 1.00
yield =
+79.94
+0.99 *A
+0.52 * B
1.38 * A2
1.00 * 82
+0.25 *A* B
yield:
1430.52285
+7.80749 *time
+13.27053 * temp
0.055050 '* time2
0.040050 * temp2
+0.010000 *time* temp
Run Standard Actual Predicted Student Cook's Outlier
Order Order Value Value Residual Leverage Residual Distance t
8 1 76.50 76.30 0.20 0.625 1.213 0.409 1.264
6 2 78.00 77.79 0.21 0.625 1.275 0.452 1.347
9 3 77.00 76.83 0.17 0.625 1.027 0.293 1.032
11 4 79.50 79.32 0.18 0.625 1.089 0.329 1.106
12 5 75.60 75.78 0.18 0.625 1.107 0.341 1.129
10 6 78.40 78.59 0.19 0.625 1.195 0.396 1.240
7 7 77.00 77.21 0.21 0.625 1.283 0.457 1.358
1 8 78.50 78.67 0.17 0.625 1.019 0.289 1.023
5 9 79.90 79.94 0.040 0.200 0.168 0.001 0.156
3 10 80.30 79.94 0.36 0.200 1.513 0.095 1.708
13 11 80.00 79.94 0.060 0.200 0.252 0.003 0.235
2 12 79.70 79.94 0.24 0.200 1.009 0.042 1.010
4 13 79.80 79.94 0.14 0.200 0.588 0.014 0.559
La localización del punto estacionario también podría encontrarse utilizando la solución general de
la ecuación 117. Observe que · [ J
b 0.995
0.515 B=
[1.376 0.1250]
0.1250 1.001
y, por la ecuación 11 7, el punto estacionario es
x.=fB1b
.![0.7345 0.0917][º·995][º·389]
2 0.0917 1.0096 0.515 0.306
179.7
e:::i
!!
E
{!
177.4
175.0
172.6
o
170.3
80.29 82.64 85.00 87.36 89.71 92.07

Tiempo
a) La gráfica de contorno
80.21
77.99
Ee
.E
Q)
75.77
'6
e
Q)
a:
73.66
92.07
86.41
83.69 11'
80.76 ~
167.9 77.93
b) La gráfica de superficie de respuesta
Figura 1111 Gráficas de contorno y de superficie de respuesta de

la respuesta rendimiento, ejemplo 112.
Es decir,x1,, = 0.389yx2 .s = 0.306. En términos de las variables naturales, el punto estacionario es
0.389= ;l ~85 0.306= ;2 ~175
=
de donde se obtiene ;1 86.95 =87 minutos de tiempo de reacción y ;2 = 176.53=176.5°F. Este valor está
muy cerca del punto estacionario que se encontró por examen visual en la gráfica de contorno de la figura
1111. Al utilizar la ecuación 118, la respuesta predicha en el punto estacionario puede encontrarse
como Y. = 80.21.
El análisis canónico que se describe en esta sección también puede usarse para caracterizar la super
ficie de respuesta. Primero es necesario expresar el modelo ajustado en la forma canónica (ecuación
119). Los eigenvalores .A.1 y A.2 son las raíces de la ecuación de determinantes
IBA.II =o
1.376A. 0.1250 1 o
1 0.1250 1.001 A. -
que se reduce a
A.2 +2.3788A.+l.3639= o
Las raíces de esta ecuación cuadrática sonA.1 = 0.9641 y A.2 = 1.4147. Por lo tanto, la forma canónica del
modelo ajustado es
y= 80.21 0.9641wf l.4147w~
Puesto que tanto I¡ como I, son negativas y el punto estacionario está en la región de exploración, se con
cluye que el punto estacionario es un máximo.
En algunos problemas MSR puede ser necesario encontrar la relación entre las variables canónicas
{w¡} y las variables del diseño {x;}. Esto es particularmente cierto cuando es imposible operar el proceso
en el punto estacionario. Como una ilustración, suponga que en el ejemplo 112 el proceso no pudo ope
rarse en ~1 = 87 minutos y ;2 = 176.5°F debido a que esta combinación de factores resulta en un costo ex·
cesivo. Se quiere "regresar" ahora del punto estacionario a un punto con un costo menor sin incurrir en
pérdidas considerables en el rendimiento. La forma canónica del modelo indica que la superficie es me
nos sensible a la pérdida de rendimiento en la dirección w1• La exploración de la forma canónica requiere
convertir los puntos del espacio (w1, w2) en puntos del espacio (x1, x2).
En general, las variables x se relacionan con las variables canónicas w por
w = M'(x x.)
donde Mes una matriz ortogonal (k x k). Las columnas de M son los eigenvectores normalizados asocia
dos con {A.¡}. Es decir, si m, es la columna iésima de M, entonces m, es la solución de
(B - A.;I)m¡ = O (1110)
para la que l:~~1mJ. =l.
El procedimiento se ilustra usando el modelo de segundo orden ajustado del ejemplo 112. Para A.1 =
0.9641, la ecuación 1110 queda como
1(1.376+0.9641) 0.1250 ][mu][º]

L uizso ci.001+0.9641) m21 - o
o
0.4129m11 +0.1250m:n =O
0.1250m11 0.0377m21 =O
m?
Quiere obtenerse la solución normalizada de estas ecuaciones, es decir, aquella para la que 1 + m;1 = l.
No existe una solución única para estas ecuaciones, por lo que lo más conveniente es asignar un valor ar
113 ANÁLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNOO ORDEN 44 7
bitrario a una de las incógnitas, resolver el sistema y normalizar la solución. Al hacer m; 1 = 1, se encuentra
m; 1 = 0.3027. Para normalizar esta solución, m;1 y m;1 se dividen entre
~(m;1)2 +(m;1)2 = ~(0.3027) 2 +(1)2 = 1.0448

Se obtiene así la solución normalizada
m = m;1 = 0.3027 = 0.2897
11
l.0448 l. 0448
y
que es la primera columna de la matriz M.

=
Utilizando A.2 1.4147 puede repetirse el procedimiento anterior, obteniéndose m12 = 0.9574 y
m22 = 0.2888 como la segunda columna de M. Por lo tanto, se tiene
M[0.2897 0.9574]
0.9571 0.2888
La relación entre las variables w y x es

W1 ] [ 0.2897 0.9571][X1 0.389]
[Wz. = 0.9574 0.2888 X2 - 0.306
o
W1 = 0.2897(x 0.389)+0.957l(x
1 2 0.306)
w2 = 0.9574(x 0.389)+0.2888(x
1 2 0.306)
Si quisiera explorarse la superficie de respuesta en la vecindad del punto estacionario, podrían determi
narse los puntos apropiados en los cuales hacer las observaciones en el espacio (w1, w2) y usar después la
relación anterior para convertir estos puntos en el espacio (x1,x2) para que puedan realizarse las corridas.
11 .. J.3 Sistemas de cordilleras

No es raro encontrar variaciones de las superficies de respuesta con máximos o mínimos puros o con pun
tos silla estudiadas en la sección anterior. Los sistemas de cordilleras, en particular, son muy comunes.
Considere la forma canónica del modelo de segundo orden presentado anteriormente en la ecuación
119:
y= Y. +A.1w¡ +A.2wi + ··· +A.kw¡
Suponga ahora que el punto estacionario x, está dentro de la región de experimentación; además, sea que
una o más de las A; sean muy pequeñas (por ejemplo, J.,= O). Entonces la variable de respuesta es muy in
sensible a las variables W; multiplicadas por las A.1 pequeñas.
En la figura 1112 se presenta una gráfica de contorno en la que se ilustra esta situación para k = 2 va
riables con A.1 = O. (En la práctica, A.1 estaría cerca de cero pero no sería exactamente igual a cero.) En teo
ría, el modelo canónico para esta superficie de respuesta es
y= Y. + .11.2W2
A A1 2
Figura 1112 Gráfica de contorno de un sistema Figura 1113 Gráfica de contorno de un sistema de
de cordilleras estacionarias. cordilleras crecientes.
con I, negativa. Observe que el marcado estiramiento en la dirección w1 ha resultado en una línea de cen
tros en y= 70 y el óptimo puede tomarse en cualquier lugar a lo largo de esta línea. A este tipo de superfi
cie de respuesta se le llama sistema de cordilleras estacionarias.
Si el punto estacionario está muy apartado de la región de exploración para el ajuste del modelo de
segundo orden y una A.¡ (o más) está cerca de cero, entonces la superficie puede ser un sistema de cordille
ras crecientes. En la figura 1113 se ilustra una cordillera creciente para k = 2 variables con J1 cerca de
cero y A.2 negativa. En este tipo de sistema de cordilleras no pueden hacerse inferencias acerca de la verda
dera superficie o del punto estacionario porque x, está fuera de la región donde se ha ajustado el modelo.
Sin embargo, la exploración adicional está garantizada en la dirección w1• SiA.2 hubiera sido positiva, este
sistema se habría llamado cordillera descendente.
113.4 Respuestas múltiples

Muchos problemas de superficies de respuesta incluyen el análisis de varias respuestas, como en el ejem
plo 112, donde el experimentador midió tres. En dicho ejemplo, el proceso se optimizó únicamente con
respecto a la respuesta rendimiento y1•
La consideración simultánea de respuestas múltiples requiere construir primero un modelo de super
ficie de respuesta apropiado para cada respuesta y después intentar encontrar un conjunto de condicio
nes de operación que optimice en cierto sentido todas las respuestas o que al menos las mantenga en los
rangos deseados. Un estudio completo del problema de las respuestas múltiples se ofrece en Myers y
Montgomery [85a].
En el ejemplo 112 pueden obtenerse modelos para las respuestas viscosidad y peso molecular ()'2 y y3,
respectivamente) de la siguiente manera:
y2 = 70.00 0.16x1 0.95x2 0.69x¡ - 6.69x; - l.25x1x2
j/3 = 3386.2+205.lx 1 +17.4x2
En términos de los niveles naturales del tiempo (.;1) y la temperatura (.;2), estos modelos son
y2 = 9030.74+13.393.;1 +97.70~2
2 75x102 .;: 0.26757.;; sx102 .;l.; 2
y
j)3 = 6308.8+41.025.;1 +35.473.;2
En las figuras 1114y 1115 se presentan las gráficas de contorno y superficie de respuesta para estos modelos.
Un enfoque relativamente directo para optimizar varias respuestas que funciona bien cuando sólo
hay pocas variables en el proceso es la superposición de las gráficas de contorno de cada respuesta. En la
figura 1116 se muestra una gráfica de superposición para las tres respuestas del ejemplo 112, con los
contornos para Jos que y1 (rendimiento) <?: 78.5, 62 s y2 (viscosidad) s; 68, yy3 (peso molecular Mn) s 3400.
Si estos límites representan condiciones importantes que el proceso debe satisfacer, entonces, como. se
muestra en la porción no sombreada de la figura 1116, existen varias combinaciones del tiempo y la tem
peratura que resultarán en un proceso satisfactorio. El experimentador puede hacer el examen visual de
e
~~ 175.0
E
<:::::>
70.00
~
172.6
170.3
167.91..:::::~..i.....::::=~""""..L...L__L::,..::.____J
77.93 80.29 82.64 85.00 87.36 89.71 92.07
Tiempo
al La gráfica de contorno
70.03
63.75
~
~ 57.47
'O
<:
"'
a:
51.19
182.1
167.9 77.93
h) La gráfica de la superficie de respuesta
Figura 1114 Gráfica de contorno y gráfica de la superficie de

respuesta de la viscosidad, ejemplo 112.
179.7
177.4
172.6
170.3
167.9,____ .___......_..___ __._ __...___..__ ___._......__,

77.93 80.29 82.64 85.00 87.36 89.71 92.07
Tiempo
a) La gráfica de contorno
3927
3566
2845
182.1
92.07
176.4
)¡,
'9~
'"<71,.,'<9 170.8
167.9 77.93
b) La gráfica de la superficie de respuesta
Figura 1115 Gráfica de contorno y gráfica de la superficie de

respuesta del peso molecular, ejemplo 112.
la gráfica de contorno para determinar las condiciones de operación apropiadas. Por ejemplo, es posible
que el experimentador esté más interesado en la región más grande de las dos regiones factibles que se
muestran en la figura 1116.
Cuando hay más de tres variables del diseño, se hace muy complicada la superposición de las gráficas
de contorno, ya que la gráfica de contorno es bidimensional, y k- 2 de las variables del diseño deben man
tenerse constantes para construir la gráfica. Con frecuencia se necesita una gran cantidad de ensayo y
error para determinar cuáles son los factores que deben mantenerse constantes y qué niveles seleccionar
para obtener la mejor vista de la superficie. Por lo tanto, existe interés práctico en métodos de optimiza
ción más formales para las respuestas múltiples.
113 ANÁLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN 4 51
182.1
179.7
177.4
I!
e8.
::J
175.0
e
~
172.6
170.3
167.9
77.93 80.29 82.64 85.00 87.36 89.71 92.07
Tiempo
Figura 11·16 Región del óptimo encontrada superponiendo las su

perficies de respuesta del rendimiento, la viscosidad y el peso molecular,
ejemplo 112.
Un enfoque popular consiste en formular y resolver el problema como un problema de optimización

restringida. Para ilustrar este enfoque utilizando el ejemplo 112, el problema podría formularse como
Máx y,
sujeto a
62s y2 s 68
y3 :S 3400
Se cuenta con varias técnicas numéricas que pueden usarse para resolver este problema. En ocasiones se
hace referencia a estas técnicas como métodos de programación no lineal. El paquete de software
Design-Expert resuelve esta versión del problema utilizando un procedimiento de búsqueda directa. Las
dos soluciones encontradas son
tiempo ""' 83.5 temperatura = 177.1 y1 = 79.5
y
tiempo = 86.6 temperatura = 172.25 y1 = 79.5
Observe que la primera solución es la región factible superior (la más pequeña) del espacio del diseño
(referirse a la figura 1116), mientras que la segunda solución es la región más grande. Ambas soluciones
están muy cerca de los límites de las restricciones. ·
Otro enfoque útil para la optimización de respuestas múltiples es usar la técnica de optimización si
multánea popularizada por Derringery Suich [37]. Su procedimiento hace uso de las funciones con condí
ción de deseable. El enfoque general consiste en convertir primero cada respuesta y; en una función con .
condición de deseable individual d¡ que varía en el rango
Osd; s 1
donde si la respuesta y¡ está en su metau objetivo, entonces d¡ = 1, y si la respuesta está fuera de una región
aceptable, d¡ = O. Después las variables del diseño se eligen para maximizar la condición de deseable global
=
D (dl · d 2 · .. · · d m )11m
donde hay m respuestas.
Las funciones con condición de deseable individual están estructuradas como se indica en la figura
¡r~~ ~r :::~T
1117. Si el objetivo T para la respuesta y es un valor máximo,
d = (1111)
1, y>T
cuando la ponderación r = 1, la función con condición de deseable es lineal. Al elegir r > 1 se pone más
interés en estar cerca del valor objetivo, y cuando se elige O < r < 1 esto tiene menos importancia. Sí el ob
jetivo para la respuesta es un valor mínimo,
1 y<T
d= (~_0;)' Ts.ys.U (1112)
1 y>U
La función con condición de deseable de dos colas que se muestra en la figura 1117c supone que el obje
tivo se localiza entre los límites inferior (L) y superior (U), y se define como
y<L
f(y~Lr
T--L
L$y$T
d= (1113)
(U-yr T$y$U
U-T
o y>U
Se usó el paquete de software Design-Expert para resolver el ejemplo 112 utilizando el enfoque de la
función con condición de deseable. Se eligió T = 80 como el objetivo para la respuesta rendimiento, U =
70, y se fijó la ponderación de esta condición de deseable individual igual a la unidad. Se hizo T = 65 para
la respuesta viscosidad con L = 62 y U = 68 (para ser consistente con las especificaciones), con ambas
ponderaciones r1 = r2 = l. Por último, se indicó que cualquier peso molecular abajo de 3400 era acepta
ble. Se encontraron dos soluciones.
Solución 1:
Tiempo = 86.5 Temperatura = 170.5 D = 0.822
y1 = 78.8 .Y2 = 65 }'3 = 3287
Solución 2:
Tiempo= 82 Temperatura = 178.8 D = 0.792
_y1 = 78.5 Yi = 65 y3 = 3400
La solución 1 tiene la condición de deseable global más alta. Observe que resulta en una viscosidad acor
de con el objetivo y en un peso molecular aceptable. Esta solución está contenida en Ja más grande de las
dos regiones de operación de la figura 1116, mientras que la segunda solución está contenida en la región
más pequeña. En la figura 1118 se muestran las gráficas de la superficie de respuesta y de contorno de la
función con condición de deseable global D.
L T y
a) El objetivo (blanco) es maximizar y
T u y
b) El objetivo (blanco) es minimizar y
T y
e) El objetivo (blanco) es que y esté tan cerca como sea posible de la especificación
Figura 11-17 Funciones con condición de deseables individuales para la optimiza

ción simultánea.
OB20
0.615
~
.J:l
0.410
"'
O]
"'
O]
"O 0.205
O]
o
e:
o 0.000
·¡;
'6
e:
o
u
175.00
Temperatura
172.50 Tiempo
a) Superficie de respuesta
"'
B 5
~ 175.00
o.
E
•
~
172.50
110.ooL
80.00
...L
82.50
__:~~======c===~~~
85.00 87.50 90.00
Tiempo
b) Gráfica de contorno
Figura11·18 Gráfica de la superficie de respuesta y de contorno de la función con con

dición de deseable del ejemplo 112.
114 DISEÑOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA 455
11 ..4 DISEÑOS EXPERIMENTALESPARA AJUSTAR
SUPERFICIES DE RESPUESTA
El ajuste y análisis de superficies de respuesta se facilita en gran medida con la elección apropiada del di
seño experimental. En esta sección se revisan algunos aspectos de la selección del diseño apropiado para
ajustar superficies de respuesta.
Cuando se selecciona un diseño de superficie de respuesta, algunas de las características deseables en
el diseño son las siguientes:
l. Proporciona una distribución razonable de los puntos de los datos (y en consecuencia informa
ción) en toda la región de interés.
2. Permite que se investigue la adecuación del modelo, incluyendo la falta de ajuste.
3. Permite que los experimentos se realicen en bloques.
4. Permite que los diseños de orden superior se construyan secuencialmente.
5. Proporciona una estimación interna del error.
6. Proporciona estimaciones precisas de los coeficientes del modelo.
7. Proporciona un buen perfil de la varianza de predicción en toda la región experimental.
8. Proporciona una robustez razonable contra los puntos atípicos o los valores faltantes.
9. No requiere un gran número de corridas.
10. No requiere demasiados niveles de las variables independientes.
11. Asegura la simplicidad del cálculo de los parámetros del modelo.
Estas características entran en conflicto en ocasiones, por lo que con frecuencia debe aplicarse la discre
cionalidad al seleccionar un diseño. Para mayor información sobre la elección de un diseño de superficie
de respuesta, referirse a Myers y Montgomery [85a], Box y Draper [16b] y Khuri y Comell [67].
11 .. 4.1 Diseños para ajustar el modelo de primer orden

Suponga que quiere ajustarse el modelo de primer orden en k variables
L /3;X; +E
k
y= /30 + (1114)
i~l
Hay una clase única de diseños que minimizan la varianza de los coeficientes de regresión (/3; }. Se trata
de los diseños de primer orden ortogonales. Un diseño de primer orden es ortogonal si todos los elemen
tos que están fuera de la diagonal de la matriz (X'X) son cero. Esto implica que la suma de los productos
cruzados de las columnas de la matriz X sea cero.
La clase de los diseños de primer orden ortogonales incluye los factoriales zk y las fracciones de la se
rie 2k en las que los efectos principales no son alias entre sí. Al usar estos diseños se supone que los niveles
bajo y alto de los k factores están codificados en los niveles usuales ± 1.
El diseño 2k no permite la estimación del error experimental a menos que se hagan réplicas de algu
nas corridas. Un método común de incluir las réplicas en el diseño zk es aumentar el diseño con varias ob
servaciones en el centro (el punto x1 = O, i = 1, 2, ... , k). La adición de puntos centrales al diseño 2k no
influye en las {P;}para i ~ 1, pero la estimación de /30 se convierte en el gran promedio de todas las obser
vaciones. Además, la adición de puntos centrales no altera la propiedad de ortogonalidad del diseño. En
a)
Figura 1119 El diseño símplex para

a) k = 2 variables y b) k = 3 variables.
el ejemplo 111 se ilustra el uso de un diseño 22 aumentado con cinco puntos centrales para ajustar un mo
delo de primer orden.
Otro diseño de primer orden ortogonal es el diseño símplex.. El diseño símplex es una figura de lados
regulares con k + 1 vértices en k dimensiones. Por lo tanto, el diseño símplex para k = 2 es un triángulo
equilátero, y para k = 3 es un tetraedro regular. En la figura 1119 se muestran diseños símplex de dos y
tres dimensiones.
114.2 Diseños para ajustar el modelo de segundo orden
En el ejemplo 112 se hizo la introducción informal (e incluso antes en el ejemplo 66) del diseño central
compuesto o DCC para ajustar un modelo de segundo orden. Se trata de la clase más popular de diseños
usados para ajustar estos modelos. En general, el DCC consta de un factorial 2k (o de un factorial fraccio
nado de resolución V) con nF corridas, 2k corridas axiales o estrella y ne corridas centrales. En la figura
1120 se muestra el DCC para k = 2 y k = 3 factores.
El despliegue práctico de un DCC surge con frecuencia a través de la experimentación secuencial,
como en Jos ejemplos 111 y 112. Es decir, se ha usado un diseño 2k para ajustar un modelo de primer or
den, este modelo ha presentado falta de ajuste, y después se agregaron las corridas axiales para permitir la
incorporación de los términos cuadráticos en el modelo. El DCC es un diseño muy eficiente para ajustar
el modelo de segundo orden. Hay dos parámetros en el diseño que deben especificarse: la distancia a de
las corridas axiales al centro del diseño y el número de puntos centrales ne. A continuación se analiza la
elección de estos dos parámetros.
114 DISEÑOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA 45 7
(0,a)
(1. +1) (+1.+1)
(a, O) (0,0) (a. O)
H.1) (+1,1)
(0, (Z)
Figura 11·20 Diseños centrales compuestos para k = 2yk = 3.
Rotabilidad
Es importante que el modelo de segundo orden proporcione buenas predicciones en toda la región de in
terés. Una manera de definir "buenas" es requerir que el modelo tenga una varianza razonablemente
consistente y estable de la respuesta predicha en los puntos de interés x. Recuerde, por la ecuación 1040,
que la varianza de la respuesta predicha en algún punto x es
V[5(x)]= a2x'(x'Xr1x
Box y Hunter [17a] propusieron que un diseño de superficie de respuesta de segundo orden debe ser rota
ble. Esto significa que la Ji15(x)] es la misma en todos los puntos x que están a la misma distancia dél cen
tro del diseño. Es decir, la varianza de la respuesta predicha es constante en esferas.
En la figura 1121 se muestran los contornos de ~J'15(x)] constante para el ajuste del modelo de se
gundo orden utilizando el DCC en el ejemplo 112. Observe que los contornos de desviación estándar
constante de la respuesta predicha son círculos concéntricos. Un diseño con esta propiedad dejará la va
rianza de )'sin cambio cuando el diseño se rota alrededor del centro (O, O, ... , O), de ahí el nombre de dise
ño rotable.
La rotabilidad es una base razonable para la selección de un diseño de superficie de respuesta. Puesto
que la finalidad de la MSR es la optimización, y la localización del óptimo se desconoce antes de correr el
experimento, tiene sentido el uso de un diseño que proporcione una precisión de estimación igual en to
das las direcciones (puede demostrarse que cualquier diseño de primer orden ortogonal es rotable ).
Un diseño central compuesto se hace rotable mediante la elección de a. El valor de a para la rotabili
dad depende del número de puntos en la porción factorial del diseño; de hecho, a = (nF )114 produce un di
seño central compuesto rotable, donde nF es el número de puntos usados en la porción factorial del
diseño.
El DCC esférico
La rotabilidad es una propiedad esférica; es decir, tiene mayor sentido como criterio de diseño cuando la
región de interés es una esfera. Sin embargo, no es importante tener una rotabilidad exacta para tener un
buen diseño. De hecho, para una región esférica de interés, la mejor elección de a desde el punto de vista
de la varianza de predicción para el DCC es hacer a = -Jk. Este diseño, llamado DCC esférico, coloca to
dos los puntos factoriales y axiales del diseño sobre la superficie de una esfera de radio -./TC. Para una expo
sición más amplia del tema, ver Myers y Montgomery [85a].
0.3019 0.3484
179.7
177.4
"'s
1ii
.,
o,
175.0
E
~
172.6
170.3
0.3019
167.9 i....::.:=:.;:._L:::...__i...:::::~ ... .::::::.....1__ ::..1....c.__,¡_:.._¡

77.93 80.29 82.64 85.00 87.36 89.71 92.07
Tiempo
a) Contornos de.,/ Vly(>dl
0.3949
0.3020
1 ~ 0.2091
~
182.1
167.9 77.93 Figura 1121 Contornos de desviación estándar cons

bl La gráfica de la superficie de respuesta
tante de la respuesta predicha para el DCC rotable, ejem
plo 112.
Corridas centrales en el DCC

La elección de a en el DCC está dictada principalmente por la región de interés. Cuando esta región es
una esfera, el diseño debe incluir corridas centrales para proporcionar una varianza razonablemente es
table de la respuesta predicha. En general, se recomiendan de tres a cinco corridas centrales.
El diseño de BoxBehnken
Box y Behnken [13] han propuesto algunos diseños de tres niveles para ajustar superficies de respuesta.
Estos diseños se forman combinando factoriales 2k con diseños de bloques incompletos. Los diseños re
114 DISEÑOS EXPERIMENTAtES PARA AJUSTAR SUPERFICIES DE RESPUESTA 459
Tabla 118 Diseño de BoxBehnken
para tres variables
Corrida X¡ Xz X3
1 1 1 o
2 1 1 o
3 1 1 o
4 1 1 o
5 1 o -1
6 1 o 1
7 1 o -1
8 1 o 1
9 o 1 1
10 o 1 1
11 o 1 -1
12 o 1 1
13 o o o
14 o o o
15 o o o
sultantes suelen ser muy eficientes en términos del número requerido de corridas, y son rotables o casi ro
tables.
En la tabla 118 se muestra el diseño de BoxBehnken para tres variables. El diseño también se ilustra
geométricamente en la figura 1122. Observe que el diseño de BoxBehnken es un diseño esférico, con to
dos los puntos localizados en una esfera de radio V'l.. Asimismo, el diseño de BoxBehnken no contiene
ningún punto en los vértices de la región cúbica creada por los límites superior e inferior de cada variable.
Esto podría ser una ventaja cuando los puntos de los vértices de] cubo representan combinaciones de los
niveles de los factores cuya prueba es prohibitivamente costosa o imposible debido a restricciones físicas
del proceso.
Región cuboidal de interés

Existen muchas situaciones en las que la región de interés es cuboidal en lugar de esférica. En estos casos,
una variante útil del diseño central compuesto es e] diseño central compuesto con centros en las caras o el
cubo con centros en las caras, en el que a = l. En este diseño los puntos axiales o estrella se localizan en
=
los centros de las caras del cubo, como se muestra en la figura 1123 para k 3. Esta variante del diseño
central compuesto se usa en ocasiones debido a que sólo requiere tres niveles de cada factor, y en la prác
··¡ •1
1
o
_,, .L
«+1 xt¿2
1
,,,.
1
x,
-1 +1 1 +1
Figura 1122 Diseño de BoxBehnken para tres Figura 1123 Diseño central compuesto con centros
factores. en las caras para k = 3.
0.848
0.742
0.637
0.531
0.425
~
1.00 1.00
(a 1 Superficie de respuesla
0.50
..~ 0.00
0.60
1.00
1.00 0.50 0.00. 0.50 1.00
x,
!M GrMlca da contorno
Figura 1124 Desviación estándar de la respuesta predicha JV[ji(x)] para el cubo con
centros en las caras con k = 3, ne = 3 y x3 = O.
a) b)
Figura 1125 Diseños equirradiales para dos variables. a) Hexágono. b) Pen

tágono.
tica con frecuencia es difícil cambiar los niveles de los factores. Sin embargo, observe que los diseños cen
trales compuestos no son rotables.
El cubo con centros en las caras no requiere tantos puntos centrales como el DCC esférico. En la
práctica, ne = 2 o 3 es suficiente para proporcionar una buena varianza de predicción en toda la región ex
perimental. Cabe señalar que en ocasiones se emplearán más corridas centrales para dar una estimación
razonable del error experimental. En la figura 1124 se muestra la raíz cuadrada de la varianza de predic
ción v'V[5(x)] del cubo con centros en las caras para k = 3 con ne = 3 puntos centrales (x3 = O). Observe
que la desviación estándar de la respuesta predicha es razonablemente uniforme en una porción relativa
mente larga del espacio del diseño.
Otros diseños
Existen muchos otros diseños de superficie de respuesta que en ocasiones son útiles en la práctica. Para
dos variables, podrían usarse diseños compuestos de puntos cuya separación en un círculo es igual y que
forman polígonos regulares. Puesto que los puntos del diseño son equidistantes del origen, a estos arre
glos con frecuencia se les llama diseños equirradiales.
Para k = 2, un diseño equirradial rotable se obtiene combinando n2 2: 5 puntos con una separación
igual en un círculo con n1 2: 1 punto en el centro del círculo. Diseños de particular utilidad para k = 2 son
el pentágono y el hexágono. Estos diseños se muestran en la figura 1125. Otros diseños útiles incluyen el
diseño compuesto pequeño, el cual consiste en un factorial fraccionado en el cubo de resolución 111* (los
efectos principales son alias de las interacciones de dos factores y ninguna de las interacciones de dos fac
tores es alias entre sí) y las corridas axiales y centrales usuales, y la clase de los diseños hfbridos. Estos di
seños pueden ser de valor considerable cuando es importante reducir el número de corridas tanto como
sea posible.
En la tabla 119 se muestra un diseño compuesto pequeño para k = 3 factores. Este diseño usa la frac
ción un medio estándar del diseño 23 en el cubo, ya que satisface los criterios de la resolución 111*. El dise
ño tiene cuatro corridas en el cubo y seis corridas axiales, y debe incluir al menos un punto central. Por lo
= =
tanto, el diseño tiene un mínimo de N 11 ensayos, y el modelo de segundo orden en k 3 variables tiene
=
p 10 parámetros por estimar, por lo que se trata de un diseño muy eficiente con respecto al número de
= =
corridas. El diseño de la tabla 119 tiene ne 4 corridas centrales. Se seleccionó a l. 73 para obtener un
diseño esférico debido a que el diseño compuesto pequeño no puede hacerse rotable.
=
En la tabla 1110 se muestra un diseño híbrido para k 3. Algunos de estos diseños tienen niveles
irregulares, y esto puede ser un factor limitante para su aplicación. Sin embargo, se trata de diseños muy
462 CAPÍTULO 11 MÉTODOS DE SUPERFICIESDE RESPUESTA
Tabla 119 Diseño compuesto pequeño

para k = 3 factores
Orden
estándar X1 Xz X3
1 1.00 1.00 1.00

2 1.00 1.00 1.00
3 1.00 1.00 LOO
4 1.00 1.00 1.00
5 1.73 0.00 0.00
6 1.73 0.00 0.00
7 0.00 1.73 0.00
8 0.00 1.73 0.00
9 0.00 0.00 1.73
10 0.00 0.00 1.73
11 0.00 0.00 . 0.00
12 0.00 0.00 0.00
13 0.00 0.00 0.00
14 0.00 0.00 0.00
pequeños, y poseen excelentes propiedades de la varianza de predicción. Para mayores detalles acerca de
los diseños compuestos pequeños y los diseños híbridos, referirse a Myers y Montgomery [85a].
114.3 Formación de bloques en los diseños de superficie de respuesta

Cuando se usan diseños de superficie de respuesta, con frecuencia es necesario considerar la formación
de bloques para eliminar las variables perturbadoras. Por ejemplo, este problema puede ocurrir cuando
un diseño de segundo orden se ensambla secuencialmente a partir de un diseño de primer orden, como se
ilustró en los ejemplos 111y112. Puede transcurrir tiempo considerable entre que se corre el modelo de
primer orden y se corren los experimentos complementarios requeridos para construir un diseño de se
Tabla 1110 Diseño híbrido para k = 3

factores
Orden
estándar X¡ Xz X3
1 0.00 0.00 1.41

2 0.00 0.00 1.41
3 1.00 1.00 0.71
4 1.00 1.00 0.71
5 1.00 1.00 0.71
6 1.00 1.00 0.71
7 1.41 0.00 0.71
8 1.41 0.00 0.71
9 0.00 1.41 0.71
10 0.00 1.41 0.71
11 0.00 0.00 0.00
114 DISEÑOS EXPERlMENT ALES PARA AJUSTAR SUPERFICIES DE RESPUESTA 463
gundo orden, y durante este tiempo las condiciones de prueba pueden cambiar, haciendo necesaria la for
mación de bloques.
Se dice que un diseño de superficie de respuesta se forma de bloques ortogonales si se divide en blo
ques tales que sus efectos no afecten las estimaciones de los parámetros del modelo de superficie de res
puesta. Si se usa un diseño zk o zk--p como un diseño de superficie de respuesta de primer orden, pueden
usarse los métodos del capítulo 7 para disponer las corridas en 2' bloques. Los puntos centrales de estos
diseños deberán asignarse por igual entre los bloques.
Para hacer la formación de bloques ortogonales de un diseño de segundo orden, deben satisfacerse
dos condiciones. Si hay nb observaciones en el bloque bésimo, entonces estas condiciones son
l. Cada bloque debe ser un diseño ortogonal de primer orden; es decir,
~ »;»; =Ü i '#. j= 0, 1, ... , k para todab

M=l
donde X;u y X¡u son los niveles de las variables iésima y jésima en la corrida uésima del experi
mento con X0u = 1 para toda u.
2. La fracción de la suma de cuadrados total para cada variable con que contribuye cada bloque,
debe ser igual a la fracción de las observaciones totales que están contenidas en el bloque;
es decir,
6
~xi
-N--=
tu nb
N i = 1, 2, ... , k para todab
~ x2
L.,¡ IU
donde N es el número de corridas del diseño.
Como un ejemplo de la aplicación de estas condiciones, considere un diseño central compuesto rota
ble en k = 2 variables con N = ].2 corridas. Los níveles r, y x2 de este diseño pueden escribirse en la matriz
del diseño
X¡ X2
1 1
1 1
1
1
1
1
¡Bloque 1
o o
o o
D= 1.414 o
1.414 o
o 1.414
o 1.414 Bloque 2
o o
o o
Observe que el diseño se ha dispuesto en dos bloques, con el primer bloque consistiendo en la porción
factorial del diseño más dos puntos centrales y el segundo bloque consistiendo en los puntos axiales más
dos puntos centrales adicionales. Es claro que la condición 1 se satisface; es decir, ambos bloques son di·
seños de primer orden ortogonales. Para investigar la condición dos, considere primero el bloque 1 y ob
serve que
~ x2lu
LJ =L
~ x22u =4
U=*l u1
Por lo tanto,
4
::;:::;:
6
8 12
Así, la condición 2 se satisface en el bloque l. Para el bloque 2 se tiene
Por lo tanto,
4 6
=
8 12
Puesto que la condición 2 también se satisface en el bloque 2, este diseño está formado de bloques ortogonales.
En general, el diseño central compuesto siempre puede construirse para hacer la formación de blo
ques ortogonales en dos bloques con el primer bloque consistiendo en nF puntos factoriales más ncF pun
tos centrales y el segundo bloque consistiendo en nA = 2k puntos axiales más nCA puntos centrales. La
primera condición de la formación de bloques ortogonales se cumplirá siempre independientemente del
valor que se use para a en el diseño. Para que la segunda condición se cumpla,
~ x!
"= nA +nCA (1115)
El miembro izquierdo de la ecuación 11 15 es 2a2/np, y después de sustituir esta cantidad, la ecuación para
el valor de a que resultará en la formación de bloques ortogonales puede resolverse como
a= [nF(nA +nCA )]112 (11·16)

2(nF +ncF)
Este valor de a no dará como resultado, en general, un diseño rotable o esférico. Si se requiere que el
diseño también sea rotable, entonces a = (nF)114 y
112 _ nF(nA +nCA)
( nF ) - (1117)
2(nF +ncF)
No siempre es posible encontrar un diseño que satisfaga exactamente la ecuación 1117. Por ejemplo, si
k = 3, np = 8 y nA = 6, la ecuación 1117 se reduce a
(8)1/2 = 8(6+nCA)
2(8+ncF)
2.83= 48+8nCA
16+2nCF
Es imposible encontrar valores de nCA y nCF que satisfagan exactamente esta última ecuación. Sin embar
go, observe que si nCF = 3 y ne-A = 2, entonces el segundo miembro es
48+8(2)
2.91
16+2(3)
por lo que el diseño se separa en bloques casi ortogonales. En la práctica podría relajarse un tanto el re
querimiento de la rotabilidad o bien el de la formación de bloques ortogonales sin ninguna pérdida im
portante de información.
El diseño central compuesto es muy versátil en cuanto a su capacidad para incorporar la formación
de bloques. Si k es lo suficientemente grande, la porción factorial del diseño puede dividirse en dos o más
bloques. (El número de bloques factoriales debe ser una potencia de 2, con la porción axial formando un
solo bloque.) En la tabla 1111 se presentan varias disposiciones útiles de la formación de bloques para el
diseño central compuesto.
Tabla 1111 Algunos diseños centrales compuestos rotables y casi rotables que se separan en bloques ortogonales
5 6 7
k 2 3 4 5 tRep. 6 tRep. 7 tRep.
Bloque{ s} factorial{ es2
np 4 8 16 32 16 64 32 128 64
Número de bloques 1 2 2 4 1 8 2 16 8
Número de puntos en cada
bloque 4 4 8 8 16 8 16 8 8
Número de puntos centrales
en cada bloque 3 2 2 2 6 1 4 1 1
Número total de puntos en
cada bloque 7 6 10 10 22 9 20 9 9
Bloque axial
nA 4 6 8 10 10 12 12 14 14
nCA 3 2 2 4 1 6 2 11 4
Número total de puntos en el
bloque axial 7 8 10 14 11 18 14 25 18
Número total de puntos N del
disefio 14 20 30 54 33 90 54 169 80
Valores dea
Separación en bloques ortogonales 1.4142 1.6330 2.0000 2.3664 2.0000 2.8284 2.3664 3.3636 2.8284
Rotabilidad 1.4142 1.6818 2.0000 2.3784 2.0000 2.8284 2.3784 3.3333 2.8284
Cabe destacar dos puntos importantes acerca del análisis de varianza cuando el diseño de superficie
de respuesta se ha corrido en bloques. El primero se refiere al uso de los puntos centrales para calcular
una estimación del error puro; Sólo los puntos centrales que se corren en el mismo bloque pueden consi
derarse como réplicas, por lo que el término del error puro sólo puede calcularse dentro de cada bloque.
Si la variabilidad es consistente en todos los bloques, entonces estas estimaciones del error puro podrían
agruparse. El segundo punto se refiere al efecto de bloque. Si el diseño se forma de bloques ortogonales
en m bloques, la suma de cuadrados de los bloques es
B;

G2
(1118)
N
donde B¿ es el total de las nb observaciones en el bloque bésimo y Ges el gran total de las N observaciones
en los m bloques. Cuando los bloques no son exactamente ortogonales, puede usarse la prueba general de
significación de la regresión (el método de la "suma de cuadrados extra") que se describió en el capítulo 10.
114.4 Diseños (óptimos) generados por computadora

Los diseños estándares de superficie de respuesta estudiados en las secciones anteriores, como el diseño
central compuesto y el diseño de BoxBehnken y sus variantes (como el cubo con centros en las caras), son
de uso generalizado porque son diseños bastante generales y flexibles. Si la región experimental es un
cubo o una esfera, de manera típica existe un diseño de superficie de respuesta que será aplicable al pro
blema. Sin embargo, ocasionalmente un experimentador se encuentra con una situación en la que el dise
ño estándar de superficie de respuesta puede no ser una elección obvia. Los diseños generados por
computadora son una alternativa por considerar en estos casos.
Hay tres situaciones en las que puede ser apropiado algún tipo de diseño generado por computadora.
l. Una región experimental irregular. Sí la región de interés del experimento no es un cubo o una esfera,
los diseños estándares quizá no sean la mejor elección. Las regiones de interés irregulares ocurren con
bastante frecuencia. Por ejemplo, un experimentador está investigando las propiedades de un adhesivo
particular. El adhesivo se aplica a dos piezas y después se cura a una temperatura elevada. Los dos facto
res de interés son la cantidad de adhesivo aplicada y la temperatura de curado. En los rangos de estos dos
factores, tomados como1a+1 en la escala de la variable codificada usual, el experimentador sabe que si
se aplica muy poco adhesivo y la temperatura de curado es muy baja, las piezas no se pegarán satisfacto
riamente. En términos de las variables codificadas, esto lleva a una restricción sobre las variables del dise
ño, por ejemplo
dondex, representa la cantidad aplicada de adhesivo y x2 la temperatura. Además, si la temperatura es de

masiado elevada y se aplica mucho adhesivo, las piezas resultarán dañadas por la fatiga térmica o bien
ocurrirá un pegado inadecuado. Por lo tanto, hay otra restricción sobre los niveles de los factores
X1 +x2 :S: 1
En la figura 1126 se muestra la región experimental que resulta de aplicar estas restricciones. Observe
que las restricciones eliminan de hecho dos de los vértices del cuadrado, produciendo una región experi
1.0 0.5 b 0.5 1.0

x,
Figura 1126 Región restringida del diseño en dos variables.
mental irregular (en ocasiones a estas regiones irregulares se les llama "latas abolladas"). No existe nin
gún diseño de superficie de respuesta estándar que se ajuste exactamente a esta región.
2. Un modelo no estándar. Por lo general, un experimentador elige un modelo de superficie de respues

ta de primer o de segundo orden, consciente de que este modelo empírico es una aproximación del verda
dero mecanismo subyacente. Sin embargo, en ocasiones el experimentador puede tener un conocimiento
o idea especial acerca del proceso bajo estudio que puede sugerir un modelo no estándar. Por ejemplo, el
modelo
y= Po +/31X1 +/32X2 +/312X1X2 +/3nx~ +/322Xi
+/3112x12x2 +/31112x{x2 +e
puede ser de interés. El experimentador estaría interesado en obtener un diseño eficiente para ajustar
este modelo reducido de cuarto grado. Como otra ilustración, en ocasiones se encuentran problemas de
superficie de respuesta en los que algunos de los factores del diseño son variables categóricas. No hay di
seños de superficie de respuesta estándares para esta situación (referirse a Myers y Montgomery [85a]
para un estudio de las variables categóricas en problemas de superficie de respuesta).
3. Requerimientos inusuales para el tamaño de la muestra. Ocasionalmente, un experimentador quizá

necesite reducir el número de corridas requeridas en un diseño estándar de superficie de respuesta. Por
ejemplo, suponga que se pretende ajustar un modelo de segundo orden en cuatro variables. El diseño
central compuesto para esta situación requiere entre 28 y 30 corridas, dependiendo del número de puntos
centrales seleccionados. Sin embargo, el modelo sólo tiene 15 términos. Si las corridas tienen un costo
muy elevado o se llevan mucho tiempo, el experimentador querrá un diseño con menos ensayos. Aun
cuando los diseños generados por computadora pueden usarse para este fin, por lo general se cuenta con
enfoques mejores. Por ejemplo, puede construirse un diseño compuesto pequeño para cuatro factores
con 20 corridas, incluyendo cuatro puntos centrales, y también se cuenta con un diseño híbrido con ape
nas 16 corridas. Éstas son en general elecciones superiores al uso de un diseño generado por computado
ra para reducir el número de ensayos.
Gran parte del desarrollo de los diseños generados por computadora se deriva del trabajo de Kiefer
[65a, b] y Kiefer y Wolfowitz [66] en la teoría de los diseños optimales. Por diseño optimal se entiende un
diseño que es "mejor" con respecto a algún criterio. Se requieren programas de computadora para cons
truir estos diseños. El enfoque usual es especificar un modelo, determinar la región de interés, seleccio
nar el número de corridas que deberán hacerse, especificar el criterio de optimalidad y después elegir los
puntos del diseño de un conjunto de puntos candidatos que el experimentador consideraría usar. De ma
nera típica, los puntos candidatos son una matriz de puntos distribuidos en la región factible del diseño.
Hay varios criterios de optimalidad populares. Quizá el de uso más generalizado es el criterio de optí
malídad D. Se dice que un diseño es optimal D si
se minimiza. Ocurre que un diseño optimal D minimiza el volumen de la región de confianza conjunta
para el vector de los coeficientes de regresión. Una medida de la eficiencia relativa del diseño 1 respecto
del diseño 2 de acuerdo con el criterio D está dada por
o = (1<x;x2 r 1)l}p1
(1119)
e l(X~X1r1I
donde X1 y X2 son las matrices X de los dos diseños y p es el número de parámetros del modelo.
El criterio de optimalidadA sólo se ocupa de las varianzas de los coeficientes de regresión. Un diseño
es optimalA si minimiza la suma de los elementos de la diagonal principal de (X'Xt1 [a ésta se le llama la
traza de (X'Xt1, denotada generalmente como tr(X'Xt1]. Por lo tanto, un diseño optimalA minimiza la
suma de las varianzas de los coeficientes de regresión.
Puesto que muchos experimentos de superficie de respuesta se refieren a la predicción de la respues
ta, los criterios de la varianza de predicción son de gran interés práctico. Quizás el más popular de estos
criterios sea el criterio de optimalidad G. Se dice que un diseño es optimal G si minimiza ·1a varianza de
predicción escalada máxima en la región del diseño. Es decir, si el valor máximo de
NV[S(x)]
ª2
en la región del diseño es un mínimo, donde N es el número de puntos del diseño. Si el modelo tiene p pa
rámetros, la eficiencia G de un diseño es precisamente
p
G, = , NV[S(x)] (1120)
max
a2
El criterio V considera la varianza de predicción en un conjunto de puntos de interés en la región del dise
ño, por ejemplo x1, x2, ... , xm. El conjunto de puntos podría ser el conjunto de candidatos del que se selec
cionó el diseño, o podría ser alguna otra colección de puntos que tienen un significado específico para el
experimentador. Un diseño que minimiza la varianza de predicción promedio en este conjunto de m pun
tos es un diseño optimal V.
En conjunto, a los criterios de diseño que se han venido estudiando suele llamárseles criterios de op
timalidad alfabética. Existen algunas situaciones en las que el diseño optimal alfabético se conoce o bien
puede construirse analíticamente. Un buen ejemplo es el diseño r,
que es optima! D, A, G y V para ajus
tar el modelo de primer orden en k variables o para ajustar el modelo de primer orden con interacción.
Sin embargo, en la mayoría de los casos el diseño optimal no se conoce y debe emplearse un algoritmo ba
sado en "Computadora para encontrar un diseño. Muchos paquetes de software de estadística que sopor
tan experimentos diseñados cuentan con esta capacidad. La mayoría de los procedimientos para construir
diseños se basan en el algoritmo de intercambio. En esencia, el experimentador selecciona una matriz de
puntos candidatos y un diseño inicial (quizá al azar) a partir de este conjunto de puntos. Entonces el algo
ritmo intercambia los puntos que están en la matriz, pero no en el diseño, con los puntos que están actual
mente en el diseño, en un esfuerzo por mejorar el criterio de optimalidad seleccionado. Debido a que no
se evalúan explícitamente todos los diseños posibles, no hay garantía de que se ha encontrado un diseño
optimal, pero el procedimiento de intercambio suele asegurar que se obtiene un diseño que está "cerca"
del optimal. Algunas implementaciones repiten varias veces el proceso de construcción del diseño, empe
zando con diseños iniciales diferentes, para incrementar la posibilidad de que se obtendrá un diseño final
que esté muy cerca del optimal.
Para ilustrar algunas de estas ideas, considere el experimento del adhesivo expuesto anteriormente y
que llevó a la región experimental irregular de la figura 1126. Suponga que la respuesta de interés es la
fuerza de desprendimiento y que quiere ajustarse un modelo de segundo orden para esta respuesta. En la
figura ll27a se muestra un diseño central compuesto con cuatro puntos centrales (12 corridas en total)
inscrito dentro de esta región. Se trata de un diseño que no es rotable, pero es el DCC más grande que
puede ajustarse dentro del espacio del diseño. Para este diseño 1(X'X)"11 = 1.852 E2, y la traza de (X'X)"1
es 6.375. En la figura ll27a también se muestran los contornos de desviación estándar constante de la
respuesta predicha, calculada suponiendo que a= 1. En la figura 1127b se muestra la gráfica de superfi
cie de respuesta correspondiente.
En la figura 1128a y enla tabla 1112 se muestra un diseño optimalD de 12 corridas para este proble
ma, generado con el paquete de softwareDesign-Expen. Para este diseño, 1(X'X)"11 = 2.153 E4. Observe
que el criterio D es considerablemente mejor para este diseño que el DCC inscrito. La eficiencia relativa
del DCC inscrito con respecto al diseño optimal D es
D = ¡1(x;x2 ) 1) -= (0.0002153)116 = 0.476

rI
1 11p
• l(X~X1 1 0.01852
Es decir, el DCC inscrito tiene una eficiencia de sólo 47 .6% que la del diseño optima! D. Esto implica que
tendrían que hacerst:.1/0.476 = 2.1 réplicas del DCC (o aproximadamente el doble) para tener la misma
precisión de la estimación de los coeficientes de regresión que la que se consigue con el diseño optimal D.
La traza de (X'Xt1 es 2.516 para el diseño optima} D, lo cual indica que la suma de las varianzas de los
coeficientes de regresión es considerablemente más pequeña para este diseño que para el DCC. En las fi
guras 1128a y b se muestran también los contornos de desviación estándar constante de la respuesta pre
dicha y la gráfica de la superficie de respuesta asociada (suponiendo que a= 1 ). En general, los contornos
de la desviación estándar de la predicción son más bajos para el diseño optima)D que para el DCC inscri
to, particularmente cerca de los límites de la región de interés, donde el DCC inscrito no incluye ninguno
de los puntos del diseño.
En la figura 1129a se muestra un tercer diseño, creado al tomar las dos réplicas de los vértices de la
región en el diseño optima) D y pasarlas al centro del diseño. Esto podría ser una idea útil, ya que la figura
1128b muestra que la desviación estándar de la respuesta predicha se incrementa ligeramente cerca del
centro de la región del diseño para el diseño optimalD. En la figura ll29a se muestran también los con
tornos de desviación estándar constante de la predicción para este diseño optimalD modificado, y en la fi
1.00
O.ISO
1.00 L
1.00 ~.60 0.00 O.ISO 1.00
.11,
I•) El diseno y los contornos de .J'V lfl•lllííi constante
~60 ~.50
(b) La gráfica de superficie de respuesta
Figura 11·27 Un diseno central compuesto inscrito para la región restringida del diseño
de la figura 1126.
2
...... 0.00
\¡J 2
0.50
1.00 '.....:
1.00 0.50 0.00 0.50 1.00
x,
(a) El disello y loe con1Drno11de N lj(xlVa' constante
0.837
0.755
0.674
B
I
e.ssz
.b
::..
(b> La gráfica de superficie de respuesta
Figura 11-28 Un diseño optimal D para la región restringida del diseño de la figura
1126.
Tabla 1112 Diseño optima! D para la

región restringida de la
figura 1126
Orden
estándar
1 0.50 LOO
2 1.00 0.00
3 0.08 0.08
4 1.00 1.00
5 1.00 1.00
6 0.00 1.00
7 1.00 0.25
8 0.25 l.00
9 1.00 0.50
10 1.00 0.00
11 0.00 1.00
12 0.08 0.08
gura 11-29b se muestra la gráfica de la superficie de respuesta. El criterio D para este diseño es 1(X'XY 1
1
= 3.71 E4, y la eficiencia relativa es

D = (l(X;x2 r l)
1 11P = (0.0002153)116 = o.si
e l(x;xl rI
1 0.000371
Es decir, este diseño es casi tan eficiente como el diseño optimalD. La traza de (X'xr1 es 2.448 para este
diseño, un valor ligeramente mayor que el que se obtuvo para el diseño optimal D. Los contornos de des
viación estándar constante de la predicción para este diseño dan la impresión visual de ser al menos tan
buenos como los del diseño optima! D, particularmente en el centro de la región.
Los diseños generados por computadora con base en los criterios de optimalidad alfabética pueden
ser ciertamente útiles en situaciones en las que la región experimental no es ni esférica ni cuboidal. Sin
embargo, no son sustitutos de los diseños estándares en la mayoría de los problemas. Los diseños optima
les alfabéticos se generan apegándose estrictamente a un solo criterio y, como se señaló al principio de la
sección 114, donde se enlistaron varios criterios para diferentes diseños, incluyen varios que son de ca
rácter un tanto cualitativo o subjetivo. En problemas experimentales reales, por lo general hay muchos
criterios que es necesario evaluar para seleccionar un diseño. Para un estudio más amplio de este tema,
referirse a Myers y Montgomery [85a, capítulo 8].
115 EXPERIMENTOS CON MEZCLAS
En las secciones anteriores se presentaron diseños de superficie de respuesta para aquellas situaciones en
las que los niveles de cada factor son independientes de los niveles de otros factores. En los experimentos
con mezclas, los factores son los componentes o ingredientes de una mezcla y, por consiguiente, sus nive
les no son independientes. Por ejemplo, si X¡, x2, ... , xP denota las proporciones de p componentes de una
mezcla, entonces
0:SX¡ si i = 1, 2, ... , p
y
(es decir, 100%)
115 EXPERIMENTOS CON MEZCLAS 4 73
1.00
0.50
0.50
1.00 ..._ _
1.00 0.50 0.00 o.so 1.00
x,
(al El diseño y ~os contornos de -Jv JY(•llfa' constante
(bl La gráfica de superficie de respuesta

Figura 1129 Un diseño optima! D modificado para la región restringida del diseño de la fi
gura 1126.
x,
b)
Figura 1130 Espacio de los factores Figura 1131 Sistema coordenado trilineal.
restringidos para mezclas con a) p = 2
componentesy b)p = 3 componentes.
Estas restricciones se ilustran gráficamente en la figura 1130 para p = 2 yp = 3 componentes. Para dos
componentes, el espacio de los factores del diseño incluye todos los valores de los dos componentes que
están sobre el segmento de recta x, + x2 = 1, con cada componente siendo acotado por O y l. Con tres
componentes, el espacio de la mezcla es un triángulo con vértices que corresponden a las formulaciones
que son mezclas puras (mezclas que son 100% de un solo componente).
Cuando hay tres componentes en la mezcla, la región experimental restringida puede representarse
convenientemente en papel milimétrico trilineal, como se muestra en la figura 1131. Cada uno de los
tres lados de la gráfica de la figura 1131 representa una mezcla que no contiene nada de alguno de los
tres componentes (el componente indicado en el vértice opuesto). Las nueve líneas de graduación en
cada dirección marcan incrementos de 10% en el componente respectivo.
Los diseños símplex se usan para estudiar los efectos de los componentes de una mezcla sobre la va
riable de respuesta. Un diseño símplex reticular {p, m} parap componentes consta de los puntos defini
dos por los siguientes arreglos de las coordenadas: las proporciones asumidas por cada componente
toman los m + 1 valores que están separados por una distancia igual de O a 1,
1 2
X¡=Ü,,,··,1 i=l,2, ...,p (1121)
mm
y se usan todas las combinacionesposibles (mezclas) de las proporciones de la ecuación 1121.Como un
ejemplo, sean p = 3 y m = 2. Entonces
i = 1, 2, 3
115 EXPERIMENTOS CON MEZCLAS 475
.:r, .. 1
Retícula [3, 2] .:r, ~ 1 Reticula [3, 3) .:r, ~ 1
.:ra; 1 .:r3; 1
Retícula [4, 21 Retícula (4, 3)
Figura 1132 Algunos diseños símplex reticulares para p = 3 yp = 4 componentes.
y el diseño símplex reticular consta de las seis corridas siguientes:

t.
(xp x2, X3) = (1, O, O), (O, 1, 0),(0, O, 1), (t, O), (t,O, t ), (O, t. Í)
En la figura 1132 se ilustra este diseño. Los tres vértices (1, O, O), (O, 1, O) y (O, O, 1) son las mezclas puras,
mientras que los puntos (t, t, O), (t, O, y (O, t) t. t)
son mezclas binarias o mezclas de dos componentes lo
calizadas en los puntos medios de los tres lados del triángulo. En la figura 1132 se muestran también los
diseños símplex reticulares {3, 3}, {4, 2} y {4, 3}. En general, el número de puntos en un diseño símplex
reticular {p, m} es
N = _,_(P._+_m__1"")
!
m!(p1)!
Una alternativa del diseño símplex reticular es el diseño símplex de centroide. En un diseño símplex
de centroide conp componentes, hay 2" 1 puntos, que corresponden a las p permutaciones de (1, O, O, ... ,
t.
O), las ( ~) permutaciones de (t, O, ... , O), las ( ~) permutaciones de (t, t, t. O, ... , O), ... , y el centroide glo
bal (}, }, ... , }). En la figura 1133 se muestran algunos diseños símplex de centroide .
.:r, "'1
;r2; 1 0C:J1
O;r3 m 1
X2 "'X3 "'í
a) bl
Figura 1133 Diseños símplexde centroide con a) p = 3 componentesy b)p = 4 componentes.

Una crítica a los diseños símplex descritos antes es que la mayoría de las corridas ocurren en la fron
tera de la región y, por consiguiente, incluyen sólo p - 1 de los p componentes. Suele ser deseable aumen
tar el diseño símplex reticular o de centroide con puntos adicionales en el interior de la región donde las
mezclas estarán formadas por la totalidad de los p componentes. Para un estudio más amplio, ver Cornell
[33] y Myers y Montgomery [85a].
Los modelos para mezclas difieren de los polinomios usuales empleados en los diseños de superficie
de respuesta debido a la restricción l:x; = l. Las formas estándares de los modelos para mezclas que se
usan ampliamente son
Lineal:
p
E(y) =L /3;X; (1122)

i~l
Cuadrático:
(1123)
Cúbico completo:
(1124)
i-c j
Cúbico especial:
jml i<j (1125)

+ LLL
i-c j-ck
/3iiicX;Xjxk
Los términos de estos modelos tienen interpretaciones relativamente simples. En las ecuaciones
1122 a 1125, el parámetro /31 representa la respuesta esperada para la mezcla purax, = 1 y xj = O cuando
j :;i!: i. A la porción ~:'~i/3;X; se le llama porción de mezcla lineal. Cuando hay curvatura derivada de una
mezcla no lineal entre pares de componentes, los parámetros /3;i representan una mezcla sinérgica o bien
antagónica. Los términos de órdenes superiores suelen ser necesarios en los modelos para mezclas por
que 1) los fenómenos estudiados pueden ser complejos y 2) la región experimental con frecuencia es la re
gión de operabilidad completa y, en consecuencia, es grande y requiere un modelo elaborado.
EJEMPLO .11"'3 · · · · · · · · • • • · • • • • · · · · · · · · · · · · • · · • · · · · · · · · · · · · · · · • · • • • · · · · · · · ·
Una mezcla de tres componentes
Cornell [33] describe el experimento con una mezcla en el que se combinaron tres componentes =polie
tileno (x1), poliestireno (x2) y polipropileno (x3)- para hilar una fibra que se usará en cortinas. La variable
de respuesta de interés es la elongación del hilo en kilogramos de fuerza aplicada. Se usa un diseño símplex
Tabla 1113 El diseño símplex reticular {3, 2} para el problema de la elongación del hilo
Punto del Proporciones de los componentes Valores observados Valor promedio_
diseño X¡ X1 X3 de la elongación de la elongación (y)
1 1 o1 o 11.0, 12.4 11.7
2 2
1
2 o 15.0, 14.8, 16.1 15.3
3 o 1 o1 8.8, 10.0 9.4
4 o 2
1
2 10.0, 9.7, 11.8 10.5
5 o1 o 1 16.8, 16.0 16.4
6 2 o 1
2 17.7, 16.4, 16.6 16.9
reticular para estudiar el producto. El diseño y las respuestas observadas se muestran en la tabla 1113.
Observe que todos los puntos del diseño incluyen mezclas puras o binarias; es decir, únicamente se usan
a lo sumo dos de los tres componentes en cualquier formulación del producto. También se corren réplicas
de las observaciones, con dos réplicas de cada una de las mezclas puras y tres réplicas de cada una de las
mezclas binarias. La desviación estándar del error puede estimarse a partir de estas réplicas de las observa
ciones como á = 0.85. Comell ajusta el polinomio de segundo grado de la mezcla a los datos, obteniendo
y= 11.7x1 +9.4x2 +16.4x3 +19.0x1x2 +ll.4x1x3 9.6x2x3
Puede demostrarse que este modelo es una representación adecuada de la respuesta. Observe que como
'/33 > '/31 > '/32, se concluiría que el componente 3 (polipropileno) produce el hilo con la elongación máxi
ma. Además, puesto que '/312 y '/313 son positivos, la mezcla de los componentes 1y2 o de los componentes
1 y 3 produce valores más altos de la elongación de los que se esperarían si nos limitáramos a promediar
las elongaciones de las mezclas puras. Se trata de un ejemplo de los efectos de mezclado "sinérgicos". Los
componentes 2 y 3 tienen efectos de mezclado antagónicos, ya que 'jJ 23 es negativa.
En la figura 1134 se grafican los contornos de la elongación, lo cual puede ser de utilidad para inter
pretar los resultados. Al examinar la figura, se observa que si se desea la elongación máxima, deberá ele
girse la mezcla de los componentes 1y3, la cual está formada por aproximadamente 80% del componente
3 y 20% del componente l.
.........................................................................
x,
Figura 1134 Contornos de la elongación estimada del

hilo constante en el modelo de segundo orden para la mez
cla del ejemplo 113.
4 78 CAPÍTIJLO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA
Se señaló ya que los diseños símplex reticular y símplex de centroide son diseños de puntos fronte
ra. Si el experimentador quiere hacer predicciones acerca de las propiedades de mezclas completas, se
ría muy deseable contar con más corridas en el interior del símplex. Se recomienda aumentar los
diseños símplex ordinarios con corridas axiales y el centroide global (si el centroide no es ya un punto
del diseño).
El eje del componente i es la recta o rayo que se extiende del punto base r, = 0,x1 = 1/(p1 ), para toda
j ;t: i, al vértice opuesto donde r, = l,x1 =O para todaj ;t: i. El punto base siempre se localizará en el cen
troide de la frontera de (p - 2) dimensiones del diseño símplex que está opuesto al vértice X; = l, x1 = O
para todaj ;t: i. [Ala frontera se le llama en ocasiones el (p2)llano.] La longitud del eje del componente
es una unidad. Los puntos axiales se sitúan sobre los ejes de los componentes a una distancia ~ del cen
troide, El valor máximo de es (p1 )!p. Se recomienda que las corridas axiales se coloquen a la mitad en
á
tre el centroide del diseño símplex y cada vértice para que ~ = (p - 1 )/2p. En ocasiones a estos puntos se
les llama mezclas de verificación axial, porque es una práctica común excluirlas cuando se ajusta el mode
lo preliminar de la mezcla y usar después las respuestas en estos puntos axiales para verificar la adecua
ción del ajuste del modelo preliminar.
En la figura 1135 se muestra el diseño símplex reticular {3, 2} aumentado con los puntos axiales.
Este diseño tiene 10 puntos, con cuatro de ellos en el interior del diseño símplex. La retícula símplex {3,
3} soportará el ajuste del modelo cúbico completo, mientras que la retícula símplex aumentada no lo
hará; sin embargo, la retícula símplex aumentada permitirá al experimentador ajustar el modelo cúbico
especial o agregar al modelo cuadrático términos especiales de cuarto orden, como /3m3x1x2x~. La
retícula símplex aumentada es superior para estudiar la respuesta de mezclas completas en el sentido de
que puede detectar y modelar la curvatura en el interior del triángulo que no puede tomarse en conside
ración por los términos del modelo cúbico completo. La retícula símplex aumentada tiene más potencia
para detectar la falta de ajuste que la retícula {3, 3}. Esto es de particular utilidad cuando el experimenta·
dor no está seguro acerca del modelo apropiado que debe usar y también planea construir un modelo se
cuencialmente empezando con un polinomio simple (quizá de primer orden), probar el modelo para la
Figura 1135 Un diseño símplex reticular aumentado.

falta de ajuste, después aumentar el modelo con términos de órdenes superiores, probar el nuevo modelo
para la falta de ajuste y así sucesivamente.
En algunos problemas de mezclas surgen restricciones sobre los componentes individuales. Las res
tricciones sobre la frontera inferior de la forma
i = 1, 2, ... ,p
son muy coinunes. Cuando sólo están presentes restricciones sobre la frontera inferior, la región factible
del diseño sigue siendo un diseño símplex, pero se inscribe dentro de la región del símplex original. Esta
situación puede simplificarse mediante la introducción de pseudocomponentes, definidos como
, X;-[;
(1126)
x,= (1 ~ 1 1)
x1 +x2 +···+xP
, , 1
=1
por lo que el uso de pseudocomponentes permite utilizar diseños tipo símplex cuando las fronteras infe
riores forman parte de la situación experimental. Las formulaciones especificadas por el diseño símplex
para los pseudocomponentes se transforman en formulaciones para los componentes originales invirtien
do la transformación de la ecuación 1126. Es decir, six~es el valor asignado al pseudocomponente iési
mo en una de las corridas del experimento, el componente iésimo de la mezcla original es
x, = 1, +(1 ~ 1 )x; 1 (1127)
Cuando los componentes tienen restricciones tanto sobre la frontera superior como la inferior, la re
gión factible deja de ser un diseño símplex; será, en cambio, un politopo irregular. Puesto que la región
experimental no tiene una forma "estándar", los diseños generados por computadora son muy útiles para
este tipo de problemas de mezclas.
Ej"El.fPLO 11.-4 · · · · · • · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · • · · • • • ·
Formulación de una pintura
Un experimentador está intentando optimizar la formulación de una pintura automotriz de recubrimien
to total. Se trata de productos complejos que tienen requerimientos de desempeño muy específicos. El
cliente quiere, en particular, que la dureza Knoop exceda de 25 y que el porcentaje de sólidos esté abajo
de 30. El recubrimiento total es una mezcla de tres componentes, que consiste en un monómero (x1), un
entrelazador (x2) y una resina (x3). Existen restricciones sobre las proporciones de los componentes:
x1 +x2 +x3 = 100
5Sx1:S25
25:Sx2 s40
50:S X3 :S 70
El resultado es la región de experimentación restringida ilustrada en la figura 1136. Puesto que la región
de interés no es símplex, se usará un diseño optima! D para este problema. Suponiendo que posiblemente
ambas respuestas serán modeladas con un modelo cuadrático de una mezcla, el diseño optimal D ilustra
Monómero
25.00
45 5.00
Entrelazador Resina
Figura 11·36 La región experimental restringida para

el problema de la formulación de la pintura del ejem
plo 114 (mostrada en la escala real del componente).
Tabla 1114 Diseño optimal D para el problema de la formulación de la

pintura del ejemplo 114
Orden Monómero Entrelazador Resina Dureza Sólidos
estándar Corrida X¡ X2 X3 Y1 Y2
1 2 17.50 32.50 50.00 29 9.539
2 1 10.00 40.00 50.00 26 27.33
3 4 15.00 25.00 60.00 17 29.21
4 13 25.00 25.00 50.00 28 30.46
5 7 5.00 25.00 70.00 35 74.98
6 3 5.00 32.50 62.50 31 31.5
7 6 11.25 32.50 56.25 21 15.59
8 11 5.00 40.00 55.00 20 19.2
9 10 18.13 28.75 53.33 29 23.44
10 14 8.13 28.75 63.13 25 32.49
11 12 25.00 25.00 50.00 19 23.01
12 9 15.00 25.00 60.00 14 41.46
13 5 10.00 40.00 50.00 30 32.98
14 8 5.00 25.00 70.00 23 70.95
115 EXPEIUMENTOS CON MEZCLAS 481
Tabla 1115 Ajuste del modelo para la respuesta dureza
Response: hardness
ANOVA for Mixture Ouadratic Model
Analysis of variance table [Partlal sum of squares]
Sum of Mean F
Model 279.73 5 55.95 2.37 0.1329
Linear Mixture 29. 13 2 14.56 0.62 0.5630
AB 72.61 1 72.61 3.08 0.1174
AC 179.67 1 179.67 7.62 0.0247
BC 8.26 1 8.26 0.35 0.5703
Residual 188.63 8 23.58
Lack oi Fit 63.63 4 15.91 0.51 0.7354
Pure Error 125.00 4 31.25
Cor Total 468.36 13
Coefficient Standard 95o/o CI 95o/o CI
Component Estimate DF Error Low High
AMonomer 23.81 1 3.36 16.07 31.55
8Crosslinker 16.40 1 7.68 1.32 34.12
CResin 29.45 1 3.36 21.71 37.19
AB 44.42 1 25.31 13.95 102.80
AC 44.01 1 15.94 80.78 7.25
BC 13.80 1 23.32 39.97 67.57
Flnal Equatlon In Terms of PseudoComponents:

hardness =
+23.81 *A
+16.40 * B
+29.45 .. e
+44.42 *A• B
44.01 *A* C
+13.80 * B * C
do en la figura 1136 puede generarse utilizando Design-Expert, Se supuso que, además de las seis corridas
requeridas para ajustar el modelo cuadrático de una mezcla, se harían cuatro corridas diferentes adicio
nales para verificar la falta de ajuste y que se harían réplicas de cuatro de estas corridas a fin de proporcio
nar una estimación del error puro. Design-Expert utilizó los vértices, los centros en los bordes, el centroide
global y las corridas de verificación (los puntos localizados a la mitad entre el centroide y los vértices)
como los puntos candidatos.
El diseño con 14 corridas se muestra en la tabla 1114 junto con las respuestas dureza y sólidos. Los re
sultados del ajuste de modelos cuadráticos para ambas respuestas se resumen en las tablas 11~15 y 1116.
Observe.que los modelos cuadráticos se ajustan muy bien tanto a la respuesta dureza como a la respuesta
sólidos. En estas tablas se muestran las ecuaciones ajustadas para ambas respuestas (en términos de los
pseudocomponentes ). En las figuras 1137 y 1138 se muestran las gráficas de contorno de las respuestas.
La figura 1139 es una gráfica de superposición de las dos superficies de respuesta, donde se muestra
el contorno de la dureza Knoop de 25% y el contorno de 30% para los sólidos. La región factible para este
producto es el área sin sombrear cerca del centro de la gráfica. Evidentemente, existen varias elecciones
Tabla 1116 Ajuste del modelo para la respuesta sólidos
Response: solids
ANOVA for Mixture Ouadratic Model
Analysis of variance table IPartial sum of squares)
Sumof Mean F
Source Squares DF Square Value Prob> F
Modal 4297.94 5 859.59 25.78 <0.0001
Linear Mixture 2931.09 2 1465.66 43.95 <0.0001
AB 211.20 1 211.20 6.33 0.0360
AC 285.67 1 285.67 8.57 0.0191
BC 1036.72 1 1036.72 31.09 0.0005
Residual 266.79 8 33.35
Lack of Fit 139.92 4 34.98 1.10 0.4633
Pure Error 126.86 4 31.72
Cor Total 4564.73 13
Coefficient Standard 95%CI 95o/o CI
Component Estlmate DF Error Low High
AMonomer 26.53 1 3.99 17.32 35.74
BCrosslinker 46.60 1 9.14 25.53 67.68
CResin 73.23 1 3.99 64.02 82.43
,,
AB · 75.76 1 30.11 145.19 6.34
AC 55.50 18.96 99.22 11.77
~e 154.61 27.73 218.56 90.67
Final Equation in Terms of P~eudo Components:
solids '='
+26.53 *A
+46.60 * B
+73.23 *e
75.76 *A* B
55.50 *A* C
154.61 * B * C
Monómero
25.00
2
2
45.00 5.00 70.00
Entrelazador Resina
Figura 1137 Gráfica de contorno de la respuesta dureza

Knoop, ejemplo 114.
115 EXPERIMENTOS CON MEZCLAS 483
Monómero
25.00
2
2
45.00 5.00 70.00
Entrelazador Resina
Figura 1138 Gráfica de contorno de la respuesta sólidos,
ejemplo 114.
Monómero
25.00
2
45.00 5.00 70.00

Entrelazador Resina
Figura 11.39 Gráfica de contorno de las respuestas dureza
Knoop y porcentaje de sólidos,donde se indica la región factible
para la formulación de Ja pintura.
para las proporciones del monómero, el entrelazador y la resina para el recubrimiento total que redunda
rá en un producto que satisfaga los requerimientos de desempeño .
.........................................................................
11~6 OPERACIÓNEVOLUTIVA
Personal de investigación y desarrollo aplica con frecuencia la metodología de superficies de respuesta en

operaciones de plantas piloto. Cuando se aplica a un proceso de producción a gran escala, suele hacerse
una sola vez (o con poca frecuencia), ya que el procedimiento experimental es relativamente minucioso.
Sin embargo, las condiciones que fueron óptimas para la planta piloto quizá no lo sean para el proceso a
gran escala. La planta piloto puede producir 2 libras de producto por día, mientras que el proceso a gran
escala puede generar 2000 libras diarias. Esta "escalación" de la planta piloto al proceso de producción a
gran escala da por lo general como resultado la distorsión de las condiciones óptimas. Incluso si la planta
a gran escala empieza a operar en el óptimo, con el tiempo se "desvía" de ese punto debido a las variacio
nes en las materias primas, los cambios ambientales y el personal de operación.
Se requiere un método para el monitoreo y el mejoramiento continuo de un proceso a gran escala
cuyo objetivo sea mover las condiciones de operación hacia el óptimo o después de una "desviación". El
método no deberá requerir cambios grandes o repentinos de las condiciones de operación que pudieran
interrumpir la producción. La operación evolutiva (EVOP, por sus siglas en inglés) fue propuesta por Box
[12c] como un procedimiento de operación con estas características. Está diseñado como un método de
operación rutinaria en la planta que lleva a cabo el personal de manufactura con un mínimo de asistencia
del equipo de investigación y desarrollo.
La EVOP consiste en introducir de manera sistemática pequeños cambios en los niveles de las va
riables de operación bajo consideración. Generalmente se emplea un diseño 2k para hacer esto. Se su
pone que los cambios de las variables son lo suficientemente pequeños para que no ocurran
perturbaciones serias en el rendimiento, la calidad o la cantidad, pero lo suficientemente grandes
para descubrir en última instancia mejoras potenciales en el desempeño del proceso. Se colectan da
tos de las variables de respuesta de interés en cada punto del diseño 2k. Cuando se ha hecho una ob
servación en cada punto del diseño, se dice que se ha completado un ciclo. Entonces pueden
calcularse los efectos y las interacciones de las variables del proceso. Finalmente, después de varios
ciclos, el efecto de una o más variables del proceso o sus interacciones sobre la respuesta puede pare
cer significativo. En este punto se debe tomar una decisión para modificar las condiciones de opera
ción básicas a fin de mejorar la respuesta. Cuando se han detectado las condiciones mejoradas, se
dice que se ha terminado una fase.
Para probar la significación de las variables e interacciones del proceso, se necesita una estimación
del error experimental. Ésta se calcula a partir de los datos del ciclo. Además, el diseño 2k se centra por lo
general en tomo a las mejores condiciones de operación actuales. Mediante la comparación de la res
puesta en este punto con los 2k puntos de la porción factorial, es posible verificar la curvatura o cambio en
la media (CIM, por sus siglas en inglés); es decir, si el proceso en realidad se centra en el máximo, por
ejemplo, entonces la respuesta en el centro deberá ser significativamente mayor que las respuestas en los
puntos periféricos del diseño 2k.
En teoría, la EVOP puede aplicarse a kvariables del proceso. En la práctica es común considerar sólo
dos o tres variables. Se presentará un ejemplo del procedimiento para dos variables. Box y Draper [16a]
ofrecen un estudio detallado del caso de tres variables, incluyendo las formas y hojas de trabajo necesa
rias. Myers y Montgomery (85a] revisan la implementación en computadora de la EVOP.
116 OPERACIÓN EVOLUTIVA 485
84.3 84.9
150
(5) (3)
! 145
(1)
84.5
•
r.:'
(2) (4)
140
84.2 84.5
245 250 255

x1 (ºF)
Figura 11-40 Un diseño 22 para la EVOP.
EJ'EMPLO 11_,5 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Considere un proceso químico cuyo rendimiento es una función de la temperatura (x1) y la presión {x2). Las
condiciones de operación actuales sonz, = 250ºF y x2 = 145 psi. El procedimiento EVOP utiliza el diseño 22
más el punto central mostrado en la figura 1140. El ciclo se completa corriendo cada punto del diseño en
orden numérico (1, 2, 3, 4, 5). Los rendimientos del primer ciclo se muestran también en la figura 1140.
Los rendimientos del primer ciclo se anotan en la hoja de cálculo EVOP, la cual se muestra en la ta
bla 1117. Al término del primer ciclo no puede hacerse ninguna estimación de la desviación estándar.
Tabla 1117 Hoja de cálculo EVOP para el ejemplo 115, n = 1

5 r:;13 Ciclo: n = 1 Fase: 1
2d4 Respuesta: Rendimiento Fecha: 1/11/00
Cálculo de la
desviación
Cálculo de los promedios estándar
Condiciones de operación (1) (2) (3) (4) (5)
(i) Suma del ciclo anterior Suma anterior S =
(ii) Promedio del ciclo anterior Promedio anterior
S=
(iii) Nuevas observaciones 84.5 84.2 84.9 84.5 84.3 Nueva S = rango x
Ís.n =
(iv) Diferencias [(ii) - (iü)] Rango de (iv)=
(v) Nuevas sumas [(i) + (iii)] 84.5 84.2 84.9 84.5 84.3 Nueva suma S =
(vi) Nuevos promedios [Y;= (v)/n] 84.5 84.2 84.9 84.5 84.3 Nuevo promedio S =
NuevasumaS
n-1
Cálculo de los efectos Cálculo de los límites de error
Efecto de la temperatura= t{y3 + y4 -y2 y5) = 0.45 Para el nuevo promedio = Jn S=
Efecto de la presión= t(y3 + Ys -y2 .Y4) = 0.25 2

Efecto dela interacción T x P=t(y2+ y3 -y4 -y5) = 0.15
Para los nuevos efectos .Jñ. S =
1.78
Efecto del cambio en la media= t(J2 + y3 + y4 + y5 4y1) = 0.02 Para el cambio en la media .Jñ. S=

5~3 Ciclo: n 2 = Fase: 1
2 i...:2.-l 4 Respuesta: Rendimiento Fecha: 1/11/00
Cálculo de la
desviación
(i) Suma del ciclo anterior 84.5 84.2 84.9 84.5 84.3 Suma anterior S =
(ii) Promedio del ciclo anterior 84.5 84.2 84.9 84.5 84.3 Promedio anterior S =
(iii) Nuevas observaciones 84.9 84.6 85.9 83.5 84.0 Nueva S = rango x
=
f511 0.60
(iv) Diferencias [(ii) (iii)] 0.4 0.4 1.0 +1.0 0.3 Rango de (iv) = 2.0
(v) Nuevas sumas [(i) + (iii)] 169.4 168.8 170.8 168.0 168.3 Nueva suma S = 0.60
(vi) Nuevos promedios fY; = (v)/n] 84.70 84.40 85.40 84.00 84.15 Nuevo promedio S =
Nueva suma S = 0.60
n1
Efecto de la temperatura = t(.Y 3 + ji 4 ji 2 ji 5) = 0.43 Para el nuevo promedio = ~ S = 0.85

Efecto de la presión= t(y3 + Ys -y2 ji4) = 0.58 Para los nuevos efectos
2
Jñ S = 0.85
Efecto de la interacción T X P = t(.Y2 + ji3 ji4 ji5) = 0.83
Efecto del cambio en la media= t(ji2 + ji3 + ji4 + ji5 4.V1) =

0.17
Para el cambio en la media 1J; S = 0.76
Los efectos y la interacción de la temperatura y la presión se calculan de la manera usual para un di
seño 22•
Después se corre un segundo ciclo y los datos del rendimiento se registran en otra hoja de cálculo
EVOP, la cual se muestra en la tabla 1118. Al final del segundo ciclo, el error experimental puede esti
marse y las estimaciones de los efectos pueden compararse con límites aproximados de 95% (dos desvia
ciones estándar). Observe que el rango se refiere al rango de las diferencias del renglón (iv); por lo tanto,
el rango es + 1.0 (1.0) = 2.0. Puesto que ninguno de los efectos de la tabla 1118 excede sus límites de
error, probablemente el verdadero efecto sea cero, y no se contemplan modificaciones en las condiciones
de operación.
En la tabla 1119 se muestran los resultados de un tercer ciclo. Ahora, el efecto de la presión excede
su límite de error y el efecto de la temperatura es igual al límite de error. Probablemente ahora se justifi
que un cambio en las condiciones de operación.
A la luz de los resultados, parece razonable empezar una nueva fase EVOP alrededor del punto (3).
Por lo tanto, x1 = 225ºF y x2 = 150 psi serían el centro del diseño 22 en la segunda fase.
Un aspecto importante de la EVOP es la retroalimentación de información generada por el proceso
para operadores y supervisores. Esto se consigue mediante un tablero con información EVOP a la vista
de todos. En la tabla 1120 se muestra el tablero de información para este ejemplo al final del ciclo 3 .
.........................................................................
116 OPERACIÓN EVOLUTIVA 487
5~3 Ciclo: n = 3 Fase: 1
2Ó4 Respuesta: Rendimiento Fecha: l/11/00
Cálculo de la
desviación
(i) Suma del ciclo anterior 169.4 168.8 170.8 168.0 168.3 Suma anterior S = 0.60
(ii) Promedio del ciclo anterior 84.70 84.40 85.40 84.00 84.15 Promedio anterior S =
0.60
(iii) Nuevas observaciones 85.0 84.0 86.6 84.9 85.2 =
Nueva S rango x
fs,. = 0.56
(iv) Diferencias [(ii) (iii)] 0.30 +0.40 1.20 0.90 1.05 Rango de (iv)= 1.60
(v) Nuevas sumas [(i) + (iii)] 254.4 252.8 257.4 252.9 253.5 Nueva suma S = 1.16
(vi) Nuevos promedios [Y; = (v)/n) 84.80 84.27 85.80 84.30 84.50 Nuevo promedio S =
Nueva suma S =
0_58
n1
Efecto de la temperatura= t(.Y3 + j/4 y2 -y5) = 0.67 Para el nuevo promedio = j;¡ S = 0.67
Efecto de la presión= t(y3 + Ys y2 y4) = 0.87 2
Efecto de la interacción T x P=t(.Y2+ Y3 -y4 -y5)=
Para los nuevos efectos ..¡¡¡ S = 0.67
0.64
Efecto del cambio enla media
0.07
=t(y2+ y3+ y4+ Ys 4ji1)= Para el cambio en la media 1J! S = 0.60
'Fabla 1120 Tablero de información EVOP, ciclo 3

Respuesta: Rendimiento porcentueí
Requerimiento: MllXimizar
84.60 85.80
150 • •
e
o
] 145 •
84.80
140 • •
84.30
84.27
245 250 265

Temperatura
Límites de error para los promedios: ±0.67

Efectos con 'Iemperatura 0.67 ±0.67
límites de error Presión 0.87 ±0.67
de 95%: TXP 0.64 ±0.67
Cambio en la media 0.07 ±0.60
Desviación estándar 0.58
Tabla 1121 Valores de Ík. n

n= 2 3 4 5 6 7 8 9 10
k =5 0.30 0.35 0.37 0.38 0.39 0.40 0.40 0.40 0.41
9 0.24 0.27 0.29 0.30 0.31 0.31 0.31 0.32 0.32
10 0.23 0.26 0.28 0.29 0.30 0.30 0.30 0.31 0.31
La mayoría de las cantidades de la hoja de cálculo EVOP se obtienen directamente del análisis del di
y -y
seño factorial 2k. Por ejemplo, la varianza de cualquier efecto, como f(Y3 + 5 2 y4), es simplemente cr/n,
donde a2 es la varianza de las observaciones (Y). Por lo tanto, los límites de error de dos desviaciones es
tándar (que corresponden a 95%) para cualquier efecto serían ±2<1/vn. La varianza del cambio en la me
dia es
Por lo tanto, los límites de error de dos desviaciones estándar para el CIM son ±(2v'JJf/3)a!Vii =
±l.78a/Vn.
La desviación estándar a se estima por el método del rango. Sea que y1(n) denote la observación en el
y
punto del diseño iésimo en el ciclo n, y que 1(n) denote el promedio correspondiente de y¡(n) después de
n ciclos. Las cantidades del renglón (iv) de la hoja de cálculo EVOP son las diferenciasy¡(n)y1(n1).La
varianza de estas diferencias es
V[y;(n)-y;(n-1)]= ai, = [1+1]=

a2
(n1)
o? -( n )
n1
El rango de las diferencias, por ejemplo Rn. se relaciona con la estimación de la desviación estándar de las
diferencias por fl D "' Rvfd2• El factor d2 depende del número de observaciones utilizadas para calcular Rv.
Entonces Rv/d2 = frln/(n - 1), por lo que puede usarse
para estimar la desviación estándar de las observaciones, donde k denota el número de puntos que se uti
lizaron en el diseño. Para un diseño 22 con un punto central se tiene k = 5, y para un diseño 23 con un pun
to central se tiene k = 9. Los valores de fk n se dan en la tabla 1121.
117 DISEÑO ROBUSTO
117.1 Antecedentes
A lo largo de este libro se ha hecho hincapié en la importancia del uso de experimentos diseñados estadís
ticamente en el proyecto, desarrollo y mejoramiento de productos y procesos. A partir de la década de
1980, los ingenieros y científicos han adquirido la conciencia creciente de los beneficios del uso de experi
117 DISEÑO ROBUSTO 489
mentos diseñados y, en consecuencia, ha habido muchas áreas de aplicaciones nuevas. Una de las más im
portantes de éstas es el diseño robusto, donde la atención se centra en uno o más de los siguientes puntos:
l. El diseño de sistemas (productos o procesos) que no sean sensibles a factores ambientales que
puedan afectar el desempeño una vez que el sistema se ha desplegado en el campo. Un ejemplo
es la formulación de una pintura para exteriores que debe tener gran duración cuando se expo
nga a una variedad de condiciones climáticas. Puesto que las condiciones climáticas no son del
todo predecibles, y ciertamente no son constantes, el responsable de la formulación del producto
quiere que éste sea robusto contra un amplio rango de factores de temperatura, humedad y pre
cipitación pluvial que afectan el desgaste y acabado de la pintura.
2. El diseño de productos para que no sean sensibles a la variabilidad transmitida por los compo
nentes del sistema. Un ejemplo es el diseño de un amplificador electrónico para que el voltaje de
salida esté tan cerca como sea posible del valor nominal deseado, independientemente de la va
riabilidad de los parámetros eléctricos de los resistores, transistores y fuentes de poder que son
los componentes del aparato.
3. El diseño de procesos para que el producto manufacturado esté tan cerca como sea posible de las
especificaciones nominales, aun cuando sea imposible controlar con toda precisión algunas va
riables del proceso (como la temperatura) o las características de las materias primas.
4. Determinar las condiciones de operación de un proceso para que las características críticas del
producto estén tan cerca como sea posible del valor objetivo deseado y la variabilidad en torno a
este objetivo se minimice. Ejemplos de este tipo de problema ocurren con frecuencia. Uno de
ellos sucede en la manufactura de semiconductores, donde sería deseable que el espesor del óxi
do de una oblea estuviera lo más cerca posible del espesor objetivo promedio, así como que la va
riabilidad del espesor a lo largo de la oblea (una medida de uniformidad) fuese lo más pequeña
posible.
A principios de la década de 1980, el ingeniero japonés Genichi Thguchi introdujo un enfoque para
resolver problemas de este tipo, a los que se hace referencia de manera conjunta como el problema del di
seño paramétrico robusto (RPD, por sus siglas en inglés) (ver Taguchi y Wu [109] y Taguchi [108a, b ]). Su
enfoque se basó en la clasificación de las variables de un proceso o producto como variables de control (o
controlables) y variables de ruido (o no controlables) para después encontrar los ajustes de las variables
controlables que minimizan la variabilidad transmitida a la respuesta por las variables no controlables. Se
establece el supuesto de que aun cuando los factores de ruido no son controlables en el sistema a gran es
cala, pueden controlarse para los fines de un experimento. Referirse a la figura 11 para una ilustración
gráfica de las variables controlables y no controlables en el contexto general de un experimento diseñado.
Taguchi introdujo algunos métodos estadísticos novedosos y ciertas variantes de las técnicas estable
cidas como parte de este procedimiento RPD. Hizo uso de diseños factoriales altamente fraccionados y
otros tipos de diseños fraccionados obtenidos a partir de arreglos ortogonales. Su metodología generó
múltiples debates y controversias. Parte de la polémica surgió porque la metodología de Taguchí fue de
fendida en Occidente inicialmente (y principalmente) por empresarios, y la ciencia estadística subyacente
no había sido revisada adecuadamente por los especialistas. Para finales de la década de 1980, los resulta
dos de una revisión muy completa indicaron que aun cuando los conceptos de ingeniería de Taguchi y el
objetivo global del RPD tenían bases sólidas, había problemas de fondo con esta estrategia experimental
y con los métodos para el análisis de datos. Para detalles específicos de estos temas, ver Box [12d], Box,
Bisgaard y Fung [14], Hunter [59a, b], Montgomery [80b], Myers y Montgomery [85a] y Pignatiello y
Ramberg [94]. Muchas de estas preocupaciones se encuentran resumidas también en el amplio panel de
·· ·· · ·
,...;O'\.:l"t"("')t"\ON\O
NNN o\ ,....: o ..,,;. v) ..,,;. ,....: ..,,;. oó
.<NNNNNNNN
ON<'"lNV"lV"l<'"lN\O
d<i..i..ir..'.N<i..iN
NNNNNNNNN
\OOONO\v\0\0\0t"
o\o\oóoó.....<o\oóo\N
,......_...,......_.Nr-fr-f'!""'"'IN
\O r \O o \O r 00 00 ......
....
·e:oo
(':!,...;,...;
eiei~~~~~~~
~o
O\N\0\0..<00\000<'"l
..2Ol) ..NN o\ o\ v) oó v) o\ ..i \Ó r..'.
._.. .............. .....-fN'P"""'INT"'"'IT"'"'I

~
.o
..N.. °'""'""""°'""""º""'"
1.0o\o\ooo\ooóv)o\
....... .,....... .,....... ,...... "-' N
. . . ., .,
.......i .......i r-f
V"lt"'!C:"<t:~"!~~O)
: \O \O r 00 \O
.... ~ .........................................
°' °'
11""""1
V)
'11""""( """""'
\OO<'"l<'"ll'N"<:l"N.<
.................. v) v) \Ó oci o\ \Ó \Ó ..,,;. \Ó
....... ,...-1 ....... .,...... ............................ """""
....
o
·i::
Q) ~ ~ íj
><Q)
~
o
<.)
g
s
.S
B
i:: ....
s .9
....o
"'
...9t>J)
~
.5
o
"'
i::
o
"5b
u
~
...,
~ '::!
s
'Q)
"'tao.
o
·=
~
Q)
o
N
~
....
....
~
"'
Fi
490
discusión publicado en Technometrics (ver Nair, et al. [86]). En el material suplementario del texto de este
capítulo también se comentan e ilustran muchos de los problemas implícitos en los métodos técnicos de
Taguchi.
La metodología de 'Iaguchi para el problema RPD gira en tomo al uso de un diseño ortogonal para
los factores controlables, el cual se "cruza" con un diseño ortogonal separado para los factores de ruido.
En la tabla 1122 se presenta un ejemplo de Byrne y Tuguchi [23] que trata del desarrollo de un método
para ensamblar un conector elastométrico en un tubo de nylon que produciría la fuerza de separación re
= =
querida. Hay cuatro factores controlables, cada uno con tres niveles (A interferencia, B espesor de la
= =
pared del conector, C profundidad de inserción y D porcentaje de adhesivo), y tres factores de ruido
o no controlables (E = tiempo de acondicionamiento, F = temperatura de acondicionamiento y G hu =
medad relativa del acondicionamiento). El panel a de la tabla 1122 contiene el diseño para los factores
controlables. Observe que se trata de un diseño factorial fraccionado de tres niveles; específicamente, es
un diseño 342• 'Iaguchi lo llama el diseño de arreglo interior. El panelb de la tabla 1122 contiene un dise
ño 23 para los factores de ruido, al que Taguchi llama el diseño de arreglo exterior. Entonces se realiza
cada corrida del arreglo interior para todas las combinaciones de tratamientos del arreglo exterior, pro
duciéndose las 72 observaciones de la fuerza de separación que se muestran en la tabla. A este tipo de di
seño se le llama diseño de arreglo cruzado.
Taguchi sugirió que los datos de un experimento de arreglo cruzado se resumieran con dos estadís
ticos: el promedio de cada observación en el arreglo interior para todas las corridas del arreglo exterior
y un resumen de estadísticas que intentaba combinar información acerca de la media y la varianza, lla
mado relación señal a ruido, Las relaciones señal a ruido se definen a propósito para que un valor máxi
mo de la relación minimice la variabilidad transmitida por las variables de ruido. Entonces se lleva a
cabo un análisis para determinar cuáles son los ajustes de los factores controlables que dan como resul
tado 1) una media tan próxima como sea posible al objetivo deseado y 2) un valor máximo de la relación
señal a ruido.
El examen de la tabla 1122 revela un problema importante con la estrategia de diseño de 'Iaguchi; a
saber, el enfoque del arreglo cruzado llevará a un experimento muy grande. En el ejemplo tratado aquí
sólo hay siete factores, pero el diseño tiene 72 corridas. Además, el diseño de arreglo interno es un diseño
342 de resolución 111 (ver el capítulo 9 para un estudio de este diseño), por lo que a pesar del gran número
de corridas, no es posible obtener ninguna información acerca de las interacciones entre las variables con
trolables. De hecho, incluso la información acerca de los efectos principales está potencialmente corrom
pida, ya que los efectos principales tienen estrechas relaciones de alias con las interacciones de dos
factores. Ocurre también que las relaciones señal a ruido de 'Iaguchi son problemáticas; al maximizarse la
relación no se minimiza necesariamente la variabilidad. Referirse al material complementario del texto
para mayores detalles.
Un punto importante acerca del diseño de arreglo cruzado es que sí proporciona información acerca
de las interacciones factor controlable x factor de ruido. Estas interacciones son cruciales para la solu
ción de un problema RPD. Por ejemplo, considere las gráficas de las interacciones de dos factores de la fi
gura 1141, donde x es el factor controlable y z el factor de ruido. En la figura 1141a no hay ninguna
interacciónx x z; por lo tanto, no hay ningún valor de la variable controlablex que afecte la variabilidad
transmitida a la respuesta por la variabilidad enz. Sin embargo, en la figura 1141b hay una fuerte interac
ciónx x z. Observe que cuandox se pone en el nivel bajo, hay mucho menos variabilidad en la variable de
respuesta que cuandox está en el nivel alto. Por lo tanto, a menos que haya como mínimo una interacción
factor controlable x factor de ruido, no hay ningún problema de diseño robusto. Como se verá en la si
guiente sección, enfocarse en la identificación y el modelado de estas interacciones es una de las claves de
un enfoque más eficiente y eficaz del RPD.
y
r m +La variabilidad -----------X;+
eny
se reduce 1
cuandor ; 1
1
1
1
! =,;:.;::.=:.;:.~~1
........ X"' -
z z
a) Ninguna interacción control x ruido b) Interacción control x ruido significativa
Figura 1141 El papel de la interacción control X ruido en un diseno robusto.
117.2 El enfoque de la superficie de respuesta para el diseño robusto

Como se señaló en la sección anterior, las interacciones entre los factores controlables y los de ruido son
la clave en un problema de diseño robusto. Por lo tanto, es lógico usar un modelo de respuesta que incluya
tanto a los factores controlables como a los factores de ruido y sus interacciones. Para ilustrar, suponga
que se tienen dos factores controlablesx, y x2 y un solo factor de ruido z1. Se supone que tanto los factores
controlables como el de ruido se expresan como las variables codificadas usuales (es decir, tienen su cen
tro en cero y tienen límites inferior y superior ±a). Si quiere considerarse un modelo de primer orden que
incluya las variables controlables, un modelo lógico es
(1128)
Observe que este modelo incluye los efectos principales de ambos factores controlables, su interacción, el
efecto principal de la variable de ruido y las dos interacciones entre las variables controlables y la de rui
do. A este tipo de modelo, el cual incorpora a las variables controlables y las de ruido, suele llamársele
modelo de respuesta o de reacción. Excepto cuando al menos uno de los coeficientes de regresión <'.511 y <'.521
sea diferente de cero, no habrá ningún problema de diseño robusto.
Una ventaja importante del enfoque del modelo de respuesta es que tanto los factores controlables
como los factores de ruido pueden colocarse en un solo diseño experimental; es decir, puede evitarse la
estructura de los arreglos interior y exterior del enfoque de Taguchi. Al diseño que contiene tanto los fac
tores controlables como los de ruido suele llamársele diseño de arreglo combinado.
Como se señaló anteriormente, se supone que las variables de ruido son aleatorias, aun cuando son
controlables para los fines de un experimento. Específicamente, se supone que las variables de ruido es
tán expresadas en unidades codificadas, que tienen valor esperado cero, varianza a~, y que si hay varias
variables de ruido, tienen covarianzas cero. Bajo estos supuestos es sencillo encontrar un modelo para la
respuesta media tomando el valor esperado de y en la ecuación 1128. Se obtiene así
donde el subíndicez del operador expectativa es un recordatorio para tomar el valor esperado con respec
to a ambas variables aleatorias de la ecuación 1128, z, y f. Para encontrar un modelo de la varianza de la
respuesta y se usa el enfoque de la transmisión del error. Primero, el modelo de respuesta de la ecuación
1128 se expande en una serie de Taylor de primer orden alrededor de z1 = O. Se obtiene así
Y = y z;O + dz
dy (z1 -O)+R+t
1
S f3o +/31X1 +/32X2 +f312X1X2

+(Y1 +óux1 +ó21X2 )z1 + Rs-«
donde R es el término del residuo de la serie de Tuylor. Como es común en la práctica, se ignorará el tér
mino del residuo. Ahora puede obtenerse la varianza de y aplicando el operador varianza en esta última
expresión (sin R). El modelo para la varianza resultante es
V, (y)= a~ (y 1 +ó11x1 +ó21x2 )2 +o"
De nueva cuenta se ha usado el subíndice z en el operador varianza como recordatorio de que tanto z,
como E son variables aleatorias.
Se han derivado modelos simples para la media y la varianza de la variable de respuesta de interés.
Observe lo siguiente:
l. Los modelos de la media y la varianza incluyen únicamente las variables controlables. Esto signi
fica que es potencialmente posible fijar las variables controlables para alcanzar un valor objetivo
de la media y minimizar la variabilidad transmitida por la variable de ruido.
2. Aun cuando en el modelo de la varianza intervienen sólo las variables controlables, incluye asi
mismo los coeficientes de regresión de la interacción entre las variables controlables y la de ruido.
Es así como la variable de ruido influye en la respuesta.
3. El modelo de la varianza es una función cuadrática de las variables controlables.
4. El modelo de la varianza (dejando de lado a2) es sólo el cuadrado de la pendiente del modelo de
respuesta ajustado en la dirección de la variable de ruido.
Para dar un uso operacional a estos modelos sería necesario:
l. Realizar un experimento y ajustar un modelo de respuesta apropiado, tal como la ecuación

1128.
2. Sustituir los coeficientes de regresión desconocidos en los modelos de la media y la varianza con
sus estimaciones de mínimos cuadrados del modelo de la respuesta o de reacción, y sustituir la a2
del modelo de la varianza con el cuadrado medio de los residuales que se encontró cuando se
ajustó el modelo de respuesta.
3. Optimizar los modelos de la media y la varianza utilizando los métodos estándares de optimiza
ción de respuestas múltiples revisadas en la sección 113.4.
Es muy sencillo generalizar estos resultados. Suponga que hay kvariables controlables y rvariables de
ruido. El modelo de respuesta general que incluye estas variables se escribirá como
>{x, z) = /(x)+h(x, z)+E (1129)
donde /(x) es la porción del modelo que incluye sólo las variables controlables y h(x, z) son los términos
que incluyen los efectos principales de los factores de ruido y las interacciones entre los factores controla
bles y los de ruido. De manera típica, la estructura de h(x, z) es
494 CAPÍTT.TLO 11 MÉTODOS DE SUPERFICIESDE RESPUESTA
La estructura de f(x) dependerá de cuál sea el tipo de modelo que el experimentador considere apropiado
para las variables controlables. Las elecciones lógicas son el modelo de primer orden con interacción y el
modelo de segundo orden. Si se supone que las variables de ruido tienen media cero, varianza y cova a;
rianzas cero, y que las variables de ruido y los errores aleatorios e tienen covarianzas cero, entonces el mo
delo de la media para la respuesta es
Ez[y(x, z)]= /(x) (1130)
y el modelo de la varianza para la respuesta es
Vz[}(x, z)]=a;~ [~~¡ z)r +a2 (1131)
Myers y Montgomery [85a] presentan una forma un tanto más general de la ecuación 1131 basada en la
aplicación directa de un' operador de varianza condicional al modelo de respuesta.
EJEMPLO 11-6 · · · · · • · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Para ilustrar el procedimiento anterior, considere nuevamente el ejemplo 62 en el que se estudiaron cua
tro factores en un diseño factorial 24 para investigar su efecto sobre la rapidez de filtración de un producto
químico. Se supondrá que el factor A, la temperatura, es difícil de controlar en el proceso a gran escala,
pero que puede controlarse durante el experimento (el cual se llevó a cabo en una planta piloto). Los
otros tres factores, la presión (B), la concentración (C) y la velocidad de agitación (D), son fáciles de con
trolar. Por lo tanto, el factor de ruido z¡ es la temperatura, y las variables controlablesx., x2 y x3 son la pre
sión, la concentración y la velocidad de agitación, respectivamente. Puesto que tanto los factores
controlables como el factor de ruido están en el mismo diseño, el diseño factorial 24 utilizado en este ex
perimento es un ejemplo de un diseño de arreglo combinado.
Utilizando los resultados del ejemplo 62, el modelo de respuesta es
5( X, Z¡ ) 70. 06 + (21.625)
2 Z¡ + (9.875)
2 X2 + (14.625)
2 X3
18.125)
(2 X2Z1 + (16.625)
2 X3Z1
= 70.06+10.81z +4.94x1 2 +7.3lx3 9.06x2z1 +8.3lx3z1
Utilizando las ecuaciones 1130 y 1131, se encuentra que los modelos de la media y la varianza son
E.[}(x, z1)]= 70.06+4.94x2 +7.3lx3
y
Vz[}(x, z1)]= a;(10.819.06x2 +8.31x3 )2 +a2
=a;(l16.91+82.0~i +69.06xi195.8~2
+179.66x3 150.5~2X3)+a2
respectivamente. Suponga ahora que los niveles bajo y alto de la variable de ruido, temperatura, se corrie
ron a una desviación estándar a ambos lados de su valor típico o promedio, de tal modo que = 1, y que a;
se usa ú2 = 19.51 (éste es el cuadrado medio de los residuales obtenido al ajustar el modelo de respuesta).
Por lo tanto, el modelo de la varianza queda como
Vz[y(x, z1)]= 136.42195.8~2 +179.66x3 150.5~2x3 +82.o&; +69.06xi
117 DISEÑOROBUSTO 495
0.500
e
:2
~
e:
fl
e
0.000
e
u
11
>t"'
().500
1.000 ..._ ..____...._ ........ _.

1.000 0.500 0.000 0.500 1.000
"• = Velocidad de agitación
Figura 1142 Contornos del índice de filtración medio constante, ejemplo 116,
=
con x1 temperatura = O.
En la figura 1142 se presenta la gráfica de contorno del paquete de software Design-Expert de los
contornos de respuesta del modelo de la media. Para construir esta gráfica se fijó el factor de ruido (tem
peratura) en cero y el factor controlable no significativo (presión) también en cero. Observe que la rapi
dez de filtración promedio se incrementa cuando tanto la concentración como la velocidad de agitación
se incrementan. Design-Expert constituirá también de manera automática gráficas de la raíz cuadrada de
los contornos de la varianza, que denomina propagación del error (o POE, por sus siglas en inglés). Evi
dentemente, la POE no es sino la desviación estándar de la variabilidad que se transmite a la respuesta
como una función de las variables controlables. En la figura 1143 se muestra la gráfica de contorno y la
gráfica de superficie de respuesta tridimensional de la POE, obtenida con Design-Expert (en esta gráfica
la variable de ruido se mantiene constante en cero, como se explicó anteriormente).
Suponga que el experimentador quiere mantener una rapidez de filtración promedio de cerca de 75 y
minimizar la variabilidad alrededor de este valor. En la figura 1144 se muestra una gráfica de superposi
ción de los contornos de la rapidez de filtración media y la POE como una función de la concentración y la
velocidad de agitación, las variables controlables significativas. Para conseguir los objetivos deseados será
necesario mantener la concentración en el nivel alto y la velocidad de agitación muy cerca del nivel inter
medio .
. . . . . . . . . . . . . . . . . . . . . . ., .
El ejemplo 116 ilustra el uso de un modelo de primer orden con interacción como el modelo para los
factores controlables,/(x). Se presenta ahora un ejemplo adaptado de Montgomery [80b] que incluye un
modelo de segundo orden.
0.50
e:
•O
·¡¡
E
E
~
c: o.oo
o
(.J
....
11
1.00 'A'''''....,j....C:'
1.00 0.50 0.00 o.so 1.00
x4 = Velocidad de agitación
a) Gráfica de contorno
28.5315
22.5032
16.4748
:.?, 10.4465
w
ir 4.41816
bJ Gráfica de superficie de respuesta
Figura 1143 Gráfica de contorno y superficie de respuesta de la propagación del error

(POE) en el ejemplo 11.6, con x1 = temperatura = O.
ll7 DISEÑO ROBUSTO 497
1.00
0.50
e
o
~
.b
i
:!1o O.DO
(,,)
.".,
0.50
1.00
1.00 0.50 O.DO 0.50 1.00
Concentración "• Velocidad de agitación
Figura 1144 Gráfica de superposición de los contornos de la media y la POE del
índice de filtración, ejemplo 116, con x1 = temperatura = O.
EJEMPLO 11~7 · · · · · · · · · · · · · · · · · · · • • • • • • · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
En una fábrica de semiconductores se realizó un experimento que incluyó dos variables controlables y tres
variables de ruido. En la tabla 1123 se muestra el diseño de arreglo combinado utilizado por los experimen
tadores. El diseño es una variante de 23 corridas de un diseño central compuesto que se creó empezando
con un DCC estándar para cinco factores (la porción del cubo es un diseño 25 1) y eliminando las corridas
axiales asociadas con las tres variables de ruido. Este diseño soportará un modelo de respuesta que tiene un
modelo de segundo orden en las variables controlables, los efectos principales de las tres variables de ruido
y las interacciones entre los factores controlables y los de ruido. El modelo de respuesta ajustado es
Y(x, z)= 30.372.92x1 4.13x2 +260x¡ +2.18x; +2.87x1x2
+2.73z1 2.33z2 +233z3 0.27x1z1 +0.89x1z2 +2.58x1z3
+2.0lx2z1 l.43x2z2 +l.56x2z3
Los modelos de la media y la varianza son
E, [y(x, z)] = 30.37 2.92x1 4.13x2 + 2.60x12 + 218x; + 2.87x1x2
y
V,[y(x, z)]= 19.26+3.20x1 +12.45x2 +7.52x? +8.52xi +2.2lx1x2
donde se han sustituido las estimaciones de los parámetros del modelo de respuesta ajustado en las ecua
ciones de los modelos de la media y la varianza y, como en el ejemplo anterior, se supone que a~= l. En
las figuras 1145y1146 se presentan las gráficas (de Design-Expeny de contorno de la media y la POE del
proceso (recuerde que la POE es la raíz cuadrada de la varianza de la superficie de respuesta) generadas a
partir de estos modelos.
498 CAPÍTIJLO 11 · MÉTODOS DE SUPERFICIES DE RESPUESTA
Tabla 11·23 Experimento de arreglo combinado con dos variables controlables y tres variables de ruido, ejemplo 11 7
Número de corrida X¡ Xi Z¡ Zz Z3 y
1 1.00 1.00 1.00 1.00 1.00 44.2
2 1.00 1.00 1.00 1.00 1.00 30.0
3 1.00 1.00 1.00 1.00 1.00 30.0
4 1.00 1.00 1.00 1.00 1.00 35.4
5 1.00 1.00 1.00 1.00 1.00 49.8
6 1.00 1.00 1.00 1.00 1.00 36.3
7 1.00 1.00 1.00 1.00 1.00 41.3
8 1.00 1.00 1.00 .;..1.00 1.00 31.4
9 1.00 1.00 1.00 1.00 1.00 43.5
10 1.00 1.00 1.00 1.00 1.00 36.1
11 1.00 1.00 1.00 1.00 1.00 22.7
12 1.00 1.00 1.00 1.00 1.00 16.0
13 1.00 1.00 1.00 1.00 1.00 43.2
14 1.00 1.00 1.00 1.00 1.00 30.3
15 1.00 1.00 1.00 1.00 1.00 30.1
16 1.00 1.00 1.00 1.00 1.00 39.2
17 2.00 0.00 0.00 0.00 0.00 46.1
18 2.00 0.00 0.00 0.00 0.00 36.1
19 O.DO 2.00 0.00 0.00 0.00 47.4
20 0.00 2.00 0.00 O.DO O.DO 31.5
21 0.00 0.00 0.00 0.00 0.00 30.8
22 0.00 0.00 0.00 0.00 0.00 30.7
23 0.00 0.00 0.00 0.00 O.DO 31.0
0.50
..... 0.00
0.50
1.00 .__ _ _,.,_ _ __......._ '""""" ___.

1.00 0.50 0.00 0.50 1.00
Figura 1145 Gráfica de contorno del modelo de la media, ejemplo 117.

117 DISEÑOROBUSTO 499
0.50
~.. 0.00
0.50
1.00 L...LL'i"'
1.00 o.so 0.00 0.50 1.00
Figura 1146 Gráfica de contorno de la POE, ejemplo 117.
1.00
0.50
"... 0.00
o.so
1.00
1.00 o.so 0.00 ·o.50 1.00
Figura 1147 Superposición de los contornos de la media y la POE para el ejem

plo 117, con la región en blanco indicando condiciones de operación satisfactorias
para la media y la varianza.
500 CAPÍTUl,O 11 MÉTODOS DE SUPERFICIESDE RESPUESTA
En este problema es deseable mantener la media del proceso abajo de 30. Al inspeccionar las figuras
1145y1146, es claro que se necesitará hacer un ajuste si se quiere hacer pequeña la varianza del proce
so. Puesto que sólo hay dos variables controlables, una forma lógica de llegar a este arreglo es superponer
los contornos de la respuesta media constante y la varianza constante, como se muestra en la figura 1147.
Esta gráfica muestra los contornos para los que la media del proceso es menor o igual que 30 y la desvia
ción estándar del proceso es menor o igual que 5. La región delimitada por estos contornos representaría
una zona de operación típica de respuesta media baja y varianza del proceso baja.
11~8 PROBLEMAS
1.l1. En una planta química se produce oxígeno licuando aire y separándolo por destilación fraccionada en sus ga
ses componentes. La pureza del oxígeno es una función de la temperatura del condensador principal y de la
relación de la presión entre las columnas superior e inferior. Las condiciones de operación actuales son tem
peratura (.;1) = 220ºC y la relación de la presión (.;2) = 1.2. Utilizando los datos siguientes, encontrar la tra
yectoria del ascenso más pronunciado:
Tumperatura (.;1) índice de la presión (.;2) Pureza

225 1.l 82.8
225 1.3 83.5
215 1.1 84.7
215 1.3 85.0
220 l.2 84.1
220 1.2 84.5
220 1.2 83.9
220 1.2 84.3
112. Un ingeniero industrial ha desarrollado un modelo de simulación por computadora para un sistema de in
ventario de dos artículos. Las variables de decisión son la cantidad del pedido y el punto de reorden de cada
artículo. La respuesta que debe minimizarse es el costo total del inventario. El modelo de simulación se usa
para producir los datos que se muestran en la tabla siguiente. Identificar el diseño experimental. Encontrar
la trayectoria del descenso más pronunciado.
Artículo 1 Artículo 2
Cantidad del Punto de Cantidad del Punto de Costo
pedido (.;1) reorden {.;2) pedido (.;3) reorden (.;4) total
100 25 250 40 625
140 45 250 40 670
140 25 300 40 663
140 25 250 80 654
100 45 300 40 648
100 45 250 80 634
100 25 300 80 692
140 45 300 80 686
120 35 275 60 680
120 35 275 60 674
120 35 275 60 681
118 PROBLEMAS 501
113. Verificarque el siguiente diseño es símplex.Ajustar el modelo de primer orden y encontrar la trayectoria del
ascenso más pronunciado.
X¡ Xz y
o .fi 1 18.5
-.fi o 1 19.8
o -.fi 1 17.4
.fi o 1 22.5
114. Para el modelo de primer orden
encontrar la trayectoria del ascenso más pronunciado. Las variables están codificadascomo 1 s X; s l.
115. La región de experimentación de tres factores son el tiempo ( 40 s T1 s 80 min), la temperatura (200 s T2 s
300ºC)y la presión (20 s P s 50 psig). Se ha ajustado un modelo de primer orden en variables codificadasa
los datos del rendimiento de un diseño 23• El modelo es
lEl punto T1 = 85, T2 = 325, P == 60 está en la trayectoria del ascenso más pronunciado?
116. La región de experimentación de dos factores son la temperatura (100 !O T::;; 300ºF) y la velocidad de ali
mentación del catalizador (10 s C s 30 lb/pulg), Un modelo de primer orden con las variables codificadas
usuales ±1 se ha ajustado a la respuesta peso molecular, obteniéndose el modelo siguiente:
y= 2000+125x1 +40x2
a) Encontrar la trayectoria del ascenso más pronunciado.

b) Se desea mover a una región donde los pesos moleculares rebasen 2500.Con base en la información que
se tiene por la experimentaciónen esta región, laproximadamente cuántos pasos en la trayectoria del as
censo más pronunciado se necesitan para moverse a la región de interés?
117. La trayectoria del ascenso más pronunciado suele calcularse suponiendo que el modelo es en realidad de pri
mer orden; es decir, que no hay interacción. Sin embargo, incluso si hay interacción, el ascenso más pronun
ciado que se determina ignorando la interacción seguirá produciendo por lo general buenos resultados. Para
ilustrar, suponga que se ha ajustado el modelo
utilizando variables codificadas (1 s X; s +l).

a) Trazar la trayectoria del ascenso más pronunciado que se obtendría si se ignorara la interacción.
b) Trazar la trayectoria del ascenso más pronunciado que se obtendría incluyendola interacción en el mo
delo. Compararla con la trayectoria que se encontró en el inciso a.
118. Los datos que se muestran en la siguiente tabla se recolectaron en un experimento para optimizar el creci
miento de un cristal como una función de tres variablesx1, x2 yx3• Son deseables los valores grandes de y (ren
dimiento en gramos). Ajustar un modelo de segundo orden y analizar la superficie ajustada. lBajo qué
conjunto de condiciones se alcanza el crecimiento máximo?
X¡ Xz X3 y
-1 1 -1 66
-1 -1 1 70
-1 1 1 78
-1 1 1 60
1 -1 -1 80
1 1 1 70
1 1 1 100
1 1 1 75
-1.682 o o 100
1.682 o o 80
o -1.682 o 68
o 1.682 o 63
o o -1.682 65
o o 1.682 82
o o o 113
o o o 100
o o o 118
o o o 88
o o o 100
o o o 85
119. Un ingeniero químico recolectó los siguientes datos. La respuesta y es el tiempo de filtración, x1 es la tempe
ratura y x2 es la presión. Ajustar un modelo de segundo orden.
X¡ Xz y
-1 1 54
-1 1 45
1 -1 32
1 1 47
-1.414 o 50
1.414 o 53
o -1.414 47
o 1.414 51
o o 41
o o 39
o o 44
o o 42
o o 40
a) lQué condiciones de operación se recomendarían si el objetivo es minimizar el tiempo de filtración?

b) lQué condiciones de operación se recomendarían si el objetivo es operar el proceso con una velocidad
de filtración media muy próxima a 46?
1110. El diseño hexagonal que se presenta a continuación se usa en un experimento que tiene como objetivo ajus
tar un modelo de segundo orden:
118 PROBLEMAS 503
X¡ X2 y
1 o 68
0.5 .J0.75 74
--0.5 .J0.75 65
1 o 60
--0.5 .JU75 63
0.5 -.J0.75 70
o o 58
o o 60
o o 57
o o 55
o o 69
a) Ajustar el modelo de segundo orden.

b) Efectuar el análisis canónico. lQué tipo de superficie se ha encontrado?
e) lQué condiciones de operación para x1 y Xi llevan al punto estacionario?
d) lDónde se correría este proceso si el objetivo es obtener una respuesta que esté tan cerca de 65 como sea
posible?
1111. Un experimentador corrió un diseño de BoxBehnken y obtuvo los siguientes resultados, donde la variable
de respuesta es la viscosidad de un polímero:
Velocidad de
Nivel Tumperatura agitación Presión X¡ X2 X3
Alto 200 10.0 25 +1 +1 +1

Intermedio 175 7.5 20 o o o
Bajo 150 5.0 15 -1 -1 -1
Corrida X¡ X2 X3 Y1
1 -1 -1 o
535
2 +1 -1 o
580
3 -1 +1 o
596
4 +1 +1 o
563
5 1 o -1 645
6 +1 o -1 458
7 -1 o +1 350
8 +1 o +1 600
9 o -1 -1 595
10 o +1 1 648
11 o -1 +1 532
12 o +1 +1 656
13 o o o 653
14 o o o 599
15 o o o 620
a) Ajustar el modelo de segundo orden.

b) Efectuar el análisis canónico. lQué tipo de superficie se ha encontrado?
e) óOué condiciones de operación para X¡, x2 y x3 llevan al punto estacionario?

d) ¿Qué condiciones de operacióri se recomendarían si es importante obtener una viscosidad que esté tan
cerca de 600 como sea posible?
1112. Considere el diseño central compuesto de tres variables que se muestra a continuación. Analizar los datos y
sacar conclusiones, suponiendo que se quiere maximizar la conversión {»1) con la actividad {»2) entre 55 y 60.
Conversión
Tiempo Temperatura Catalizador (%) Actividad
Corrida (min) (°C) (%) Y1 Y2
1 1.000 1.000 1.000 74.00 53.20
2 1.000 1.000 1.000 51.00 62.90
3 1.000 1.000 1.000 88.00 53.40
4 1.000 1.000 1.000 70.00 62.60
5 1.000 1.000 1.000 71.00 57.30
6 1.000 1.000 1.000 90.00 67.90
7 1.000 1.000 1.000 66.00 59.80
8 1.000 1.000 1.000 97.00 67.80
9 0.000 0.000 0.000 81.00 59.20
10 0.000 0.000 0.000 75.00 60.40
11 0.000 0.000 0.000 76.00 59.10
12 0.000 0.000 0.000 83.00 60.60
13 1.682 0.000 0.000 76.00 59.10
14 1.682 0.000 0.000 79.00 65.90
15 0.000 1.682 0.000 85.00 60.00
16 0.000 1.682 0.000 97.00 60.70
17 0.000 0.000 1.682 55.00 57.40
18 0.000 0.000 1.682 81.00 63.20
19 0.000 0.000 0.000 80.00 60.80
20 0.000 0.000 0.000 91.00 58.90
1113. Un fabricante de herramientas de corte ha desarrollado dos ecuaciones empíricas para la vida de la herra
mienta en horas {»1) y para el costo de la herramienta en dólares (»2). Ambos modelos son funciones lineales
de la dureza del acero (x1) y de la fecha de fabricación (x2). Las dos ecuaciones son
y1=10+5x1 +2x2
y2 = 23+ 3x1 + 4x2
y ambas ecuaciones son válidas en el rango1.5 5' X¡ :5 1.5. El costo unitario de la herramienta debe estar aba
jo de $27.50 y la vida debe exceder 12 horas para que el producto sea competitivo. ¿Existe algún conjunto de
condiciones de operación factible para este proceso? lDónde se recomendaría correr este proceso?
1114. Se corre un diseño central compuesto en un proceso de deposición química por vapor y se obtienen los datos
experimentales que se muestran a continuación. Se procesaron simultáneamente cuatro unidades experi
mentales en cada corrida del diseño, y las respuestas son la media y la varianza del espesor, calculadas en las
cuatro unidades.
118 PROBLEMAS 505
X¡ X2 y s2
1 1 360.6 6.689
1 1 445.2 14.230
1 1 412.1 7.088
1 1 601.7 8.586
1.414 o 518.0 13.130
1.414 o 411.4 6.644
o 1.414 497.6 7.649
o 1.414 397.6 11.740
o o 530.6 7.836
o o 495.4 9.306
o o 510.2 7.956
o o 487.3 9.127
a) Ajustar un modelo a la respuesta media. Analizar los residuales.

b) Ajustar un modelo a la respuesta varianza. Analizar los residuales.
e) Ajustar un modelo a ln(s2). i.Este modelo es superior al que se encontró en el inciso b?
d) Suponga que se quiere que el espesor medio esté en el intervalo 450 ± 25. Encontrar un conjunto de con
diciones de operación que consiga este objetivo y que al mismo tiempo minimice la varianza.
e) Comentar los aspectos de la minimización de la varianza del inciso d. lSe ha minimizado también la va
rianza total del proceso?
1115. Verificar que el diseño de primer orden ortogonal es también un diseño de primer orden rotable.
1116. Demostrar que aumentar un diseño 2k con ne puntos centrales no afecta las estimaciones de{J; (i = 1, 2, ... , k),
pero que la estimación de la ordenada al origen {10 es el promedio de las 2k + ne observaciones.
1117. El diseño central compuesto rotable. Puede demostrarse que un diseño de segundo orden es rotable si
I::~
1x:x~. =O si a o b (o ambas) son impares y si I:~.x~ = 3I:.1x;.x; •. Demostrar que para el diseño central
compuesto estas condiciones llevan a a= (np)ll4 para la rotabilidad, donde n» es el número de puntos en la
porción factorial.
1118. Verificar que el diseño central compuesto que se muestra abajo está separado en bloques ortogonales:

X¡ Xz X3 X¡ X2 X3 X¡ Xz X3
o o o o o o 1.633 o o
o o o o o o 1.633 o o
1 1 1 1 1 1 o 1.633 o
1 1 1 1 1 1 o 1.633 o
1 1 1 1 1 1 o o 1.633
1 1 1 1 1 1 o o 1.633
o o o
o o o
1119. Formación de bloques del diseño central compuesto. Considere un diseño central compuesto para k = 4 varia
bles en dos bloques. i.Puede encontrarse siempre un diseño rotable formado de bloques ortogonales?
1120. i.Cómo puede correrse un diseño hexagonal en dos bloques ortogonales?
1121. En la tabla siguiente se muestra el rendimiento durante los cuatro primeros ciclos de un proceso químico.
Las variables son el porcentaje de concentración (x1) en los niveles 30, 31y32 y la temperatura (x2) en 140,
142 y 144ºF. Hacer el análisis utilizando métodos EVOP.
Condiciones
Ciclo (1) (2) (3) (4) (5)
1 60.7 59.8 60.2 64.2 57.5
2 59.1 62.8 62.5 64.6 58.3
3 56.6 59.1 59.0 62.3 61.1
4 60.5 59.8 64.5 61.0 60.1
1122. Suponga que se aproxima una superficie de respuesta con un modelo de orden d1, tal como y= X/J1 +e,
cuando la verdadera superficie está descrita por un modelo de orden d2 > d1; es decir, E(y) = X/J1 + X/J2.
a) Demostrar que los coeficientes de regresión son sesgados, es decir, que E<}J1) = fJ1 + A{J2, donde A=
(X1¡X1)1X1¡X2. Es común llamar a A la matriz alias.
b) Si d1 = 1 y d2 = 2, y se utiliza un diseño 2k completo para ajustar el modelo, usar el resultado del inciso a
para determinar la estructura de los alias.
e) Si d1 = 1, d2 = 2 y k = 3, encontrar la estructura de los alias, suponiendo que se usa un diseño 231 para
ajustar el modelo.
= = =
d) Si d, 1, d2 2 y k 3, y se utiliza el diseño símplex del problema 113 para ajustar el modelo, determi
nar la estructura de los alias y comparar los resultados con el inciso c.
11~23. En un artículo ("Conozcamos todos el cuadrado latino", en Quality Engineering, vol. 1, pp. 453465), J.S.
Hunter ilustra algunos de los problemas asociados con los diseños factoriales fraccionados 3k-p. El factor A
es la cantidad de etanol agregada a un combustible estándar y el factor B representa la relación aire/com
bustible. La variable de respuesta es la emisión de monóxido de carbono (CO) en g/m3• El diseño se mues
tra abajo:
Diseño Observaciones
A B X¡
y
Xz
o o -1 1 66 62
1 o o -1 78 81
2 o +1 1 90 94
o 1 1 o 72 67
1 1 o o 80 81
2 1 +1 o 75 78
o 2 1 +1 68 66
1 2 o +1 66 69
2 2 +1 +1 60 58
Observe que se ha usado el sistema de notación de O, 1y2 para representar los niveles bajo, intermedio y alto
de los factores. Se ha usado también una "notación geométrica" de 1, O y +l. Se hacen dos réplicas de cada
corrida del diseño.
a) Verificar que el modelo de segundo orden
y= 78.5+4.5x1 7.0x2 4.Sx? - 4.0xi - 9.0x1x2
es un modelo razonable para este experimento. 'Irazar los contornos de la concentración de CO en el es
pacio x1, x2•
118 PROBLEMAS 507
b) Suponga ahora que en lugar de sólo dos factores, se usaron cuatro factores en un diseño factorial frac
cionado J4Z y que se obtuvieron exactamente los mismos datos que en el inciso a. El diseño sería el si
guiente:
Diseño Observaciones
A B e D
y
Xi Xz X3 X4
o o o o -1 -1 -1 -1 66 62
1 o 1 1 . o -1 o o 78 81
2 o 2 2 +1 -1 +1 +1 90 94
o 1 2 1 -1 o +1 o 72 67
1 1 o 2 o o -1 +1 80 81
2 1 1 o +1 o o 1 75 78
o 2 1 2 1 +1 o +1 68 66
1 2 2 o o +1 +1 -1 66 69
2 2 o 1 +1 +1 -1 o 60 58
Confirmar que este diseño es un arreglo ortogonal L9•

e) Calcular los promedios marginales de la respuesta CO en cada nivel de los cuatro factores A, B, C y D.
Construir gráficas de estos promedios marginales e interpretar los resultados. lLos factores C y D pare
cen tener efectos grandles? lEstos factores tienen en realidad algún efecto sobre la emisión de CO? lPor
qué su efecto aparente es grande?
d) El diseño del inciso b permite el ajuste del modelo
4 4
y= Po+ L P;x; + L P11x; +E
i;J i~t
Suponga que el verdadero modelo es
L /3;;x; + ~L /3;¡X Xi =E
4 4
y= Po+ L /3;X; + 1
i~t . i•l i<j
Demostrar que si las '/11 representan las estimaciones de mínimos cuadrados de los coeficientes del mode
lo ajustado, entonces
E(Po) = /30 Pu - Pi• - /334

E(Pi):;:: /31 -({313 + {314) / 2
E(P2) = P2 (/313 + P1• + P34 )12
E(P3 )= {33 -(f3u +{324 )/ 2
E(P. )= f3. -(P12 +P13 )/2
E(fJu) = Pn -(P13 - /324 )/ 2
E(P uJ = /3 22 +(Pn + /314 + /3 34 ) I 2
E(P33) = p33 ({324 pl2 )/ 2+ /314
E(P44 >= /344-(Pu -/313 )12+/313
lAyuda esto a explicar los efectos grandes de los factores C y D que se observaron gráficamente en el in
ciso c?
1124. Suponga que es necesario diseñar un experimento para ajustar un modelo cuadrático en la región1 :s; X; :s;
+ 1, i = 1, 2 sujeto a la restricciónx, + x2 s l. Si se viola la restricción, el proceso no funcionará adecuada
mente. No es posible hacer más den = 12 corridas. Establecer los siguientes diseños:
a) Un modelo DCC "inscrito" con punto central en x1 = x2 = O.
b) Un diseño factorial 32 "inscrito" con punto central en x1 = x2 = 0.25.
e) Un diseño optima! D.
d) Un diseño optima!D modificado que sea idéntico al del inciso e, pero con todas las réplicas de las corri
das en el centro del diseño.
e) Evaluar el criterio 1 (X'X)1 I para cada diseño.
f) Evaluar la eficiencia D para cada diseño en comparación con el diseño optima}D del inciso c.
g) ¿Qué diseño preferiría el lector? ¿por qué?
1125. Considere un diseño 23 para ajustar un modelo de primer orden.
a) Evaluar el criterio D 1 (X'X)1 I para este diseño.
b) Evaluar el criterio A tr(X'X)1 para este diseño.
e) Encontrar la varianza de predicción escalada máximapara este diseño. ¿Este diseño es optima! G?
1126. Repetir el problema 1125 utilizando un modelo de primer orden con las interacciones de dos factores.
1127. Un ingeniero químico desea ajustar una curva de calibración para un nuevo procedimiento utilizado para
medir la concentración de un ingrediente particular de un producto fabricado en sus instalaciones. Pueden
prepararse 12 muestras, cuya concentración es conocida. El ingeniero quiere construir un modelo para las
concentraciones medidas. Piensa que una curva de calibraciónlineal será adecuada para modelar la concen
tración medida como una función de las concentraciones conocidas; es decir,y = {J0 + fJiX +e, dondex es la
concentración real. Están bajo consideracióncuatro diseños experimentales.El diseño 1 consta de seis corri
das con la concentración conocida 1 y seis corridas con la concentración conocida 10. El diseño 2 consta de
cuatro corridas con las concentraciones 1, 5.5y10. El diseño 3 consta de tres corridas con las concentraciones
1, 4, 7 y 10. Por último, el diseño 4 consta de tres corridas con las concentraciones 1 y 10 y seis corridas con la
concentración 5.5.
a) Graficar la varianza de predicción escalada para los cuatro diseños en la misma gráfica en el rango de la
concentración 1 s x s 10. ¿Qué diseño sería preferible?
b) Calcular el determinante de (X'X)1 para cada diseño. ¿Qué diseño sería preferible de acuerdo con el
criterio D?
e) Calcular la eficienciaD de cada diseño en comparacióncon el "mejor" diseño que se haya encontrado en
el inciso b.
d) Para cada diseño, calcular la varianza de predicción promedio en el conjunto de puntos dado por x = 1,
1.5, 2, 2.5, ... , 10. ¿Qué diseño sería preferible de acuerdo con el criterio V?
e) Calcular la eficiencia V de cada diseño en comparación con el mejor diseño que se haya encontrado en el
inciso d.
f) ¿Cuál es la eficiencia G de cada diseño?
1128. Resolver de nuevo el problema 1127,suponiendo que el modelo que el ingeniero quiere ajustar es cuadráti
co. Evidentemente, ahora sólo pueden considerarse los diseños 2, 3 y 4.
1129. Un experimentador quiere correr un experimento de una mezcla de tres componentes. Las restricciones so
bre las proporciones de los componentes son las siguientes:
0.2 :S X1 :S 0.4
0.1 :S X2 :5 0.3
0.4 :S X2 :5 0.7
a) Establecer un experimento para ajustar un modelo cuadrático para mezclas. Usar n = 14 corridas, con
cuatro réplicas. Usar el criterio D.
b) TIazar la región experimental.
118 PROBLEMAS 509
e) Establecer un experimento para ajustar un modelo cuadrático para mezclas con n ::: 12 corridas, supo
niendo que tres de estas corridas son réplicas. Usar el criterio D.
d) Comentar los dos diseños que se encontraron.
1130. Myers y Montgomery [85a] describen un experimento con una mezcla de gasolina en el que intervienen tres
componentes de la mezcla. No hay restricciones sobre las proporciones de la mezcla, y se usó el siguiente di
seño con 10 corridas:
Punto del diseño X1 Xi X3 y, mi/gal

1 1 o o 24.5, 25.1
2 o 1 o 24.8, 23.9
3 o o1 1 22.7, 23.6
4 l
2 2 o 25.1
5 1
2 o 1
2 24.3
6 o
1
l
2
1
1
2
1
23.5
7 3 3 3 24.8, 24.1
2 1 1
8 3 6 6 24.2
1 1. .!.
9 6 J 6 23.9
1 l 2
10 6 6 3 23.7
a) lQué tipo de diseño utilizaron los experimentadores?

b) Ajustar un modelo cuadrático para mezclas a los datos. lEs adecuado este modelo?
e) Grañcar los contornos de la superficie de respuesta. lQué mezcla se recomendaría para maximizar las
millas por galón?
1131. Considere el experimento del llenado de las botellas del ejemplo 61. Suponga que el porcentaje de carbona
tación (A) es una variable de ruido (en unidades codificadas a;
= 1).
a) Ajustar el modelo de respuesta a estos datos. lSe trata de un problema de diseño robusto? .
b) Encontrar el modelo de la media y el modelo de la varianza o bien la POE.
e) Encontrar un conjunto de condiciones que resulten en una desviación del llenado promedio tan próxima
a cero como sea posible con varianza transmitida mínima.
1132. Considere el experimento del problema 1112. Suponga que la temperatura es una variable de ruido (a~= 1
en unidades codificadas). Ajustar modelos de respuesta para las dos respuestas. lSe trata de un problema de
diseño robusto con respecto a ambas respuestas? Encontrar un conjunto de condiciones que maximicen la
conversión con la actividad entre 55 y 60 y que minimice la variabilidad transmitida por la temperatura.
1133. Se ha corrido un experimento en un proceso que aplica un material de recubrimiento a una oblea. En cada
corrida del experimento se fabricó una oblea y se midió varias veces el espesor del recubrimiento en varios si
tios de la misma. Después se obtuvo la media y 1 y la desviación estándar y2 de la medición del espesor. Los da
tos (adaptados de Box y Draper [16b]) se muestran en la tabla siguiente:
Media Desviación estándar

Corrida Velocidad Presión Distancia Y1 Y2
1 1.000 1.000 1.000 24.0 12.5
2 0.000 1.000 1.000 120.3 8.4
3 1.000 1.000 1.000 213.7 42.8
4 1.000 0.000 ~1.000 86.0 3.5
5 0.000 0.000 1.000 136.6 80.4
6 1.000 0.000 1.000 340.7 16.2
7 1.000 1.000 1.000 112.3 27.6
510 CAPÍ11JLO 11 MÉTODOS DE SUPERFICIES DE RESPUESTA
Media Desviación estándar

Corrida Velocidad Presión Distancia Y1 Yz
8 0.000 1.000 1.000 256.3 4.6
9 1.000 1.000 1.000 271.7 23.6
10 1.000 1.000 0.000 81.0 o.o
11 0.000 1.000 0.000 101.7 17.7
12 1.000 1.000 oroo 357.0 32.9
13 1.000 0.000 0.000 171.3 15.0
14 0.000 0.000 0.000 372.0 o.o
15 1.000 0.000 0.000 501.7 92.5
16 1.000 1.000 0.000 264.0 63.5
17 0.000 1.000 0.000 427.0 88.6
18 1.000 1.000 0.000 730.7 21.1
19 1.000 1.000 1.000 220.7 133.8
20 0.000 1.000 1.000 239.7 23.5
21 1.000 1.000 1.000 422.0 18.5
22 1.000 0.000 1.000 199.0 29.4
23 0.000 0.000 1.000 485.3 44.7
24 1.000 0.000 1.000 673.7 158.2
25 1.000 1.000 1.000 176.7 55.5
26 0.000 1.000 1.000 501.0 138.9
27 1.000 1.000 1.000 1010.0 142.4
a) lQué tipo de diseño utilizaron los experimentadores? lEs ésta una buena elección del diseño para ajus
tar un modelo cuadrático?
b) Construir los modelos para ambas respuestas.
e) Encontrar un conjunto de condiciones óptimas que resulten en una media tan grande como sea posible
con la desviación estándar menor que 60.
1134. Una variaci6n del ejemplo 6-2. En el ejemplo 62 se encontró que una de las variables del proceso (B = pre
sión) no era importante. Al eliminar esta variable se producen dos réplicas de un diseño 23. Los datos se
muestran enseguida:
e D A(+) A() y s2
45,48 71,65 57.75 121.19

+ 68,80 60,65 68.25 72.25
+ 43,45 100,104 73.00 1124.67
+ + 75, 70 86,96 81.75 134.92
Suponer que C y D son factores controlables y que A es una variable de ruido.

a) Ajustar un modelo para la respuesta media.
b) Ajustar un modelo para la respuesta ln(s2).
e) Encontrar las condiciones de operación que resulten en la respuesta de rapidez de filtración media que
exceda 75 con varianza mínima.
d) Comparar los resultados obtenidos con Jos del ejemplo 116, en el que se aplicó el enfoque de la transmi
sión del error. ¿Hasta qué punto son similares las dos respuestas?
Experimentos
con factores
aleatorios
A lo largo de gran parte de este libro se ha supuesto que los factores de un experimento son factores fijos,
es decir, los niveles de los factores usados por el experimentador son los niveles de interés específico. La
implicación de esto es, desde luego, que las inferencias estadísticas que se hacen acerca de estos factores
se restringen a los niveles específicos estudiados. Es decir, si se investigan tres tipos de materiales, como
en el experimento de la vida de la batería del ejemplo 51, las conclusiones sólo son válidas para esos ti
pos específicos de materiales. Una variante de esto ocurre cuando el factor o factores son cuantitativos.
En estas situaciones, con frecuencia se usa un modelo de regresión que relaciona la respuesta con los fac
tores para predecir la respuesta en la región que abarcan los niveles de los factores usados en el díseño ex
perimental. Varios ejemplos de esto se presentaron en los capítulos 5 al 9. En general, cuando se trabaja
con un efecto fijo, se dice que el espacio inferencial del experimento es el conjunto específico de los nive
les de los factores investigados.
En algunas situaciones experimentales, los niveles de los factores se eligen al azar de una población
más grande de niveles posibles, y el experimentador quiere sacar conclusiones acerca de la población
completa de los niveles, no sólo de los que se usaron en el diseño experimental. En esta situación se dice
que se trata de un factor aleatorio. Se empieza con una situación simple, un experimento con un solo fac
tor en el que el factor es aleatorio y se usa esto para introducir el modelo de efectos aleatorios para el aná
lisis de varianza y los componentes de la varianza. Los factores aleatorios ocurren también normalmente
en experimentos factoriales, así como en otros tipos de experimentos. Este capítulo se enfoca en los méto
dos para el diseño y análisis de experimentos factoriales con factores aleatorios. En el capítulo 13 se pre
sentarán los diseños anidados y de parcelas subdivididas, dos situaciones en las que es frecuente
encontrar factores aleatorios en la práctica.
12 .. 1 MODELO CON EFECTOS ALEATORIOS
Es común que un experimentador esté interesado en un factor que tiene un gran número de posibles nive
les. Cuando el experimentador selecciona aleatoriamente a de estos niveles de la población de los niveles
del factor, entonces se dice que el factor es aleatorio. Puesto que los niveles del factor utilizados realmente
en el experimento se eligieron al azar, se hacen inferencias acerca de la población completa de los niveles
del factor. Se supone que la población de los niveles del factor es de tamaño infinito o bien lo suficíentemen
511
512 CAPÍTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS
te grande para considerarla infinita. No es frecuente encontrar situaciones en las que la población de los ni
veles del factor sea lo suficientemente pequeña para emplear el enfoque de una población finita. Referirse
a Bennett y Franklin [9] y Searle y Fawcett [101] para una revisión del caso de una población finita.
El modelo estadístico lineal es
i = 1, 2, ... , a
yv.. =µ+'C+t:
,
... {
IJ
1 2
J= ' ' ... , n
(121)
donde tanto 'C; como t:ij son variables aleatorias. Si 'C; tiene varianza a; y es independiente de eíi, la varianza
de cualquier observación es
V(y;j) =a; +0 2
Alas varianzas a;
ya2 se les llama los componentes de la varianza,y al modelo (ecuación 121) se le llama
modelo de efectos aleatorios o de los componentes de la varianza. Para probar hipótesis en este modelo se
requiere que las {eíi} sean NID(O, a2), que las {r.} seanNID(O, a;), y que r, y E;j sean independientes.1
La suma de cuadrados identidad
(122)
sigue siendo válida. Es decir, se hace la partición de la variabilidad total en las observaciones en un com
pcnerite que mide la variación entre los tratamientos ( ss'fiatamientos) y un componente que mide la variación
dentro de los tratamientos (SSE)· Probar hipótesis acerca de los efectos de tratamientos individuales no
tiene sentido, por lo que en su lugar se prueban hipótesis acerca del componente de la varianza a;:
H0 :a;=o
H1 :a; >O
(123)
Si a; =O, todos los tratamientos son idénticos; pero si a;>

O, existe variabilidad entre los tratamientos.
Como anteriormente, SSE/a2 se distribuye como jicuadrada con N - a grados de libertad y, bajo la hipóte
sis nula, SSnatamienioJa2 se distribuye como jicuadrada con a - 1 grados de libertad. Ambas variables alea
torias son independientes. Por lo tanto, bajo la hipótesis nula = O, el cociente a;
SS Tratamiento•
Fo = __a_-_1__ = MSTratamientos (124)
SSE MSE
N-a
se distribuye como F con a 1 y N -a grados de libertad. Sin embargo, es necesario examinar los cuadra
dos medios esperados para tener la descripción completa del procedimiento de prueba.
Considere
E(MSTratamicn1os):
1
al E(SSTr•tamientos)=
1
al E
[ • YZ Y.~]
fr --;;- N
2 -- 1 ( .L.?
, )2]
ª [;;L (L
1 1ª n a n
=---=tE 1;) 1=1
µ+r;+E¡; ) N i=1 1=1
µ+r;+E;¡
·
Cuando se eleva al cuadrado y se toma la función esperanza de las cantidades entre corchetes, se observa
que los términos que incluyen ar; son reemplazados por a;
como E ( 'C;) = O. Además, los términos que in
1 El supuesto de que las {r;} son variables aleatorias independientes implica que el supuesto usual de que l:7~i T; =O del modelo de
efectos fijos no se aplica al modelo de efectos aleatorios.
121 MODELO CON EFECTOS ALEATORIOS 513
cluyen a ez, ri
E.2 y l:~~1l:71 son reemplazados por no2, ana2y an2 a;'
respectivamente. Por otra parte, to
dos los productos cruzados que incluyen a r; y E;¡ tienen valor esperado cero. Esto lleva a
E( MSTrawr»entos) = a~ l [ Nµ 2 +Na; +aa2 - Nµ 2 na; - a2]
o
E( MS Tratamientos ) = a +na;
2
(125)
De manera similar, puede demostrarse que
E(MSE)= a2 (126)
Por los cuadrados medios esperados, se observa que bajo H0 tanto el numerador como el denomina
dor del estadístico de prueba (ecuación 124) son estimadores insesgados de a2, mientras que bajo H1 el
valor esperado del numerador es mayor que el valor esperado del denominador. Por lo tanto, H0 deberá
rechazarse para los valores de F0 que sean muy grandes. Esto implica una región crítica de una cola supe
rior, por lo que Hose rechaza si Fo > F<:t, a - i, N - a:
El procedimiento de cálculo y el análisis de la tabla de varianza del modelo de efectos aleatorios son
idénticos a los que se utilizaron en el caso de efectos fijos. Sin embargo, las conclusiones son muy diferen
tes, ya que se aplican a la población completa de los tratamientos.
Por lo general habrá interés en estimar los componentes de la varianza (a2 y a;) del modelo. Al pro
cedimiento que se usa para estimar a2 y a; se le llama método del análisis de varianza, ya que hace uso de
las líneas de la tabla del análisis de varianza. El procedimiento consiste en igualar los cuadrados medios
esperados con sus valores observados en la tabla del análisis de varianza y despejar los componentes de la
varianza. Al igualar los cuadrados medios observados con los esperados en el modelo de efectos aleato
rios con un solo factor, se obtiene
MSTratBIDientos = ª2 +na;
y
MSE =a2
Por lo tanto, los estimadores de los componentes de la varianza son
a2 = MS E (127)
y
2 MS Tratamientos MS E
a=------- (128)
A
' n
Para tamaños de las muestras desiguales, se reemplaza n en la ecuación 128 con
(129)
En el método del análisis de varianza para estimar los componentes de la varianza no se requiere el
supuesto de normalidad. Produce estimadores de a2 y a; que son los mejores estimadores cuadráticos in
sesgados (es decir, de todas las funciones cuadráticas insesgadas de las observaciones, estos estimadores
tienen mínima varianza).
514 CAPITuLO 12 EXPERIMENTOS CON FACTORES ALEATORIOS
Ocasionalmente, el método del análisis de varianza produce una estimación negativa de uno de los
componentes de la varianza. Evidentemente, los componentes de la varianza son por definición no nega
tivos, por lo que la estimación negativa de un componente de la varianza se considera con cierta preocu
pación. Un curso de acción es aceptar la estimación y usarla como evidencia de que el verdadero valor del
componente de la varianza es cero, suponiendo que la variación muestra} llevó a la estimación negativa.
Esto tiene un atractivo intuitivo, pero adolece de algunas dificultades teóricas. Por ejemplo, usar cero en
lugar de la estimación negativa puede alterar las propiedades estadísticas de otras estimaciones. Otra al
ternativa es volver a estimar el componente de la varianza negativa utilizando un método que produzca
siempre estimaciones no negativas. Una alternativa más es considerar la estimación negativa como evi
dencia de que el modelo lineal supuesto es incorrecto y examinar de nuevo el problema. El tratamiento
completo de la estimación de los componentes de la varianza se ofrece en Searle [99a, b ], Searle, Casella y
McCullogh [100) y Burdick y Graybill [22].
EJEMPLO 12.-1 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Una compañía textil fabrica un tejido en un gran número de telares. Le gustaría que los telares fueran ho
mogéneos a fin de obtener un tejido de resistencia uniforme. El ingeniero del proceso sospecha que, ade
más de la variación usual de la resistencia dentro de las muestras del tejido del mismo telar, puede haber
también variaciones significativas en la resistencia entre un telar y otro. Para investigar esta posibilidad, el
ingeniero selecciona cuatro telares al azar y hace cuatro determinaciones de la resistencia del tejido fabri
cado en cada telar. Este experimento se corre de manera aleatoria, y los datos obtenidos se muestran en la
tabla 121. Se realiza el análisis de varianza, el cual se muestra en la tabla 122. Por el análisis de varianza
se concluye que los telares de la planta difieren significativamente.
Los componentes de la varianza se estiman con á2=1.90 y
u:= 29.73; 1.90 = 6.96
Por lo tanto, la varianza de cualquier observación de la resistencia se estima con

fl, = {J +á;=1.90+6.96=
2 8.86.
La mayor parte de esta variabilidad es atribuible a las diferencias entre los telares .
...................................................... • .
Este ejemplo ilustra un uso importante de los componentes de la varianza: la separación de las dife
rentes fuentes de variabilidad que afectan un producto o sistema. El problema de la variabilidad de un
producto se presenta con: frecuencia en el control de calidad, y en muchas ocasiones es difícil aislar las
Tabla 12·1 Datos de la resistencia del ejemplo 121

Observaciones
Tulares 1 2 3 4 Yi
1 98 97 99 96 390
2 91 90 93 92 366
3 96 95 97 95 383
4 95 96 99 98 388
1527 =y_
121 MODELOCONEFECTOSALEATORIOS 515
Tabla 122 Análisis de varianza de los datos de la resistencia
variación cuadrados libertad medio Fa Valor P
Telares 89.19 3 29.73 15.68 <0.001
Error 22.75 12 1.90
Total 111.94 15
fuentes de la variabilidad. Por ejemplo, este estudio puede haber sido motivado por una gran variabilidad
en la resistencia del tejido, como se ilustra en la figura 12la. En esta gráfica se presenta la salida del pro
ceso (resistencia del tejido) modelado como una distribución normal con varianza a~ = 8.86. (Ésta es la
estimación de la varianza de cualquier observación de la resistencia del ejemplo 121.) Las especificacio
nes superior e inferior de la resistencia se muestran también en la figura 12la, y es relativamente inme
diato ver que una proporción bastante grande de la salida del proceso se sale de las especificaciones (las
áreas sombreadas de las colas de la figura 12 la). El ingeniero del proceso se ha preguntado por qué es
tan grande la cantidad de tejido defectuoso que debe desecharse, reelaborarse o degradarse a un produc
to de menor calidad. La respuesta es que la mayor parte de la variabilidad de la resistencia del producto es
el resultado de las diferencias entre los telares. El desempeño irregular de los telares podría ser el resulta
do de una instalación incorrecta, un mantenimiento deficiente, una supervisión ineficaz, operadores sin
la capacitación suficiente, fibra de entrada defectuosa, etcétera.
El ingeniero del proceso debe intentar ahora aislar las causas específicas de la diferencia en el desem
peño de los telares. Si pudiera identificar y eliminar estas fuentes de variabilidad entre los telares, sería
posible reducir considerablemente la varianza de la salida del proceso, quizá hasta a;
= 1.90, la estima
ción del componente de la varianza dentro del telar (error) en el ejemplo 121. En la figura 12lb se mues
tra la distribución normal de la resistencia de la fibra con a~ = 1.90. Observe que la proporción del
producto defectuoso en la salida se ha reducido radicalmente. Aun cuando es improbable que pueda eli
minarse toda la variabilidad entre los telares, es claro que una reducción significativa en este componente
de la varianza incrementaría sensiblemente la calidad de la fibra producida.
__./' ~~ª8.86
LS (especificacióninferior)
5:-
US (especificaciónsuperior)
al Variabilidad de la salida del proceso.
LS (especificacióninferior) US (especificaciónsuperior)
b) Variabilidad de la salida del proceso si u~ =O.
Figura 121 Salida del proceso en el problema de la

resistencia de la fibra.
··· ····
516 CAPÍTIJLO 12 EXPERIMENTOS CON FACTORES ALEATORIOS
Es sencillo encontrar un intervalo de confianza para el componente de la varianza o'. Si las observa
ciones siguen una distribución normal e independiente, entonces (N -a)MSe/a2 se distribuye como xt_0•
Por lo tanto,
( N - a )MS "- ]
s X «n.u-« = 1
2 2
p [ Xi-(a/2),N-a :$ ª2 a
y un intervalo de confianza de 100(1 a) por ciento para a2 es

(N-a)MSE (N-a)MSE
2
s a 2 s '2''""" (1210)
Xa/2,N-a Xi-(a/2),N-a
Considere ahora el componente de la varianza a;. El estimador puntual de a; es

/'J2 = AfSTrat.arnientos MSE
, n
La variable aleatoria (a - l)MSnacamienioJ(a2 +na;) se distribuye como 1, y (N -a)MSE/a2 se distribuye x;_
como X~-·· Por lo tanto, la distribución de probabilidad de /'J; es una combinación lineal de dos variables
aleatorias jicuadrada, por ejemplo
donde
o? +na2 ª2
u1 = n(a1)
' y u=---
2 n(N-a)
Desafortunadamente, no puede obtenerse una expresión predeterminada para la distribución de esta
combinación lineal de variables aleatorias jicuadrada. Por lo tanto, no es posible construir un intervalo
de confianza exacto para a;.
En Graybill [50] y Searle [99a] se presentan procedimientos aproximados.
Ver también la sección 127.
Es sencillo encontrar una expresión exacta para un intervalo de confianza del cociente + a2). a;/(a;
Se trata de un cociente con significado, ya que refleja la proporción de la varianza de una observación [re
cuerde que V(Y¡J =a;+ a2] que es el resultado de las diferencias entre los tratamientos. Para desarrollar
este intervalo de confianza en el caso de un diseño balanceado, observe que MSnatamientos y MSE son varia
bles aleatorias independientes y, además, que puede demostrarse que
MSTraramjento• /(na; +02) _ F
MSE / 02 a-1,N-a
Por lo tanto,
}: < AfSTratemíentos
( l-a/2,a-1,N-a - i1sE
.m•
02
na,2 +a 2 s Fa/2' a1 ' N-a
)
= 1 a (1211)
Al reordenar la ecuación 1211, puede obtenerse la siguiente expresión:
P(Ls:; su)=l-a (1212)
donde
L=!(MSTratamientos
n MS E
1
Fa/2,a-1,N-a
l) (1213a)
12Z DISEÑO FACTORIAL DE DOS FACTORES ALEA TORIOS 517
U_ 1 (MSTraia.menros 1 1) (1213b)
n MS E Fl-a/2,a-1.N-a
Observe que L y U son los límites de confianza inferior y superior del intervalo 100( 1 a) por ciento, res
pectivamente, del cociente a;1a2. Por lo tanto, un intervalo de confianza de 100(1 a) por ciento para
a;!(a; + a2) es
L 02 U
<
1+L - a; +,;T
2
<
l+U
(1214)
Para ilustrar este procedimiento, se encontrará un intervalo de confianza de 95% de a;/(a; + a2)
para los datos de la resistencia del ejemplo 12L Recuerde queMSTtatamiemos = 29.73, MSE = 1.90, a = 4, n
= 4,F0_025,3•12 = 4.47y F0_975,3,12 = 1/F0_025,12,3 = 1/14.34 = 0.070. Por lo tanto, parlas ecuaciones 1213a y b,
L=.![(29·73)(1 )1]=0.625
4 1.90 4.47
73)(1)1]
u=! [(29·
4 1.90 0.070
= 54.883
y por la ecuación 1212, el intervalo de confianza de 95% para a;/(a; + a2) es

0.625 a2 54.883
< <
T
1.625 a; +a2 - 55.883
0.39S 2
ª2 T 2 S0.98
a,+a
Se concluye que la variabilidad entre los telares explica entre 39 y 98% de la varianza en la resistencia ob
servada del tejido producido. Este intervalo de confianza es relativamente ancho debido al tamaño pe
queño de la muestra que se usó en el experimento. Sin embargo, es evidente que la variabilidad entre los
telares (a;) no es insignificante.
12 .. 2 DISEÑO FACTORIAL DE DOS FACTORES ALEATORIOS
Suponga que se tienen dos factores, A y B, y que ambos tienen un gran número de niveles de interés
(como en la sección anterior, se supondrá que el número de niveles es infinito). Se escogerán al azar a ni
veles del factor A y b niveles del factor B, y estos niveles de los factores se incluirán en un diseño experi
mental factorial. Si el experimento se hace con n réplicas, las observaciones pueden representarse con el
modelo lineal
i.:_ 1, 2, ,a
{k = 1, 2,
J 1, 2, , b
, n
(1215)
donde todos los parámetros del modelo, t;,{Jj, (r{J);j y eijk• son variables aleatorias independientes. Thmbién
se supondrá que las variables aleatorias r;, {Jj, (r{J)11 y eijk siguen una distribución normal con media cero y
varianzas dadas por V(i";) =a;, V(j3i) =a~, V{(r,B);J =a~ y V(s;jk) = o'. Por lo tanto, la varianza de cual
quier observación es
=
V(y ijk ) o: +ai{J +a2 +a2 T T{J
(1216)
y a; , a~ , a;fJ y a2 son los componentes de la varianza. Las hipótesis que quieren probarse sonH0 = O, :a;
H0:a ~ = O y H0:a ~ = O. Observe la similitud con el modelo de efectos aleatorios de un solo factor.
Los cálculos numéricos del análisis de varianza se mantienen sin cambios; es decir, SSA, SSB, SSAB, SSr
y SS E se calculan como en el caso de efectos fijos. Sin embargo, para formar los estadísticos de prueba, de
ben examinarse los cuadrados medios esperados. Puede demostrarse que
E(MS A)= a2 +na;fJ +bnai
E(MS8) = a? +na;P +ana~ (1217)
E(MS AB) = a2 +na2•fJ
y
E(MSE)=a2
Por los cuadrados medios esperados se observa que el estadístico apropiado para probar la hipótesis
de que no hay interacción, H0:a;fJ = O, es
MSAB
F=-- (1218)
0 MS E
ya que bajo H0 tanto el numerador como el denominador de F 0 tienen valor esperado a2, y sólo si H0 es fal
sa E(MS AB) es mayor que E(MS E)· El cociente F0 se distribuye como Fea - l), ab(n- n De manera similar, para
probar H0 :a; = O se usaría
MSA
F=-- (1219)
o MS AB
que se distribuye como F. _ 1, (a _ l)(b _ l)• y para probar H0:a~ = O el estadístico es

MSB
Fo= MS (1220)
AB
que se distribuye como Fb-l, (al)(bt)· Todas estas pruebas son de una sola cola superior. Observe que estos
estadísticos de prueba no son los mismos que se usarían si ambos factoresA y B fuesen fijos. Los cuadra
dos medios esperados se usan siempre como guía para construir los estadísticos de prueba.
En muchos experimentos que incluyen factores aleatorios existe al menos interés tanto en estimar los
componentes de la varianza como en la prueba de las hipótesis. Los componentes de la varianza pueden
estimarse con el método del análisis de varianza, es decir, igualando los cuadrados medios observados de
las líneas de la tabla del análisis de varianza con sus valores esperados y resolviendo para los componentes
de la varianza. Se obtiene así
{12 = MSE
A2 MSAB -MSE
at/1 = n
(1221)
2 MSB -MSAB
á fJ = ---a-n-~
A2 MSA -MSAB
a,= bn
12·2 DISEÑO FACTORIAL DE DOS FACTORES ALEATORIOS 519
como las estimaciones puntuales de los componentes de la varianza en el modelo de efectos aleatorios de
dos factores. En la sección 12 7 se revisarán otros métodos para obtener estimaciones puntuales de los
componentes de la varianza y los procedimientos para construir intervalos de confianza.
E)'E~LO 12-2 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Estudio de capacidad o aptitud de sistemas de medición
Con frecuencia se usan experimentos diseñados estadísticamente para investigar las fuentes de variabili
dad que afectan a un sistema. Una aplicación industrial común es usar un experimento diseñado para es
tudiar los componentes de la variabilidad en un sistema de medición. Estos estudios se conocen
comúnmente como estudios de capacidad o aptitud de instrumentos de medición (calibradores) o esto·
dios de repetibilidad y reproductibilidad (R&R) de instrumentos de medición (calibradores), ya que és
tos son los componentes de la variabilidad de interés.
En la tabla 123 se muestra un experimento R&R de instrumentos de medición típico (de Montgo
mery [80a]). Se usa un instrumento o calibrador para medir una dimensión crítica de una pieza. Se han se
leccionado 20 piezas del proceso de producción, y tres operadores escogidos al azar miden dos veces cada
pieza con este calibrador. El orden en que se hacen las mediciones está completamente aleatorizado, por
lo que se trata de un experimento factorial de dos factores en el que los factores del diseño son las piezas y
los operadores, con dos réplicas. Las piezas y los operadores son factores aleatorios. Es válida la identi
dad del componente de la varianza de la ecuación 1215; es decir,
aiy = a2r +aifJ +ai•fl +ai
donde a!es la variabilidad total (que incluye la variabilidad debida a las diferentes piezas, la variabilidad
debida a los diferentes operadores y la variabilidad debida al calibrador), a;
es el componente de la va
rianza de las piezas, a~ es el componente de la varianza de los operadores, a;fl es el componente de la va
'Thbla 12-3 El experimento de la capacidad o aptitud del sistema de

medición del ejemplo 122
Número de
la pieza Operador 1 Operador 2 Operador 3
1 21 20 20 20 19 21
2 24 23 24 24 23 24
3 20 21 19 21 20 22
4 27 27 28 26 27 28
5 19 18 19 18 18 21
6 23 21 24 21 23 22
7 22 21 22 24 22 20
8 19 17 18 20 19 18
9 24 23 25 23 24 24
10 25 23 26 25 24 25
11 21 20 20 20 21 20
12 18 19 17 19 18 19
13 23 25 25 25 25 25
14 24 24 23 25 24 25
15 29 30 30 28 31 30
16 26 26 25 26 25 27
17 20 20 19 20 20 20
18 19 21 19 19 21 23
19 25 26 25 24 25 25
20 19 19 18 17 19 17
rianza que representa la interacción entre las piezas y los operadores, y a2 es el error experimental
aleatorio. De manera típica, al componente de la varianza a2 se le llama la repetibilidad del instrumento
de medición (calibrador), ya que puede considerarse que a2 refleja la variación obtenida cuando la misma
pieza es medida por el mismo operador, y es común llamar a
2 2
a P +a,p
la reproductibilidad del instrumento de medición (calibrador), ya que refleja la variabilidad adicional en
el sistema de medición que resulta del uso del instrumento por parte del operador. Estos experimentos
suelen realizarse con el objetivo de estimar los componentes de la varianza.
En la tabla 124 se muestra el análisis de varianza de este experimento. Los cálculos se realizaron uti
lizando la rutina Balanced ANOVA (análisis de varianza balanceado) de Minitab. Con base en los valores
P, se concluye que el efecto de las piezas es grande, que los operadores quizá tengan un efecto pequeño y
que no hay ninguna interacción significativa piezaoperador. La ecuación 1221 puede usarse para esti
mar los componentes de la varianza de la siguiente manera:
A2=62.390.71=10.2S
a, (3)(2)
e;2 = 1.31 o. 71 = 0.015

p (20)(2)
A 2 O. 71 o. 99
a,¡¡= 2 0.14
y
o? = 0.99
La parte inferior de la salida de Minitab de la tabla 124 contiene los cuadrados medios esperados del
modelo aleatorio, con los números entre paréntesis representando los componentes de la_ varianza [(4)
representa a2, (3) representa a;¡¡, etc.]. Se presentan también las estimaciones de los componentes de la
varianza, junto con el término del error que se utilizó para probar ese componente de la varianza en el
análisis de varianza. Más adelante se estudiará la terminología modelo no restringido;ésta no tiene rele
vancia en los modelos aleatorios.
Observe que la estimación de uno de los componentes de la varianza, a;¡¡, es negativa. Desde luego,
esto no tiene sentido, ya que por definición las varianzas son no negativas. Desafortunadamente, pueden
obtenerse estimaciones negativas de los componentes de la varianza cuando se usa el método de estima
ción del análisis de varianza (lo cual se considera una de sus desventajas). Existen varias maneras de abor
dar esta situación. Una posibilidad es suponer que la estimación negativa significa que el componente de
la varianza en realidad es cero y simplemente se hace cero, dejando sin cambios las demás estimaciones
no negativas. Otro enfoque es estimar los componentes de la varianza con un método que asegure estima
ciones no negativas (este enfoque se revisará brevemente en la sección 12 7). Por último, podría observar
se que el valor P del término de interacción de la tabla 124 es muy grande, tomar esto como evidencia de
que a~P es en realidad cero (es decir, que no hay efecto de interacción) y ajustar un modelo reducidode la
forma
Yijk == u+e¡ +f)j +e;¡k

que no incluye el término de interacción. Éste es un enfoque relativamente sencillo y que con frecuencia
funciona casi tan bien como los métodos más elaborados.
e
'
....
GI
.e
,.._'4' u
"'
e
w ......
_,
' GI
o "'C
'()..,o .... o
.N Ei
GI
N
' "'C ......
«I GI .. N
....'.i
,..... :s..,,..-~
o.o.., ... cu ..... o
o ........
11'1 NO
o ...... e '4'
1.,
<I) .,.. '()
o.oo '
e:+.++
·;¡;
v"O '4'.00
ººº "'(11
.., .., ..,
GI QI ,,...,. ""' ,.-..
E '
.......... .._11'1'4'N e......, 11¡,J'"'
~ '° 00 ...... "'C ::::JNNN
:§ """'"º ....cuu 01 + + +
;:;E
~
..,º
....... . . ..,
00 e:
CIJitr-~~,.._,,_,_,
Q.(11'4''4''4''4'
<n.OONN )( ~ ft,J .._,""" i.....,,r
Eoo.o w ....
~
o .., ..., . . . °'
~
"O.,
NO"ON
... N.OO
e
'
o
' '..,..,4'
e
' GI
§ w +'
..... (11 <nll'l,.._OON
...

Gl"<""OOll'I. cnN.11'100
E9. ::::J > '4' '°o 11'\ 11'1 GI +'
o ..... u c:oooo ......
g .g"' °' '4' O .
... ..,°'
"' "'1110
' U'\ N ,..._ 0 '4'
...
e: IU
>
.., .... .
o 00 Nll'I,.._
o N .,..cae:,.._
ONO.Q<.
~ .....
..... § e ' Q.
.D
"'~
~
.o
'N
IU
GI
u
.._0NOOOO
>"' EiOOOO
o.
u
1
...
:> e:
.., e .
·¡:: "'
o
•i::l
cu
l ...."' c.
'
"'., :e
> 1ll Ei ' o
"O .._,
IU E
Q. o
> "'C
o
"'C >"' '
+'
"'
"' "'
e:
....o ....o '
1 "'
.... e: ' IU
.~.... "'
'
' IO
'
o Q.
+' o
"'o
> '
o .,..111 '
o Q.
GI
"' le
+' c..
'
+' o
r "O c.. +' 111 GI ..... o
c.._,
GI c.. GI c.. '
....
N
..!! ~"'
.~ o
+' +'
u '
"'41
s,
>
_,
ca
u
"' "'
c.. +' ' +' o "'
::::Jl..411..L.+'
...::::J
u «I Q. «I '
Q. 0 Q.W
o
"' "'
Q. e: OIOQ.ca'0 ..N..,'4'
~ ~ .... Q. o < Q. O Q.W 1
<I) <I)
521
Tabla 125 Análisis de varianza del modelo reducido, ejemplo 122

··· ········,~
Análisis de varianza (diseñosbalanceados)

part random 20 1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20
operator random 3 1 2 3
Analysis of Variance for y
Source DF SS MS f p
part 19 1185.425 62.391 70.64 0.000
operator 2 2 .617 1. 308 1. 48 0.232
Error 98 86.550 0.883
Total 119 1274.592
Source Variance Error Expected Mean Square for Ea ch Term

component term Cusing unrestricted model)
1 part 10.2513 3 (3) + 6 ( 1)
2 operator 0.0106 3 (3} + 40(2)
3 Error 0.8832 (3)
En la tabla 125 se muestra el análisis de varianza del modelo reducido. Puesto que no hay término de
interacción, los dos efectos principales se prueban contra el término del error, y las estimaciones de los
componentes de la varianza son
2 = 62.390.88=10.25
A
o; (3)(2)
A 2 = 1.31 0.88::;: o 0108
ª fJ (20)(2) ·
f12 = 0.88
Por último, la varianza del calibrador podría estimarse como la suma de las estimaciones de los compo
nentes de la varianza fJ2 y fJ~ como
a calibrador = a
A2 A2+A2
a {J
= 0.88+0.0108
= 0.8908
La variabilidad del calibrador parece ser pequeña en comparación con la variabilidad del producto. Se
trata generalmente de una situación deseable, la cual implica que el calibrador tiene la capacidad de dis
tinguir entre las diferentes gradaciones del producto.
123 MODELO MIXTO CON DOS FACTORES
Se considera ahora la situación en que uno de los factores,A, está fijo y el otro, B, es aleatorio. Se le llama
análisis de varianza del modelo mixto. El modelo estadístico lineal es
l
i.:_1,2, ,a
Yifk = u+t , + /3¡ +(r/3);¡ +Eijk J - l, 2, , b (12~22)
k= l,2, ,n
123 MODELO MIXTO CON DOS FACTORES 523
Aquí t, es un efecto fijo,p; es un efecto aleatorio, se supone que la interacción (r/3);¡ es un efecto aleatorio y
E;¡k es un error aleatorio. Se supone también que las {r1} son efectos fijos tales que :I7_1 r ¡ = O y que /3; es
una variable aleatoria NID(O, a~). El efecto de la interacción, (r/3);¡. es una variable aleatoria normal con
media O y varianza [(a l)/a]a;11; sin embargo, la operación suma del componente de la interacción en el
rango del factor fijo es igual a cero. Es decir,
!
i~l
(r/3);1 = (rf:J).; =O t= 1, 2, ... ,b
Esta restricción implica que algunos elementos de la interacción en diferentes niveles del factor fijo no
son independientes. De hecho, puede demostrarse (ver el problema 1225) que
Cov[(r{:J);i'(r/3)0] =_!a~ i-:¡!:; t'

a
La covarianza entre (r/3);1 y (r/3);r paraj -:¡!:; j' es cero, y el error aleatorio E;;k es NID(O, <f). Puesto que la
suma de los efectos de la interacción en los niveles del factor fijo es igual a cero, a esta versión del modelo
mixto con frecuencia se le llama modelo restringido.
En este modelo la varianza de (r{J)¡¡ se define como [(a - 1 )la Ja~ en vez de como a~ para simplificar
los cuadrados medios esperados. El supuesto (r/3)J =O también tiene un efecto sobre los cuadrados me
dios esperados, los cuales puede demostrarse que son
bn2: r;
a
B(MS )= a2 +na2
A r/l
+ ;~i
a-l
E(MSB)=a2 +ana~
E(MS AB )= a2 +na~11 (1223)
y
E(MSE )= o?
Por lo tanto, el estadístico de prueba apropiado para probar que las medias de los efectos del factor fijo
son iguales, o H0:r1 = O, es
que tiene la distribución de referenciaF 0_1,(al)(bt)· Para probar H0: a~, el estadístico de prueba es
MSB
Fo= MS
E
con la distribución de referencia Fb _ 1, ab(n _ 1¡. Por último, para probar la hipótesis de la interacción
H0:a~ = O, se usaría
MSAB
F.=--
º MSE
que tiene la distribución de referencia F(a _ l)(b _ t), .U.(n _ 1¡
En el modelo mixto es posible estimar los efectos del factor fijo como
fe=Y . . (1224)
t ¡J;..Y.
- - - .. i = 1, 2, ... ,a
Los componentes de la varianza a~, a;11 y o? pueden estimarse aplicando el método del análisis de varian
za. Al eliminar la primera ecuación de las ecuaciones 1223 quedan tres ecuaciones con tres incógnitas,
cuyas soluciones son
A2 MSB -MSE
ª11 = an
MSAB -MSE
2
{J •/I = ~'=
n
y
a2 -
- MSE
Este enfoque general puede emplearse para estimar los componentes de la varianza en cualquier modelo
mixto. Después de eliminar los cuadrados medios que contienen factores fijos, siempre quedará un siste
ma de ecuaciones que puede resolverse para los componentes de la varianza.
En los modelos mixtos, el experimentador puede tener interés en probar hipótesis o en construir in
tervalos de confianza para las medias de tratamientos individuales del factor fijo. Al utilizar estos proce
dimientos, deberá tenerse cuidado de usar el error estándar apropiado de la media de los tratamientos. El
error estándar de la media de los tratamientos del efecto fijo es
Cuadrado medio para probar el efecto fijo ]112 ~ MS AB

[Número de observaciones en la media de cada tratamiento = ¡;;;
Observe que esto es simplemente el error estándar que se usaría si éste fuera un modelo con efectos fijos,
salvo porque MSE se ha reemplazado con el cuadrado medio que se usó en la prueba de la hipótesis.
EJEMPLO 12-3 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Retomando el experimento de la capacidad o aptitud del sistema de medición
Considere de nuevo el experimento R&R del calibrador descrito en el ejemplo 122. Suponga ahora que
sólo tres operadores usan este calibrador, de tal modo que los operadores son un factor fijo. Sin embargo,
puesto que las piezas se eligen al azar, se trata ahora de un experimento con un modelo mixto.
El análisis de varianza del modelo mixto se muestra en la tabla 126. Los cálculos se realizaron utili
zando la rutina Balanced ANOVA (análisis de varianza balanceado) de Minitab. Se especificó el uso del
modelo restringido en el análisis de Minitab, el cual generó también los cuadrados medios esperados para
este modelo. En la salida de Minitab, la cantidad Q[2] indica una expresión cuadrática que incluye al ope
rador del efecto de factor fijo. Es decir, Q[2] = ~~.1p~ / (b1). Las conclusiones son similares al ejemplo
122. Los componentes de la varianza pueden estimarse con la ecuación 1225 como
A2 = MSp;01,.. -MSE = 62.390.99

10.23
(]Piezas an (3)(2)
MSPiezasxopenrado~s -MSE = 0.7120.99 =O.l4
2
{J Piezas X operadores =
{J 2 = MSE = 0.99
Estos resultados también se muestran en la salida de Minitab. De nueva cuenta, resulta una estimación
negativa del componente de la varianza de la interacción. Un curso de acción apropiado sería ajustar un
e
...
l..
.....
.c.
u
Cll
o w
1 ~
o
l.. .....
O-'
........
... o
"ti
,..,
o; ,.._ -4"
... 'e N
e 111 u
"'C
:i "'C CJI
cr" o
o; ~
...r::: e t"I o a.. o,., ...
o,.._'()
CI)
e•.
....
u
.N
o.oa Cll l..
+
~ cu ..... ,..... ,,..... ,,.....
... ººº
......
E 111.!<'ll"l
ir: 11'\NO CIJ '"" ....,....,
...;
Ñ
"N~N ...
"ti
....
'>ONN
O.CÍO I' CI + + +
o u e
cu.,...,,......_",....¿.,
} 4" ... 00
........ N.C
e Q.111~~~4"
...
"Q)
)( :1 '""" '1..11
Wv
'-"' ....,
~ ,..,º,.._,..,
......
Cl).OONN
s:oc.o
,.., l"'l ...... o. l..
E o e
·§ N.CO
o
l..
l..
l..~,.,
...
-4"
...9... NQ>'()N w ....
.....
e
o
...:i.ro1n.
111 UIU'\r.OON
fl>N.11\00.
41 +' N
U Cl""I
°',...,
o..-
~
::g.... '§'
_, ... >.. ~ '() Q 11'\ 11'\ e ",.,
Cll CN
o
....., e
.o
.....
"O Cll l.. ll'IN,.._,04"
o ao
:§
c.s
8
>
.....
N 11\ ,.._,
N
.....
l..Q.O
Cll e. ºº
1
ª
> o
6.,. ;
1110
'N
Cll
l"l
Cll
u
u
.Q
.,.~ > e
""'° .... .
"0.NCOOO..
<ll
o.
·e: ·i:::o Cll
...1 ....111... l..
~ <llo
~ ~
... e
o ...
"'C 111
.....
....o
Q. > 111
~
:!1i"'
c.s
l:!c.s
>.. "'C
t e .........
)(
~
o
...o l..
..... Cll
o Q.
~ ·¡ Cll
.....
..... 111
Cll
.....
Cll
... o
Cll .,.
...o
L.. l..
> o Q. o
o

... L.. ...
... o
'°Ñ "O
<ll
·¡¡;
L..
...u ........
o Cll
L.. _,
111
>..
Cll
o
L.. .........
111 i<
Cll
L.._,
o
QI
u
L..
L.. Cll L..
Cll Q. 111 L..
Q. 0 Q.W
L..
~ 111 111
Cll
Q. e
111 ::;, ......
o
L.. ........
Cll Q. 111 L.. o
:i
o . N,., 4"
~ ~ .... Q. o < CI) Q. o
ll. 1 w CI)
525
modelo reducido, como se hizo en el ejemplo 122. En el caso de un modelo mixto con dos factores, esto
lleva a los mismos resultados del ejemplo 122.
. .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . • .
Modelos mixtos alternativos
Se han propuesto varias versiones diferentes del modelo mixto. Estos modelos difieren de la versión res
tringida del modelo mixto estudiado anteriormente en los supuestos establecidos acerca de los compo
nentes aleatorios. A continuación se revisa brevemente uno de estos modelos alternativos.
Considere el modelo
Y1J1c =µ+a; +ri +(ar);; +s;;k
donde a¡ (i = 1, 2, ... ,a) son efectos fijos tales que ~:~iªi = Oyyi, (ar);; y E;ik son variables aleatorias no co
rrelacionadas que tienen media cero y varianzas V(r) = a~, V[(ar);i] = a!, y V(s;¡k) = a2. Observe que
aquí no se usa la restricción impuesta anteriormente sobre el efecto de la interacción; por consiguiente, a
esta versión del modelo mixto se le llama con frecuencia modelo mixto no restringido.
Es posible demostrar que los cuadrados medíos esperados para este modelo son (referirse al material
suplementario del texto de este capítulo)
bn,! a;
E(MS A)= <J2 +na:,,+ ;i
a-1
E(MS B )= a2 +na2~ +ana2r
E(MS AB )= u2 +no~ (1226)
y
E(MSE)=a2
Al comparar estos cuadrados medios esperados con los de la ecuación 1223, se observa que la única dife
rencia evidente es la presencia del componente de la varianza a~ en el cuadrado medio esperado del
efecto aleatorio. (En realidad, hay otras diferencias debido a las definiciones diferentes de la varianza del
efecto de la interacción en los dos modelos.) Por consiguiente, se probaría la hipótesis de que el compo
nente de la varianza del efecto aleatorio es igual a cero (H0:a!, = O) usando el estadístico
MSB
Fo=--
- MSAB
en contraste con probar H0: a~ con F0 = MSB/MSE en el modelo restringido. La prueba deberá ser más
conservadora cuando se emplee este modelo porque por lo general MSAB será mayor que MSE.
Los parámetros de los dos modelos guardan una relación cercana. De hecho, puede demostrarse que
Pi= v, +(ar).1
(r/3)1f = (ar)9 +(ar).1
ª2r = ª2fJ +_!_02
a ~
y
a~= a!,
123 MODELO MIXTO CON DOS FACTORES 52 7
Puede usarse el método del análisis de varianza para estimar los componentes de la varianza. Con re
ferencia a los cuadrados medios esperados, se encuentra que el único cambio de las ecuaciones 1225 es
que
2 MSB-MSAB
éi=----- (1227)
y an
Estos dos modelos son casos especiales del modelo mixto propuesto por Scheffé [98b, d]. En este mo
delo se supone que las observaciones pueden representarse con
i.'.:
1, 2, ,a
Yiik=mii+eiik
{ 1-l,2, ,b
k = 1, 2, .n
donde m,j y Ei¡k son variables aleatorias independientes. La estructura de mii es

m;¡ = µ+T; +b1 +e;¡
E(m;¡)=µ+T;
y
e.·J =O j = 1, 2, ... ,b
Las varianzas y covarianzas de b¡ y C;¡ se expresan a través de las covarianzas de las m,1• Además, los pará
metros de los efectos aleatorios en otras formulaciones del modelo mixto pueden relacionarse con b¡ y C;¡·
El análisis estadístico del modelo de Scheff é es idéntico al del modelo restringido tratado aquí, salvo por
que, en general, el estadístico MS A/MSAB no siempre se distribuye como F cuando H0: r¡ = O es verdadera.
A la luz de esta multiplicidad de modelos mixtos, una pregunta lógica es: Zqué modelo deberá usarse?
La mayoría de los especialistas en estadística prefieren el modelo restringido, mismo que se encuentra
con mayor frecuencia en la literatura del tema. El modelo restringido es en realidad un poco más general
que el no restringido, ya que en el primero la covarianza entre dos observaciones del mismo nivel del fac
tor aleatorio puede ser positiva o negativa, mientras que en el segundo esta covarianza sólo puede ser po
sitiva. Si la estructura correlativa de los componentes aleatorios no es grande, entonces cualquiera de los
dos modelos mixtos es apropiado, y sólo hay diferencias menores entre ellos. Cuando se haga referencia
más adelante a los modelos mixtos, se supondrá la estructura del modelo restringido. Sin embargo, si hay
correlaciones grandes en los datos, entonces quizá deba emplearse el modelo de Scheffé. La elección del
modelo deberá ser siempre dictada por los datos. El artículo de Hocking [56] es un resumen claro de dife
rentes modelos mixtos.
mEMPLO 12 .-4 · · · · · · • · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · • · · · · · · · · · · · • · · • •
El modelo no restringido
Algunos paquetes de software de computadora tienen soporte para un solo modelo mixto. Minitab sopor
ta tanto el modelo restringido como el no restringido, aun cuando la selección por omisión es el modelo
no restringido. En la tabla 127 se muestra la salida de Minitab para el experimento del ejemplo 123 utili
zando el modelo no restringido. Observe que los cuadrados medios esperados concuerdan con los de la
ecuación 1226. Las conclusiones son idénticas a las del análisis del modelo restringido, y las estimaciones
de los componentes de la varianza son muy similares.
e
s,
cu
1
s:
u
<O
w ,...,
c.. cu
o o
.... o
...... 4"
..... e
cu
c.. o
co cu.. n
::1 +'.N
'°"'º
.N 0..01""1.
C' u ...........
U) .... e C1I
"O
o o"""'°
o.oo
s,
e...,++
(O (11
·51
·§ .........
11'\NO
ººº E
cu a>",...,"
'"...,...,,,,.,
"':!:: i...11'\=tN o e'-"'"'""
o '° 00 ... e + + +
cu
::INNN
.......
I'
Ol =t.oo CI
e .......... o u
'U
00 cu-... .--.....-i.,..._,~
o.. (11..,,..,,..,,..,,
Ol >< j .._,......, '-"'.....,.
o ,,,., o ...... "" w .....
1 ........ U)oeOONN
ll·o
EO.O.o
..., l'l ...... °' ,_
N.oo o
,_ E
e
:l
!"')
....:,
NO.ON
.... '"cu
'l'll't'l4"
..........
,.....
o (11 U)ll'\ ...... OQN
o.
s... ;;i'
cu. 00 11'\ ....
::1
_,
.... >.
Cl)N.11"100
4'0011'\ll'I
cu ... 00
u e o °'...,°' o. .
I'
e<OCiu ""N
. . °'
"ij)
o
Ol "O
(O
>e ..., ....o
c.. ll'IN"0.=t
....o
....... ,_ a.o
ce
...
00 N 11'1 I'
'U
....o 8 N
ºº
ª"'
(O e. 1
_,lllN
...e e;¡
Cll
u
> o
u
.§ .s:i
Cll
> e
..., '° ..-....
0..0.NOOOO.
o (U m a..
~ ,_ '
...
...o
•C:: ...J
11)
Ol "' ' ,_
(O
.~
~"' ~
>.O
1 e
(O
........ ....o
)(
....111o '
o o.
(U
~ ·; ' ,_ (11 ' ... o

> .... '
o Q.
QI (O"' s,
.... ,_ .... o
e
N
"O
11)
'
o
...
o
(11 Cll .... o
..........
QI ' QI ' ,_
...... ......"'
"'
....... ,_<O _,>. u
t..+'L.+'0<0 "'"' ,_
u (O Q. (O
o.. o a.w
c..
ª u ' Cll :::>

(O ::S'GI''+'
~
~· ~
'° mo.
....
Q.
o
e:
ce
O<OQ.IOt..O
U) 0..0 Q.WI
o
U)
. N l""I '4'
528
124 DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA CON EFECTOS ALEATORIOS 529
12..4 DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA
CON EFECTOS ALEATORIOS
Pueden usarse las curvas de operación característica del apéndice para determinar el tamaño de la mues
tra en experimentos con factores aleatorios. Se empieza con el modelo de efectos aleatorios con un solo
factor de la sección 121. La probabilidad del error tipo 11 para el modelo de efectos aleatorios es
f3 = 1 P{Rechazar H01 H0 es falsa}
= 1 P{F0 > Fa.a-i.N-.1 a; >O} (1228)
De nueva cuenta se requiere la distribución del estadístico de prueba F¿ = MSnaiamicnioJMSE bajo la hipó
tesis alternativa. Puede demostrarse que si H1 es verdadera (a; >O), la distribución deF0esF central con
a - 1 y N - a grados de libertad. ·
Puesto que la probabilidad del error tipo 11 del modelo de efectos aleatorios se basa en la distribución
F central usual, podrían usarse las tablas de la distribución F del apéndice para evaluar la ecuación 1228.
Sin embargo, es más simple determinar la sensibilidad de la prueba mediante el uso de las curvas de ope
ración característica. En la parte IV del apéndice se presenta una serie de estas curvas para varios valores
de los grados de libertad del numerador, de los grados de libertad del denominador y a de 0.05 y 0.01. En
estas curvas se grafica la prolbabilidad del error tipo 11 contra el parámetro .A., donde
(1229)
Observe que .A. incluye dos parámetros desconocidos, a2 y a; .

Quizá pueda estimarse si se tiene una a;
idea acerca de cuánta variabilidad de la población de tratamientos es importante detectar. Puede esco
gerse una estimación de a2 recurriendo a la experiencia previa o discrecionalmente. En ocasiones es útil
definir el valor de a;
que quiere detectarse en términos del cociente a;1<r.
Ej"EMPLO 12-5 · · · · · · · · · · · · • · · • • • • • · · · · · · · · · · · · · · · · · · • • • • • • • • • • • · • · · · · · · · • •
Suponga que se han seleccionado cinco tratamientos al azar con seis observaciones por tratamiento y que
a= 0.05,yquiere determinarse la potencia de la prueba cuando a; esigualaa2• Puesto que a= 5,n = 6y
a; = a', puede calcularse
,t = .Jl +6(1) = 2.646
Por la curva de operación característica con a 1 = 4, N -a = 25 grados de libertad ya = 0.05, se encuen
tra que
(3=0.20
y por lo tanto la potencia es de aproximadamente 0.80 .
.........................................................................
También puede usarse el incremento porcentual en Ja desviación estándar de un método de observa
ción para determinar el tamaño de la muestra. Si los tratamientos son homogéneos, entonces la desvia
ción estándar de una observación seleccionada al azar es a. Sin embargo, si los tratamientos son
diferentes, la desviación estándar de una observación elegida al azar es
~ª2 +a;
Si Pes el incremento porcentual fijo en la desviación estándar de una observación más allá del cual se de
sea rechazar la hipótesis nula, entonces
~02 +a; 1+0.0lP
a
o
ª2 = (1 +0.01P)
f 2 1
a
Por lo tanto, utilizando la ecuación 1229, se encuentra que
). = ~ = ~l+n[(l+0.01P) 1] 2 (1230)
Para unaP dada pueden usarse las curvas de operación característica de la parte VI del apéndice para en
contrar el tamaño de la muestra deseado.
También pueden usarse las curvas de operación característica para determinar el tamaño de la mues
tra del modelo de efectos aleatorios con dos factores y del modelo mixto. Se utiliza la parte VI del apéndi
ce para el modelo de efectos aleatorios. El parámetro I, los grados de libertad del numerador y los grados
de libertad del denominador se muestran en la mitad superior de la tabla 128. Para el modelo mixto de
ben usarse las partes V y VI del apéndice. Los valores apropiados de <1>2 y). se muestran en la mitad infe
rior de la tabla 128.
Tabla 128 Parámetros de las curvas de operación característica de las tablas V y VI del apéndice para los modelos con dos
factores de efectos aleatorios y mixto
El modelo de efectos aleatorios
Grados de Grados de
libertad del libertad del
Factor .4 numerador denominador
bna;
A 1+ a1 (a- l)(b1)
a2+na;11
ana~
B 1+ b1 (al)(b1)
a2+na;11
na;11
AB 1+ (al)(b1) ab(n 1)
ª2
El modelo mixto
Grados de libertad Grados de libertad Parte del
Factor Parámetro del numerador del denominador apéndice
A (fijo) a1 (a- l)(b1) V
ana2
B (aleatorio) .4= 1+P b1 ab(n 1) VI
ª2
AB (a - l)(b1) ab(n 1) VI
125 REGLAS PARA LOS CUADRADOS MEDIOS ESPERADOS 531
12 .. 5 REGLAS PARA LOS CUADRADOS MEDIOS ESPERADOS
Una parte importante de cualquier problema de diseño experimental es la realización del análisis de va
rianza. Esto implica determinar la suma de cuadrados de cada componente del modelo y el número de
grados de libertad asociados con cada suma de cuadrados. Después, para construir los estadísticos de prueba
apropiados, deben determinarse los cuadrados medios esperados. En situaciones de diseño complejas,
particularmente las que incluyen modelos aleatorios o mixtos, con frecuencia es útil contar con un proce
dimiento formal para este proceso.
Se presentará un conjunto de reglas para anotar los cuadrados medios esperados en cualquier experi
mento factorial balanceado, anidado2 o factorial anidado. (Observe que los arreglos parcialmente balan
ceados, como los cuadrados latinos y los diseños de bloques incompletos, se excluyen explícitamente.)
Estas reglas son estudiadas por varios autores, incluyendo Scheffé (98d], Bennetty Franklin [9], Comfield
y Tukey (34] y Searle [99a, b]. Mediante el examen de los cuadrados medios esperados puede desarrollar
se el estadístico apropiado para probar hipótesis acerca de cualquier parámetro del modelo. El estadísti
co de prueba es el cociente de los cuadrados medios que se elige, de tal modo que el valor esperado del
cuadrado medio del numerador difiere del valor esperado del cuadrado medio del denominador única
mente por el componente de la varianza o el factor fijo en el que se tiene interés.
Siempre es posible determinar los cuadrados medios esperados de cualquier modelo como se hizo en
el capítulo 3, es decir, mediante la aplicación directa del operador valor esperado. Este método de fuerza
bruta, como suele llamársele, puede ser muy laborioso. Las reglas que se presentan a continuación pro
ducen siempre los cuadrados medios esperados sin recurrir al enfoque de fuerza bruta y, con la práctica,
su uso se vuelve relativamente simple. Cuando se aplican a un modelo mixto, estas reglas producen cua
drados medios esperados que son consistentes con los supuestos del modelo mixto restringido de la sec
ción 123. Las reglas se ilustran utilizando el modelo factorial de efectos fijos con dos factores.
Regla l. El término del error del modelo, Eij .. m• se escribe como E(ij ... Jm• donde el subíndice m denota el
subíndice de la réplica. Para el modelo con dos factores, esta regla implica que E¡;k se convierte en E(ijJk·
Regla 2. Además de una media global(µ) y un término del error [e(i;... ¡m], el modelo contiene todos los
efectos principales y las interacciones cuya existencia supone el experimentador. Si existen todas las in
teracciones posibles entre los k factores, entonces hay ( ~ ) interacciones de dos factores, ( ~ ) interacciones
de tres factores, ... , 1 interacción de k factores. Si uno de los factores de un término aparece entre parénte
sis, entonces no hay interacción entre ese factor y los demás factores de ese término.
Regla 3. Para cada término del modelo, los subíndices se dividen en tres clases: a) vivos: aquellos que es
tán presentes en el término y no están entre paréntesis; b) muertos: aquellos que están presentes en el tér
mino y están entre paréntesis; y e) ausentes: aquellos subíndices que están presentes en el modelo pero no
en ese término particular.
Por lo tanto, en (r{J),1, i y j son subíndices vivos y k es un subíndice ausente, y en e(ij)k• k es un subíndice
vivo, mientras que i y j son subíndices muertos.
2 Los diseños anidados se estudian en el capítulo 13.
532 CAPÍTULO 12 EXPERIMENTOS CON FACTORF.S ALEATORIOS
Reglo, 4. Grados de libertad. El número de grados de libertad de cualquier término del modelo es el pro
ducto del número de niveles asociados con cada subíndice muerto y el número de niveles asociados con
cada subíndice vivo menos 1.
Por ejemplo, el número de grados de libertad asociados con (r/3)ij es (a l)(b1), y el número de gra
dos de libertad asociados con t(if'Jk es ab(n - 1).
Reglo, 5. Cada término del modelo tiene asociado con él un componente de la varianza (efecto aleato
rio) o bien un factor fijo (efecto fijo). Si una interacción contiene al menos un efecto aleatorio, la interac
ción completa se considera aleatoria. Un componente de la varianza tiene letras griegas como subíndices
para identificar el efecto aleatorio particular. Por lo tanto, en un modelo mixto de dos factores con el fac
tor A fijo y el factor B aleatorio, el componente de la varianza deB es a~, y el componente de la varianza
deAB es a;P. Un efecto fijo se representa siempre por la suma de cuadrados de los componentes del mo
delo asociados con ese factor dividida por sus grados de libertad. En el ejemplo tratado aquí, el efecto de
A es
Regla 6. Cuadrados medios esperados. Para obtener los cuadrados medios esperados, se elabora la tabla
siguiente. Hay un renglón para cada componente (cuadrado medio) del modelo y una columna para cada
subíndice. Arriba de cada subíndice se escribe el número de niveles del factor asociados con ese subíndice
y si el factor es fijo (F) o aleatorio (R). Las réplicas siempre se consideran aleatorias.
a) En cada renglón se escribe 1 si uno de los subíndices muertos en el componente del renglón coin
cide con el subíndice de la columna:
F F R
a b n
Factor j k
E(ij)k 1 1
b) En cada renglón, si cualquiera de los subíndices del componente del mismo coincide con el sub
índice de la columna, se escribe O si el encabezado de la columna es un factor fijo y 1 si es un fac
tor aleatorio:
F F R
a b n
Factor j k
r¡ o
{J¡ o
('r/3)9 o o
8(ii~ 1 1 1
125 REGLAS PARA LOS CUADRADOS MEDIOS ESPERADOS 533
e) En las posiciones del renglón que quedan vacías se escribe el número de niveles que aparecen in
dicados arriba del encabezado de la columna:
F F R
a b n
Factor j k
T¡ o b n
/3j a o n
(r/3);i o o n
E¡· 1 1 1
d) Para obtener los cuadrados medios esperados de cualquier componente del modelo, primero se
cubren todas las columnas cuyos encabezados sean subíndices vivos de ese componente. Des
pués, en cada renglón que contiene al menos los mismos subíndices que los del componente bajo
consideración, se toma el producto de los números visibles y se multiplica por el factor fijo o alea
torio apropiado de la regla l. La suma de estas cantidades es el cuadrado medio esperado del
componente del modelo bajo consideración. Por ejemplo, para encontrar E(MSA), se cubre la co
lumna i. El producto de los números visibles en los renglones que contienen al menos el subíndi
ce i son bn (renglón 1), O (renglón 3) y 1(renglón4). Observe que i no está presente en el renglón
2. Por lo tanto, el cuadrado medio esperado es
E(MSA)=a +
bn! r7
2 ¡;¡
a-l
En la tabla 129 se presenta la tabla completa de los cuadrados medios esperados para este diseño. En
las tablas 1210 y 1211 se muestran las derivaciones de los cuadrados medios esperados para los modelos
con dos factores, aleatorio y mixto, respectivamente. Observe que se ha supuesto la versión restringida
del modelo mixto para producir los cuadrados medios esperados. En el ejemplo siguiente se considera un
diseño factorial con tres factores.
Ej'EMPLO 12 -6 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Considere un experimento factorial de tres factores con a niveles del factor A, b niveles del factor B, e ni
veles del factor C y n réplicas. El análisis de este diseño, suponiendo que todos los factores son de efectos
Tabla 129 Derivación de los cuadrados medios esperados, modelo de

efectos fijos con dos factores
F F R
a b n Cuadrado
Factor j k medio esperado
bn"J:.T2
T¡ o b n 2
a+--'
a1
anr.¡3~
{J¡ a o n
ª
2
+ b1
n"í:."í:.(r{J)~
(r/3);¡ o o n
2
a+
(al)(b 1)
E 1 1 1 1 ª2
Tabla 1210 Derivación de los cuadrados medios esperados, modelo de

efectos aleatorios con dos factores
R R R
a b n Cuadrado
Í¡ 1 b n a2 + n<?,11 + bna;
/3¡ a 1 n a2 + n<?,p + ana~
(•/3)ij 1 1 n a2+na;11
E;¡ 1 1 1 ª2
Tabla 1211 Derivación de los cuadrados medios esperados, modelo

mixto con dos factores
F R R
a b n Cuadrado
bnl:.•7
í¡ o b n
2 2
<1 +na,,s+--
a1
/3¡ a 1 n a2+ an<l~
('r/3)1¡ o 1 n a2+ n<l~
E ij 1 1 1 <12
Tabla 12·12 Derivación de los cuadrados medios esperados, modelo de

efectos aleatorios con tres factores
R R R R
a b e n Cuadrado
Factor j k l medio esperado
1:¡ 1 b e n a2 + cn<12r{J + bna;"Y + na2.P, + bcna2r
/3¡ a 1 e n o" + cn<?,11 + ana~ + na;fJr + acna~
2b2 2 2 b2
Yk a b 1 n a+ n<l"'Y+anafJr+na,fJr+a nar
2 2 2
(•/3);¡ 1 1 e n a + na,fJr + cna,p
(rrh 1 b 1 n a2 + na;¡¡y + bna~
(/3y)¡k a 1 1 n a2 + na2<PY + ana1h
(•/3y)ijk 1 1 1 n a2+na2 ,¡¡y
E¡¡kJ 1 1 1 1 ª2
126 PRUEBAS F APROXIMADAS 535
fijos, se presenta en la sección 54. Ahora se determinan los cuadrados medios esperados suponiendo que
todos los factores son aleatorios. El modelo estadístico apropiado es
Yijkl = µ+T; +{Ji +r, +(T/3);¡ +(ty)ik +({Jy)jk +(T{Jy)l}k +eqkl

Utilizando las reglas descritas antes, en la tabla 1212 se derivan los cuadrados medios esperados.
Se observa, al examinar los cuadrados medios esperados de la tabla 1212, que siA, By C son factores
aleatorios, entonces no existe ninguna prueba exacta para los efectos principales. Es decir, si se quiere
probar la hipótesisa; = O, no es posible formar un cociente de dos cuadrados medios esperados tal que el
único término del numerador que no está en el denominador sea bcna;. El mismo fenómeno ocurre para
los efectos principales de B y C. Observe que efectivamente existen las pruebas apropiadas para las in
teracciones de dos y tres factores. Sin embargo, es posible que las pruebas de los efectos principales sean
de importancia básica para el experimentador. Por lo tanto, lcómo deberán probarse los efectos principa
les? Este problema se considera en la siguiente sección .
.........................................................................
12-6 PRUEBASF APROXIMADAS
Es frecuente que en experimentos factoriales con tres o más factores incluidos en un modelo aleatorio o
mixto, así como en otros diseños más complejos, no exista un estadístico de prueba exacto para ciertos
efectos de los modelos. Una posible solución a este dilema es suponer que ciertas interacciones son insig
nificantes. Para ilustrar, si fuera razonable suponer que todas las interacciones de dos factores del ejem
plo 126 son insignificantes, entonces podría hacerse a~= o~ =o~ =O, y sería posible conducir
pruebas de los efectos principales.
Aun cuando parece tratarse de una posibilidad atractiva, es necesario señalar que debe haber algo en
la naturaleza del proceso o algún conocimiento previo sólido que permita suponer que una o más de
las interacciones son insignificantes. En general, no es sencillo establecer este supuesto, y tampoco debe
rá hacerse a la ligera. No deberán eliminarse ciertas interacciones del modelo sin evidencia concluyente
de que es apropiado hacerlo. Un procedimiento defendido por algunos experimentadores es probar pri
mero las interacciones, después fijar en cero aquellas interacciones que se hayan encontrado no significa
tivas, para después suponer que estas interacciones son cero cuando se prueben otros efectos en el mismo
experimento. Aun cuando en ocasiones se aplica en la práctica, este procedimiento puede ser riesgoso, ya
que cualquier decisión respecto a una interacción está sujeta tanto al error tipo 1 como al error tipo Il.
Una variante de esta idea es agrupar ciertos cuadrados medios en el análisis de varianza para obtener
una estimación del error con más grados de libertad. Por ejemplo, suponga que en el ejemplo 126 no fue
significativo el estadístico de prueba F0 = MSABc!MSE. Por lo tanto, H0:a;/j'¡ = O no se rechaza, y tanto
MSABc como MSE estiman la varianza del error a2. El experimentador podría considerar la agrupación o
combinación de MSABc y MSE de acuerdo con
MS , = abc(n- l)MSE +(al)(bl)(c l)MS ABc
E abc(nl)+(al)(bl)(c1)
de tal modo queE(MSE") = a2. Observe queMSE. tieneabc(n1) + (al)(bl)(c1) grados de libertad,
en comparación con los abc(n - 1) grados de libertad del MSE original.
El riesgo de agrupar es que puede incurrirse en un error tipo 11 y combinar con el error el cuadrado
medio de un factor que en realidad es significativo, obteniéndose así un nuevo cuadrado medio residual
536 CAPÍTULO 12 EXPERIMENTOSCONFACTORESALEATORIOS
(MS E') que es muy grande. Esto hará que sea más difícil detectar otros efectos significativos. Por otra par
te, si el cuadrado medio del error original tiene un número muy pequeño de grados de libertad (por ejem
plo, menos de seis), el experimentador quizá tenga mucho que ganar al hacer la agrupación, ya que podría
conseguirse así un incremento potencialmente considerable de la precisión de pruebas posteriores. Un
procedimiento razonablemente práctico es el siguiente. Si el cuadrado medio del error original tiene seis
o más grados de libertad, no hacer la agrupación. Si el cuadrado medio del error original tiene menos de
seis grados de libertad, hacer la agrupación sólo si el estadístico F del cuadrado medio que se agrupará no
es significativo para un valor grande de a, tal como a = 0.25.
Cuando no es posible suponer que ciertas interacciones son insignificantes y sigue siendo necesario
hacer inferencias acerca de los efectos para los que no existen pruebas exactas, puede emplearse un pro
cedimiento atribuido a Satterthwaite [97]. El método de Satterthwaite utiliza combinaciones lineales de
cuadrados medios, por ejemplo,
MS'= MS, + ··· +MS, (1231)
y
MS"= MSU + ... +MSV (1232)
donde los cuadrados medios de las ecuaciones 1231y1232 se seleccionan de tal modo que E(MS') -
E(MS") sea igual a un múltiplo del efecto (el parámetro del modelo o el componente dela varianza) con
siderado en la hipótesis nula. Entonces el estadístico de prueba sería
MS'
F= MS" (1233)
que se distribuye aproximadamente como Fp, q» donde
(MS, + ... +MS, )2

(1234)
p= MS? / t. + ... +MSJ / Ís
(MSu + ... +MSv )2

(1235) .
En p y q ,J; es el número de grados de libertad asociados con el cuadrado medio MS;. No existe la seguridad
de que p y q sean enteros, por lo que puede ser necesario hacer una interpolación en las tablas de la distri
bución F. Por ejemplo, en el modelo de efectos aleatorios con tres factores (tabla 1212), es relativamente
sencillo ver que un estadístico de prueba apropiado para H0 :a; = O sería F = MS' /MS", con
MS'= MSA +MSABC
MS"= MSAB +MSAC
Los grados de libertad de F se calcularían con las ecuaciones 1234 y 1235.

La teoría subyacente de esta prueba es que tanto el numerador como el denominador del estadístico
de prueba (ecuación 1233) se distribuyen aproximadamente como múltiplos de variables aleatorias
jicuadrada, y puesto que no aparece ningún cuadrado medio en el numerador o el denominador de la

ecuación 1233, el numerador y el denominador son independientes. Por lo tanto, en la ecuación 1233, F
se distribuye aproximadamente como Fp. q· Satterthwaite hace hincapié en que deberá prestarse atención
al aplicar el procedimiento cuando algunos de los cuadrados medios de MS' y MS" aparezcan con signos
negativos. Gaylor y Hopper [ 48] reportan que si MS' = MS1 - MS2, entonces la aproximación de Sattert
hwaite tiene una validez razonable si
MS
MS >/l.o.rru.tz
1
,¡, XF0_50.1, ,¡,
2
y si /1 s 100 y /2 <:=: fi/2.
EJEMPLO 12,,.7 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Se estudia la caída de la presión medida en una válvula de expansión de una turbina. El ingeniero de dise
ño considera que las variables importantes que influyen en las lecturas de la caída de la presión son la
temperatura del gas en la admisión (A), el operador (B) y el manómetro específico que utiliza el operador
(C). Estos tres factores se incluyen en un diseño factorial, con la temperatura del gas fija y el operador y el
manómetro aleatorios. En la tabla 1213 se muestran los datos codificados de dos réplicas. El modelo li
neal de este diseño es
donde r; es el efecto de la temperatura del gas (A),{Jj es el efecto del operador (B) Yl'k es el efecto del ma
nómetro (C).
El análisis de varianza se muestra en la tabla 1214. Se ha agregado la columna titulada "Cuadrados
medios esperados" a esta tabla, y las entradas de esta columna se derivan por los métodos estudiados en la
sección 125. Por la columna Cuadrados medios esperados, se observa que existen pruebas exactas para
todos los efectos esperados salvo el efecto principalA. En la tabla 1214 se muestran los resultados de es
tas pruebas. Para probar el efecto de la temperatura del gas, o H0:-r; = O, podría usarse el estadístico
MS'
F=-
MS"
Tabla 1213 Datos codificados de la caída de la presión para el experimento de la turbina

Temperatura del gas (A)
60ºF 75ºF 90ºF
Manómetro Operador (B) Operador (B) Operador (B)
(C) 1 2 3 4 1 2 3 4 1 2 3 4
1 -2 o 1 4 14 6 1 -7 -8 -2 -1 -2
-3 -9 8 4 14 o 2 6 8 20 -2 1
2 6 -5 -8 -3 22 8 6 -5 8 1 -9 8
4 1 -2 -7 24 6 2 2 3 -7 8 3
3 -1 -4 o -2 20 2 3 -5 -2 1 -4 1
-2 8 -7 4 16 o o 1 1 -2 -7 3
t00tOI
º°'º""'""'t
000000
V
:flS:¡j~(ó~
~o~N,....;o

o 00 t o o r
o v
...... v
~ ,....; ~ ,.,¡ ..¿. °' ..,.; ~
N 00
'O o ..... ~
"':s .....
Ir') .... ~
v "' (") N (")
~o
86
]"'.... ~1
i:::
~
l..)
1
~
o
g. +
,..<§:
o t::>
i:::
~o +
.,'$ """)"
s 5
b ~
l..)~
~ ~ 5 .§
('t'e-N
t::> t::>
C'
.g"' + +l.: +l.: + +

'O"' ]
.... ... ¡:.
"b "b ... ~ .. ~~ . . <§:
i::: I::! t::> b
Ji:
b
8 "' +
~ ~
+ + ...+b + + +
i::: i::: ~ I::!
~
"'5. "b "'e '"e
N
b "b "'b "b
..$
~

~u
"' o,)
'O 'O
...!!! B t!o N t'") N \O v \O
.... "'
N \O
e
"'~
'O
~
"'
8
5:.=
<11
'O
_g
~
'°
~ ~,g \O N
....°' r. °' r.
v
.... o N
fü "'N °' oo Ir) t'")
"'"'
00
>
..,.;
~ r: ,....; r: o\
Rt o
~ en
~~
e =.... v N "' .... .....
~ \O ~
(")
"'
j ~ \..)
o e ~ ~ o"
~
.... 'O o
o,)·
... ál .: ....
o
....
Ñ
...!! ~>
~~ ~o 'O ~
"' ~
.... e
..e ~ o ] \..)
~ ~ 8' ~ \..)
~ ~ ~ ~ ~ ¡S
\..)
538
donde
MS'= MSA +MSABC
y
MS"= MSAB +MSAC
ya que
bcn'l:.r2
E(MS')-E(MS")= . '
a-1
Para determinar el estadístico de prueba para H0:r¡ = O, se calculan
MS'= MSA +MSABC
= 511.68+ 13.84 = 525.52
MS"=MSAB +MSAC
= 202.00+ 34.47 = 236.47
y
F = MS' = 525.52 = 2_22
MS" 236.47
Los grados de libertad de este estadístico se encuentran con las ecuaciones 1234 y 1235 de la siguiente
manera:
( MS A + MS ABC ) 2
p= MS2A /2+MSABC2 /12
= (525.52)2 = 211 =2
(511.68)2/2+(13.84)2/12
y
(MSAB +MS AC )2
q= MSAB
2 /6+MSAC2 /4
(236.47)2
= '' 7.88=8
(202.00)2 / 6+(34.47)2 / 4
=
Al comparar F 2.22 conFo.os,2,8 = 4.46, no puede rechazarse E, El valor P aproximado esP 0.17. =
La interacciónAB, o temperaturaoperador, es grande, y hay ciertos indicios de una interacciónAC o
temperaturamanómetro. El análisis gráfico de las interaccionesAB y AC, ilustrado en la figura 122, indi
ca que el efecto de la temperatura puede ser grande cuando se usan el operador 1 y el manómetro 3. Por lo
tanto, parece posible que los efectos principales de la temperatura y el operador estén enmascarados por
la interacción AB grande .
.........................................................................
En la tabla 1215 se presenta la salida de la rutina Balanced ANOVA (análisis de varianza balancea
do) de Minitab para el experimento del ejemplo 127. Se ha especificado el modelo restringido. Q[l] re
presenta el efecto fijo de la presión del gas. Observe que las entradas de la tabla del análisis de varianza
125
100 100
a¡ 75
X
75
< (;,)
X
[(l
50 ~ 50
~ ,,a;[(l
.s"'
"'.
e
25. ""' 25
8;2 ,,.,
_!!¡
"'
"iii e~
.§ o B-4 g¡ o 1
c~2
~
-25 B· 1 -25
B;J C;3
-50 50
60 75 90 60 75 90
A A
Figura 12.2 Interacciones en el experimento de la caída de la presión.
concuerdan en general con las de la tabla 1214, salvo por la pruebaF de la temperatura del gas (factor A).
Minitab indica que la prueba no es exacta (lo que se ve por los cuadrados medios esperados). La Prueba
Sintetizada construida por Minitab es en realidad el procedimiento de Satterthwaite, pero usa un estadís
tico de prueba diferente del que se utilizó aquí. Observe que, por la salida de Minitab, el cuadrado medio
del error para probar el factor A es
( 4)+ ( 5) 7 = MS AB + MS AC - MS AfJC
cuyo valor esperado es
E1(4)+(5)(7)]= a? +na;h +cna;¡¡ +a2 +na;h
+bno:lJ' -(a2 +na2•h )
= a2 +na2•h +cna2•ti +bnoí:lJ'

que es un cuadrado medio del error apropiado para probar el efecto promedio de A. Esto es una muy bue
na ilustración de que puede haber más de una manera de construir los cuadrados medios sintéticos usa
dos en el procedimiento de Satterthwaite. Sin embargo, se preferiría en general la combinación lineal de
los cuadrados medios que se seleccionaron, en lugar de la que eligió Minitab, ya que no incluye ningún
cuadrado medio con signo negativo en las combinaciones lineales.
El análisis del ejemplo 127, suponiendo el modelo no restringido, se presenta en la tabla 1216.
La diferencia principal con el modelo restringido es que ahora los valores esperados de los cuadrados me
dios de los tres efectos principales son tales que no existe ninguna prueba exacta. En el modelo restringido,
los dos efectos aleatorios promedio podrían probarse contra su interacción, pero ahora el cuadrado me
dio esperado de B incluye a a ;/Ir y a a ;tJ, y el cuadrado medio esperado de C incluye a a ;/Ir y a a~ . De nueva
cuenta, Minitab construye cuadrados medios sintéticos y prueba estos efectos con el procedimiento de
Satterthwaite. Las conclusiones generales no son radicalmente diferentes del análisis del modelo restrin
gido, además del cambio grande en la estimación del componente de la varianza del operador. El modelo
no restringido produce una estimación negativa de a~. Puesto que el factor manómetro no es significativo
en ninguno de los dos análisis, es posible que sea pertinente alguna reducción del modelo.
e
s, M
Cll ....
...... ......
OI
..e .t"
U N
111
>< w + en
E
Q....O..t00. ..... 00 ' .....
..00.00
. . '°ºº°''°00
........... ..........
~º""".t"
....
o
... e l.. .....
ººººººº cu a
c.. o+
cu e ,.... .....
'
W'"
......
.... º"'º°'°',..,"'
,.,o .... "'~'°'°
::::J
17"1:111\
.... N,.,""' ....
............t"ll"I
..... 1
o .....
en
. 11111"1
111 ._. 00 .t._. ......
N~O.t"N..0
..... ""00..N000
e u ........
111
lll· ... +++++
Cll c..
E+-1,-..~,...,,,...,..,.,"'"",.....
Cll +
..e
enoo,....00 ..... .#"o
111 ..... 0a ........... a ..... .... .....
EON00.t0.004"
""C cu"""""""'"'""~ c#"
> ......
.. ..... N.t.t" ..... ..
....
Cll C...N00NNON
en
UICll+++++++
..t" 0,.,rt'l.N C11 e
en,.,
In. N
111::t""'""'"'._,....,....,.""'.....,
00 00 00 00 00 00 00 00
Q.· ....'""~~,...,...,.,,,...,_,,,....,,...,
>< Z:0
LIJ
L.N
c.. ON
enONO....._o....._..oN o e C..N
en,..,oo .... o.oo.t..1nrr1 ' c.. ... ....
w
...
.... Cll
..........................
NN ..rt'I00
°''°ºº ln
w ... 111
111 c.
0.t"
..... ....
N.N.
,..,
0. Cll ....
u
e C11
c
0.11"10.0.NO,.,
0011"1 ..... 11"1000
111
Cll
..........
c.°'
°',.,""""'"'"'"'.t" 1
4110.... o lll c .... e
.....::i '°
.... .... o "'D o
o .... c.
"'
Cll '
iu e
>
lll
c.
.._Nrt'IN0.tONO..
.... ,.., . . . >o .,.. ....
w
111
L.
o u
~
....111 ...c
Cll Cll
en ..e
Cll Cll ::i
>
Cll
u
e
Cll
1C11 ...
Cll lll
l.D ... >
...J
4110 e e
111
.,..
....
::i
111
UJ
....
1
.._
o
""'
en c..
:::Jo
111
Cll
.....
cn
...o
c. o o
Cll lll Cll ... .... ... IU ...
> ><
1•rCC
a "" > '
º
ICll s,
::::Jo
u
IU
IUCll\!:llll
'en• ' ""
Cll ~
~ lll
........ ta ~
o
..., ca... >< ' Cll ::i .... Cll
"' 111
.... 111 '
IO C11 UJ 111
c.. t11 •
Cll ::::J c.. Cll
....
Cll
c
O
+'
Q.IUOC.
OUJ+'O 111 GJii...
.,..
o cu Cll"' "' IO"' '"' Cll

'
o
....lll 111 C11
O
+'
Q.cuOQ.
O CI..., O
lll
.... Cll
l&..IClll1L.l0
lllQl:::JllllllClllll'
~
....
1 ......
Cll 111
Cll > U CUCll"'"' cu•"' u 1110.IUIUIUC.IU&.. c ' u cu
....1 .... t1I L.1 l.. Oll1 L.1 lll o o ' \!:10<.0UJUJOUJW > o &..l.D
u 111 Cll ::i cu ::i 111 Cll ::) 111 111 Cll 111 c.. ... z ::i en ' ::::J
ca m c. ca C 01110.IUllllUC.lll'O O ..Nrt'l.t"ll"l0 ..... 0C) ' o .....
"'1.DOUJ C Cl>CIOl.DUJUJOl.DWI X en "' w en
541
.i: uoo...:t
U G.N
IO
)( )( )(
w +++ CI')
E
CL.00000..00
,._.1"1000000
L.'",.....'"'
o"""' ..,,.11\
...000001' ~'ti ...............
~·
0..0000
C)C)OOOOO Cll &
... + + +
..
"'
:,, 'tiGJ"""',....,,,,...."""'
C'+'11\..00..,,.11\0 o
en u.._,.._,.._,.._......,,.,,,,,....
NCO.:l'NNO
... e'
~ +'
•r00..0>0>000>0
+ + + + + + U)
E11 CllCU,...,.,..,..,.....,......,..."'~ CIJ +. + +

,_,._,._,._,._,._,._,._ ....e..,,...,,.
$:
,.... ,...... """"
Cl')GC)f'QC)f'...,,.0 ,, e.._,.._,.._,'"'"""".._,...., in
E..ON00.:tOOO_,. Cll :::JNNNNNNN >i. ...... ....., .......
..... VI
..l")N.:t.:tl"I. uen+++++++
..#" 01")1"'1.N C11 e
11\.. N c.·~ . . . . ,.... " ""' , . . ,. . . . . . "' ,..,.
)( CllOOOOOOOOOOOOOOOO
LLI :S.._,'""""''~.._,...,._.
L.N l'l"l 11\
l.. ONNll\
Cl')\QN0.1'01'.0N O E r....NN
Cl')l"lOO.O.oo.:t.U"\l""I l.. l.. • s,
,._
11\NN
f'l'll"ll'.r0.000
...
w .....
CIJ w
....
U)
NN .l"I001'U"\
0.:t N.N.,._0 cu .. .1'.:t0.0NOl"l U) .... r o 00
. . l"I uc ..,,.'Oltll'.000
º°'º°'
o.
'° ,._
111
e" 11\ .... "" 11\ "' ..... ..,,. 1
o IO C:
... o .,, o
1.. 11\
c..
Q l.. Q. 11 l..
LLNl"IN>O.:t..ON0. m E ... l..
1... Q .... f'l'l,._ >o .,... w
o u U)
.... ~ Cll Cll

.....
Cll
>
Cll
u Cll
Ch
Cll
en
::::J
l'Cll
...
.e
e
Cll e en ..... UJ >.
..J IO ::::J 1 Cll. VI
IV LL. ' en '
11,, e & c.. l.!> o ::::Jo '
Q.CllOO m C11 "' +' IO +' o
>. )(,,,, > ' en' ~
1 ... e e o ::::Jo "'
c.. Cll
en•l.!> "'c..
~ m 10
...... ~
o
+' m....,
111 Cll UJ 111
l....
O
Cll ::::J l.. Cll
Q.CVOQ.
U)
El!
l....
....o111
...o Ch c..
c.. en... c..
Cll ::::J c.. Cll
+' Ol.!>...,O
lllGl1<lt l'Cllolt l..
Cll
Cll
'
Cll Cll
c.. .....
...
Ch Cll
o
.....
0.11100.
o!.::! ..... o Cll
1
U)
l.. entt 1....1 o
111 ::::J Ch Ch Cll U) s,
•.... t t ' en
111 U) Cll ::::J
o m 11 >. u l'Cll Cll i< ... l'Cll.
' .... ..... u cvo.mmcvo.1111.... e l.... UIUQ.IV
+.'tC..en .... .:..1 ' en11 .:..1 o m o ' 1.::101.::!l!ll.!>OUIW >. o l.... l.::! o
UJ
UChCll::::J co ::::1cnC11::::100C110'+' z ::::J CI') ... ::::J
O .Nf'l'l..,,.11\0,._00 o.Nl'l"l
•
CO IV Q. IV C OIUO.l'Clll'Clll'CllQ.CVi:..O l..
LLUJOl.!> C Cl')UJ0!.::11.::!l.!>Ol.!>WI )( VI w CI')
542
12 7 ALGUNOS TEMAS ADICIONALES SOBRE LA ESTIMACIÓN DE LOS COMPONENTES DE LA VARIANZA 543
12 .. 7 ALGUNOS TEMAS ADICIONALES SOBRE LA ESTIMACIÓN DE LOS
COMPONENTES DE LA VARIANZA
Como se señaló anteriormente, la estimación de los componentes de la varianza en un modelo aleatorio o

mixto reviste con frecuencia considerable importancia para el experimentador. En esta sección se presen
tan algunos resultados y técnicas adicionales que son útiles para estimar los componentes de la varianza.
La atención se centra en los procedimientos para encontrar intervalos de confianza para los componentes
de la varianza, y se ilustra asimismo cómo encontrar estimaciones de máxima verosimilitud de los compo
nentes de la varianza. El método de máxima verosimilitud puede ser una alternativa útil cuando el méto
do del análisis de varianza produce estimaciones negativas.
127.1 Intervalos de confianza aproximados para los componentes de la varianza

Cuando se introdujo el modelo de efectos aleatorios en la sección 121,se presentaron intervalos de con
fianza exactos de 100(1a) por ciento para a2 y para otras funciones de los componentes de la varianza en
ese diseño experimental simple. Siempre es posible encontrar un intervalo de confianza exacto para cual
quier función de los componentes de la varianza que es el valor esperado de uno de los cuadrados medios
del análisis de varianza. Por ejemplo, considere el cuadrado medio del error. Puesto que E(MSE) = u2,
siempre es posible encontrar un intervalo de confianza exacto para a2, ya que la cantidad
feMSe / ª2 = fEa2 / az
tiene una distribución jicuadrada con !E grados de libertad. El intervalo de confianza exacto de 100( 1 a)
por ciento es
(1236)
Desafortunadamente, en experimentos más complejos en los que intervienen varios factores del dise
ño no es posible por lo general encontrar intervalos de confianza exactos para los componentes de la va
rianza de interés, ya que estas varianzas no son el valor esperado de un solo cuadrado medio del análisis
de varianza. Sin embargo, los conceptos fundamentales de las "pseudo" pruebas F aproximadas de Sat
terthwaite, introducidos en la sección 126, pueden emplearse para construir intervalos de confianza
aproximados de los componentes de la varianza para los que no se cuenta con ningún intervalo de con
fianza exacto.
Recuerde que el método de Satterthwaite utiliza dos combinaciones lineales de cuadrados medios
MS'= MS, + ··· +MS5
y
MS"= MSU + ... +MS,,
con el estadístico de prueba
MS'
F= MS"
que tiene una distribuciónF aproximada. Al utilizar los grados de libertad apropiados paraMS' y MS", de
finidos en las ecuaciones 1234 y 1235, este estadístico F puede usarse en una prueba de significación
aproximada del parámetro o del componente de la varianza de interés.
Para probar la significación de un componente de la varianza, por ejemplo a~, las dos combinaciones
lineales, MS' y MS", se eligen de tal modo que la diferencia en sus valores esperados sea igual a un múlti
plo del componente, por ejemplo
E(MS')- E(MS")= ko~
o
2 _ E(MS')-E(MS")
ºº - k . (1237)
La ecuación 1237 proporciona una base para una estimación puntual de a~:
A2 MS'-MS"
=ºº k
= _.!:.k MS + ... +.!.k MS 'k_ _.!:. MS
T U
- ... .!.k MS V
(1238)
Los cuadrados medios (MS¡) de la ecuación 1238 son independientes, donde las/ ¡MS/a7 = SS/a7 tienen
distribuciones jicuadrada coa]¡ grados de libertad. La estimación del componente de la varianza.rrj , es
una combinación lineal de múltiplos de los cuadrados medios, y ra ~la~ sigue una distribución jicuadrada
aproximada con r grados de libertad, donde
(á~ )2
r=-----
¿2·
m
M k Í;
1 MS2
(MS + .. ·+MS -MS - 00 ·-MS )2

= MS~ M;2 M~2 M~2 (1239)
__ r + ... +' +--u + ... +·_v
J, t. t. t.
Este resultado sólo puede usarse si fJ ~ > O. Como r no será un entero en la mayoría de los casos, por lo ge
neral será necesario hacer una interpolación de las tablas jicuadrada. Graybill [50] establece un resulta
do general para r.
Ahora bien, puesto que rfJ ~ Ja2 tiene una distribución jicuadrada aproximada con r grados de libertad,
2
P { X1-a12,r :s;;
ro~ 2
~ Xa12,r
}
= 1 a
0~
y
rfJ~
p { 2:s;;ªº 2
:s;;
rfJ~
z
}
= 1a
Xa/2,r X1-aJ2,r
Por lo tanto, un intervalo de confianza aproximado de 100(1 a) por ciento para a~ es

rfJ2 A 2
º<
2
2<
-Uo -
roo
2 (1240)
X a/2,r X 1-a/2,r
EJEMPLO 12 .. s ····························································
Para ilustrar este procedimiento, considere nuevamente el experimento del ejemplo 12 7, donde se usó
un modelo mixto con tres factores en un estudio de la caída de la presión en una válvula de expansión de
una turbina. El modelo es
Yi¡kl = u+i¡ +P¡ +yk +(rP)¡¡ +(ryh +(PY)¡k +(rPY);¡k +E;¡kl
127 ALGUNOS TEMAS ADICIONALES SOBRE LA ESTIMACIÓN DE LOS COMPONENTES DE LA VARIANZA 545
donde r; es un efecto fijo y todos los demás efectos son aleatorios. Se encontrará un intervalo de confianza
aproximado para a;P. Al utilizar los cuadrados medios esperados de la tabla 1214, se observa que la dife
rencia en los valores esperados de los cuadrados medios para el efecto de la interacción de dos factores
AB y el efecto de interacción de tres factores ABC es un múltiplo del componente de la varianza de
.
mter é s, a,p·
2
E(MS AB )- E(MS ABC) =a 2 +na;h +cna;P -(a2 +na~)

= cna,P2
Por lo tanto, la estimación puntual de a;P es
á2 = MS AB - MS ABC = 134.9119.26 = 19.28
•fi en (3)(2)
y
r = '( M_S=AB'--_M_S-"AB=c'-)_2 = (134. 9119.26)2 = 436
MS!s MS!sc (134.91)2 (19.26)2
='+="' +
(al)(b1) (a- l)(b l)(c1) (2)(3) (2)(3)(2)
El intervalo de confianza aproximado de 95% paraa;P se encuentra entonces con la ecuación 1240 de la
siguiente manera:
ro;fJ
2
ro~
2-~a.p :S2
X 0.025 .r X O.'J1S ·'
( 4.36)(19.28) :S (}2 < (4.36)(19.28)
11.58 TfJ - 0.61
7.26 :S a;P :S 137.81
Este resultado es consistente con los resultados de la pruebaF exacta para a;fi, en que hay evidencia sóli
.........................................................................
da de que este componente de la varianza es diferente de cero .
127.2 Método de grandes muestras modificado

El método de Satterthwaite de la sección anterior es una forma relativamente simple de encontrar un in
tervalo de confianza aproximado para un componente de la varianza que puede expresarse como una
combinación lineal de cuadrados medios, por ejemplo
=¿
Q
6'~ C¡MS¡ (1241)

i=-1
El método de Satterthwaite funciona bien cuando los grados de libertad de cada cuadrado medio MS; son
relativamente grandes, y cuando todas las constantes e; de la ecuación 1241 son positivas. Sin embargo,
en ocasiones algunas de las e; son negativas. Graybill y Wang [51] propusieron un procedimiento llamado
método de grandes muestras modificado, que puede ser una alternativa muy útil del método de Sattert
hwaite. Si todas las constantes e; de la ecuación 1241 son positivas, entonces el intervalo de confianza mo
dificado de 100(1 a) por ciento de una muestra grande para a~ es
Q Q
tJ20 - ~
~
G2c~ MS2 :::;; ª02 :S (120 + _¿
l l 1
~ H2c2 MS2 I 1 1
(1242)
546 CAPÍ11JLO 12 EXPERIMENTOS CON FACTORE.5 ALEATORIOS
donde
1 1
G. =1 y H.= 1
1 Fa,f ,oo 1
l F.la,/,; 1oci
Observe que una variable aleatoria F con un número infinito de grados de libertad en el denominador es
equivalente a una variable aleatoria jicuadrada dividida por sus grados de libertad.
Considere ahora el caso más general de la ecuación 1241, donde las constantes e; no tienen restric
ciones sobre el signo. Esto puede escribirse como
p Q
á~ = L c,MS, - L c¡MS¡, (1243)
i~l ¡~P+l
Ting, et al [110], dan un intervalo de confianza inferior aproximado de 100(1a) por ciento para a~ como
L= <J~ -.Jfl: (1244)
donde
p Q p Q
VL =L c;
G;2 MS;2 + L HJcJ MS} + L L G:c;c¡MS;MS¡
i~l jmP+l ;~1 j~P+l
L L G;,c;c MS;MS
P-1 P
+ 1 1
i~l t»¡
G.=11
, F a,f,,OQ
H¡ = l 1
Fi-a,/1,m
1)2 G2 F2 - H2
G.. = ( Fa,f¡,f¡
l
• a,/;./¡ J
'' Fa,/,./¡
G. =
"
r(1
l
1 Fa,fi+ !,,"'
)2 (/; + f,)2
t.t,
'G2f._;'G2f,' (P1),
f. /;
si P > 1 y e;;, = O si P = 1
Estos resultados también pueden extenderse para incluir intervalos de confianza aproximados para
cocientes de componentes de la.varianza. Para una relación completa de estos métodos, referirse al exce
lente libro de Burdick y Graybill [22].
Ej'EMPLO 12-9 · · · · · · · · · · · · • · · · • · · · • · · · · · · · · · · · · · · · · · · · · · · · · • · · · · · · · · · · · · · ·
Para ilustrar el método de grandes muestras modificado, considere nuevamente el modelo mixto con tres
factores del ejemplo 12 7. Se encontrará un intervalo de confianza inferior aproximado de 95% para a;P.
Recuerde que la estimacíón puntual de u~ es
A 2 = MS AB - MS ABC = 134.9119.26 = 19 28
a rP en (3)(2) ·
127 ALGUNOS TEMAS ADICIONALES SOBRE LA ESTIMACIÓN DE LOS COMPONENTES DE LA VARIANZA 54 7
Por lo tanto, en la notación de la ecuación 1243, c1 = c2 = 1/6,

y
1
G1 =11
F. 1= 0.524
0.05 ,6 • ., 2.1
1 1
H2 = 1=O4351=1.30
Fo.95,12,., •
G = ( Fo.os.6.12
1)2 (G1 )2 F.2o.os,6,12
(H 2 )2
12 F.
0.05,6,12
= (3.001 )2 (0.524)2 (3.00)2 (1.3)2 = 0.054

3.00
G;, =0
Por la ecuación 1244
VL = G12c; MS:W +HiciMS:Wc +G12c1c2MSA0MS ABc

= (0.524)2 (1 / 6)2 (134.91)2 +(l.3)2 (1/6)2 (19.26)2
+(0.054)(1/6)(1/6)(134.91)(19.26)
= 152.36
Así, un límite de confianza inferior aproximado de 95% para a;fl es
L= a;fl -JV: = 19.28.J15236 = 6.94
Este resultado es consistente con los resultados de la prueba F exacta para este efecto.
127.3 Estimación de máxima verosimilitud de componentes de la varianza

En este capítulo se ha subrayado el método del análisis de varianza para estimar los componentes de la
varianza debido a que es relativamente directo y hace uso de cantidades familiares: los cuadrados medios
de la tabla del análisis de varianza. Sin embargo, el método tiene ciertas desventajas, incluyendo la moles
ta tendencia a producir en ocasiones estimaciones negativas. Además, el método del análisis de varianza
es en realidad un método de estimador de momentos, una técnica que los especialistas en estadística ma
temática prefieren en general no usar para estimar parámetros, debido a que resulta con frecuencia en es
timaciones de parámetros que no tienen buenas propiedades estadísticas. A la técnica de estimación de
parámetros preferida se le llama método de máxima verosimilitud. La implementación de este método
puede ser un tanto complicada, en particular para el modelo de un diseño experimental, pero en cierto
sentido el método de máxima verosimilitud selecciona estimaciones de los parámetros que, para un mo
delo y una distribución del error especificados, maximiza la probabilidad de ocurrencia de los resultados
muestrales. Una descripción general muy adecuada del método de máxima verosimilitud aplicado amo
delos de diseños experimentalles se ofrece en Milliken y Johnson [79].
La revisión completa del método de máxima verosimilitud sale del alcance de este libro, pero la idea
general puede ilustrarse con suma facilidad. Soponga quex es una variable aleatoria con una distribución
de probabilidadf(x; O), donde O es un parámetro desconocido. Seax¡,x2, ••• ,xn una muestra aleatoria den
observaciones. Entonces la función de verosimilitud de la muestra es
Observe que ahora la función de verosimilitud es una función únicamente del parámetro desconocido O.
El estimador de máxima verosimilitud de fJ es el valor de O que maximiza la función de verosimilitudL(8).
Para ilustrar cómo se aplica esto en el modelo de un diseño experimental con efectos aleatorios, con
sidere un modelo de dos factores con a = b = n = 2. El modelo es
Y;¡k = µ+r¡ +t', +(r/3);¡ +Eiik
con i = 1, 2, j = 1, 2 y k = 1, 2. La varianza de cualquier observación es
.. ) = 02y = 02 +azfJ +a2<fJ +o '
V(y 1jk f
y las covarianzas son

Cov(yifk' Yt/k' )=a; +a~ +a;fJ i = i ', j = j', k ;é k
1
= ª2f i='i', i=i' (1245)

-az
- fJ i ;é i', i= j'
=O i ;é i', j;t:. j'
Es conveniente considerar las observaciones como un vector 8 x 1, es decir,
Ym
Y112
Y211
Y21z
y=
Yui
Y122
Y221
Y222
y las varianzas y covarianzas pueden expresarse como una matriz de covarianza 8 X 8
s ~~: i:J
donde 1:11, >:22, l:12 y 2':21 = l:' 12 son matrices 4 x 4 definidas de la siguiente manera:
ª2y 02' +a2{J +a2r{J

1
ª2
f r
02r +a2{J +a2r{J ª2y ª2f u'f

ª2
l':u = >=22 = ª2f ª2f ª2y 2
a, +a
2
fJ
2
+a,fJ
2 2 2
ª2f ª2f a, +a fJ +ar{J ª2
y
ª2{I
ª2{J o
= o
ª2{J ª2{J o
ª2 1
>=12
o ª2{J
u~
o o ª2{J {J
12 7 ALGUNOS TEMAS ADICIONALES SOBRE LA ESTIMACIÓN DE LOS COMPONENTES DE LA VARIANZA 549
y l:21 es sólo la transpuesta de 1:12• Entonces cada observación sigue una distribución normal con varianza
a~,y si se supone que todas las N
= abn observaciones tienen una distribución normal conjunta, entonces
la función de verosimilitud del modelo aleatorio queda como
donde jN es un vector N x 1 compuesto de unos. Las estimaciones de máxima verosimilitud deµ, a;, a~,
a;P y a2 son los valores de estos parámetros que maximizan la función de verosimilitud. También sería de
seable restringir las estimaciones de los componentes de la varianza a valores no negativos. Por lo tanto,
en la práctica la función de verosimilitud se maximizaría sujeta a esta restricción.
La estimación de los componentes de la varianza por el método de máxima verosimilitud requiere
software de computadora especializado. Algunos paquetes de software de estadística general cuentan
con esta capacidad. El sistema SAS calcula estimaciones de máxima verosimilitud de los componentes de
la varianza de modelos aleatorios o mixtos con la rutina SAS PROC MIXED. Se ilustrará el uso de la ruti
na PROC MIXED aplicándola al modelo factorial de dos factores introducido en los ejemplos 122 y
123.
Considere primero el ejemplo 122. Se trata del modelo de un diseño factorial de efectos aleatorios
con dos factores. El método del análisis de varianza ha producido una estimación negativa del componen
te de la varianza de la interacción. Las estimaciones negativas de los componentes de la varianza pueden
evitarse en la rutina PROC MIXED especificando el uso del método de máxima verosimilitud restringi
da (o residual) (REML, por sus siglas en inglés). En esencia, la REML restringe las estimaciones de los
componentes de la varianza a valores no negativos.
La rutina PROC MIXED del sistema SAS requiere como entrada la matriz de covarianza de los pará
l
metros del modelo. La estructura de un modelo aleatorio en el que todas las variables aleatorias son mu
tuamente independientes es
a;1 O O
G= O a~l O (1246)
[
O O a;/l1
donde las 1 son matrices identidad. (La estructura de la covarianza de un modelo puede especificarse en
la rutina PROC MIXED con la opción TYPE = structure en el enunciado RANDOM.) La estructura de
la covarianza del modelo del ejemplo 122 se especifica como TYPE = SIM (el valor por omisión de
PROC MIXED), que especifica la estructura simple de la covarianza para los parámetros del modelo da
dos en la ecuación 1246.
En la tabla 1217 se presenta la salida de la rutina PROC MIXED de SAS para el experimento del
ejemplo 122. Se especificó el método de estimación REML de los componentes de la varianza. La salida
se ha anotado con números para facilitar la descripción que se presenta a continuación:
l. Estimaciones de los componentes de la varianza y la salida relacionada.
2. Parámetro covarianza, Identifica los parámetros del modelo: a;, a~, a;P y a2.
3. Cociente de la varianza estimada del efecto y la varianza estimada del error residual:
{12 / {12
'
4. Estimaciones de los parámetros. Son las estimaciones REML de los componentes de la varianza
&; ,fl~, &;P y f12• Observe que la estimación REML de a-;P es cero.
o ..... ~
. . '° .....,.,
11'\,., o
.g "'
ll)
c.. .000
cu
º'°... ....
ª
"' Q.
Q.
$"' ~:::) 0000 e

o.::: "' ,.,
,., 00
. e,.,
11'\
~
c..
cu º'° _,"' ...... o.
8 :1
o
º,.,
1
o l000000
:::1,.._NO,.._
'U
ll)
....1 '0011'\0.
~
,.,.... 11'\"' o 11'\
o
'""""'°º°'
U>ONOll'I
..
00 QIOOO.
§1! a::oooo
ll)
_s
~ ...
N
Q.
_,
00 o
0000·
,., ~
1 1 1
ll)
........ ce
•O
o
a ...
'U 11)
ON
"O
oc ,.., N ~o o Cll
i:t:OOOO
'.::l"' ...... o o w
s·.o
..N ....1
E A
o
lO
fi!i
ººººº
t-0000
:::>
CUON00>00~"'1
:::io""°'°'°'Ll"I..
u °' ....
o w
a:: '
00
....11)
<0000
a:oooo
..J _, O 00 l"I
ce lOOOOO
e >O N O
• • •1""1
"O
;;l
00 ..... Q.
"'ºººº >> .• ·~00~ •
...
..
o
......... 00 w 0..0000
. .
00000..-0..
....o ...ººººº
o. e N.:t •Q N
cu ~ ....
' NNNO
"'10 o
(11
1 1 1 ~
2:!
Cll .......o
.... '() ..... .....
N
t0000 ....o
º"" .....
p,
a: 1 e
:g g ,,
lO
:::i lO
L.
~"'
E ..,,,. ....
e
11'\
... ' 000 ..e.. . ...

)( ce
Q..
e
.....o... ..o..e
.., :>"' u º,.... ...lO
]·i:: ' tll •O 111 1 tll ' o
o cu ,., 11) N ..... cu ....
o .... .... NN w o OCIO1(\ ..,
'°o....
11)
.....
.,..e"'
ll)
o. lO '
e
'°'°
ll)
:::1
s, ' tN00 .....
2:! .,.. Cll
... ........c.. ,,o

"O E S!
,.... 'N 00,.... a:,., ...... o
....,,,>~~~~ El .....cu El~
' 00 s, .....
..,,,.
...e
Q..
'U
.9
E
(1,) "'
ll)
Q
lO
,,... ,..,01"'1..... N....
NI'\ e ~cu u CC'O"'ON
Q.0.011"\ ~~ 111
cu cu e w
,, e'' o
w ¡:: 01'\0'0
'U
a >< >cu 111 o e ONON .... o .e
"'ll) ~o ....
1'11
o
.
l"'IN lO U) 0"1 00000 e: o·. e·..
~ urn cu
E ....! 'N
cu
c..
lO
c..
ca
0"100
. C)
.......
e
cuoo .... ca .....
...,.t""'J::..ca•r- GJ
~~ .r:.
1
111
111
lO
>
Cll
Q.
cu
...
cu
lO
N'OOO
N.:tOl"'I
°'..,,,.o,.,.,
>
o
....
....
o.oo
1
.....
lO...., .,.. E 111 ~
eca ..... c..cu· ...
Cll o )....J
;¡;¡"O
· ll)
¡¡¡ ,....;¡ .....

....
_J
u
e.,,
e
~]......
N>000
ONO. u
....... ..........
111 .... >~'+lO
e ClllCU•rC:l:DCI
::E a:: 1 0.-0"'1 l:lll:OONOl/'I o Owo..1 .... o
.... o,....,.,º°'
. .
~ ¡;-¿ oce 'l""' 11'\ 000
<
11) ...J .,. .,.. 111....1
1U ' w ONOOO o t-0..-00...... cu.,.....,111.,,Cllll•
< .... ca ..... .,,c.cauc..o N....I
¡:: 11)
1 a:: ....! <""''°º°'
(f) ~ 111
ca a: > .... 1
ºººº c. a::OOOI"\ o•,..>cca....1e11c..z:
....o C..C..lO"tJ
z: UQl•.C....l•,..:la:: lO w
"' al wo. E w..000 .w
'< Q.. w
~ .§
. . .
).. 0.0000
OIX
...o
.... o. llllllC..lOElO.C
:~ ~ °'ººº <
U)
ººººº CU.Cftl.¡.>f.Ll.W UN
4).$
..g
tt'INOO
"'0000 ºººº 1
OO>U)a::ceU) 1
'U
@ ~: El~ º""ºº
Nr.OO
l"\l"\00
a:
~·:
...... "B: .ooo o
::E ::>: . .
º'°ºº 1
cc
u<;!
QN:
0:::~1
o.._
...
o..o..
1 ea::
c..o o. lO
a:
..........
~"'.,¡Si a::
lO 1
Q.. <
o :::1
... ,,
· .,,
"U ·
~ (ij'.
o
....ce IXl1•,..
> w a:: a:: 11)
OQ..CCCC CU
(/)"O a:: voo..o..a:::
....
i:
E
c..
a::
o Q.. "''lO
1 o : :i
....N' 8: ce ...
a:: 1 1 ....
,,
..!3
,,e¡ > w a:: a:: 111
o.. e e cu
~ ....o o a.. a.. a:
550
,..,.., . .,.
Qj
§ L.
'° ..,.....
u
~ Cll
Q.
o
"'~ Q. 00
8 ::>
e .....
.,e..."' .....
o;
.., ..,
L. 00 • °'
$ Cll 00
=
In
3
:2 o e e
43 ...J
,..,,
e... o
e ......
"'
o IO In • 11"1 «I ""'º . . .
00 o°'
e: .r;;. o o ::::1 NO,.._
e
::l
Q.
.....
ce
o o
"CI
11)
ano..
'°º°'
NO&n
t: oc ....
.S .,. •O 111
Cll
ai:: 000
..... .....
~ N N o ...." OOQ GION000.0NN
.,.
o
. . ...... .,.
"'C "' o o 1 1 1 w ::101"'10.NN,.._,.._ A
...J
o o
:;g"'
. . .,.,...
IO
.,..e
E A ::> '0001"1,.._,.._CO&n N
w a1oaoo. L.
.a·o ai:: L.
a..
o o .... o::
o
000
000
...J
ce > a.. o
....... > 00000..0.
.....
.go ~
111
..,,.
w
< ººº ....
N
..... NNNO
1 1 ..... ee
..,,.
...
000 1 .,.
...
111
a·¡;¡ •O ......
........
ai:: 000 11)
Cll N
o o w o
Cll
.., o a.. ººº ...... .....
.o.....
~ >
ººº e u
L. al ......
ººº ....
>jg
-g ~
::::1
"CI .,..
lii
... ... .,..X o
e .,..o e "
......
:g
-:;:::
.D ...,
Vl
Q)
Cll
u
o w
11)
o
In •O
N
...
L.
o::
e
000
....
Cll
....
IO
" ....o
L.
.... L.
......
w
Cll
Q.
>..
......e
·o °'
00 e al
a.. IO
.......E
8.
L. .... Cll "CI 1
,...
L. E lii
e
a.. '° .,.."X
,..,..,..,
L.
o.
~
L.
w ..... L. L. ....
...." ..,
Cll o v•r"1:1
... 13 e e u ...... 11) o ..... co
..,o,... ....
L.
"'C o ..... e
o u w
" ....
"CI N
..... e e w Cv
.,, o .e
O
.:a::l '2"' ....
X
E
e
...
IO
U)
.., o
IO
s,
1
o::
e
0.000
CON CI
e o•. e.
GIOO...,al'
......
o
.c:I>
ti~ a.. ..... o"' ..... ,,.. .s: ca •r 4»

~.i Cll
IO
a..
1111
> .., o'° .,......e «l +'•r- E lll.:.t.
....
11) ..... N
~:E .e
..... ....
Cll NO,.._
,.., 01"1 o NON
....
lil0''11·.
.,.. .,.. " o >.. _, 11)
e
z
"
0000
. ¡¡;~ V
.,.. >.:.t. '1
"
.,. o..,
~e
u
e:
al
........111 '°º'°° ""'ºº .....
lll...,
e ClllCll•rClllCI
IO
1
e o .,..u .oo o owc1 ....
rn ·u ....
CD NO.
.01'"1 .... ...... 1 _. .... .... o
111...J
11"1000 o::
....oQ.
111
~ ~
L. Cll ........ """ Cllll
IO w NOOO
"CI Q.lllU'0• N...J o
~ ~ > o .>cta...JCllL.E Cll 1
o ººº
..... E E "' L. ..M: lllW
1111 .,, u <
8 :g
en "' u >. u GI .,.. C ...J .,.. :S CZ: L. o::
111 o:: llllllL.lllEIO..C ::1 w
.Y g ce o Cll.OIO+'W.ltt.UN o e,
.,..o .....
~ ~
l3
'°ºº
""'ºº
.... aoco <
o::
CO>U)O::cCU) 1 U) o
~
o .2.
U.l .:¡:::
::l ca
QC
1'"100
.,.ºº
l'00
E
L.
IO
""''
a..
o ::::1
ftl
?:S 8 OCIO a.. ... "D

;:g ~
ü ...
'°ºº
.o..
>
o
1 1 .,..
o:: o:: 111
..... V
<
a.. <"
a.. a::
~~
p.. 8
~5 o::
o
.@-g 1
~~ ce
en §' o::
e W'
.....
00 .,
L. a..
o
ftl
::::1
N a.. .. "CI
..... 1 ......,..
...!3 > a:: ar:: 11)
o ce ce 11
~ V a.. Q. o::
551
S. Error estándar de la estimación. Es el error estándar (se) para muestras grandes de la estimación
del parámetro: se( {J;) =~V( {J¡ ).
6. El estadístico Z asociado con la varianza estimada:
z =a;/ se(&¡).
7. Valor P del estadístico Z calculado.
8. Nivel alfa usado para calcular el intervalo de confianza.
9. Límites inferior y superior de un intervalo de confianza de la teoría normal para muestras gran
des de 100(1 a) por ciento para los componentes de la varianza:
L= a7 - Z,,12se( ü7) U==&¡ +Zª12se( a7)
10. Matriz asintótica de la covarianza de las estimaciones. Es la matriz de la covaríanza para mues
tras grandes de las estimaciones de los componentes de la varianza.
11. Medidas del ajuste del modelo para comparar el ajuste de modelos alternativos.
Observe que los resultados de la rutina PROC MIXED de SAS coinciden muy de cerca con los valores pre
sentados en el ejemplo 122 cuando el modelo reducido (sin el término de la interacción) se ajustó a los datos,
En el ejemplo 123 se consideró el mismo experimento, pero se supuso que los operadores eran un
factor fijo, lo cual llevó a un modelo mixto. La rutina PROC MIXED de SAS puede emplearse para esti
mar los componentes de la varianza para esta situación. La estructura de la covarianza de las observacio
nes, suponiendo que todas las variables aleatorias son mutuamente independientes (es decir, el modelo
mixto no restringido), es
Cov(y;¡k• Y;)'k' )=a~ +a;11 +a2 í = i ', j = i', k = k'
i = i ', j = j', k ;t:. k'
2 2
=a f! +a,11 (1247)
=a~ i ;t:. i ', j = i'
=0 j ;t:. j'
l
La matriz de la covarianza de los parámetros del modelo es
G=[ª~IO O
a2</31
(1248)
(Esto se especifica en el enunciado TYPE = SIM en la entrada de la rutina PROC MIXED.) En la tabla
1218 se muestra la salida de la rutina PROC MIXED de SAS para la forma no restringida del modelo
mixto del ejemplo 123. De nueva cuenta se seleccionó el método REML. La estimación del componente
de la varianza para el factor "pieza" es muy similar a la estimación que se obtuvo utilizando el modelo
aleatorio. La estimación de la varianza del error residual también es similar. Además, la salida incluye
una prueba F para el efecto fijo.
12-8 PROBLEMAS
121. Una fábrica textil tiene un gran número de telares. Se supone que cada telar produce la misma cantidad de
tela por minuto. Para investigar este supuesto, se eligen cinco telares al azar y se registra su producción en
tiempos diferentes. Se obtienen los siguientes datos:
Telar Producción (lb/min)

1 14.0 14.1 14.2 14.0 14.1
2 13.9 13.8 13.9 14.0 14.0
3 14.1 14.2 14.1 14.0 13.9
4 13.6 13.8 14.0 13.9 13.7
5 13.8 13.6 13.9 13.8 14.0
128 PROBLEMAS 553
a) Explicar por qué este experimento es de efectos aleatorios. ¿Todos los telares tienen la misma produc
ción? Utilizar a = 0.05.
b) Estimar la variabilidad entre los telares.
e) Estimar la varianza del error experimental.
d) Encontrar un intervalo de confianza de 95% para a; t(a;+u2}
e) Analizar los residuales de este experimento. ¿Considera el lector que se satisfacen los supuestos del aná
lisis de varianza?
12·2. Un fabricante sospecha que los lotes de materia prima suministrados por su proveedor difieren de manera
significativa en el contenido de calcio. Hay un gran número de lotes actualmente en el almacén. Se seleccio
nan cinco de ellos para hacer un estudio. Un químico hace cinco determinaciones en cada lote y obtiene los
siguientes datos:
Lote 1 Lote2 Lote3 Lote4 Lotes

23.46 23.59 23.51 23.28 23.29
23.48 23.46 23.64 23.40 23.46
23.56 23.42 23.46 23.37 23.37
23.39 23.49 23.52 23.46 23.32
23.40 23.50 23.49 23.39 23.38
a) lExiste una variación significativa en el contenido de calcio de un lote a otro? Utilizar a 0.05. =
b) Estimar Ios componentes de la varianza.
e) Encontrar un intervalo de confianza de 95 % para a; / (a; + u2}
d) Analizar los residuales de este experimento. ¿se satisfacen los supuestos del análisis de varianza?
123. En una fábrica metalúrgica se usan varios hornos para calentar ejemplares de metal. Se supone que todos los
hornos operan a la misma temperatura, aunque se sospecha que quizá no sea éste el caso. Se seleccionan al
azar tres hornos y se registran sus temperaturas en cargas sucesivas. Los datos recabados son los siguientes:
Horno 'Iemperatura
1 491.50 498.30 498.10 493.50 493.60
2 488.50 484.65 479.90 477.35
3 490.10 484.80 488.25 473.00 471.85 478.65
a) ¿Existe una variación significativa de la temperatura entre los hornos? Utilizar a = 0.05.
b) Estimar los componentes de la varianza de este modelo.
e) Analizar los residuales de este experimento y sacar conclusiones acerca de la adecuación del modelo.
124. En un artículo de Ioumal of the Electrochemical Society (vol. 139, no. 2, pp. 524532) se describe un experi
mento para investigar la deposición de vapor a baja presión del polisilicio. El experimento se llevó a cabo en
el reactor de alta capacidad! de Sematech en Austin, Texas. El reactor tiene varias posiciones para las obleas,
y se seleccionan al azar cuatro de estas posiciones. La variable de respuesta es la uniformidad del espesor de
la película. Se hicieron tres réplicas del experimento y se obtuvieron los siguientes datos:
Posición de la oblea Uniformidad

1 2.76 5.67 4.49
2 1.43 1.70 2.19
3 2.34 1.97 1.47
4 0.94 1.36 1.65
a) lHay alguna diferencia en las posiciones de las obleas? Utilizar a = 0.05.

b) Estimar la variabilidad debida a las posiciones de las obleas.
e) Estimar el componente del error aleatorio.
d) Analizar los residuales de este experimento y comentar la adecuación del modelo.
125. Considere el experimento de la deposición de vapor del problema 124.
a) Estimar la variabilidad total de la respuesta uniformidad.
b) L Qué parte de la variabilidad total de la respuesta uniformidad se debe a la diferencia entre las posicio
nes en el reactor?
e) lHasta qué nivel podría reducirse la variabilidad de la respuesta uniformidad si pudiera eliminarse la va
riabilidad entre una posición y otra en el reactor? lConsidera el lector que ésta es una reducción signifi
cativa?
126. En un artículo deloumal of Quality Technology (vol. 13, no. 2, pp: 111114) se describe un experimento para
investigar los efectos de cuatro sustancias químicas blanqueadoras sobre la brillantez de la pulpa. Estas cua
tro sustancias químicas se seleccionaron al azar de una población grande de agentes blanqueadores poten
ciales. Los datos son los siguientes:
Sustancia química Brillantez de la pulpa

1 77.199 74.466 92.746 76.208 82.876
2 80.522 79.306 81.914 80.346 73.385
3 79.417 78.017 91.596 80.802 80.626
4 78.001 78.358 77.544 77.364 77.386
a) lExiste alguna diferencia en los tipos de sustancias químicas? Utilizar a = 0.05.

b) Estimar la variabilidad debida al tipo de sustancias químicas.
e) Estimar la variabilidad debida al error aleatorio.
d) Analizar los residuales de este experimento y comentar la adecuación del modelo.
12 7. Considere el modelo de efectos aleatorios, balanceado, en una variable. Desarrollar un procedimiento para
encontrar un intervalo de confianza de 100(1 a) por ciento para a2/(a; + a2).
a) lCuál es la probabilidad de aceptar H0 si a; es 4 veces la varianza del error a2?
b) Si la diferencia entre los telares es lo suficientemente grande para incrementar la desviación estándar de
una observación en 20%, quiere detectarse esto con una probabilidad de al menos 0.80. lQué tamaño de
la muestra deberá usarse?
129. Se llevó a cabo un experimento para investigar la capacidad o aptitud de un sistema de medición. Se seleccio
naron diez piezas al azar, y dos operadores escogidos aleatoriamente midieron tres veces cada pieza. Las
pruebas se hicieron en orden aleatorio y se obtuvieron los siguientes datos:
Mediciones del Mediciones del

Número operador 1 operador 2
de pieza 1 2 3 1 2 3
1 50 49 50 50 48 51
2 52 52 51 51 51 51
3 53 50 50 54 52 51
4 49 51 50 48 50 51
5 48 49 48 48 49 48
6 52 50 50 52 50 50
7 51 51 51 51 50 50
8 52 50 49 53 48 50
9 50 51 50 51 48 49
10 47 46 49 46 47 48
128 PROBLEMAS 555
a) Analizar los datos de este experimento,

b) Encontrar estimaciones puntuales de los componentes de la varianza utilizando el método del análisis de
varianza.
1210. Considere nuevamente los datos del problema 56. Suponga que ambos factores, las máquinas y Jos operado
res, se eligen al azar.
b) Encontrar estimaciones puntuales de los componentes de la varianza utilizando el método del análisis de
varianza.
1211. Considere nuevamente los datos del problema 513. Suponga que ambos factores son aleatorios.
b) Estimar los componentes de la varianza.
1212. Suponga que en el problema 511 las posiciones en el horno se seleccionaron aleatoriamente, dando como
resultado un experimento con un modelo mixto. Analizar de nuevo los datos de este experimento bajo este
nuevo supuesto. Estimar los componentes apropiados del modelo.
1213. Analizar de nuevo el experimento de los sistemas de medición del problema 129, suponiendo que los opera
dores son un factor fijo. Estimar los componentes apropiados del modelo.
1214. En el problema 56, suponga que sólo hay cuatro máquinas de interés, pero los operadores se seleccionaron
aleatoriamente.
a) lQué tipo de modelo es apropiado?
b) Efectuar el análisis y estimar los componentes del modelo.
1215. Mediante la aplicación del operador valor esperado, desarrollar los cuadrados medios esperados del modelo
factorial mixto con dos factores. Usar los supuestos del modelo restringido. Verificar los resultados con los
cuadrados medios esperados de la tabla 1211 para constatar que concuerdan.
1216. Considere el diseño factorial de tres factores del ejemplo 126. Proponer los estadísticos de prueba apropia
dos para todos los efectos principales y las interacciones. Repetir para el caso en que A y B son fijos y C es
aleatorio.
1217. Considere el experimento del ejemplo 12 7. Analizar los datos para el caso en queA, By C son aleatorios.
1218. Deducir los cuadrados medios esperados de la tabla 1214.
1219. Considere un experimento factorial de cuatro factores donde el factor A tiene a niveles, el factor B tiene b ni
veles, el factor C tiene e niveles, el factor D tiene d niveles y hay n réplicas. Anotar las sumas de cuadrados, los
grados de libertad y Jos cuadrados medios esperados para los siguientes casos. Suponer el modelo restringido
para todos los modelos mixtos. Puede usarse un paquete de computadora como Minitab.
a) A, B, C y D son factores fijos.
b) A, B, C y D son factores aleatorios.
e) A es fijo y B, C y D son aleatorios.
d) A y B son fijos y C y D son aleatorios.
e) A, By C son fijos y D es aleatorio.
lExisten pruebas exactas para todos los efectos? Si no es así, proponer estadísticos de prueba para los efectos
que no puedan probarse directamente.
1220. Considere nuevamente los incisos e, d y e del problema 1219. Obtener los cuadrados medios esperados su
poniendo un modelo no restringido. Puede usarse un paquete de computadora como Minitab. Comparar los
resultados obtenidos con los del modelo restringido.
1221. En el problema 517, suponga que los tres operadores se seleccionaron al azar. Analizar los datos bajo estas
condiciones y sacar conclusiones. Estimar los componentes de la varianza.
1222. Considere el modelo factorial de tres factores
¡=
i_ :_ 1, 2, , a
J1, 2, , b
k 1, 2, , e
Suponiendo que los tres factores son aleatorios, desarrollar la tabla del análisis de varianza, incluyendo los
cuadrados medios esperados. Proponer los estadísticos de prueba apropiados para todos los efectos.
1223. El modelo factorial de tres factores para una sola réplica es
Y;;k = u+r¡ +/3j +yk +(r:/3);¡ +(f3y)jk +(ry);k +(t/3Y);¡k +t:;;k

Si todos los factores son aleatorios, épuede probarse alguno de los efectos? Si las interacciones de tres facto
res y (r/3);¡ no existen, ¿es posible probar todos los demás efectos?
1224. En el problema 56, suponga que tanto las máquinas como los operadores se escogieron al azar. Determinar
la potencia de la prueba para detectar un efecto de la máquina tal que a~ = a2, donde a~ es el componente de
la varianza del factor máquina. ¿son suficientes dos réplicas?
1225. a;
En el análisis de varianza del modelo mixto de dos factores, demostrar que Cov[(r:/1)1¡, (r/1);1] =-(Va) 11 para
i oF- i'.
1226. Demostrar que el método del análisis de varianza siempre produce estimaciones puntuales insesgadas de los
componentes de la varianza en cualquier modelo aleatorio o mixto.
1227. Invocando los supuestos de.normalidad usuales, encontrar una expresión para la probabilidad de obtener
una estimación negativa de un componente de la varianza por el método del análisis de varianza. Utilizando
este resultado, escribir un enunciado para la probabilidad de que a-; < O en un análisis de varianza de un fac
tor. Comentar la utilidad de este enunciado de probabilidad.
1228. Analizar los datos del problema 129, suponiendo que los operadores son fijos y utilizando tanto la forma no
restringida como la restringida de los modelos mixtos. Comparar los resultados que se obtienen con los dos
modelos.
1229. Considere el modelo mixto de dos factores. Demostrar que el error estándar de la media del factor fijo (por
ejemplo, A) es [MSAB/bn]112.
1230. Considere los componentes de la varianza del modelo aleatorio del problema 129.
a) Encontrar un intervalo de confianza exacto del 95% para a2•
b) Encontrar intervalos de confianza aproximados del 95% para los otros componentes de la varianza utili
zando el método de Satterthwaite.
123 l. Usar el experimento descrito en el problema 56 y suponer que ambos factores son aleatorios. Encontrar un
intervalo de confianza exacto del 95% para a2• Construir intervalos de confianza aproximados del 95% para
los otros componentes de la varianza utilizando el método de Satterthwaite.
1232. Considere el experimento de tres factores del problema 517 y suponga que los operadores se seleccionaron
al azar. Encontrar un intervalo de confianza aproximado del 95 % para el componente de la varianza del ope
rador.
1233. Resolver de nuevo el problema 1230 utilizando el método de grandes muestras modificado que se describe
en la sección 127.2. Comparar las dos series de intervalos de confianza obtenidas y comentarlas.
1234. Resolver de nuevo el problema 1232 utilizando el método de grandes muestras modificado que se describe
en la sección 127.2. Comparar este intervalo de confianza con el que se obtuvo anteriormente y comentarlo.
Diseños anidados
y de parcelas
subdivididas
En este capítulo se introducen dos importantes tipos de diseños experimentales: el diseño anidado y el di
seño de parcelas subdivididas. Estos dos diseños encuentran una aplicación razonablemente generaliza
da en el uso industrial de los experimentos diseñados. Con frecuencia incluyen también uno o más
factores aleatorios, por lo que algunos de los conceptos introducidos en el capítulo 12 tendrán cabida
aquí.
13 .. i DISEÑO ANIDADO DE DOS ETAPAS
En algunos experimentos con factores múltiples, los niveles de uno de los factores (por ejemplo el factor
B) son similares pero no idénticos a los diferentes niveles de otro factor (por ejemplo A). A un arreglo
como éste se le llama diseño anidado o jerárquico, con los niveles del factor B anidados bajo los niveles
del factor A. Por ejemplo, considere una compañía que compra su materia prima a tres proveedores dife
rentes. La compañía quiere determinar si la pureza de la materia prima de cada proveedor es la misma.
Hay cuatro lotes de materia prima disponibles de cada proveedor, y se harán tres determinaciones de la
pureza en cada lote. La situación se describe en la figura 131.
Se trata de un diseño anidado de dos etapas, con los lotes anidados bajo los proveedores. A primera
vista se podría preguntar por qué no es un experimento factorial. Si fuera un experimento factorial, en
tonces el lote 1 se referiría siempre al mismo lote, el lote 2 se referiría siempre al mismo lote, etcétera.
Evidentemente, no es éste el caso, ya que los lotes de cada proveedor son únicos para ese proveedor
particular. Es decir, el lote 1 del proveedor 1 no tiene relación con el lote 1 de cualquier otro proveedor,
el lote 2 del proveedor 1 no tiene relación con el lote 2 de cualquier otro proveedor, etcétera. Para sub
rayar el hecho de que los lotes de cada proveedor son diferentes, se pueden numerar como 1, 2, 3 y 4
para el proveedor 1; 5, 6, 7 y 8 para el proveedor 2; y 9, 10, 11y12 para el proveedor 3, como se muestra en
la figura 132.
En ocasiones quizá no se sepa si un factor está cruzad'? en un arreglo factorial o anidado. Si los niveles
del factor pueden numerarse arbitrariamente como en la figura 132, entonces el factor está anidado.
557
558 CAPÍTULO 13 DISEÑOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS
Lotes ~ ~
{'"'
Ym Y131 Y141 Y211 Y221 Y231 Yz41 Y311 Yn1 Y331 Y341
Observaciones Y112 Y122 Y132 Y142 Y212 Y222 Y2a2 Y242 Y312 Y322 Y332 Y342
Y113 >'123 >'133 Y143 Y213 Y;m Yiaa Y243 Y313 )'323 Y333 Y343
Figura 13·1 Diseño anidado de dos etapas.
13.. Ll Análisis estadístico
¡ ~=1,
El modelo estadístico lineal para el diseño anidado de dos etapas es
2, , a
yijk =µ+r;+/3¡c;¡+EW)k J1, 2, , b (131)
k = 1, 2, , n
Es decir, hay a niveles del factor A, b niveles del factor B anidados bajo cada nivel de A, y n réplicas. El
subíndice j(i) indica que el niveljésimo del factor B está anidado bajo el nivel iésimo del factor A. Resul
ta conveniente considerar que las réplicas están anidadas dentro de la combinación de los niveles de A y
B; por lo tanto, se usa el subíndice (ij)k para el término del error. Se trata de un diseño anidadobalancea·
do, ya que hay el mismo número de niveles de B con cada nivel de A y el mismo número de réplicas. Puesto
que no todos los niveles del factor B aparecen dentro de todos los niveles del factor A, no puede haber in
teracción entre A y B.
La suma de cuadrados total corregida puede escribirse como
(132)
Al desarrollar el miembro derecho de la ecuación 132, se obtiene
ya que los tres términos con productos cruzados son cero. La ecuación 133 indica que puede hacerse la
partición de la suma de cuadrados total en una suma de cuadrados debida al factor A, una suma de cua
drados debida al factor B bajo los niveles de A, y una suma de cuadrados debida al error. Simbólicamente,
la ecuación 133 puede escribirse como
SST = SSA +SSB(A) +SSE (134)
Hay abn 1 grados de libertad para SSn a 1 grados de libertad para SSA> a(b 1) grados de libertad para
SSB(A)yab(n 1) grados de libertad para el error. Observe queabn 1 = (a1) + a(b-1) + ab(n 1). Si
los errores son NID(O, cr), cada una de las sumas de cuadrados del miembro derecho de la ecuación 134
Figura 132 Disposición alternativa del diseño anidado de dos etapas.

131 DISEÑO ANIDADO DE DOS ETAPAS 559
Tabla 13·1 Cuadrados medios esperados en el disefio anidado de dos etapas
A fijo A fijo A aleatorio
E(MS) Bfijo B aleatorio B aleatorio
bnL ri bn¿ r2
E(MSA) a2 + na2p + bna:T
ª a2+na2 P + a1 '
2
+ a1
E(MS8ftl)) 2 nLL P~ci¡ a2+n~ a2+no2 p

o+ a(b1)
E(MSE) a2 02 02
puede dividirse por sus grados de libertad para obtener cuadrados medios con una distribución indepen
diente tales que el cociente de dos cuadrados medios cualesquiera se distribuye como F.
Los estadísticos apropiados para probar los efectos de los factoresA y B dependen de siA y B son fijos
=
o aleatorios. Si los factores A y B son fijos, se supone que l:;,,,1 t, O y l:~~i /3¡(•) O (i 1, 2, ... ,a). Es decir, = =
la suma de los efectos del tratamiento A es cero, y la suma de los efectos del tratamiento Bes cero dentro
de cada nivel de A. De manera alternativa, si A y B son aleatorios, se supone que r1 es NID(O, o;) y que /3¡(i)
es NID(O, a~). Tumbién es frecuente encontrar modelos mixtos con A fijo y B aleatorio. Los cuadrados
medios esperados pueden determinarse aplicando directamente las reglas del capítulo 12. Para el modelo
mixto, estos cuadrados medios esperados suponen la forma restringida del modelo del capítulo 12. En la
tabla 131 se muestran los cuadrados medios esperados para estas situaciones.
La tabla 131 indica que si los niveles de A y B son fijos, H0:r; O se prueba con MS A/MS E y H0:/3¡ci¡ = O =
se prueba con MSB(A/MSE. Si A es un factor fijo y B es aleatorio, entonces H0:r1 = O se prueba con
MSA/MS8(A¡ y H0:a~ =O se prueba conMSBftlfMSE. Por último, si tantoA comoB son factores aleatorios,
H0:a; =O se prueba conMSA/MS8(A¡YH0:a~ =O conMS8ftl/MSE. El procedimiento de prueba se resume
en la tabla del análisis de varianza, como se muestra en la tabla 132. Las fórmulas para calcular las sumas
de cuadrados se obtienen desarrollando las cantidades de la ecuación 133 y simplificando. Éstas son
1 a 2
SS--""' 2~
(135)
A - bn -"'
1•1
Y;., abn
1 l
=;; LL Y:. - bn L Y~.
a b a
'SSB(A)
¡,,,¡ ¡..I i•l
1ªb
= LLL Y:k--n LL Y:.
abn
SSE (137)
:b~
i•l j•l k=l i=I j=J
a b n 2
SST = LLL
i=l j=l k"'I
Y:k - (138)
Tabla 13·2 Tabla del análisis de varianza para el diseño anidado de dos etapas
A a1
BdentrodeA a(b1)
Error ab(n 1)
Tutal abn-1
560 CAPÍTIJLO 13 DISENOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS
Se observa que la ecuación 136 para SSB(A) puede escribirse como
SSB(A) =L
t=l
. [1-;; :¿
b
Fl
Y~. - b~
y2 l
Esto expresa la idea de que SSB(A) es la suma de cuadrados entre los niveles de B para cada nivel de A, su
mados en todos los niveles de A.
EJEMPLO 13 .. 1 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Considere una compañía que compra materia prima en lotes de tres proveedores diferentes. La pureza de
esta materia prima varía considerablemente, lo cual ocasiona problemas en la manufactura del producto
terminado. Quiere determinarse si la variabilidad de la pureza es atribuible a las diferencias entre los pro
veedores. Se seleccionan al azar cuatro lotes de materia prima de cada proveedor, y se hacen tres determi
naciones de la pureza en cada lote. Se trata, desde luego, de un diseño anidado de dos etapas. Los datos,
después de codificarlos restando 93, se muestran en la tabla 133. Las sumas de cuadrados se calculan de
la siguiente manera:
• b n 2
SST = LLL Y~k-~

i=l i=l k=l abn
= 153.00 (1:{ = 148.31

1 a 2
SS = ~ y2 _ _L,_
A bn ¿¡ t.. abn
t=l
= _1_((5)2 +( 4)2 +(14)2 ]..., (13)2

(4)(3) 36
= 19.754.69= 15.06
1 • 1 a
LL Y:. - L Y;.
b
SSB(A) =;; i=l j=l

bn
i=l
= ! [(0)2 +(9)2 +(1 )2 + ... +(2)2 +( 6)2 ]19. 75

3
= 89.6719.75= 69.92
y
lªb
= LLL Y~k-- LL
abn
SSE y:_
i=J i=t k=1 n •=1 i=l
= 153.00 89.67 = 63.33 .
Tabla 133 Datos codificados de la pureza del ejemplo 131 (Codificación: Yiik =pureza 93)
Proveedor 1 Proveedor 2 Proveedor 3
Lotes 1 2 3 4 1 2 3 4 1 2 3 4
1 -2 2 1 1 o 1 o 2 -2 1 3
1 -3 o 4 2 4 o 3 4 o 1 2
o 4 1 o -3 2 -2 2 o 2 2 1
Totalesde los lotes Y;¡. o 9 1 5 4 6 3 5 6 o 2 6
Totales de los proveedores v: 5 4 14
Tabla 134 Análisis de varianza de los datos del ejemplo 131
Fuente de Suma de Grados de Cuadrado Cuadrado medio
variación cuadrados libertad medio esperado Fo ValorP
Proveedores 15.06 2 7.53 ª2+ 3a~+ 6:¿ T~ 0.97 0.42
Lotes (dentro de los proveedores) 69.92 9 7.77 Uz+ Ju2fl 2.94 0.02
Error 63.33 24 2.64 ª2
Total 148.31 35
En la tabla 134 se resume el análisis de varianza. Los proveedores son fijos y los lotes aleatorios, por lo
que los cuadrados medios esperados se obtienen de la columna de en medio de la tabla 131 y se repiten
por conveniencia en la tabla 134. Por el examen de los valores P, se concluiría que no hay ningún efecto
significativo sobre la pureza debido a los proveedores, pero la pureza de los lotes de materia prima del
mismo proveedor difieren significativamente .
• '!I •••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••
Las implicaciones prácticas de este experimento y del análisis son muy importantes. El objetivo del
experimentador es encontrar la fuente de la variabilidad en la pureza de la materia prima. Si ésta es resul
tado de las diferencias entre los proveedores, el problema puede resolverse seleccionando al "mejor"
proveedor. Sin embargo, esa solución no es aplicable aquí porque la principal fuente de variabilidad es la
variación de la pureza de un lote a otro dentro de los proveedores. Por lo tanto, el problema debe atacarse
trabajando con los proveedores para reducir su variabilidad de un lote a otro. Esto puede implicar modifi
caciones en los procesos de producción de los proveedores o en su sistema interno de control de calidad.
Observe lo que habría pasado si se hubiera hecho un análisis incorrecto de este diseño como un expe
rimento factorial de dos factores. Si se considera que los lotes están cruzados con los proveedores, se ob
tienen los totales de los lotes de 2, 3, 2 y 16, donde cada celda lote x proveedores contiene tres réplicas.
Por lo tanto, puede calcularse una suma de cuadrados debida a los lotes y una suma de cuadrados de in
teracción. El análisis de varianza factorial completo se muestra en la tabla 135, suponiendo un modelo mixto.
Este análisis indica que los lotes difieren significativamente y que hay una interacción significativa
entre los lotes y los proveedores. Sin embargo, es difícil ofrecer una interpretación práctica de la interac
ción lotes x proveedores. Por ejemplo, Zesta interacción significativa quiere decir que el efecto del pro
veedor no es constante de un lote a otro? Además, la interacción significativa aunada al efecto no
significativo del proveedor podría llevar al analista a concluir que los proveedores en realidad difieren,
pero su efecto está enmascarado por la interacción significativa.
Tabla 135 Análisis de varianza incorrecto del diseñoanidado de dos etapas del ejemplo 131 como un diseño factorial
(proveedores fijos, lotes aleatorios) ·
variación cuadrados libertad medio F0 ValorP
Proveedores (S) 15.06 2 7.53 1.02 0.42
Lotes (B) 25.64 3 8.55 3.24 0.04
Interacción S x B 44.28 6 7.38 2.80 0.03
Error 63.33 24 2.64
Total 148.31 35
562 . CAPÍTULO 13 DISEÑOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS
Cálculos
Algunos paquetes de software de estadística realizarán el análisis de un diseño anidado. En la tabla 136
se presenta la salida del procedimiento Balanced ANOVA (análisis de varianza balanceado) de Minitab
(utilizando el modelo restringido). Los resultados numéricos concuerdan con los cálculos manuales re
portados en la tabla 134. Minitab también reporta los cuadrados medios esperados en la parte inferior de
la tabla 136. Recuerde que el símbolo Q[l] es un término cuadrático que representa el efecto fijo de los
proveedores, por lo que en la notación que se usa aquí,
2: i;
a
Q[l]= 1=l._
a-1
Por lo tanto, el término del efecto fijo en el cuadrado medio esperado de Minitab para los proveedores
12Q[1] = 12~:~1 i-7 / (31) =
6l:¡~1 r;,
resultado que concuerda con el que se presenta en el algoritmo ta
bular de la tabla 134.
En ocasiones no se cuenta con un programa de computadora especializado para analizar diseños ani
dados. Sin embargo, observe, al comparar las tablas 134 y 135, que
SSB +SSsxB = 25.64+44.28= 69.92:= SSB(S) _
Es decir, la suma de cuadrados de los lotes dentro de los proveedores se compone de la suma de cuadra
dos de los lotes más la suma de cuadrados de la interacción lotes x proveedores. Los grados de libertad
poseen una propiedad similar; es decir,
Lotes Lotes x Proveedores Lotes dentro de los proveedores
--+
3 6
=--------=------
9
Por lo tanto, un programa de computadora para analizar diseños factoriales podría usarse también para
analizar diseños anidados agrupando el "efecto principal" del factor anidado y las interacciones de ese
factor con el factor bajo el que está anidado.
Tabla 136 Salida de Minitab (Balanced ANOVA) [análisis de varianza balanceado) para el ejemplo 131
Análisis de varianza (diseños balanceados)
Factor Type LeveAs Values

Supplier fixed 3 1 2 3
Batch(Supplier) random · 4 1 2 3 4
Analysis of Variance for Purity
Source DF SS MS F p
Supplier 2 15.056 7.528 0.97 0.416
BatchCSupplier) 9 69.917 7.769 2.94 0.017
Error 24 63.333 2.639
Total 35 148.306
Source Variance Error Expected Mean Square for Each Term

component term (using restricted model)
1 Supplier 2 (3) + 3(2) + 12Q[1J
2 Batch(Supplier) 1. 71 o 3 (3) + 3(2)
3 Error 2.639 (3)
131.2 Verificación del diagnóstico

La herramienta principal para verificar el diagnóstico es el análisis residual. Para el diseño anidado de
dos etapas, los residuales son
El valor ajustado es
y si se establecen las restricciones usuales sobre los parámetros del modelo (I; t; = Oy I ¡ P i(il = O, i = 1,
2, ... , a), entonces µ = Y. . , í'; = Y;. - Y. . , y P i(il = yij. - Y;. . Por consiguiente, el valor ajustado es
~ =Y...
Yijk +(Y;.. -Y...
)+(h .. )
Y;
=:Y;¡.
Por lo tanto, los residuales del diseño anidado de dos etapas son
(139)
donde Y¡¡ son los promedios de los lotes individuales.

Las observaciones, los valores ajustados y los residuales para los datos de la pureza del ejemplo
131 son:
Valor observado yijk Valor ajustado J;¡k =Y;¡.

1 0.00 1.00
1 0.00 1.00
o 0.00 0.00
-2 3.00 1.00
3 3.00 0.00
4 3.00 1.00
-2 0.33 1.67
o 0.33 0.33
1 0.33 1.33
1 1.67 0.67
4 1.67 2.33
o 1.67 1.67
1 1.33 2.33
-2 1.33 0.67
-3 1.33 1.67
o 2.00 2.00
4 2.00 2.00
2 2.00 0.00
1 1.00 0.00
o 1.00 1.00
-2 1.00 1.00
o 1.67 1.67
3 1.67 1.33
2 1.67 0.33
2 2.00 0.00
564 CAPÍTULO l3 DISEÑOS ANIDADOS Y DE PARCEIAS SUBDMDIDAS
Valor observado Yiik Valor ajustado jijk = J;¡

4 2.00 2.00
o 2.00 2.00
-2 0.00 2.00
o 0.00 0.00
2 0.00 2.00
1 0.67 0.33
1 0.67 1.67
2 0.67 1.33
3 2.00 1.00
2 2.00 0.00
1 2.00 1.00
Pueden realizarse ahora las verificaciones de diagnóstico usuales; incluyendo las gráficas de probabilidad
normal, la verificación de puntos atípicos y la graficación de los residuales contra los valores ajustados.
Como una ilustración, en la figura 133 se grafican los residuales contra los valores ajustados y contra los
niveles del factor proveedor.
• •
2 • •
• • •
.!l 1 • • •
"'"'
"C
·¡¡; • • •
~o
• •
1 • • • •
• • • •
2
-3 -2 1 o 2
Valores predichos
a) Gráfica de los residuales contra los valores predichos
• •
2 • •
• • •
:íl 1
«i
• • •
·¡"¡ • • •
"C
a: o
• •
1 • • •
• • •
-2
2 3
Proveedor
b) Gráfica de los residuales contra el proveedor
Figura 133 Gráficas de los residuales del ejemplo 131.

En la situación de un problema como el que se describe en el ejemplo 131, las gráficas de los residua
les son particularmente útiles debido a la información de diagnóstico adicional que contienen. Por ejem
plo, el análisis de varianza ha indicado que la pureza media de los tres proveedores no difiere pero que
hay una variabilidad estadísticamente significativa de un lote a otro (es decir, a~ > O). Pero, lla variabili
dad dentro de los lotes es la misma para todos los proveedores? Se ha supuesto de hecho que éste es el
caso, y si no es cierto desde luego que nos gustaría saberlo, ya que tiene un impacto práctico considerable
sobre la interpretación de los resultados del experimento. La gráfica de los residuales contra los provee
dores de la figura 13-3b es una manera simple pero eficaz de verificar este supuesto. Puesto que la disper
sión de los residuales es aproximadamente la misma para los tres proveedores, se concluiría que la
variabilidad en la pureza de un lote a otro es aproximadamente la misma para los tres proveedores.
131.3 Componentes de fa varianza

Para el caso de efectos aleatorios, el método del análisis de varianza puede usarse para estimar los com
ponentes de la varianza o', a~ a;.
y Por los cuadrados medios esperados de la última columna de la tabla
131, se obtiene
&2 -MS
- E (1310)
ª2 =
MSB(A)-MSE
{J n
(1311)
ª2 = MSA -MsB<A>
T bn
(1312)
En muchas aplicaciones de diseños anidados interviene un modelo mixto, con el efecto principal (A)
fijo y el factor anidado (B) aleatorio. Éste es el caso para el problema descrito en el ejemplo 131; los pro
veedores (factor A) son fijos, y los lotes de materia prima (factor B) son aleatorios. Los efectos de los pro
veedores pueden estimarse con
5 13 28
f1 = Yi. -y _ =---=
12 36 36
A _ 4 _ 13 1
T2 = Yz.. - y = 12 36 = 36
14 13 29
Y... = 12 36 = 36
A
T3 = y3 -
Para estimar los componentes de la varianza a2 y <J ~, se elimina la línea de la tabla del análisis de varianza
relativo a los proveedores y se aplica el método de estimación del análisis de varianza a las dos líneas si
guientes. Se obtiene así
y
U2 = MS B(A) - MS E = 7• 77 2.64 = 1.71
P n 3
566 CAPÍTULO 13 DISEÑOS ANIDADOS Y DE PARCELAS SUBDMDIDAS
Etapa 1 Lote 1 ..•
Muestra
Etapa2
1
Medición Medición Medición

Etapa 3 1 2 1
Figura 134 Diseño anidado escalonado de dos etapas.
Estos resultados se muestran también en la parte inferior de la salida de Minitab de la tabla 136. Por el
análisis del ejemplo 131, se sabe que T:; no difiere significativamente de cero, mientras que el componente
de la varianza a~ es mayor que cero.
131.4 Diseños anidados por etapas

Un problema potencial en la aplicación de los diseños anidados es que en ocasiones para obtener un nú
mero razonable de grados de libertad en el nivel más alto, puede terminarse con muchos grados de liber
tad (quizá demasiados) en las etapas inferiores. Para ilustrar, suponga que se están investigando las
diferencias potenciales en el análisis químico entre diferentes lotes de material. Se planea tomar cinco
muestras por lote, y cada muestra se medirá dos veces. Si quiere estimarse un componente de la varianza
para los lotes, entonces 10 lotes no sería una elección irrazonable. Esto resulta en 9 grados de libertad
para los lotes, 40 grados de libertad para las muestras y 50 grados de libertad para las mediciones.
Una manera de evitar esta situación es usar un tipo particular de diseño anidado no balanceado lla
mado diseño anidado por etapas. En la figura 134 se muestra un ejemplo de un diseño anidado escalona
do. Observe que sólo se toman dos muestras de cada lote; una de ellas se mide dos veces, mientras que la
otra una sola vez. Si hay a lotes, entonces habrá a - l grados de libertad para los lotes (o, en general, la eta
pa superior), y todas las etapas inferiores tendrán exactamente a grados de libertad. Para más informa
ción sobre el uso y el análisis de estos diseños, ver Bainbridge [5], Smith y Beverly [104] y Nelson [88a, b,
c], así como el material suplementario del texto de este capítulo.
132 DISEÑOANIDADOGENERALDE mETAPAS
Los resultados de la sección 131 pueden extenderse fácilmente al caso de m factores completamente ani
dados. A este diseño se le llamaría diseño anidado de m etapas. Como un ejemplo, suponga que una fun
dición quiere investigar la dureza de dos formulaciones diferentes de una aleación de metal. Se preparan
tres hornadas de cada formulación de la aleación, se seleccionan dos lingotes al azar de cada hornada
para probarlos, y se hacen dos mediciones de la dureza en cada lingote. La situación se ilustra en la figura
135.
En este experimento, las hornadas están anidadas bajo los niveles del factor formulación de la alea
ción, y los lingotes están anidados bajo los niveles del factor hornada. Por lo tanto, se trata de un diseño
anidado de tres etapas con dos réplicas.
132 DISEÑOANIDADOGENERALDE mETAPAS 567
Formulación
de la aleación
Hornadas
Lingotes
Observaciones
{"'"
Y1112
Y11z1
Y1122
Y1211
Y121z
Y1:m
Y1222
Y1311
Ymz
Y1321
Y13zz
Figura 135 Diseno anidado de tres etapas.
El modelo para el diseño anidado general de tres etapas es

i_ '.: 1, 2, ,a
;1, 2, , b
(1313)
{ k = 1, 2, ,e
l = 1, 2, , n
Para el ejemplo tratado aquí, t, es el efecto de la formulación de la aleación ié~ima, /3¡(i) es el efecto de la
hornadajésima dentro de la aleación iésima, Yk(li) es el efecto del lingote késimo dentro de la hornada
Variabilidad de la
formulación de la aleación
Variabilidad de una
hornada a otra
Variabilidad de la
prueba analitica
Dureza Dureza
media observada
Figura 136 Fuentes de variación en el ejemplo del diseno anidado de
tres etapas.
568 CAPÍTIJLO 13 DISEÑOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS
Tabla 13, 7 Análisis de varianza del diseño anidado de tres etapas

Fuente de Grados de Cuadrado
variación Suma de cuadrados libertad medio
A ~ (-Y«. __ -Y- .... )2
b en L.,,
a1 MSA
i
B (dentro deA) en LL (.Yij .. -Y. ... i a(b1) MSB(A)

i j
C (dentro de B) nLLL (Y;¡k -y_j ab(e1) MSC(B)

i j k
Error abcin 1) MSE
Total aben= l
jésima y la aleación iésima, y E(iik)l es el término del error NID(O, a2) usual. La extensión de este modelo a
m factores es directa.
Observe que en el ejemplo anterior la variabilidad global de la dureza constó de tres componentes:
uno que resultó de las formulaciones de las aleaciones, otro que se generó de las hornadas y uno más que
salió del error de la prueba analítica. Estos componentes de la variabilidad en la dureza global se ilustran
en la figura 136.
Este ejemplo demuestra la manera en que se usa frecuentemente el diseño anidado en el análisis de
procesos para identificar las principales fuentes de variabilidad en la salida. Por ejemplo, si el componen
te de la varianza de la formulación de la aleación es grande, entonces esto implica que la variabilidad glo
bal de la dureza podría reducirse utilizando únicamente una de las formulaciones de la aleación.
El cálculo de las sumas de cuadrados y el análisis de varianza del diseño anidado de m etapas son si
milares al análisis presentado en la sección 131. Por ejemplo, el análisis de varianza del diseño anidado
de tres etapas se resume en la tabla 137. En esta tabla se muestran también las definiciones de las sumas
de cuadrados. Observe que son una extensión simple de las fórmulas para el diseño anidado de dos eta
pas. Muchos paquetes de software de estadística realizarán los cálculos.
Para determinar los estadísticos de prueba apropiados deben encontrarse los cuadrados medios es
perados empleando los métodos del capítulo 12. Por ejemplo, si los factoresA y B son fijos y el factor C es
aleatorio, entonces los cuadrados medios esperados pueden derivarse como se indica en la tabla 138. En
esta tabla se indican los estadísticos de prueba apropiados para esta situación.
Tabla 138 Derivación de los cuadrados medios esperados para un diseño anidado
de tres etapas con A y B fijos y C aleatorio
F F R R
a b e n
Factor j k l Cuadrado medio esperado
bcnL r2
T; o b e n a2+na2+ '
' a1
f3 i(i) 1 o e n a2+na2+cnLL fl~<')

' a(b-1)
y k(ij) 1 1 1 n a2+na
2
2
r
fl(iikl 1 1 1 1 a
133 DISEÑOS CON FACTORES ANIDAfX)S Y FACTORIALES 569
133 DISEÑOS CON FACTORES ANIDADOS Y FACTORIALES
En experimentos con factores múltiples, algunos factores pueden estar incluidos en un arreglo factorial y
otros estar anidados. En ocasiones a estos diseños se les llama diseños factorialesanidados. El análisis
estadístico de un diseño así con tres factores se ilustra en el ejemplo siguiente.
E.JEMPLO13-2 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · • · · · · · · · ·
Un ingeniero industrial estudia la inserción manual de componentes electrónicos en tarjetas de circuitos
impresos a fin de mejorar la rapidez de la operación de ensamblaje. Ha diseñado tres dispositivos de en
samblaje y dos arreglos del sitio de trabajo que parecen prometedores. Se necesitan operadores para rea
lizar el ensamblaje, y se decide seleccionar aleatoriamente cuatro operadores para cada combinación
dispositivoarreglo del sitio de trabajo. Sin embargo, debido a que los sitios de trabajo se encuentran en
diferentes puntos dentro de la planta, es difícil usar los mismos cuatro operadores para cada arreglo del
sitio de trabajo. Por lo tanto, los cuatro operadores escogidos para el arreglo 1 son diferentes de los cuatro
para el arreglo 2. Puesto que sólo hay tres dispositivos y dos arreglos del sitio de trabajo, y los operadores
se escogen al azar, se trata de un modelo mixto. Las combinaciones de tratamientos de este diseño se co
rren en orden aleatorio y se obtienen dos réplicas. Los tiempos de ensamblaje se miden en segundos y se
En este experimento, los operadores están anidados dentro de los niveles de los arreglos del sitio de
trabajo, mientras que los dispositivos y los arreglos del sitio de trabajo están incluidos en un factorial. Por
lo tanto, este diseño tiene factores anidados y factoriales. El modelo lineal para este diseño es
l
i=l,2,3
j= 1 2
(1314)
k=1:2,3,4
l= 1, 2
donde t, es el efecto del dispositivo iésimo, pi es el efecto del arreglo del sitio de trabajo jésimo, Ykv> es el
efecto del operador késimo dentro del níveljésímo del arreglo del sitio de trabajo, (r/3)ij es la interacción
dispositivo x arreglo del sitio de trabajo, ('l'Y)iic(fl es la interacción dispositivo x operadores dentro del
arreglo del sitio de trabajo, y E(ijt)I es el término del error usual. Observe que no puede existir ninguna in
teracción arreglo del sitio de trabajo x operador porque no todos los operadores usan todos los arreglos
del sitio de trabajo. Asimismo, tampoco puede haber ninguna interacción dispositivo x arreglo del sitio
de trabajo x operador. En la tabla 1310 se derivan los cuadrados medios esperados utilizando el algo
ritmo tabular del capítulo 12. Esto produce el análisis de un modelo mixto restringido. El estadístico de
prueba apropiado para cualquier efecto o interacción puede encontrarse inspeccionando esta tabla.
Tabla 139 Datos del tiempo de ensamblaje del ejemplo 132

Arreglo 1 Arreglo 2
Operador 1 2 3 4 1 2 3 4 Y;..
Dispositivos 1 22 23 28 25 26 27 28 24 404
24 24 29 23 28 25 25 23
Dispositivos 2 30 29 30 27 29 30 24 28 447
27 28 32 25 28 27 23 30
Dispositivos 3 25 24 27 26 27 26 24 28 401
21 22 25 23 25 24 27 27
Totales de los operadores, Y.jk. 149 150 171 149 163 159 151 160
Tutales de los arreglos, Y.¡.. 619 633 1252 =Y ....
Tabla 1310 Derivación del cuadrado medio esperado del ejemplo 132
F F R R
3 2 4 2
Factor j k l Cuadrado medio esperado
't¡ o 2 4 2 a2 + 2a'Y2 + 8~ r2•
/3 i 3 o 4 2 <12 + oo:+ 24 /3~
y k(i) 3 1 1 2 <12+ oo:
( r/3);¡ o o 4 2 a2 + 2a;, + 4¿ ¿ (r/3)~
(ry)ik(i) o 1 1 2 a2+ 2a~
E i'k 1 1 1 1 1 <12
En la tabla 13ll se muestra el análisis de varianza completo. Se observa que los dispositivos de en
samblaje son significativos y que los operadores dentro de los arreglos del sitio de trabajo también difie
ren significativamente. Está presente también una interacción significativa entre los dispositivos y los
operadores dentro de los arreglos del sitio de trabajo, indicando que los efectos de los diferentes disposi
tivos no son los mismos para todos los operadores. Los arreglos del sitio de trabajo parecen tener un efec
to reducido sobre el tiempo de ensamblaje. Por lo tanto, para minimizar el tiempo de ensamblaje, la
atención debería centrarse en los dispositivos tipo 1 y 3. (Observe que los totales de los dispositivos de la
tabla 139 son menores para los tipos 1 y 3 que para el tipo 2. Esta diferencia en las medias del tipo de dis
positivo podría probarse formalmente utilizando comparaciones múltiples.) Además, la interacción entre
los operadores y los dispositivos implica que algunos operadores son más eficientes que otros al utilizar
los mismos dispositivos. Quizás estos efectos operadordispositivo podrían aislarse y los operadores cuyo
desempeño es menos eficiente podrían mejorar impartiéndoles capacitación adicional.
Cálculos
Hay varios paquetes de software de estadística que analizan con facilidad diseños factorialesanidados,
incluyendo Minitab y SAS. En la tabla 1312 se presenta la salida de Minitab (Balanced ANOVA, análisis
de varianza balanceado), suponiendo la forma restringida del modelo mixto, para el ejemplo 132. Los
cuadrados medios esperados de la parte inferior de la tabla 1312 concuerdan con los que se derivaron
con el método tabular de la tabla 1310. Q[l ], Q[3] y Q[4] son los efectos del factor fijo para los arreglos
del sitio de trabajo, los dispositivos, y la interacción arreglo del sitio de trabajo x dispositivo, respectiva
mente. Las estimaciones de los componentes de la varianza son:
Operador (arreglo): a~ = 1.609
Dispositivo x operador (arreglo): a~ = 1.576
Error: o? = 2.333
Dispositivos (F) 82.80 2 41.40 7.54 0.01
Arreglos (L) 4.08 1 4.09 0.34 0.58
Operadores (dentro de los arreglos), O (L) 71.91 6 11.99 5.15 <0.01
FL 19.04 2 9.52 1.73 0.22
FO(L) 65.84 12 5.49 2.36 0.04
Error 56.00 24 2.33
Tutal 299.67 47
.s::.
u
111
w
c..
Q..N00000
º ...
...... _,
11
coco.,,,
.
inOONO
GI 'C
c.. on
IU E!.
ººººº ::::J
t7' 'C al
''
,,, ....,. "'"' ....,.........."'

...
CI) 11 ....,.
.... ....,. e
+'N
u
al•r + + +
Oln,....N 11 c..
E....,,""""""",..,,
rn N N U'\ 11\ 11\
""C CU'-"'-''-''-'"-"
Cl)l"\00.0fO'I
EOOCOONOOfO'I ...uc:n+++++
111 '00NNN
º°''"""'"""" GI C
CL·r-"""""',..."""""'
:i< rn e e e e e e
W :l'V"""V._,'-""V
NNN
11...
uc °'o
e 11 e
cu e
.,.. o ~ <""N
c.. a.
11 .... .CNNN....,. ., e
...~
....
11 E! O <""N....,. >O
> u ......
11 ....
..J ::::J
c.. ...... o
ll'CE!"Cll o ..... >.
a.11011 ...... ::::J 111
>. )( 'C )( o ..J
~ .... e:.,.. GI >. .....
,.._ IU '+ u IU ...... c..
c.. e _, ... o
IU v ::::J QI ...
...... .,.. ,,,,.... L. O C.. IU
..... c.. ..... o >. ::::J c..
::::J 111 ... QI
o >1U ::::J
o
GI ""'
c.. ftl ..J )( a.
>. >. ::::J c.. """' •r-0
ftl 't IU ... GI c.. .......
..J o ..J
..... ......,
l<Q.
•rO
0111•11
....... c.. ... c..
c.. rn c.. .._.., c..
::::J ftl ::::J ::::J ::::J
o Qj .,.. OGI•" o c.. .... o .... o
c.. .....
+.I c.. rn "..,..,'..,' 11 >.11:i<>.:i<c..
0 ::::J IU ::::J >. U::::llU:;:J::::J::::JC..' u ., a.• ... ., ... c..
..... o c.. ... _, c..oc.. ... 0 ... 0111 c.. ..JO.._..J.._Ll.I
U>.Gl:i< ftl ::J>.ll:i<>.:i<c.. ... ::::J
IU ftl Q.•r e o ai a.•...,.,. c.. o O ..Nl"'l4'1nO
i., ..Jo .... C 11).JOY...J&L.WI CI)
571
E
'
QI
1
.e:
u
w"'......
....,
.,,,.
' __, ...
o QI..
..,_ "t:lw
a....f'.00000
co .... o .... ,.., o as
11'1..0NO
QI
'
E
+ ....,
o .,,,.
... ....,
lll,,
o
·51 ººººº :::1 111.. .....
C'""'NNl"l_,,.
·€ ,.., .. in,...,..,

.._"4COU'lottn
(JJ (,,,) ....... ......,
.... -o -o Cif es
e: '
L..I L..l
...."'
"' .... + + + +
8o ON ...... ..N
E
QI.,,
cu",....,....,...~
'Ll'\lnlnll'\LI'\
~o e
,.,..,.,
C'"~'"'""'"
11),.,\0>Q.Ottl CI) :::INNNNN
E E 00 00 O..t\.1 00 l"'I ....
Q) 00.,.,11'1'4'1') u tll+++++
.g QI e:
~
"'
N
.... .,,,.
ot .. .. O>ll"IN Q.•r-,...,""""'"~,-..
)( (ll'()0'()0..00
w :::J...._,.....,....,....,,-..;,,,.,
'B::l NNN
'
......
o
,..,
";" E
,....;
o .,,
11)
11) 00 .... °' . ,. ,., o
l"l l''N N l"l 0 ,..._
'O
'
'
w .....
L.Nlnll'lln0
QI
,.,
00. ...... 00000
} cu~~~
.,
. "'
:::1
co
4'..NO..Ll'\00.
,..._oo..oll'lo
N
QI ....
u e:
e: QI
00
o
o,.,
......
11'1 tt)
,,.,
Q)
o > ....
Ctl e:
o .N
~
~§
....
lll N -4' ,.,
QI ... ..ONNN'4'1'
'
lll
Q.
E
::E >
Cll
Cll
....e .::. .N'4' > o
u ......
....
1
"'
o ~o ...J :::1
...... o
"O
E,,
'
o ....
~ "'g QI,,
Q. QI oCll
).. X "l:J )(
.... :::1
o
>.
Ctl
...J
.......... e: .,..
~
o
"'
ca
.e .... Ctl .... u
Cll
e:
>.
co ......
... '
o
' ...J
;;!"' •Qo ......
"' .....
.... ....
co
......
.... '
:::1
o
IV ...,
"'
"'
e;
co :a"'
o ' o > ' '
:::1
co
:::1
o >
co :::1
o
QI ...
"' "'
...J
.... QI
)( Q.
......
'"
>. >. ' ' ......
"' ¡:j "' .... :::1 •r0
'ª~ ·e:"' "'

...J
...... o
.,,
"'
...J
.....
+.'
X Q.
......
IV '
......o ' ...:s 'QI ... IV
...o •t0
~ "' ¡;.. '

.....,, ....... ':::1 ....... ' ....
:::1 lll
o '- .... o ... o
:::J :::1 '
. . .....o IV <i<
QI
o QI
'O ' ' QI Cll >.CllX>.X '
:::¡ . ~
\
o :::1"' :::1 >.
__, u :::1 lll :::J :::1 u co O.·r "' .,.. ...
.~
:¡;
.... o .......
U)o.lVX
"' "' o, .... "'e:
'0'+'0..,
:::1>.C11><>.x
o "' Q.•.. "' .......
o
' ...o
lll '
:::1
o
...JOU.....J.._W
.Nl")"4"11'1..0
~ ~ u.. ...Jo u.. < ln...JO"'...JU..WI 11)
572
134 DISEÑO DE PARCELAS SUBDIVIDIDAS 573
En la tabla 1313 se presenta el análisis de Minitab del ejemplo 132 utilizando la forma no restringida
del modelo mixto. Los cuadrados medios esperados de la parte inferior de esta tabla son ligeramente di
ferentes de los que se reportaron para el modelo restringido y, por lo tanto, la construcción de los estadís
ticos de prueba será ligeramente diferente para el factor operadores (arreglo). Específicamente, el
denominador del cociente F de los operadores (arreglo) es la interacción dispositivos x operadores
(arreglo) del modelo restringido (12 grados de libertad para el error), y es la interacción arreglo x dispo
sitivos en el modelo no restringido (2 grados de libertad para el error). Puesto que MSanegta x dispositivos >
MSaispositivos x aperador (arregloj> y tiene menos grados de libertad, se encuentra ahora que el operador dentro del
efecto del arreglo sólo es significativo en el nivel aproximado de 12% (el valor P fue 0.002 en el análisis del
modelo restringido). Además, la estimación del componente de la varianza a~ = 1.083 es menor. Sin em
bargo, puesto que está presente un efecto grande de los dispositivos y una interacción dispositivos x ope
rador (arreglo) significativa, seguiría sospechándose que existe un efecto del operador y, por lo tanto, las
conclusiones prácticas de este experimento no son afectadas mucho por elegir la forma restringida o la no
restringida del modelo mixto. Las cantidades Q[l, 4] y Q[3, 4] son términos cuadráticos del tipo fijo que
contienen el efecto de interacción arreglos x dispositivos.
Si no se cuenta con un paquete de software especializado como SAS o Minitab, entonces puede usar
se un programa para analizar experimentos factoriales con factores anidados y factoriales. Así, el experi
mento del ejemplo 132 podría considerarse como un factorial de tres factores, con los dispositivos (F),
los operadores (O) y los arreglos (L) como los factores. Entonces se agruparían ciertas sumas de cuadra
dos y ciertos grados de libertad para formar las cantidades apropiadas requeridas para el diseño con los
factores anidados y factoriales de la siguiente manera:
Análisis factorial Análisis factorialanidado

Grados de Grados de
Suma de cuadrados libertad Suma de cuadrados libertad
SSF 2 2
ssl 1 1
SSFL 2 2
SSo 3
SSLo 3 SS01L¡ = SS0 + SSw 6
SSFO 6 12
SSFOL 6
SSE 24 24
SSr 47 47
13~4 DISEÑO DE PARCELAS SUBDIVIDIDAS
En algunos experimentos factoriales con factores múltiples quizá no sea posible la aleatorización comple
ta del orden de las corridas. Esto suele resultar en una generalización del diseño factorial llamada diseño
de parcelas subdivididas.
Como un ejemplo, considere un fabricante de papel que está interesado en tres métodos diferentes
para preparar la pulpa y cuatro temperaturas de cocción diferentes de la pulpa y que desea estudiar el
efecto de estos dos factores sobre la resistencia a la tensión del papel. Cada réplica de un experimento fac
torial requiere 12 observaciones, y el experimentador ha decidido correr tres réplicas. Sin embargo, la ca
5 74 CAPÍTIJLO 13 DISEÑOS ANIDADOS Y DE PARCELAS SUBDMDIDAS
pacidad de la planta piloto sólo permite realizar 12 corridas por día, por lo que el experimentador decide
correr una réplica en cada uno de tres días y considerar los días o las réplicas como bloques. En un día lle
va a cabo el experimento de la siguiente manera. Se produce un lote de pulpa con uno de los tres métodos
bajo estudio. Después este lote se divide en cuatro muestras, y la cocción de cada muestra se hace con una
de las cuatro temperaturas. Entonces se produce un segundo lote de pulpa utilizando otro de los tres mé
todos. Este segundo lote también se divide en cuatro muestras que se prueban con las cuatro temperatu
ras. Después se repite el proceso, utilizando un lote de pulpa producido por el tercer método. Los datos se
Iniciahnente, esto podría considerarse un experimento factorial con tres niveles del método de pre
paración (factor A) y cuatro niveles de la temperatura (factor B) en un bloque aleatorizado. Si éste fuera
el caso, entonces el orden de experimentación dentro de cada réplica o bloque debería ser completamen
te aleatorizado. Es decir, dentro de un bloque debería seleccionarse aleatoriamente una combinación de
tratamientos (un método de preparación y una temperatura) y obtener una observación, después debería
seleccionarse aleatoriamente otra combinación de tratamientos y obtener una segunda observación, y así
sucesivamente hasta que se hayan tomado las 12 observaciones en el bloque. Sin embargo, el experimen
tador no recabó los datos de esta manera. Él hizo un lote de pulpa y obtuvo observaciones para las cuatro
temperaturas de ese lote. Debido a la economía para preparar los lotes y al tamaño de los lotes, ésta es la
única manera factible de correr este experimento. Un experimento factorial completamente aleatorizado
requeriría 36 lotes de pulpa, lo cual es totalmente irrealista. El diseño de parcelas subdivididas requiere
sólo tres lotes de pulpa por bloque (réplica), en este caso 9 lotes en total. Evidentemente, el diseño de par
celas subdivididas ha dado como resultado una eficiencia experimental considerable.
El diseño utilizado en el ejemplo de la pulpa es de parcelas subdivididas. Cada réplica o bloque del di
seño de parcelas subdivididas se divide en tres partes llamadas parcelas completas, y a los métodos de
preparación se les llama tratamientos principales o de parcelas completas. Cada parcela completa se di
vide en cuatro partes llamadas subparcelas (o parcelas subdivididas), y se asigna una temperatura a cada
una de ellas. A la temperatura se le llama el tratamiento de la subparcela. Observe que si están presentes
otros factores no controlados o fuera del diseño, y si estos factores no controlados varían cuando los mé
todos para preparar la pulpa se modifican, entonces cualquier efecto de los factores fuera del diseño so
bre la respuesta estará completamente confundido (o mezclado) con el efecto de los métodos para
preparar la pulpa. Puesto que los tratamientos de las parcelas completas de un diseño de parcelas subdivi
didas están confundidos con las parcelas completas y los tratamientos de las subparcelas no están confun
didos, es mejor asignar el factor en el que haya mayor interés a las subparcelas, de ser posible.
Este ejemplo es bastante típico de la forma en que se usan los diseños de parcelas subdivididas en un
ambiente industrial. Observe que, en esencia, los dos factores "se aplicaron" en tiempos diferentes. Por
consiguiente, un diseño de parcelas subdivididas puede considerarse como dos experimentos "combina
Tabla 1314 El experimento de la resistencia a la tensión del papel

Réplica (o Réplica (o Réplica (o
Método de preparación bloque) 1 bloque) 2 bloque) 3
de la pulpa 1 2 3 1 2 3 1 2 3
Temperatura (°F)
200 30 34 29 28 31 31 31 35 32
225 35 41 26 32 36 30 37 40 34
250 37 .38 33 40 42 32 41 39 39
275 36 42 36 41 40 40 40 44 45
13.4 DISEÑO DE PARCELAS SUBDIVIDIDAS 575
dos" o superpuestos entre sí. Un "experimento" tiene el factor parcela completa aplicado a las unidades
experimentales grandes (o es un factor cuyos niveles son difíciles de cambiar) y el otro "experimento" tie
ne el factor subparcela aplicado a las unidades experimentales más pequeñas (o es un factor cuyos niveles
son fáciles de cambiar).
El modelo lineal para el diseño de parcelas subdivididas es
Y1J1c = u+t , +/3¡ +(r/J);¡ +r1c +(ry)ik

i_ '.: 1, 2, , r
+(Pr)¡1c +('rf}y)IJ/< +e;¡1c {
J1, 2, ,a (1315)
k = 1, 2, , b
donde r:;,/J; y (r:fJ)11 representan la parcela completa y corresponden respectivamente a los bloques (o répli
cas), a los tratamientos principales (factor A) y al error de la parcela completa [réplicas (o bloques) x A);
y Y» (ry)ik, (PY);k y (rf}y);¡t representan la subparcela y corresponden respectivamente al tratamiento de la
subparcela (factor B), las réplicas (o bloques) x By las interaccionesAB, y al error de la subparcela (blo
ques x AB). Observe que el error de la parcela completa es la interacción réplicas (o bloques) x A y que
el error de la subparcela es la interacción de tres factores bloques x AB. Las sumas de cuadrados para es
tos factores se calculan como en el análisis de varianza de tres factores sin réplicas.
Los cuadrados medios esperados del diseño de parcelas subdivididas, con las réplicas o bloques alea
torios y los tratamientos principales y los tratamientos de subparcelas fijas, se derivan en la tabla 1315.
Observe que el factor principal (A) de la parcela completa se prueba contra el error de la parcela comple
ta, mientras que el subtratamiento (B) se prueba contra la interacción réplicas (o bloques) x subtrata
mientos. La interacciónAB se prueba contra el error de la subparcela. Observe que no hay pruebas para
el efecto de la réplica (o bloque) (A) o la interacción réplica (o bloque) x subtratamiento (AC).
El análisis de varianza de los datos de la resistencia a la tensión de la tabla 1314 se resume en la tabla
1316. Puesto que tanto los métodos de preparación como las temperaturas son fijos y las réplicas son
aleatorias, son aplicables los cuadrados medios esperados de la tabla 1315. El cuadrado medio de los
métodos de preparación se compara con el cuadrado medio del error de la parcela completa, y el cuadra
Tabla 13·15 Derivación del cuadrado medio esperado del diseño de parcelas subdivididas
r a b 1
R F F R
Factor j k h Cuadrado medio esperado
1 1 o2+abo2
Parcela completa
'r¡
/3¡ r
a
o
b
b 1
, rb L pi
02+bo2+ 1
<fl a-1
(r/J)¡¡ 1 o b 1 o2+bo2
Yk r a o 1
2 2
o +ao.,,+ (bl)
k rz
ra
(t'l')ik 1 a o 1 o2+ao2
Subparcela
(fty)¡t r o o 1
2 2.,, r LL
(PY)~k
cr +oq¡y+ (al)(b1)
(r/jy)¡ík 1 o o 1 02+02
E ijk 1 1 1 1 o2 (no ~stimable)
subtratamiento. Esta situación también es similar a un submuestreo, como lo describe Ostle (92]. Supo
niendo que A y B son fijos, los cuadrados medios esperados en este caso son
bn_L r2
E(MS A
)=a29+na2+.¡, a-l '
E(MS B )= . a28 +na2.¡,

an¿ f3'1:
+ b1 '
E(MSAB )=a;
nLL (r/3)~
+na!+ (al)(b1)
E(MSE )=a; (1318)
Por lo tanto, no hay pruebas para los efectos principales a menos que la interacción sea insignificante. La
situación es exactamente la de un análisis de varianza de dos factores con una observación por celda. Si
los dos factores son aleatorios, entonces los efectos principales pueden probarse contra la interacciónAB.
Si sólo uno de los factores es aleatorio, entonces el factor fijo puede probarse contra la interacciónAB.
En general, si se analiza un diseño factorial y todos los efectos principales y las interacciones son sig
nificativos, entonces deberá examinarse con atención cómo se realizó realmente el experimento. Puede
haber restricciones sobre la aleatorización en el modelo que no se tomaron en cuenta en el análisis y, por
consiguiente, los datos no deberán analizarse como un factorial. ·
13 .. 5 OTRAS VARIANTES DEL DISEÑO DE PARCELAS SUBDIVIDIDAS
13 ..5.1 Diseño de parcelas subdivididas con más de dos factores

En ocasiones se encuentra que la parcela completa o la subparcela contendrán dos o más factores, dis
puestos en una estructura factorial. Como un ejemplo, considere un experimento conducido en un horno
para hacer crecer un óxido en una oblea de silicio. Las variables de respuesta de interés son el espesor de
la capa de óxido y la uniformidad de la capa. Hay cuatro factores del diseño: la temperatura (A), el flujo
de gas (B), el tiempo (C) y la posición de la oblea en el horno (D). El experimentador planea correr un di
seño factorial 24 con dos réplicas (32 ensayos). Ahora bien, los factores A y B (la temperatura y el flujo de
gas) son difíciles de cambiar, mientras que C y D (el tiempo y la posición de la oblea) son fáciles de modifi
car. Esto lleva al diseño de parcelas subdivididas que se muestra en la figura 137. Observe que las dos ré
plicas del experimento están subdivididas en cuatro parcelas completas, cada una de las cuales contiene
una combinación de los ajustes de la temperatura y el flujo de gas. Una vez que se eligen estos niveles,
cada parcela completa se subdivide en cuatro subparcelas, y se realiza un diseño factorial 22 en los facto
res tiempo y posición de la oblea, donde las combinaciones de tratamientos de la subparcela se prueban
en orden aleatorio. Únicamente se hacen cuatro cambios de la temperatura y del flujo de gas en cada ré
plica, mientras que los niveles del tiempo y la posición de la oblea están completamente aleatorizados.
Un modelo para este experimento, consistente con la ecuación 1316, es
Yljklm = u+t ¡ +Pj +rk +(Pr)jk +eijk +d, +A.'" +(dA.)1m
+(/Jd)¡1 +({3A.)¡m +(yd)ld +(dA.)rm +({3yd)jld +({3yA.)j/<m
i=l,2
i= 1, 2
k=l, 2 (1319)
{ l= 1, 2
m=l, 2
135 OTRAS VARIANTES DEL DISEÑO DE PARCELAS SUBDIVIDIDAS 579
Bloque 1 Bloque 2
P11rcela A!+l n n 1+1 n 1+1 1+1 n

completa
BLJ ~ LJ L:J ~ ~ LJ L:J
l 1 l 1 1 1 1 1
Subparcala
c:o:o:o:o·o·o:oo

D
+
D
+
D
+
D
+
D
+
D
+
Figura 13.7 Diseño de parcelas subdivididascon cuatro factores del diseño, dos en la parcela completa y dos
D
+
D
+
en la subparcela.
donde t, representa el efecto de la réplica, f3j y yk los efectos principales de la parcela completa, 9;jk es el
error de la parcela completa, ó1 y A.m representan los efectos principales de la subparcela y E;¡klm es el error
de la subparcela. Se han incluido todas las interacciones entre los cuatro factores del diseño. En la tabla
1317 se presenta el análisis de varianza de este diseño, suponiendo que las réplicas son aleatorias y que
todos los factores del diseño son efectos fijos. En esta tabla, y a; a;
representan las varianzas de los erro·
res de la parcela completa y de la subparcela, respectivamente, a~ es la varianza de los efectos de los blo
Tabla 1317 Análisis abreviado de un diseño de parcelas subdivididas con los factores A y B en las parcelas completas
y los factores C y D en las subparcelas (referirse a la figura 13 7)
variación cuadrados libertad Cuadrado medio esperado
Réplicas (T1) 1 u;+ 16a~
A (/3¡) 1 a;+8a~+A
B (Yk) SSB 1 a;+ 8a~+ B
AB SSAB 1 u;+ 8a~+ AB
Error de la parcela completa (8qk) SSWP 3 a~+ 8a~
C(d1) SSe 1 a;+c
D (.\m) SS0 1 a;+D
CD SSen 1 a;+cn
AC SSAC 1 a;+AC
BC SSse 1 a;+BC
AD SSAD 1 u;+AD
BD SSsn 1 a;+BD
ABC SSABc 1 a;+ABC
ABD SSABD 1 <r.+ABD
ACD SSACD 1 a;+ACD
BCD SSsen 1 a;+BCD
ABCD SSABCD 1 a;+ABCD
Error de la subparcela (E;j1c1m) ss; 12 ª2'
Thtal SSr 31
ques, y (para simplificar) se han usado letras mayúsculas latinas para denotar los efectos de tipo fijo. Los
efectos principales y la interacción de la parcela completa se prueban contra el error de la parcela com
pleta, mientras que los factores de la subparcela y todas las demás interacciones se prueban contra el
error de Ja subparce]a. Si algunos de los factores del diseño son aleatorios, los estadísticos de prueba se
rán diferentes. En algunos casos no habrá ninguna prueba F exacta y deberá usarse el procedimiento de
Satterthwaite (descrito en el capítulo 12).
Los experimentos factoriales con tres o más factores en una estructura de parcelas subdivididas tien
den a ser experimentos bastante grandes. Por otra parte, la estructura de parcelas subdivididas con fre
cuencia facilita la realización de un experimento grande. Por ejemplo, en el caso del horno de oxidación,
los experimentadores sólo tienen que cambiar ocho veces los factores que son difíciles de modificar (A y
B), por lo que quizá un experimento de 32 corridas no sea demasiado ilógico. Es posible reducir el núme
ro de corridas utilizando un factorial fraccionado para los factores del diseño de interés.
135.2 Diseño de parcelas con doble subdivisión

El concepto de diseños de parcelas subdivididas puede extenderse a situaciones en las que pueden ocurrir
restricciones sobre la aleatorización en cualquier número de niveles dentro del experimento. Si hay dos
niveles de restricciones sobre la aleatorización, al arreglo se le llama diseño de parcelas con doble subdi
visión. En el ejemplo siguiente se ilustra este dise.ño.
EJEMPLO 13-3 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Un investigador estudia los tiempos de absorción de un tipo particular de cápsula de antibiótico. Hay tres
técnicos, tres concentraciones de la dosis y cuatro espesores de la pared de la cápsula. Cada réplica de un
experimento factorial requeriría 36 observaciones. El experimentador se ha decidido por cuatro réplicas,
y es necesario correr cada réplica en un día diferente. Observe que los días pueden considerarse como
bloques. Dentro de una réplica (o un bloque) (día), el experimento se realiza asignando una unidad de
antibiótico a un técnico que lleva a cabo el experimento con las tres concentraciones de la dosis y los cua
tro espesores de la pared. Una vez que se ha formulado una concentración particular de la dosis, se prue
ban los cuatro espesores de la pared con esa concentración. Después se selecciona otra concentración de
la dosis y se prueban los cuatro espesores de la pared. Por último se prueba la tercera concentración de la
dosis y los cuatro espesores de la pared. Mientras tanto, otros dos técnicos del laboratorio también siguen
el mismo plan, empezando cada uno con una unidad de antibiótico.
Observe que hay dos restricciones sobre la aleatorización dentro de cada réplica (o bloque): el técni
co y la concentración de la dosis. Las parcelas completas corresponden al técnico. El orden en que se asig
nan los técnicos a las unidades de antibiótico se determina aleatoriamente. Las concentraciones de la
dosis forman tres subparcelas. La concentración de la dosis puede asignarse aleatoriamente a una subpar
cela; Por último, dentro de una concentración particular de la dosis se prueban los cuatro espesores de la
pared de la cápsula de manera aleatoria, formando cuatro subsubparcelas. A los espesores de la pared
suele llamárseles subsubtratamientos. Puesto que hay dos restricciones sobre la aleatorización en el ex
perimento (algunos autores dicen que hay dos "divisiones" en el diseño), al diseño se le llama diseño de
parcelas con doble subdivisión. En la figura 138 se ilustran las restricciones sobre la aleatorización y el
.........................................................................
arreglo experimental de este diseño .
Espesor de la pared
1
Antibiótico Concentración
asignado a de la dosis 2
un técnico elegida
Primera Segunda 3
restricción restricción
sobre la sobre la
aleatorización aleatorización Orden
aleatorio
4
Técnico
2 3
Concentración
Bloques de la dosis 2 3 2 3 2 3
1 1 1 1
Espesor de 2
la pared
2 2 2 2 2 2 2 2
3 3 3 3 3 3 3 3 3
4 4 4 4 4 4 4 4 4
1 1 1 1
2
Espesor de 2 2 2 2 2 2 2 2 2
la pared 3 3 3 3 3 3 3 3 3
4 4 4 4 4 4 4 4 4
1 1 1 1
3
Espesor de 2 2 2 2 2 2 2 2 2
la pared
3 3 3 3 3 3 3 3 3
4 4 4 4 4 4 4 4 4
1 1 1
Espesor de 2 2 2 2 2 2 2 2 2
4 la pared
3 3 3 3 3 3 3 3 3
4 4 4 4 4 4 4 4 4
Figura 138 Diseño de parcelas con doble subdivisión.
Un modelo estadístico lineal para el diseño de parcelas con doble subdivisión es

Yifkh = u+t , +f3j +(rf3)ii +yk +(iy)ik +(/3Y)1k +(rf3y)ifk
+oh +(ro)¡¡, +(f3o)1h
+( rf3o)ijh +(yo)kh +( ryo)ikh +(f3yo) jkh
i. ".: 1, 2, , r
j J1, 2,
k = 1, 2,
h= 1, 2,
,
,
,
a
b
e
(1320)
donde r;, {31 y (rfJ)ij representan la parcela completa y corresponden a las réplicas o bloques, a los trata
mientos principales (factor A) y al error de la parcela completa [réplicas (o bloques) x A)J, respectiva
mente; y rt, (ryh, (/3y)jk y (rf3y)ijk representan la subparcela y corresponden al tratamiento de la

subparcela (factor B), las interacciones de réplicas (o bloques) x B yAB, y al error de la subparcela, res
pectivamente; y dh y los parámetros restantes corresponden a la subsubparcela y representan, respectiva
mente, al tratamiento de la subsubparcela (factor C) y a las interacciones restantes. A la interacción de
cuatro factores (rf3yd)ifkh se le llama el error de la subsubparcela.
Suponiendo que las réplicas (bloques) son aleatorias y que los demás factores del diseño son fijos,
pueden derivarse los cuadrados medios esperados como se muestra en la tabla 1318. Las pruebas de los
tratamientos principales, los subtratamientos, los subsubtratamientos y sus interacciones son obvias al
inspeccionar esta tabla. Observe que no existen pruebas para las réplicas o bloques ni para las interaccio
nes en las que intervienen réplicas o bloques.
El análisis estadístico de un diseño de parcelas con doble subdivisión es como el de una sola réplica de
un factorial de cuatro factores. El número de grados de libertad de cada prueba se determina de la mane
ra usual. Para ilustrar, en el ejemplo 133, donde se manejaron cuatro réplicas, tres técnicos, tres concen
traciones de la dosis y cuatro espesores de la pared, se tendrían sólo (r- l)(a 1) = (41)(3 1) = 6
grados de libertad del error de la parcela completa para probar a los técnicos. Se trata de un número rela
tivamente pequeño de grados de libertad, y el experimentador podría considerar el uso de réplicas adicio
Tabla 1318 Derivación del cuadrado medio esperado para el diseño de parcelas con doble subdivisión
r a b e 1
R F F F R
Factor j k h l Cuadrado medio esperado
7:¡ 1 a b e 1 a2+abcda2
Parcela completa /3¡ r o b e 1 a2+a2 +

rbc Í: {32
J
rfJ (a1)
(r:f3)ij 1 o b e 1 a2+bca;
Yk r a o e 1 a2+aca2 +
rae L
y~
ry (b1)
(ry)lk 1 a o e 1 a2+aca2
Subparcela
(f3y)¡k r o o e 1
2 2 ry re (f3y)~h LL
a +ca,.11r+ (al)(b1)
(rf3rh 1 o o e 1 a2+ca;.11r
óh r a b o 1 a2+aba2 +
rab L óz
"' (c1)
(r:ó);h 1 a b o 1 a2+aba~"
({3ó)¡h r o b o 1 0
2 2 rb LL ({3ó)~h
+ba,¡¡.i+ (al)(c1)
(r:f3ó);¡h 1 o b o 1 a2+ ba2r{M
Subsubparcela (yó)kh r a o o 1 2 2 'ª2:2: <ró)Zi.
a +aa,,,.,+ (bl)(c1)
(ryó)ikh 1 a o o 1 a2+aa2
(f3yó)¡kh r o o o 1
2 2,,,., r 2: 2: 2: (f3ró)~k
a +a,ll>"+ (bl)(c1)
(r{3yó)¡¡kk 1 o o o 1 (J2 + (J2rJlr<l
E1(iikh) 1 1 1 1 1 a2 (no estimable)
Parcelas completas i
A3 A1 A2
B, A:¡B, A,B, A:zB,
Parcelas
A:¡B3 A1B3 A:zBa en franjas
...
A:¡Bz A1B2 Az82
Figura 139 Una réplica (bloque) de un di

seño de parcelas subdivididas en franjas.
nales para incrementar la precisión de la prueba. Si hay a réplicas, se tendrán 2(r - 1) grados de libertad
para el error de la parcela completa. Por lo tanto, cinco réplicas producirán 2(5 1) = 8 grados de liber
tad, seis réplicas producirán 2( 6 1) = 10 grados de libertad, siete réplicas producirán 2(7 1) = 12 gra
dos de libertad, etcétera. Por consiguiente, es probable que el experimentador no quiera correr menos de
cuatro réplicas, ya que se producirían así sólo cuatro grados de libertad. Cada réplica adicional permite
ganar dos grados de libertad para el error. Si se cuenta con recursos para correr cinco réplicas, la preci
sión de la prueba podría incrementarse en un tercio (de seis a ocho grados de libertad). Además, al pasar
de cinco a seis réplicas, hay 25% de ganancia adicional en la precisión. Si los recursos lo permiten, el expe
rimentador deberá correr cinco o seis réplicas.
135.3 Diseño de parcelas subdivididas en franjas
El diseño de parcelas subdivididas en franjas ha tenido una amplia aplicación en las ciencias agrícolas,
pero sólo ocasionalmente encuentra un uso en la experimentación industrial. En el caso más simple, se
tienen dos factores A y B. El factor A se aplica a las parcelas completas como en el diseño de parcelas sub
divididas estándar. Después el factor B se aplica a franjas (que son en realidad sólo otro conjunto de par
Tabla 13·19 Análisis de varianza abreviado de un diseño de parcelas subdivididas en franjas

variación cuadrados libertad Cuadrado medio esperado
Réplicas (o bloques) SSRtpli<a5 r1
A SSA a1
Error, de la parcela completa SSWPA (r l)(a1) ª~ + oo;P

B SSB b1
2
a,+aa'l'+
z ra
bl
2: y¡
Error, de la parcela completa SSWPB (rl)(b1) (72
'
+ ªª2'!'
AB SSAB (al)(b1) 2 r 2:2:

(rf3)~k
a,+ (al)(b1)
Error de la subparcela ss; (rl)(al)(b1) (72
'
Total SST rab-l
celas completas) que son ortogonales a las parcelas completas originales utilizadas para el factor A. En la
figura 139 se ilustra una situación en la que los dos factores A y B tienen tres niveles. Observe que los ni
veles del factor A están confundidos (o mezclados) con las parcelas completas, y que los niveles del factor
B están confundidos con las franjas (las cuales pueden considerarse como un segundo conjunto de parce
las completas).
Un modelo para el diseño de parcelas subdivididas en franjas de la figura 139, suponiendo y réplicas,
a niveles del factor A y b niveles del factor B, es
i_:
l
1, 2, ,r
J 1, 2, , a
k = 1, 2, , b
donde (r/3);¡Y (ry);kson los errores de la parcela completa de los factoresA y B, respectivamente, y E¡¡k es el
error "de la subparcela" usado para probar la interacciónAB. En la tabla 1319 se muestra un análisis de
varianza abreviado, suponiendo que A y B son factores fijos y que las réplicas son aleatorias. En ocasiones
las réplicas se consideran como bloques.
136 PROBLEMAS
131. El fabricante de la carga propulsora de una turbina está estudiando la rapidez de combustión del propulsor
obtenido de tres procesos de producción. Se seleccionan al azar cuatro lotes del propulsor de la salida de
cada proceso y se hacen tres determinaciones de la rapidez de combustión de cada lote. Los resultados se
presentan a continuación. Analizar los datos y sacar conclusiones.
Proceso 1 Proceso 2 Proceso 3

Lote 1 2 3 4 1 2 3 4 1 2 3 4
25 19 15 15 19 23 18 35 14 35 38 25
30 28 17 16 17 24 21 '27 15 21 54 29
26 20 14 13 14 21 17 25 20 24 50 33
132. Se estudia el acabado superficial de piezas metálicas fabricadas en cuatro máquinas. Se conduce un experi
mento en el que cada máquina es operada por tres operadores diferentes y se colectan y prueban dos ejem
plares de cada operador. Debido a la ubicación de las máquinas, se usan operadores diferentes en cada
máquina, y los operadores se eligen al azar. Los datos se muestran en la tabla siguiente. Analizar los datos y
sacar conclusiones.
Máquina 1 Máquina2 Máquina3 Máquina4

Operador 1 2 3 1 2 3 1 2 3 1 2 3
79 94 46 92 85 76 88 53 46 36 40 62
62 74 57 99 79 68 75 56 57 53 56 47
133. Un ingeniero de manufactura está estudiando la variabilidad dimensional de un componente particular que
se produce en tres máquinas. Cada máquina tiene dos mandriles, y se seleccionan al azar cuatro componen
tes de cada mandril. Los 'resultados se presentan a continuación. Analizar los datos, suponiendo que las má
quinas y los mandriles son factores fijos.
136 PROBLEMAS 585
Máquina 1 Máquina2 Máquina3
Mandril 1 2 1 2 1 2
12 8 14 12 14 16
9 9 15 10 10 15
11 10 13 11 12 15
12 8 14 13 11 14
134. Para simplificar la programación de la producción, un ingeniero industrial está estudiando la posibilidad de
asignar un tiempo estándar a una clase particular de tareas, con la creencia de que las diferencias entre las ta
reas son insignificantes. Para ver si esta simplificación es posible, se seleccionan seis tareas al azar. Cada ta
rea se encarga a un grupo diferente de tres operadores. Cada operador completa dos veces la tarea en
momentos diferentes durante la semana, y se obtienen los resultados siguientes. ¿Qué conclusiones pueden
sacarse acerca del uso del tiempo estándar común para todas las tareas de esta clase? ¿Qué valor se usaría
para el estándar?
Tarea Operador 1 Operador 2 Operador 3

1 158.3 159.4 159.2 159.6 158.9 157.8
2 154.6 154.9 157.7 156.8 154.8 156.3
3 162.5 162.6 161.0 158.9 160.5 159.5
4 160.0 158.7 157.5 158.9 161.1 158.5
5 156.3 158.1 158.3 156.9 157.7 156.9
6 163.7 161.0 162.3 160.3 162.6 161.8
135. Considere el diseño anidado de tres etapas que se muestra en la figura 135 para investigar la dureza de una
aleación. Utilizando los datos que se presentan a continuación, analizar el diseño, suponiendo que la quími
ca de la aleación y las hornadas son factores fijos y que los lingotes son aleatorios. Usar la forma restringida
del modelo mixto.
Quimica de la aleación
Hornadas 1 2
1 2 3 1 2 3
Lingotes 1 2 1 2 1 2 1 2 1 2 1 2
40 27 95 69 65 78 22 23 83 75 61 35
63 30 67 47 54 45 10 39 62 64 77 42
136. Analizar nuevamente el experimento del problema 135 utilizando la forma no restringida del modelo mixto.
Comentar las diferencias que se observan entre los resultados del modelo restringido y el no restringido.
Puede usarse un paquete de software de computadora.
137. Derivar los cuadrados medios esperados para el diseño anidado balanceado de tres etapas, suponiendo que
A es fijo y que By C son aleatorios. Obtener las fórmulas para estimar los componentes de la varianza. Supo
ner la forma restringida del modelo mixto.
138. Repetir el problema 137 suponiendo la forma no restringida del modelo mixto. Puede usarse un paquete de
software de computadora para hacerlo. Comentar las diferencias entre el análisis y las conclusiones del mo
delo restringido y el no restringido.
139. Derivar los cuadrados medios esperados para el diseño anidado balanceado de tres etapas si los tres factores
son aleatorios. Obtener las fórmulas para estimar los componentes de la varianza.
1310. Verificar los cuadrados medios esperados que se dan en la tabla 131.
1311. Diseños anidados no balanceados. Considere un diseño anidado de dos etapas no balanceado con b¡ niveles de
B bajo el nivel iésimo de A y n;¡ réplicas en la celda ijésima.
a) Anotar las ecuaciones normales de mínimos cuadrados para esta situación. Resolver las ecuaciones nor
males.
b) Construir la tabla del análisis de varianza para el diseño anidado no balanceado de dos etapas.
e) Analizar los datos siguientes, utilizando los resultados del inciso b.
Factor A 1 2
Factor B 1 2 1 2 3
6 3 5 2 1
4 1 7 4 o
8 9 3 3
6
1312. Componentes de la varianza en el diseño anidado no balanceado de dos etapas. Considere el modelo
i = 1,
¡
2, , a
i= 1, 2, , b
k = 1, 2, , n1i
donde A y B son factores aleatorios. Demostrar que
E(MS A)= o? +c1a~ +c2a;

E(MSB(A) )= a2 +c0a~
E(MSE)=a2
donde
~a
N- L,,.¡ [ b¡
~
L.J n~ /n.
l) 1.•
)
j;l j;l
e1 = a-l
a
N-L j;l
n2t.
e 2 - N
a-l
1313. Un ingeniero de procesos está probando el rendimiento de un producto manufacturado en tres máquinas.
Cada máquina puede operarse con dos ajustes de la potencia. Además, una máquina tiene tres estaciones en
las que se fabrica el producto. Se conduce un experimento en el que cada máquina se prueba con ambos ajus
tes de la potencia, y se toman tres observaciones del rendimiento de cada estación. Las corridas se hacen en
orden aleatorio, y los resultados se presentan a continuación. Analizar este experimento, suponiendo que los
tres factores son fijos.
136 PROBLEMAS 587

Estación 1 2 3 1 2 3 1 2 3
34.1 33.7 36.2 31.1 33.1 32.8 32.9 33.8 33.6
Ajuste de la potencia 1 30.3 34.9 36.8 33.5 34.7 35.l 33.0 33.4 32.8
31.6 35.0 37.1 34.0 33.9 34.3 33.1 32.8 31.7
24.3 28.1 25.7 24.1 24.1 26.0 24.2 23.2 24.7
Ajuste de la potencia 2 26.3 29.3 26.1 25.0 25.1 27.1 26.1 27.4 22.0
27.1 28.6 24.9 26.3 27.9 23.9 25.3 28.0 24.8
1314. Suponga que en el problema 1313 podrían emplearse un gran número de ajustes de la potencia y que los dos
que se seleccionaron para el experimento se escogieron al azar. Obtener los cuadrados medios esperados para
esta situación suponiendo la forma restringida del modelo mixto y hacer las modificaciones apropiadas al
análisis anterior.
1315. Analizar nuevamente el experimento del problema 1314 suponiendo la forma no restringida del modelo
mixto. Puede usarse un paquete de software de computadora para hacerlo. Comentar las diferencias entre el
análisis y las conclusiones del modelo restringido y el no restríngido.
1316. Un ingeniero de estructuras está estudiando la resistencia de una aleación de aluminio adquirida de tres fa
bricantes. Cada fabricante entrega la aleación en barras de tamaño estándar de 1.0, 1.5 o 2.0 pulgadas. El
procesamiento de los diferentes tamaños de las barras a partir de un lingote común implica técnicas diferen
tes de forjado, por lo que este factor puede ser importante. Además, las barras se forjan de lingotes fabrica
dos en hornadas diferentes. Cada fabricante entrega dos ejemplares de prueba de cada tamaño de las barras
de tres hornadas. Los datos de la resistencia resultantes se presentan a continuación. Analizar los datos, su
poniendo que los fabricantes y el tamaño de las barras son fijos y las hornadas son aleatorias. Usar la forma
restringida del modelo mixto.
Fabricante 1 Fabricante 2 Fabricante 3

Hornada 1 2 3 1 2 3 1 2 3
Tamaño de la barra: 1 pulgada 1.230 1.346 1.235 1.301 1.346 1.315 1.247 1.275 1.324
1.259 1.400 1.206 1.263 1.392 1.320 1.296 1.268 1.315
1 !pulgadas 1.316 1.329 1.250 1.274 1.384 1.346 1.273 1.260 1.392
1.300 1.362 1.239 1.268 1.375 1.357 1.264 1.265 1.364
2 pulgadas 1.287 1.346 1.273 1.247 1.362 1.336 1.301 1.280 1.319
1.292 1.382 1.215 1.215 1.328 1.342 1.262 1.271 1.323
1317. Resolver de nuevo el problema 1316 utilizando la forma no restringida del modelo mixto. Puede usarse un
paquete de software de computadora para hacerlo. Comentar cualquier diferencia entre el análisis y las con
clusiones del modelo restringido y el no restríngido.
1318. Suponga que en el problema 1316 las barras pueden adquirirse en muchos tamaños y que los tres tamaños
que realmente se utilizaron en el experimento fueron seleccionados al azar. Obtener los cuadrados medios
esperados para esta situación y hacer las modificaciones apropiadas al análisis anterior. Usar la forma res
tringida del modelo mixto.
1319. La normalización del acero se hace calentándolo arriba de la temperatura crítica, recalentándolo y después
enfriándolo con aire. Este proceso incrementa la resistencia del acero, refina el grano y homogeneiza la es
tructura. Se lleva a cabo un experimento para determinar el efecto de la temperatura y de la duración del
tratamiento térmico sobre la resistencia del acero normalizado. Se seleccionan dos temperaturas y tres dura
588 CAPÍTIJLO 13 DISEÑOS ANIDADOS Y DE PARCEIAS SUBDMDIDAS
dones. El experimento se realiza calentando el horno a una temperatura seleccionada aleatoriamente e in
sertando tres ejemplares de prueba. Después de 10 minutos se retira uno de ellos, después de 20 minutos se
retira un segundo ejemplar y después de 30 minutos se retira el último. Entonces se corre la temperatura al
otro nivel y se repite el proceso. Se requieren cuatro corrimientos para recabar los datos, los cuales se mues
tran abajo. Analizar los datos y sacar conclusiones, suponiendo que ambos factores son fijos.
'Iemperatura, ºF
Corrimiento Tiempo, minutos 1500 1600
10 63 89
1 20 54 91
30 61 62
10 50 80
2 20 52 72
30 59 69
10 48 73
3 20 74 81
30 71 69
10 54 88
4 20 48 92
30 59 64
1320. Se diseña un experimento para estudiar la dispersión de los pigmentos de una pintura. Se estudian cuatro
mezclas diferentes de un pigmento particular. El procedimiento consiste en preparar una mezcla particular y
en aplicarla después a un panel utilizando tres métodos (con brocha, por rocío y con rodillo). La respuesta
medida es el porcentaje de reflectancia (coeficiente de reflexión) del pigmento. Se necesitan tres días para
correr el experimento, y los datos obtenidos se presentan a continuación. Analizar los datos y sacar conclu
siones, suponiendo que las mezclas y los métodos de aplicación son fijos.
Método de Mezcla
Día aplicación 1 2 3 4
1 64.5 66.3 74.1 66.5
1 2 68.3 69.5 73.8 70.0
3 70.3 73.1 78.0 72.3
1 65.2 65.0 73.8 64.8
2 2 69.2 70.3 74.5 68.3
3 71.2 72.8 79.1 71.5
1 66.2 66.5 72.3 67.7
3 2 69.0 69.0 75.4 68.6
3 70.8 74.2 80.l 72.4
1321. Repetir el problema 1320, suponiendo que las mezclas son aleatorias y que los métodos de aplicación son fi
jos.
1322. Considere el diseño de parcelas con doble subdivisión del ejemplo 133. Suponga que este experimento se
conduce como se describe y que se obtienen los datos que se muestran en la siguiente tabla. Analizar los da
tos y sacar conc!usiones.
136 PROBLEMAS 589
Técnico
Réplicas 1 2 3
Concentración
(o bloques) de las dlosis 1 2 3 1 2 3 1 2 3
Espesor de la pared
1 95 71 108 96 70 108 95 70 100
1 2 104 82 115 99 84 100 102 81 106
3 101 85 117 95 83 105 105 84 113
4 108 85 116 97 85 109 107 87 115
1 95 78 110 100 72 104 92 69 101
2 2 106 84 109 101 79 102 100 76 104
3 103 86 116 99 80 108 101 80 109
4 109 84 110 112 86 109 108 86 113
1 96 70 107 94 66 100 90 73 98
3 2 105 81 106 100 84 101 97 75 100
3 106 88 112 104 87 109 100 82 104
4 113 90 117 121 90 117 110 91 112
1 90 68 109 98 68 106 98 72 101
4 2 100 84 112 102 81 103 102 78 105
3 102 85 115 100 85 110 105 80 110
4 114 88 118 118 85 116 110 95 120
1323. Resolver nuevamente el problema 1322, suponiendo que los técnicos se eligen al azar. Usar la forma restrin
gida del modelo mixto.
1324. Suponga que en el problema 1322 se usaron cuatro técnicos. Suponiendo que todos los factores son fijos,
lcuántos bloques deberán correrse para obtener un número adecuado de grados de libertad para probar las
diferencias entre los técnicos?
1325. Considere el experimento q¡ue se describe en el ejemplo 133. Demostrar cómo se determinaría el orden en
que se corren la combinaciones de tratamientos si este experimento se realizara como a) una parcela con do
ble subdivisión, b) una parcela subdividida, e) un diseño factorial en un bloque aleatorizado y d) un diseño
factorial completamente aleatorizado.
Otros tópicos
de diseño y
análisis
El tema de los experimentos diseñados estadísticamente es muy amplio. En los capítulos previos se ha
ofrecido una presentación introductoria de muchos de los conceptos y métodos básicos, aunque en algu
nos casos sólo se ha podido presentar un panorama general. Por ejemplo, hay exposiciones que ocupan un
libro sobre tópicos, como la metodología de superficies de respuesta, los experimentos con mezclas, la es
timación de los componentes de la varianza y los diseños óptimos. En este capítulo se presenta un panora
ma general de varios tópicos más que el experimentador puede encontrar potencialmente útiles.
141 RESPUESTAS Y TRANSFORMACIONES NO NORMALES
141.1 Selecciónde una transformación: el método de BoxCox

En la sección 34.3 se estudió el problema de una varianza no constante de la variable de respuesta y en
un experimento diseñado, y se señaló que se trata de una desviación de los supuestos del análisis de va
rianza estándar. Este problema de la desigualdad de la varianza ocurre con relativa frecuencia en la
práctica, muchas veces en conjunción con una variable de respuesta no normal. Algunos ejemplos in
cluirían el conteo de defectos o partículas, los datos de proporciones, como el rendimiento o la propor
ción de productos defectuosos, o una variable de respuesta que sigue alguna distribución sesgada (una
"cola" de la distribución de la respuesta es más larga que la otra). Se introdujo la transformación de la
variable de respuesta como un método apropiado para estabilizar la varianza de la respuesta. Se revisa
ron dos métodos para seleccionar la forma de la transformación, una técnica gráfica empírica y un pro
cedimiento esencialmente de ensayo y error en el que el experimentador simplemente intenta una o
más transformaciones, y selecciona la que produce la gráfica más agradable o satisfactoria de los residua
les contra la respuesta ajustada.
En general, las transformaciones se usan para tres propósitos: estabilizar la varianza de la respuesta,
hacer que la distribución de la variable de respuesta esté más cerca de la distribución normal y mejorar el
ajuste del modelo a los datos. Este último objetivo podría incluir la simplificación del modelo, por ejem
590
141 RE.5PUESTAS Y TRANSFORMACIONES NO NORMALES 591
plo, eliminando términos de interacción. En ocasiones, una transformación será razonablemente eficaz
para conseguir de manera simultánea más de uno de estos objetivos.
Se ha señalado ya que la familia de potencias de las transformaciones y* = 'I es muy útil, donde A. es el
parámetro de la transformación que habrá de determinarse (por ejemplo A. = t significa usar la raíz cua
drada de la respuesta original). Box y Cox [15] han indicado cómo puede estimarse el parámetro de la
transformación A. al mismo tiempo que los demás parámetros del modelo (la media global y los efectos de
los tratamientos). La teoría fundamental en su procedimiento utiliza el método de máxima verosimilitud.
El procedimiento de cálculo real consiste en efectuar, para varios valores de A., el análisis de varianza es
tándar de
/l ,t O
yel> = ..tv1 :;t (141)
{
j ln y l=O
donde y= ln1[(1/n) 1: lny] es la media geométrica de las observaciones. La estimación de máxima verosi
militud de A. es el valor para el que la suma de cuadrados del error, por ejemplo SS E(A. ), es un mínimo. Este
valor de ,l se encuentra generalmente construyendo una gráfica de SS E(A.) contraz y leyendo después en la
gráfica el valor de I que minimiza SSE(A.). En general, son suficientes entre 10 y 20 valores de I para esti
mar el valor óptimo. Si se necesita una estimación más precisa de A., podría realizarse una segunda itera
ción utilizando un número mayor de valores.
Observe que no es posible seleccionar el valor de A. comparando directamente las sumas de cuadrados
y,
del error obtenidas en los análisis de varianza de ya que para cada valor de A. la suma de cuadrados del
error se mide en una escala diferente. Además, surge un problema con y cuando A. = O; a saber, cuando A.
tiende a cero.y' tiende a la unidad. Es decir, cuando A. = O, todos los valores de la respuesta son una cons
tante. El componente (t1)/A. de la ecuación 141 alivia este problema porque cuando A. tiende a cero, (Y
1)/A. tiende a un límite de lny. El componente del divisor y• 1 de la ecuación 141 reescala las respues
tas para que las sumas de cuadrados del error sean comparables directamente.
Al utilizar el método de BoxCox, se recomienda que el experimentador use elecciones simples de A.,
ya que es probable que la diferencia práctica entre A. = 0.5 y A. = 0.58 sea pequeña, pero la transformación
de la raíz cuadrada (A. = 0.5) es mucho más fácil de interpretar. Obviamente, los valores deA. próximos a la
unidad sugerirían que no es necesaria ninguna transformación.
Una vez que se ha seleccionado un valor de A. por el método de BoxCox, el experimentador puede
=
analizar los datos utilizando 1como la respuesta, a menos desde luego que A. O, en cuyo caso se usa lny.
Es perfectamente aceptable utilizar y<A) como la respuesta real, aun cuando las estimaciones de los pará
metros del modelo tendrán una diferencia de escala y un corrimiento del origen en comparación con los
resultados obtenidos cuando se usa 'I (o In y).
Es posible encontrar un intervalo de confianza aproximado de 100(1 a) por ciento para A. calcu
lando
(142)
donde v es el número de grados de libertad, y graficando una recta paralela al eje A. a la altura SS* sobre la
gráfica de SS E(A.) contra A.. Entonces, al localizar los puntos sobre el eje A. donde SS* corta la curva SS E(A. ),
pueden leerse directamente en la gráfica los límites de confianza para A.. Si este intervalo de confianza in
cluye el valor A. = 1, esto implica (como se señaló antes) que los datos no soportan la necesidad de una
transformación.
592 CAPÍTIJLO 14 OTROS TÓPICOS DE DISEÑO Y ANÁLISIS
EJEMPLO 14-1 · · · · · · · · • · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
El procedimiento de BoxCox se ilustrará utilizando los datos de la descarga pico presentados original
mente en el ejemplo 35. Recuerde que se trata de un experimento con un solo factor (ver la tabla 3 7
para los datos originales). Utilizando la ecuación 141 se calcularon los valores de SSE(,t) para varios valo
res de A.:
l SSE(l)
1.00 7922.11
0.50 687.10
0.25 232.52
0.00 91.96
0.25 46.99
0.50 35.42
0.75 40.61
1.00 62.08
1.25 109.82
1.50 208.12
En la figura 141 se muestra una gráfica de los valores próximos al mínimo, en la que se observa que
A. =0.52 produce un valor mínimo de aproximadamente SS E(.A.) == 35.00. Un intervalo de confianza aproxi
mado de 95% para A. se encuentra calculando la cantidad SS* de la ecuación 142 de la siguiente manera:
ss: = ssE(A.) (1+ t;·;~ º)

2
= 35.00 [1 + <2·~~6) J 2
= 42.61
Al representar SS* en la gráfica de la figura 141 y al leer los puntos de la escala I donde esta recta interse
ca la curva, se obtienen los límites de confianza inferior y superior de.A. de,t = 0.27 y).+ = O. 77. Puesto que
estos límites de confianza no incluyen el valor 1, es correcto el uso de una transformación, y la transforma
ción de la raíz cuadrada (A. =
0.50) que se usó en realidad se justifica con facilidad .
.........................................................................
Algunos programas de computadora incluyen el procedimiento de BoxCox para seleccionar una

transformación de la familia de potencias. En la figura 142 se presenta la salida de este procedimiento
como se implementa en Design-Expert para los datos de la descarga pico. Los resultados concuerdan en
gran medida con los cálculos manuales resumidos en el ejemplo 141. Observe que la escala vertical de la
gráfica de la figura 142 es ln[SSE(.A.)].
14· 1 RESPUESTAS Y TRANSFORMACIONES NO NORMALES 593
110
100
90
80
70
?¿ 60
50
40
30
20
10
o
0.00 0.25 0.50 0.75 1.00 1.25 l
l"= 0.27 l• .. 0.77
Figura 141 Gráfica de SSE(l) contra A. para el ejemplo

141.
Gráfica da BoxCo>< trensfonnaciones de potencias

Gráfica de DESIGN-EXPERT
Descargapico 20.32
Lambda
Corriente~l
Mejor= 0.541377
Intervalo de confianza
=
bajo 0.291092
16.14
lmervalo de confianza
alto= 0.791662
Transformación
recomendada
Raíz cuadrada a;
(Lambda= 0.5)
i"'
e 11.95
~
5
7.76
-2 1 o 2 3
Lambda
Figura 142 Salida de Design-Expert para el procedimiento de BoxCox,

14.. 1.2 Modelo lineal generalizado

Con frecuencia las transformaciones de datos son una forma muy eficaz de abordar el problema de las
respuestas no normales y de la desigualdad asociada de la varianza. Como se ha visto en la sección ante
rior, el método de BoxCox es una forma sencilla y eficaz de seleccionar la forma de la transformación.
Sin embargo, puede haber problemas asociados con el uso de una transformación de datos.
Un problema es que el experimentador puede sentirse incómodo al trabajar con la respuesta en la es
cala transformada. Es decir, el experimentador se interesa en el número de defectos, no en la raíz cuadra-
da del número de defectos, o en la resistividad en lugar del logaritmo de la resistividad. Por otra parte, si
una transformación en realidad tiene éxito y mejora el análisis y el modelo asociado de la respuesta, los
experimentadores adoptarán por lo general con rapidez la nueva métrica.
Un problema más serio es que una transformación puede resultar en un valor sin sentido para la va
riable de respuesta en alguna porción del espacio de los factores del diseño que es de interés para el expe
rimentador. Por ejemplo, suponga que se ha usado la transformación de la raíz cuadrada en un
experimento que incluye el número de defectos observados en obleas de semiconductores, y para alguna
porción de la región de interés la raíz cuadrada predicha del conteo de defectos es negativa. Es probable
que esto suceda en situaciones en las que el número real de defectos observados es pequeño. Por consi
guiente, el modelo del experimento ha producido una predicción evidentemente no confiable justo en la
región donde sería deseable que este modelo tuviera un buen desempeño predictivo.
Por último, como se señaló en la sección 141.1, es frecuente el uso de transformaciones a fin de esta
bilizar la varianza, inducir la normalidad y simplificar el modelo. No existe la seguridad de que una trans
formación conseguirá eficazmente todos estos objetivos al mismo tiempo.
Una alternativa del enfoque típico de la transformación de datos seguida del análisis estándar de mí
nimos cuadrados de la respuesta transformada es usar el modelo lineal generalizado. Se trata de un enfo
que desarrollado por Nelder y Wedderburn [87] que en esencia unifica modelos lineales y no lineales con
respuestas normales y no normales. McCullagh y N elder [76] ofrecen un completo estudio de los modelos
lineales generalizados y Myers y Montgomery (85b] proporcionan un tutorial. También se presentan deta
lles adicionales en el material suplementario del texto de este capítulo. Se ofrecerá un panorama general
de los conceptos y se ilustrarán con dos ejemplos breves.
Un modelo lineal generalizado es básicamente un modelo de regresión (el modelo de un diseño expe
rimental también es un modelo de regresión). Como todos los modelos de regresión, está constituido por
un componente aleatorio (lo que se ha llamado generalmente el término del error) y una función de los
factores del diseño (lasx) y algunos parámetros desconocidos (las {3). En un modelo de regresión lineal de
la teoría normal estándar se escribe
(143)
donde se supone que el término del error E tiene una distribución normal con media cero y varianza cons
tante, y la media de la variable de respuesta y es
(144)
A la parte x'P de la ecuación 144 se le llama predictor lineal. El modelo lineal generalizado contiene la
ecuación 143 como un caso especial.
En un modelo lineal generalizado, la variable de respuesta puede tener cualquier distribución que
sea un miembro de la familia exponencial. Esta familia incluye las distribuciones normal, de Poisson, bí
141 RESPUESTAS Y TRANSFORMACIONES NO NORMALES 595
nomial, exponencial y gamma, por lo que la familia exponencial es una colección rica y flexible de distri
buciones aplicables en muchas situaciones experimentales. Además, la relación entre la media de la
respuesta µ y el predictor lineal x'fJ se determina por una función de enlace.
g(µ)= x'fJ (145)
El modelo de regresión que representa la respuesta media está dado entonces por
E(y) = µ = g-1 (x'{J) (146)
Por ejemplo, a la función de enlace que lleva al modelo de regresión lineal ordinario en la ecuación 143
se le llama enlace identidad, ya queµ = g1(x'fJ) = x'{J. Como otro ejemplo, el enlace log (logarítmico)
ln(µ)= x'fJ (147)
produce el modelo
(148)
El enlace logarítmico se usa con frecuencia con datos de conteos (respuesta de Poisson) y con respuestas
continuas que presentan una distribución que tiene una cola larga a la derecha (la distribución exponen
cial o gamma). Otra función de enlace importante que se usa con datos binomiales es el enlace logit
ln(l~µ)=x'fJ (149)
Esta elección de la función de enlace lleva al modelo

1
µ=-- (1410)
1+e·~
Hay muchas elecciones posibles de la función de enlace, pero debe ser siempre monótona y diferenciable.
Observe asimismo que en un modelo lineal generalizado, la varianza de la variable de respuesta no tiene
que ser una constante; puede ser una función de la media (y de las variables predictoras a través de la fun
ción de enlace). Por ejemplo, si la respuesta es de Poisson, la varianza de la respuesta es exactamente
igual a la media.
Para usar un modelo lineal generalizado en la práctica, el experimentador debe especificar una distri
bución de la respuesta y una función de enlace. Después se hace el ajuste del modelo o la estimación de
los parámetros por el método de máxima verosimilitud, el cual para la familia exponencial resulta ser una
versión iterativa de los mínimos cuadrados ponderados. Para los modelos de regresión lineal o de diseños
experimentales ordinarios con una variable de respuesta normal, esto se reduce a los mínimos cuadrados
estándares. Utilizando un enfoque que es análogo al análisis de varianza de datos de la teoría normal,
pueden hacerse inferencias y la verificación de diagnósticos para un modelo lineal generalizado. Referir
se a Myers y Montgomery [85b] para los detalles y ejemplos. Dos paquetes de software que soportan el
modelo lineal generalizado son SAS (PROC GENMOD) y SPLUS.
Ej"EMPLO 14-2 · · · · · · · · · · · · · · · · · · · · · • · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
El experimento de los defectos en las rejillas
En el problema 829 se introdujo un experimento para estudiar los efectos de nueve factores sobre los de
fectos en rejillas de planchas moldeadas de recuadros abiertos. Bisgaard y Fuller realizaron un interesan
te y útil análisis de estos datos para ilustrar el valor de la transformación de datos en un experimento
VlOti.riti.rii.riO<""IO\"<t"Vl"<t"Vl<""IO\
"<t" 00 "<t" "<t "<t "<t "<t 00 ,..... N ,..... <""l ,..... <""l ,..... N
o\oci,....;or;,....;.,;Q\oci,....;dNt.'.Nt.'.....;d
,...., ......
......
......... ........,.....,..,...,...,..,..,.....,.,......,.,,..,
~;;::gg~gg~~;;::~~;;::~~~~g;
v:$viN...¡.N...¡..¿.,;Nd<.i...¡..,.;...¡.Nd
;:;"g'~ ~~· ~~·@·~ &;[ \i:d' \i:d' ~ &;[
~ciS6e6~~918-r!8-d.,91 ...__....._.. ..._.,.._...
~~~8~8~~gg!;:~~~~gg!;:
vi«"i,....;.,.; ~.,.;vi.,.;,....; 'T,....;.,.; ,....;.,_;,....;9
.9"'
.g
596
141 RESPUESTAS Y TRANSFORMACIONES NO NORMALES 597
diseñado. Como se señaló en el inciso f del problema 829, los autores utilizaron una modificación de la
transformación de la raíz cuadrada que llevó al modelo
...::::=::::::::_
(.JY+.jy+l)/2= 2.5130.996x4 l.21x6 -0.772x2x7
donde, como de costumbre, las x representan los factores del diseno codificados. Esta transformación
hace un excelente trabajo para estabilizar la varianza del número de defectos. En las dos primeras seccio
nes de la tabla 141 se presenta parte de la información acerca de este modelo. Bajo el encabezado
"Transformados", la primera columna contiene la respuesta predicha. Observe que hay dos valores predi
chos negativos. El encabezado "No transformados" presenta los valores predichos no transformados, jun
to con los intervalos de confianza de 95% para la respuesta media en cada uno de los 16 puntos del diseño.
Puesto que hubo algunos valores predichos negativos, así como límites de confianza inferiores negativos,
no fue posible calcular los valores de todas las entradas de esta sección de la tabla.
La respuesta es en esencia una raíz cuadrada del conteo de los defectos. Un valor predicho negativo
es claramente ilógico. Observe que esto ocurre donde los conteos observados fueron pequeños. Si es im
portante usar el modelo para predecir el desempeño en esta región, el modelo puede ser no confiable.
Esto no deberá tomarse como una crítica del experimento original ni del análisis de Bisgaard y Fuller, Fue
un experimento de exploración en extremo exitoso que definió con toda claridad las variables importan
tes del proceso. La predicción no fue una de las metas originales, y tampoco fue el objetivo del análisis
realizado por Bisgaard y Fuller.
Sin embargo, si hubiera sido importante obtener un modelo de predicción, probablemente un modelo
lineal generalizado habría sido una buena alternativa para el enfoque de la transformación. Myers y
Montgomery usan un enlace log (logarítmico) (ecuación 147) y una respuesta de Poisson para ajustar
exactamente el mismo predictor lineal dado por Bísgaard y Fuller. Esto produce el modelo
La tercera sección de la tabla 141 contiene los valores predichos de este modelo y los intervalos de
confianza de 95% para la respuesta media en cada punto del diseño (obtenida con el procedimiento
PROC GENMOD de SAS). No hay valores predichos negativos (lo cual se asegura con la elección de la
función de enlace) ni límites de confianza inferiores negativos. En la última sección de la tabla se compa
ran las longitudes de los intervalos de confianza de 95% para la respuesta no transformada y el modelo li
neal generalizado (GLM). Observe que los intervalos de confianza del modelo lineal generalizado son
uniformemente más cortos que sus contrapartes de mínimos cuadrados. Esto es un sólido indicio de que
el enfoque del modelo lineal generalizado ha explicado la variabilidad y ha producido un modelo superior
en comparación con el enfoque de la transformación .
.........................................................................
EJEMPLO 14 .. 3 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
El experimento del hilado de estambre
En la tabla 142 se presenta un diseño factorial 33 que se realizó para investigar el desempeño de un hilado
de estambre bajo ciclos de carga repetida. El experimento se describe completo en Boxy Draper [16b]. La
respuesta es el número de ciclos hasta una falla. De manera típica, los datos de confiabilidad como éstos
son no negativos y continuos, y con frecuencia tienen una distribución con una cola derecha alargada.
Los datos se analizaron inicialmente utilizando el enfoque estándar (mínimos cuadrados), y la trans
formación de datos fue necesaria para estabilizar la varianza. Se encuentra que el logaritmo de los datos
598 CAPÍTULO 14 OTROS TÓPICOS DE DISEÑO Y ANÁLISIS
Tabla 142 ·El experimento del hilado de estambre

Logaritmo
Ciclos hasta de los ciclos
Corrida X¡ X2 X3 una falla hasta una falla
1 -1 -1 -1 674 2.83
2 -1 -1 o 370 2.57
3 -1 -1 1 292 2.47
4 1 o -1 338 253
5 -1 o o 266 2.42
6 -1 o 1 210 2.32
7 -1 1 -1 170 2.23
8 -1 1 o 118 2.07
9 -1 1 1 90 1.95
10 o -1 -1 1414 3.15
11 o -1 o 1198 3.08
12 o -1 1 634 2.8
13 o o -1 1022 3.01
14 o o o 620 2.79
15 o o 1 438 2.64
16 o 1 -1 442 2.65
17 o 1 o 332 2.52
18 o 1 1 220 2.34
19 1 -1 -1 3636 3.56
20 1 -1 o 3184 3.5
21 1 -1 1 2000 3.3
22 1 o -1 1568 3.19
23 1 o o 1070 3.03
24 1 o 1 566 2.75
25 1 1 -1 1140 3.06
26 1 1 o 884 2.95
27 1 1 1 360 2.56
de los ciclos hasta una falla produce un modelo adecuado en términos del ajuste global del modelo, así
como gráficas satisfactorias de los residuales. El modelo es
log j= 2.751+0.3617x1 0.2739x2 O.l7llx3
o en términos de la respuesta original, ciclos hasta una falla,

j)= 102.75l+0.3617;:,0.2739;r,0.171l:r,.
Este experimento se analizó también utilizando el modelo lineal generalizado, seleccionando la dis
tribución gamma para la respuesta y el enlace log (logarítmico). Se usó exactamente la misma forma del
modelo encontrada por el análisis de mínimos cuadrados de la respuesta con la transformación logarítmi
ca. El modelo que resultó es
y= e6.3489+0.8425:r,0.6313xz0.38.'ílx,.
En la tabla 143 se presentan los valores predichos del modelo de mínimos cuadrados y del modelo lineal
generalizado, junto con los intervalos de confianza de 9~% para la respuesta media de cada uno de los 27
,...
o
o "O
ü~
~
~8~
~~1~
013:.=t)
.a o :9
'6h "O -
i::
Mi
Q o cu
.3~"0 "'º"O¡s
e "'
.~s ~1
i 8 "'
~=cu~
]
l i: '73 "O 11')
.so 8 °'
]
o o
ü .. .d
~
º:6
~~
c..
~~~~~íl~~~~8~~~~~~~~~íl~~~S~G
NNNNNNNN~~~NNNNNNN~~~~~N~NN
599
puntos del diseño. La comparación de las longitudes de los intervalos de confianza revela que es posible
que el modelo lineal generalizado sea un mejor predictor que el modelo de mínimos cuadrados.
Los modelos lineales generalizados han encontrado amplia aplicación en la investigación y el desa
rrollo biomédico y farmacéutico. Conforme más paquetes de software incluyan esta capacidad, encontra
rá una aplicación más amplia en el ámbito de la investigación y el desarrollo industrial general.
142 DATOS NO BALANCEADOS EN UN DISEÑO FACTORIAL
El centro de atención principal de este libro ha sido el análisis de diseños factoriales balanceados, es de
cir, los casos en que en cada celda hay el mismo número n de observaciones. Sin embargo, es común en
contrar situaciones en las que el número de observaciones en las celdas son desiguales. Estos diseños
factoriales no balanceados ocurren por varias razones. Por ejemplo, el experimentador puede haber dise
ñado inicialmente un experimento balanceado, pero debido a problemas imprevistos cuando se corre el
experimento, los cuales resultan en la pérdida de algunas observaciones, termina trabajando con datos no
balanceados. Por otra parte, algunos experimentos no balanceados se diseñan expresamente de este
modo. Por ejemplo, ciertas combinaciones de tratamientos pueden ser más costosas o más difíciles de co
rrer que otras, por lo que pueden hacerse menos observaciones en esas celdas. De manera alternativa, al
gunas combinaciones de tratamientos pueden ser de mayor interés para el experimentador debido a que
representan condiciones nuevas o no exploradas, por lo que puede optar por obtener réplicas adicionales
de dichas celdas.
La propiedad de ortogonalidad de los efectos principales y las interacciones, presente en los datos ba
lanceados, no es válida en el caso no balanceado. Esto significa que las técnicas del análisis de varianza
usual no son aplicables. Por consiguiente, el análisis de factoriales no balanceados es mucho más difícil
que el de los diseños balanceados.
En esta sección se ofrece un breve panorama general de los métodos para abordar los factoriales no
balanceados, centrando la atención en el caso del modelo de efectos fijos con dos factores. Suponga que
el número de observaciones en la celda ijésima es nij. Además, sean; = 1:~=1 nii el número de observacio
nes en el renglóniésimo (el nivel iésimo del factorA), seanJ = I:;=1 nii el número de observaciones de la
columna jésima (el niveljésimo del factor B) y sean .. = 1:~=1 I:~=i nij el número total de observaciones.
142.1 Datos proporcionales: un caso sencillo

Una de las situaciones que incluye datos no balanceados presenta escasa dificultad para el análisis; se tra
ta del caso de los datos proporcionales. Es decir, el número de observaciones en la celda ijésima es
nn -J,
(1411)
l.
n--=--
11 n
Esta condición implica que el número de observaciones en dos renglones o columnas cualesquiera es pro
porcional. Cuando ocurren datos proporcionales, puede emplearse el análisis de varianza estándar. Sólo
142 DATOS NO BAIANCEAOOS EN UN DISEÑO FACTORIAL 601
es necesario hacer modificaciones menores en las fórmulas del cálculo manual de las sumas de cuadrados,
las cuales quedan como
SST= !±~
;~1 i'"l k.,I
2
Y;¡k2 -~
2
n
2
Yi. _L_
Como un ejemplo de datos proporcionales, considere el experimento del diseño de la batería del
ejemplo 51. En la tabla 144 se muestra una versión modificada de los datos originales. Desde luego, los
datos son proporcionales; por ejemplo, en la celda 1,1 se tienen
nln.1 10(8)
n11 ===4
n 20
observaciones. Los resultados que se obtienen al aplicar el análisis de varianza usual a estos datos se pre
sentan en la tabla 145. Tanto el tipo de material como la temperatura son significativos, lo cual concuerda
con el análisis del conjunto completo de datos del ejemplo 51. Sin embargo, la interacción que se observó
en el ejemplo 51 no está presente.
142.2 Métodos aproximados

Cuando los datos no balanceados no se apartan demasiado del caso balanceado, en ocasiones es posible
usar procedimientos aproximados que convierten el problema no balanceado en uno balanceado. Esto
Tabla 144 Experimento del diseño de la batería con datos proporcionales

Tipo de Tumperatura, ºF
material 15 70 125
nu =4 n12 = 4 n13 = 2 ni.= 10
130 155 34 40
1 74 180 80 75 70 58 Yi .. = 896
n21 = 2 n22 =2 n23 = 1 n2. = 5
2 159 126 136 115 45 Yi.. = 581
n31 =2 n32 = 2 n33 =1 n3. = 5
3 138 160 150 139 96 h.= 683
n.1=8 n.2 = 8 n.3 = 4 n .. = 20
Y.1. = 1122 Y.2. = 769 Y.3. = 269 Y. .. = 2160
602 CAPÍTIJLO 14 OTROS TÓPICOS DE DISENO Y ANÁLISIS
Tabla 145 Análisis de varianza de los datos del diseño de la batería

de la tabla 144
variación cuadrados libertad medio Fo
Tipos de material 8,170.400 2 4,085.20 5.00
Temperatura 16,090.875 2 8,045.44 9.85
Interacción 5,907.725 4 1,476.93 1.18
Error 8,981.000 11 816.45
Tutal 39,150.000 19
hace, desde luego, que el análisis sea tan sólo aproximado, pero el análisis de datos balanceados es tan
sencillo que con frecuencia el experimentador se ve tentado a usarlo. En la práctica, es necesario decidir
cuándo los datos no son lo suficientemente diferentes del caso balanceado para hacer que el grado de
aproximación introducido sea relativamente de escasa importancia. A continuación se describen breve
mente algunos de estos métodos aproximados. Se supone que todas las celdas contienen al menos una ob
servación (es decir, n;1 ~ 1 ).
Estimación de observaciones faltantes

Si sólo unas cuantas n;1 son diferentes, un procedimiento razonable es estimar los valores faltantes. Por
ejemplo, considere el diseño no balanceado de la tabla 146. Evidentemente, estimar el único valor faltan
te de la celda 2,2 es un enfoque razonable. Para un modelo con interacción, la estimación del valor faltan
te en la celda ijésima que minimiza la suma de cuadrados del error es Y;J· Es decir, el valor faltante se
estima tomando el promedio de las observaciones que están disponibles en esa celda.
El valor estimado se trata como un dato real. La única modificación del análisis de varianza es reducir
los grados de libertad del error en el número de observaciones faltantes que se han estimado. Por ejemplo,
si se estima el valor faltan te en la celda 2,2 de la tabla 146, se usarían 26 grados de libertad en lugar de 27.
Apartado de datos
Considere los datos de la tabla 14 7. Observe que la celda 2,2 sólo tiene una observación más que las otras.
Estimar los valores faltan tes de las ocho celdas restantes quizá no sea una buena idea en este caso, ya que
esto resultaría en estimaciones equivalentes a cerca de 18% de los datos finales. Una alternativa es apar
tar una de las observaciones de la celda 2,2, para obtener así un diseño balanceado con n = 4 réplicas.
La observación que se aparte deberá elegirse al azar. Además, en lugar de descartar completamente
la observación, podría reintegrarse al diseño, después elegir al azar otra observación para apartarla y re
Tabla 146 Los valores n,i para un

diseño no balanceado
Columnas
Renglones 1 2 3
1 4 4 4
2 4 3 4
3 4 4 4
142 DATOS NO BALANCEAOOS EN UN DISEÑO FACTORIAL 603
Tabla 147 Los valores TI¡¡ para un
diseño no balanceado
Columnas
Renglones 1 2 3
1 4 4 4
2 4 5 4
3 4 4 4
petir el análisis. Y, se esperaría, estos dos análisis no llevarán a interpretaciones antagónicas de los datos.
Si lo hacen, se sospecha que la observación que se apartó es un valor atípico o disparatado y deberá mane
jarse en consecuencia. En la práctica es improbable que ocurra esta confusión cuando sólo se aparta un
número reducido de observaciones y la variabilidad dentro de las celdas es pequeña.
Método de las medias no ponderadas
En este enfoque, introducido por Yates [113a], los promedios de las celdas se tratan como si fueran datos
y son objeto de un análisis de datos balanceados estándar para obtener las sumas de cuadrados de los ren
glones, las columnas y la interacción. El cuadrado medio del error se encuentra como
Entonces, MSE estima u2, la varianza de Y1Jk• una observación individual. Sin embargo, se ha realizado un
análisis de varianza de los promedios de las celdas, y como la varianza del promedio de la celda ijésima es
a2Jn;¡. el cuadrado medio del error que se usa en realidad en el análisis de varianza deberá ser una estima
ción de la varianza promedio de las Y;¡. por ejemplo
a b
"" ~"" u2 / n:9

_¿_¿
~ 2 • b
V(Ji;¡.)= M j=I =~ 1
ab ab i=i J=l n;¡
Utilizando MSE de la ecuación 1412 para estimar u2 en la ecuación 1413, se obtiene

MSE ~~
1 1
MSE =--L.i~ - (1414)
ab i=1 1~1 nlj
como el cuadrado medio del error (con n __ -ab grados de libertad) que se usará en el análisis de varianza.
El método de las medias no ponderadas es un procedimiento aproximado porque las sumas de cua
drados de los renglones, las columnas y la interacción no se distribuyen como una variable aleatoria
jicuadrada. La ventaja principal del método parece ser la simplicidad de los cálculos. Cuando las n;¡ no di
fieren de manera radical, el método de las medias no ponderadas funciona con frecuencia razonablemen
te bien.
Una técnica relacionada es el método de los cuadrados ponderados de las medias, propuesto tam
bién por Yates [113a]. Esta técnica se basa también en las sumas de cuadrados de las medias de las celdas,
pero los términos de las sumas de cuadrados se ponderan en proporción inversa a sus varianzas. Para ma
yores detalles de este procedimiento, ver Searle [99a] y Speed, así como Hocking y Hackney [106].
142.3 Método exacto
En situaciones en que los métodos aproximados no son apropiados, como cuando ocurren celdas vacías
(algunas nij = O) o cuando las n;1 presentan diferencias radicales, el experimentador debe usar un análisis
exacto. El enfoque utilizado para desarrollar las sumas de cuadrados para probar los efectos principales y
las interacciones consiste en representar el modelo del análisis de varianza como un modelo de regresión,
ajustar ese modelo a los datos y usar el enfoque de la prueba general de significación de la regresión. Sin
embargo, existen varias formas en que puede hacerse esto, y estos métodos pueden producir valores dife
rentes para las sumas de cuadrados. Además, las hipótesis que se están probando no siempre son análo
gos directos de las del caso balanceado, y su interpretación tampoco es siempre sencilla. Para mayor
información al respecto, ver el material suplementario del texto de este capítulo. Otras buenas referen
cias son Searle [99a]; Speed y Hocking [105]; Hocking y Speed [58]; Hocking, Hackney y Speed [57];
Speed, Hocking y Hackney [106]; Searle, Speed y Henderson [102]; Searle [99c]; y Milliken y Johnson
[79], El software de estadística SAS proporciona un excelente enfoque del análisis de datos no balancea
dos a través del procedimiento PROC GLM.
143 ANÁLISIS DE COVARIANZA
En los capítulos 2 y 4 se introdujo el uso del principio de la formación de bloques para mejorar la preci
sión con la que se hacen comparaciones entre tratamientos. La prueba t pareada fue el procedimiento
ilustrado en el capítulo 2, mientras que en el capítulo 4 se presentó el diseño de bloques aleatorizados. En
general, el principio de la formación de bloques puede usarse para eliminar el efecto de los factores per
turbadores controlables. El análisis de covarianza es otra técnica que en ocasiones es útil para mejorar la
precisión de un experimento. Suponga que en un experimento con una variable de respuesta y existe otra
variable, por ejemplox, y que y se relaciona linealmente conx. Además, suponga quex no puede ser con
trolada por el experimentador, pero puede observarse junto con y. A la variablex se le llama variable con
comitante o covariable. El análisis de covarianza implica ajustar la variable de respuesta observada para
el efecto de la variable concomitante. Si no se hace este ajuste, la variable concomitante podría inflar el
cuadrado medio del error y hacer que sean más difíciles de detectar las verdaderas diferencias en la res
puesta debidas a los tratamientos. Por lo tanto, el análisis de covarianza es un método de ajuste para los
efectos de una variable perturbadora no controlable. Como se verá, el procedimiento es una combinación
del análisis de varianza y del análisis de regresión.
Como un ejemplo de un experimento en el que puede emplearse el análisis de covarianza, considere
el estudio realizado para determinar si existe una diferencia en la resistencia de una fibra de monofila
Tabla 148 Datos de la resistencia a la ruptura (y = resistencia en libras

y x =diámetro en 103 pulgadas)
y X y X y X
36 20 40 22 35 21
41 25 48 28 37 23
39 24 39 22 42 26
42 25 45 30 34 21
~ 32 44 28 32 15
207 126 216 130 180 106
143 ANÁLISIS DECOVARIANZA 605
50
45
;...,
~
c.
::1
40
2
.!!!
"'"'
·¡;
e: 35
*.,
·¡¡¡
o:
30
o
10 20 30 40
Diámetro, .i
Figura 143 Resistencia a la ruptura (y) contra el diámetro

de la fibra (x).
mento producida por tres máquinas diferentes. Los datos de este experimento se muestran en la tabla
148. En la figura 143 se presenta un diagrama de dispersión de la resistencia (Y) contra el diámetro (o
grosor) de la muestra. Evidentemente, la resistencia de la fibra también se afecta por su grosor; por consi
guiente, una fibra más gruesa será por lo general más resistente que una delgada. El análisis de covarianza
podría usarse para eliminar el efecto del grosor (x) sobre la resistencia (Y) cuando se prueban las diferen
cias en la resistencia entre las máquinas.
14.. 3.1 Descripción del procedimiento

A continuación se describe el procedimiento básico para el análisis de covarianza, ilustrándolo para un
experimento de un solo factor con una covariable. Suponiendo que existe una relación lineal entre la res
puesta y la covariable, un modelo estadístico apropiado es
y'J. =µ+r+f3(x . -x
i 11 ••
)+t..
Y
{i.J:~l,2,
1, 2,
,a
,n
(1415)
donde yij es la observaciónjésima de la variable de respuesta tomada bajo el tratamiento o nivel iési
mo del único factor.z, es la medición hecha de la covariable o variable concomitante correspondiente a yij
(es decir, la corrida ijésima),x . es la media de los valores r.;« es la media global, t"; es el efecto del trata
miento résimo, f3 es el coeficiente de regresión lineal que indica la dependencia de Y;¡ dexij y E;¡ es un com
ponente del error aleatorio. Se supone que los errores E¡¡ son NID(O, ol), que la pendiente f3 -:t:. O y que la
verdadera relación entre Y¡¡ y X¡¡ es lineal, que los coeficientes de regresión de cada tratamiento son idénti
cos, que la suma de los efectos de los tratamientos es cero (1:7.1 T¡ =O) y que la variable concomitante x,
no se afecta por los tratamientos.
Observe, por la ecuación 1415, que el modelo del análisis de covarianza es una combinación de los
modelos lineales empleados en el análisis de varianza y regresión. Es decir, se tienen efectos de los tra
tamientos {r¡}, como en un análisis de varianza de un solo factor, y un coeficiente de regresiónji, como
en una ecuación de regresión. La variable concomitante de la ecuación 1415 se expresa cerno (x;¡-x..)
606 CAPhlJLO 14 OTROS TÓPICOS DE DISEÑO Y ANÁLISIS
en lugar dex¡¡, para que el parámetroµ se preserve como la media global. El modelo pudo haberse escri
to como
~:'.: 1, 2, .a (1416)
{J1, 2, ,n
dondeµ' es una constante diferente de la media global, que para este modelo esµ' + ffX. . Es más común
encontrar la ecuación 1415 en la literatura sobre el tema.
Para describir el análisis, se introduce la siguiente notación:
LL (Y¡¡:V :¿:¿ y:-L_an

a n a n 2
sw = . )2 = (1417)
iml j=l l=l j=l
(1418)
(1419)
(1420)
(1421)
(1422)
(1423)
E"'=!! i•l J=l

(x;¡ -x1• )2 = s; -T"' (1424)
u; = LL
• n
(x" -x 1• )(y"}';.)= s; -Txy (1425)

i=l ¡1
Observe que, en general, S = T +E, donde los símbolos S, Ty E se usan para denotar las sumas de cuadra
dos y los productos cruzados del total, los tratamientos y el error, respectivamente. Las sumas de cuadrados
dex yy deben ser no negativas; sin embargo, las sumas de los productos cruzados (xy) pueden ser negativas.
A continuación se indica la forma en que el análisis de covarianza ajusta la variable de respuesta para
el efecto de la covariable. Considere el modelo completo (ecuación 1415). Los estimadores de mínimos
cuadrados deµ, T1 y fJ son fe= .Y.. • í'1 = Y1. - :V. -'/3<.x1. -x . ~y
Exy
fJ= -
A
(1426)
s;
La suma de cuadrados del error en este modelo es
SSE =E»' -(Exy )2 / e; (1427)
con a(n - 1) 1 grados de libertad. La varianza del error experimental se estima con
MS - SSE
E - a(n1)1
143 ANÁLISIS DE COVARIANZA 607
Suponga ahora que no hay ningún efecto de los tratamientos. El modelo (ecuación 1415) sería entonces
(1428)
y puede demostrarse que los estimadores de mínimos cuadrados deµ y {3 son fa = Ji. y P = S,JSia. La suma
de cuadrados del error en este modelo reducido es
(1429)
con an - 2 grados de libertad. En la ecuación 1429, la cantidad (S"')2/S"" es la reducción de la suma de cua
drados de y obtenida a través de la regresión lineal de y sobre x. Además, observe que SSE es menor que
SS~ [ya que el modelo (ecuación 1415) contiene los parámetros adicionales { T1}] y que la cantidad SS~ -
SS E es una reducción en la suma de cuadrados debida a las { r.}. Por lo tanto, la diferencia entre SS~ y SS E•
es decir, SS~ -SSE, proporciona una suma de cuadrados cona1 grados de libertad para probarla hipó
tesis de que no hay ningún efecto de los tratamientos. Por consiguiente, para probar H0:r; = O, se calcula
F. = . _( s_s-=..~ _-_S_S=...;E )"--/-"""( a__1') (1430)

0
SSE / [a(n1)1]
que, si la hipótesis nula es verdadera, se distribuye como Fª _ 1, a(n _ l) l • Por lo tanto, H0:T¡ O se rechaza si =
F0 > Fez,ª_ 1, a(n _ 1¡ _ 1• También podría usarse el enfoque del valor P.
Es instructivo examinar la presentación de la tabla 149. En ella el análisis de covarianza se ha presen
tado como un análisis de varianza "ajustado". En la columna de la fuente de variación, la variabilidad to
tal se mide por S», con an - 1 grados de libertad. L3 fuente de variación "regresión" tiene la suma de
cuadrados (S.y)2/Sia con un grado de libertad. Si no hubiera ninguna variable concomitante, se tendría S"'
= = =
S"" = Exy E"" O. Entonces la suma de cuadrados del error sería simplemente Eyy y la suma de cuadra
=
dos de los tratamientos sería Syy-Eyy Tyy· Sin embargo, debido a la presencia de la variable concomitan
te, SYY y Eyy deben "ajustarse" para la regresión de y sobrex, como se muestra en la tf.bla 149. La suma de
cuadrados del error ajustada tiene a(n 1) 1 grados de libertad en lugar de a(n 1) grados de libertad T
debido a que se ajusta un parámetro adicional (la pendiente P) a los datos.
Los cálculos suelen presentarse en una tabla del análisis de covarianza como la tabla 1410. Se em
plea esta presentación porque resume de manera conveniente todas las sumas de cuadrados y los produc
tos cruzados requeridos, así como las sumas de cuadrados para probar las hipótesis acerca de los efectos
de los tratamientos. Además de utilizarla para probar la hipótesis de que no hay diferencias en los efectos
de los tratamientos, con frecuencia esta tabla se encuentra útil en la interpretación de los datos para pre
sentar las medias de los tratamientos ajustadas. Estas medias ajustadas se calculan de acuerdo con
Yi. ajustada = Y;. - '/3<..i;. - x. ) i=l,2, ...,a (1431)
donde 'jJ = E'>' / E.,,. Esta media de los tratamientos ajustada es el estimador de mínimos cuadrados de
µ + r¡, i= 1, 2, ... , a, en el modelo (ecuación 1415). El error estándar de cualquier media ajustada de los
tratamientos es
S- .
>'•.•Jllllad•
= [Ms
E
(!.+
n
(x,. x .
E
.)2 )]112 (1432)
J::r

o .....
1
:a ......
e
CI)
i;..¡"'

,......_ i;..¡ 1
...... o

I::!
~"'
1 "O
'!!!"
.fJ"'
<:s
11 1
1
8"'
_..,,
~ v:i"'
v:i"'
~
"' ~
<:s
"1 ~
1

et c:
:9
"' ~

CI)
g, 13 .....
...... .... :§
CI)
,.,
1 <:""l
o ~ "O .....
:a ,,
1
..... ...."'
CI)
1
1
I::!
1
<:s
*
CI)
i;..¡"' <:s
El v:i"'
"1 ......
"") 1
"'o. "Oo"'
*
o
"O 1 1 "' "'
o
...."' i;¡"'
<:s "O c'5
"O 11
"'
a"'
"") t:;.;
v:i"' ;:::!
~ :¿'
~~ "1~
?..

?..
~""
CI)
"O "Q
.g"'"'~ .....
,....;
1 .....
1
;:..., 1
~"'
"1
..._,""
1
V;J¡,_ i;..¡"'
"1
"
1 11
1 1
¿:;"'.o:.:: <:s
.._, .§ ~
i:: .o '<l
<:s
"'
·¡;;;
v:i"'
"1 t5"' "")
<".)
"'~u
:g
e ,....., e"' ;:..., h~
"' ~~
;:l
"'
o ~"' i;..¡"'
;:::!
§ "O
·¡;;
• u
.... e~
"'~ ]t

?. o
~l'i' tí 8 .g
·¡; J!l
o
CI) o ~ ¡....,""
"Q ....
~l'i' <".)
""
> 1 e,
~~ ~ "'
e:;:l "'
{j "'
o ~~ >.
........
., (IJ~
"O
:§ "'
~"'
1 ?.. h~ ¡..:¡~ "lq
'.;¡¡ ~
~ "1~
.._ "1~ ¡..:¡"" "O
~ 8 o
.,
ª
e:;:l ?. <,
1 V:J"' 1:::
CI)
l'i' ?.
s §.,
"O "1 V;Jl'i'
.._,

11 "O
o
<) :i
(IJ
1
"J"'
o.
.,>< "'
t:
CI)
~
"")~ ¡¡:¡ e:;:l ;:§
11 ......
~ ~ CI)
"Q 1 1 1
v:i"' I::! I::!
~ <:s
~"" "'o '5"
"1 <:s
u
., 1
"O ·¡"'; ~....
:!?!"' t5"' >
o
o
~ .,
u
¡;:¡"'
"O
"O
"'
o
~~
c: "'
o '.;¡¡ "'
t;
3
;:::!
q CI)
"O'º c: ~ ·¡;
~9
"'" 5·~
...... -
CI) ·
e:.)
"' ~ .... o
.....
c:
e .9"'
e::
"'
o
"E
...!!
="' ~
e o
t:
ta
.,t. ·o
·a
"'
¡9
CI)
~> CI)
·9
2·~"'

~ ~ F' llJ ..... ....
..!3
..ri ~ >
¡=:"'
o
t::
"«! "'
¡=:~
~
;:::!
~"O
<ll
llJ Fl
608
14.3 ANÁLISIS DE COVARlANZA 609
Por último, cabe recordar que se ha supuesto que el coeficiente de regresión f3 del modelo (ecuación
1415) es diferente de cero. La hipótesis H0:f3 = O puede probarse utilizando el estadístico de prueba
(E.>y)2 /E""
F.0 = (1433)
MS E
que bajo la hipótesis nula se distribuye como F1• a(~_ 1¡ _ 1• Por lo tanto, H0:/3 = O se rechaza si F0 > Fa, 1,
a(n - 1) 1·
'E}"EMPW14 . . 4 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·
Considere el experimento descrito al principio de la sección 143. 'Ires máquinas producen una fibra de
monofilamento en una fábrica textil. El ingeniero del proceso tiene interés en determinar si existe alguna
diferencia en la resistencia a la ruptura de la fibra producida por las tres máquinas. Sin embargo, la resis
tencia de una fibra se relaciona con su diámetro, con las fibras más gruesas, siendo éstas, en general, más
resistentes que las más delgadas. Se selecciona una muestra aleatoria de cinco ejemplares de prueba de fi
bra de cada máquina. En la tabla 148 se muestra la resistencia de la fibra (Y) y el diámetro correspondien
te (x) de cada ejemplar.
El diagrama de dispersión de la resistencia a la ruptura contra el diámetro de la fibra (figura 143) in
dica una clara tendencia a una relación lineal entre la resistencia a la ruptura y el diámetro, y parece apro
piado eliminar el efecto del diámetro sobre la resistencia mediante un análisis de covarianza. Suponiendo
que la relación lineal entre la resistencia a la ruptura y el diámetro es apropiada, el modelo es
i = 1, 2, 3
Y--=
1)
µ+r. +/3(x . 1 lJ
-x ..
)+E g { i= 1, 2, ... , 5
Utilizando las ecuaciones 1417 a 1425, pueden calcularse
syy =LL y:-L=

3 5 2 (603)2
(36)2 +(41)2 + ... +(32)2 = 346.40
;~1 J;J an (3)(5)
S,,. = LL x: - -·
J
;;1 ¡;1
s x2
an
(362)2
= (20)2 +(25)2 + ... +(15)2
( 3)( 5)
= 261.73
sxy = ~}": X;¡Y;¡ - (x .. )(Y .. )= (20)(36)+(25)(41)+ ... +(15)(32)

/;1 ¡;1 an
( 362 )( 603) = 282 60
(3)(5)
T
YY
= .!_n ±
1;1
y~_ y_2
'· an
= ![(207)2 +(216)2 +(180)2 ] (603)2 = 140.40
5 (3)(5)
1 ~ x. ~ 1 (362)2
= "i"i tt_ = = 66.13
2 2 2 2.
Trx X1_ - an 5[(126) +(130) +(106) ] (3)(5)
TlY = ~ ~ x;.Y;. - (x.. ~~Y..) ~[(126)(207)+(130)(216)+(106)(184)]

1;1 .
(362)(603)
96.00
(3)(5)
E»'= S»' -T»' = 346.40140.40= 206.00

E""= S,.. -T,,, = 261.7366.13= 195.60
E">'= S">' -T">' = 2826096.00= 186.60
Por la ecuación 1429 se encuentra
SS~ = S »' - ( S ">' ) S

2
/ xx
= 346.40(186.60) /261.73 2
= 41.27
con an - 2 = (3)(5) 2 = 13 grados de libertad; y por la ecuación 1427 se encuentra
SSE = Eyy -(E"Y )2 / ti;
= 206.00(186.60) 2/ 195.60
= 27.99
con a(n - 1) 1 = 3(5 1) 1 = 11 grados de libertad.
La suma de cuadrados para probar H0:r1 = r2 = r3 = O es
SS~ -SSE = 41.2727.99
=1128
con a - 1 = 3 1 = 2 grados de libertad. Estos cálculos se resumen en la tabla 1411.

Para probar la hipótesis de que las máquinas difieren en la resistencia a la ruptura de la fibra produci
da, es decir, H0:r¡ = O, por la ecuación 1430 el estadístico de la prueba se calcula como
F = (SS~-SSE)/(a-l)
0
SS E / [a(n - 1 ) 1]
1128/2 6.64
= 27.99/11 = 2.54 = 261
Al comparar este valor con Fo.to, 2. 11 = 2.86,se encuentra que no puede rechazarse la hipótesis nula. El va
lor P de este estadístico de la prueba es P = 0.1181.Por lo tanto, no hay evidencia sólida de que las fibras
producidas por las tres máquinas difieran en fa. resistencia a la ruptura.
La estimación del coeficiente de regresión se calcula con la ecuación 1426 como
p = E">' = 186.60= 0.9540

E,,, 195.60
La hipótesis H0:{J = O puede probarse usando la ecuación 1433. El estadístico de prueba es
F = (E">')2 I Exz = (186.60) 2 /195.60 =

70.08
o MSE 254
y puesto que F0.01, 1, 11 = 9.65, se rechaza la hipótesis de que f3 = O. Por lo tanto, existe una relación lineal
entre la resistencia a la ruptura y el diámetro, y el ajuste proporcionado por el análisis de covarianza fue
necesario.
~ ......
..... 00
o ......
......
~ o
......
~ \O
C'i
o
"O o
""· .... "O
'<t
;i
= 8""s
V)
"O <U
e C'i ~
"SI)
~
lS 
'e"' ...oc.
= .....
·~<lJ "'
o
... "O
8•\O::E N::E
...:':! l3"" ~
o
<lJ
"'
;:l
u
~~~
B"' 
o ~~o NN'<t
............
¿;"'.,:.:::=
u "O
<lJ
o
.. "'~
";¡;
"'"'
<=
"O
5

......
..;.
......
...!:!
"O
o
3·~
~; ·s=~
~>
Q
e
003
"'
·§"' '4
"';:l
~
O"
'"'Ji ¡Q ~""
..Q
~ ::E
611
Las medias de los tratamientos ajustadas pueden calcularse con la ecuación 1431. Estas medias ajus
tadas son
y1 ajustada = y1 - P(x x. ) 1
= 41.40(0.9540)(25.20 24.13) = 40.38
Yz.ajustada = .Y2. - P(x2. -x . )

= 43.20(0.9540)(26.0024.13) = 41.42
y
y3_ ajustada= y3_ -ft<_x3. - x)
= 36.00(0.9540)(21.20 24.13) = 38.80
Al comparar las medias ajustadas con las medias no ajustadas de los tratamientos (las y¡_), se observa que
las medias ajustadas se encuentran mucho más próximas entre sí, una indicación más de que el análisis de
covarianza fue necesario.
Un supuesto básico en el análisis de covarianza es que los tratamientos no influyen en la covariablex,
ya que la técnica elimina el efecto de las variaciones en lasi;.· Sin embargo, si la variabilidad en las z¿ se
debe en parte a los tratamientos, entonces el análisis de covarianza elimina parte del efecto de los trata
mientos. Por lo tanto, deberá tenerse una seguridad razonable de que los tratamientos no afectan los va
lores x; En algunos experimentos esto puede ser obvio a partir de la naturaleza de la covariable, mientras
que en otros puede ser más dudoso. En el ejemplo tratado aquí puede haber una diferencia en el diámetro
de la fibra (x;i) entre las tres máquinas. En tales casos, Cochran y Cox [26] sugieren la posible utilidad de
un análisis de varianza de los valores r, para determinar la validez de este supuesto. Para el problema tra
tado aquí, con este procedimiento se obtiene
F. = 66.13/ 2 = 33.07 = 2.03
o 195.60/12 16.30
que es menor queF0.10,i,12 = 2.81, por lo que no hay razón para creer que las máquinas producen fibras con
diámetros diferentes .
.........................................................................
La verificación del diagnóstico del modelo de covarianza se basa en el análisis residual. Para el mode
lo de covarianza, los residuales son
donde los valores ajustados son

yij = ,U+f; +P(x¡¡ -x . )=y_ +[.Y;_ -.Y . -P(x;. -x . )]
+/3A(x. -x )=y. +PA(x.9 .X)
I} •• l. l.
Por lo tanto,
e 1J. = y.v - y'· - ft(x f.}
- x )
'-
(1434)
Para ilustrar el uso de la ecuación 1434, el residual de la primera observación de la primera máquina
del ejemplo 144 es
e11 = Yu Y;. - fJ(x11 - i'.1) = 3641.4(0.9540)(20 25.2)
= 36 36.4392 = 0.4392
143 ANÁLISIS DE COVARIANZA 613
En la tabla siguiente se presenta una lista completa de las observaciones, los valores ajustados y los
residuales:
Valor observado J;¡ Valor ajustado Y;¡ Residual e;¡ = J;¡ - J;¡
36 36.4392 0.4392
41 41.2092 0.2092
39 40.2552 1.2552
42 41.2092 0.7908
49 47.8871 1.1129
40 39.3840 0.6160
48 45.1079 2.8921
39 39.3840 0.3840
45 47.0159 2.0159
44 45.1079 1.1079
35 35.8092 0.8092
37 37.7171 0.7171
42 40.5791 1.4209
34 35.8092 1.8092
32 30.0852 1.9148
Los residuales se grafican contra los valores ajustados Y;¡ en la figura 144, contra la covariable z, en la fi
gura 145 y contra las máquinas en la figura 146. En la figura 147 se muestra la gráfica de probabilidad
normal de los residuales. Estas gráficas no revelan ninguna desviación importante de los supuestos, por lo
que se concluye que el modelo de covarianza (ecuación 1415) es apropiado para los datos de la resisten
cia a la ruptura.
Es interesante observar lo que habría ocurrido en este experimento si no se hubiera realizado el aná
lisis de covarianza, es decir, si los datos de la resistencia a la ruptura (Y) se hubieran analizado como un ex
perimento de un solo factor en el que se ignoraralacovariablex. Enla tabla 1412 se muestra el análisis de
varianza de los datos de la resistencia a la ruptura. Se concluiría, con base en este análisis, que las máqui
nas difieren significativamente en la resistencia de la fibra producida. Es exactamente la conclusión
+4
•
+2
• • •
• •
••
• •• • •
2 • •
-4'--~~_.___~~ ........ ~~---~~~~~~
25 30 35 40 45 50
Y¡¡
Figura 144 Gráfica de los residuales contra los valores ajus
tados del ejemplo 144.
•
2
• •
•• •
.:;::.
o
....•• •
-2 • •
-4L-~~-'--~~--'-~~~..._~~ .......~~--'
o 10 20 30 40 50
Figura 145 Gráfica de los residuales contra el diámetro x de

la fibra en el ejemplo 144.
opuesta del análisis de covarianza. Si se sospechara que las máquinas difieren significativamente en su
efecto sobre la resistencia de la fibra, entonces se intentaría igualar la resistencia producida por las tres
máquinas. Sin embargo, en este problema las máquinas no difieren en la resistencia de la fibra producida
después de que se elimina el efecto lineal del diámetro. Sería conveniente reducir la variabilidad del diá
metro de la fibra dentro de las máquinas, ya que con esto probablemente se reduciría la variabilidad de la
resistencia de la fibra.
143.2 Solución por computadora

Se cuenta con varios paquetes de software que pueden realizar el análisis de covarianza. En la tabla 1413
se muestra la salida del procedimiento General Linear Models (modelos lineales generales) de Minitab
•
2
•
•• •
.,~ o •
• •• ••
••
2
• •
4
o 2 3
Máquina
Figura 146 Gráfica de los residuales contra las

máquinas.
143 ANÁLISISDECOVARIANZA 615
99
96
90
:=
·O
80
"
;¡; 70
E 60
oe 50
"C
"'
:g 40
j 30
20
~
10
6
4 -2 o 2 4
Residuales. e¡¡
Figura 14.7 Gráfica de probabilidad normal de los residuales del ejemplo 144.
para los datos del ejemplo 14·4. Esta salida es muy similar a las que se presentaron anteriormente. En la
sección de la salida bajo el encabezado "Análisis de varianza" ("Analysis ofvariance"), "SS Seq" corres
ponde a la partición "secuencial" de la suma de cuadrados del modelo global, es decir,
SS (Modelo)= SS (Diámetro)+ SS(Máquina 1 Diámetro)
= 305.13+ 1128
= 318.41
mientras que "SS ajustada" corresponde a la suma de cuadrados "extra" para cada factor, es decir,
SS(MáquinalDiámetro)= 13.28
y
SS(Diámetro [Máquinaj= 178.01
Observe que SS(Máquina 1 Diámetro) es la suma de cuadrados que deberá usarse para probar que no hay
ningún efecto de la máquina, y que SS(Diámetro 1 Máquina) es la suma de cuadrados corregida que debe
rá usarse para probar la hipótesis de que {J = O. Los estadísticos de la prueba de la tabla 1413 difieren li
geramente de los que se calcularon manualmente debido al redondeo.
Tabla 1412 Análisis incorrecto de los datos de la resistencia a la ruptura como un experimento de un solo factor
Fuente de Gradosde
variación Sumade cuadrados libertad Cuadradomedio F0 ValorP
Máquinas 140.40 2 70.20 4.09 0.0442
Error 206.00 12 17.17
lbtal 346.40 14
Tabla 1413 Salida de Minitab (análisis de covarianza) del ejemplo 144

Modelo lineal general

Machi ne fixed 3 1 2 3
Analysis of Variance for Strength, using Adjusted SS for Tests
Diameter 1 305.13 178. 01 178.01 69.97 0.000
Machi ne 2 13.28 13.28 6.64 2.61 o. 118
Error 11 27.99 27.99 2.54
Total 14 346.40
Term Coef StDev T p
Constant 17 .177 2.783 6 .17 0.000
Diameter 0.9540 0.1140 8.36 0.000
Machi ne
1 0.1824 0.5950 0.31 0.765
2 1.2192 0.6201 1. 97 0.075
Mea ns for Covariates

Covariate Mean StDev
Diameter 24 .13 4.324
Least Squares Means for Strength
Machi ne Mean StDev
1 40.38 0.7236
2 41. 42 0.7444
3 38.80 0.7879
El programa calcula también las medias de los tratamientos ajustadas con la ecuación 1431 (Minitab
hace referencia a éstas como las medias de mínimos cuadrados en la salida muestral) y los errores están
dar. El programa comparará asimismo todos los pares de medias de tratamientos utilizando los procedi
mientos de comparación múltiple por pares estudiados en el capítulo 3.
14.. 3,3 Desarrollo mediante la prueba general de significación de la regresión

Es posible desarrollar formalmente el procedimiento para probar H0:r:; = O en el modelo de covarianza
y v. =µ+r+f3(x-x )+e. {i.:ll,2,2, ,a
,n (1435)
1 9 .. 'J
1_ ,
utilizando la prueba general de significación de la regresión. Considere la estimación de los parámetros
del modelo (ecuación 1415) por mínimos cuadrados. La función de mínimos cuadrados es
L= }:!
;~1 j~l
[yij - µ-r:i -fi(xij -x_ )]2 (1436)
143 ANÁLISIS DE COY ARIANZA 617
y a partir de aLtaµ = aL/itr; = aL/a{J = O, se obtienen las ecuaciones normales
µ:an,U+n! f¡ =Y. (1437a)
r;:n,U+nf; +,8 !
j~l
(x;¡ -x . )= yj i=l,2, ...,a (1437b)
{J:~)i! (xij-x . )+PSxx =S ; (1437c)

j:sl j~l
Al sumar las a ecuaciones de la ecuación 1437b, se obtiene la ecuación 1437a porque I:~i Ij~1 (x;j -
x..) = O, por lo que existe una dependencia lineal en las ecuaciones normales. Por lo tanto, es necesario au
mentar las ecuaciones 1437 con una ecuación linealmente independiente para obtener una solución.
Una condición lógica es :I::;
1 f; ==O.
Al utilizar esta condición, de la ecuación 1437a se obtiene

{l,='J. (1438a)
y de la ecuación 1437b
f; =Y;. - Y. - .B(:xi - x. ) (1438b)
La ecuación 1437c puede reescribirse como
a n a n
~(-y.•.
,L., y)~
.. LJ (x IJ.. -x •• )-ª~JJ ~ (x -x )~
,,L., l. ..
(x 'l. -x ..
)+ªS
p .a
=S .zy
;~1 j;;;;;;l ;~1 j~l
después de sustituir para f;. Pero se observa que

4 "
}: O\. Ji.. )}: (x;;-x .. )=T.ty

i;l j~l
!;~1
(x1_ -x . )!j;l
(x;¡ -x _ )= T""
Por lo tanto, la solución de la ecuación 1437c es

~ s; -T.ty e;
{3=~~
SJIX-TXX EJQC
que fue el resultado dado anteriormente en la sección 143.1 en la ecuación 1426.
La reducción en la suma de cuadrados total debida al ajuste del modelo (ecuación 1415) puede ex
presarse como
L +,Bsxy
4
R(µ, s, P)= µy__+ f¡y¡_
•
= CY.. )Y. + L [Y;_ Y. -ts; I e; )(x;. -x . )]Y;. +(Exy I e; )S.rr
1-1
• •
= l / an+ L (Y Ji.. )Y;. (E")'/ E:a)L (x; -x . )Y;. +(E.rr / E:a)S.iy
1.
i:::;l ;~1
=Y.~ l an+Tc¿ -(E")' I E"")(T"Y -S"Y)

=Y.~/ an+Tw +(Exy )2 I En:
Esta suma de cuadrados tiene a + 1 grados de libertad porque el rango de las ecuaciones normales es
a + l. La suma de cuadrados del error de este modelo es
LL y:-R(µ, /3)
a n
SSE = T,
= L ,L y: - y an - T
a n
2
2 / YY - (Exy ) / Exx
i=l j=l
= Syy-Tyy-(Exy)2 /E,,,
(1439)
= EYY (Exy)2 I e;
con an - (a + 1) = a(n - 1) 1 grados de libertad. Esta cantidad se obtuvo anteriormente como la ecua
ción 1427.
Considere ahora el modelo restringido a la hipótesis nula, es decir, a H0:r1 = T2 = ... = Ta = O. Este
modelo reducido es
= µ+f3(x-'J -.X .. )+e .. i.:_ 1,2, ,a

Yq.. Q {1- l, 2, ,n
(1440)
Se trata de un modelo de regresión lineal simple, y las ecuaciones normales de mínimos cuadrados para
este modelo son ·
anü= Y.. (1441a)
(144lb)
Las soluciones de estas ecuaciones sotx]: =y yp = SJSxx; y la reducción en la suma de cuadrados total
debida al ajuste del modeló reducido es
R(µ, /3) = fi,y_ + ps xy
=(y _ )Y. +( S xy ! S"" )S xy
= y_2 / an+(Sxy )2 / S,,, (1442)
Esta suma de cuadrados tiene dos grados de libertad.

La suma de cuadrados apropiada para probar H0:T 1 = Tz = ... = Tª = O puede encontrarse como
R( TIµ, /3) = R(µ, T, /3) R(µ, /3)
= l / an + T 2 2
YY + (E xy ) / E"' - y_~ / an - ( S xy ) / S X<
= syy (Sxy)2 / s; -[Eyy (Exy) 2 / E,n:] (1443)
utilizando TYY = Syy-Eyy. Observe queR(T lµ,/3) tiene a+ 12 =a - l grados de libertad y que es idéntica
a la suma de cuadrados dada por SSJ::SSEenlasección 143.1. Por lo tanto, el estadístico de prueba para
H0:T; =O es
F. = R( tj µ, /3) / (a - 1) = _ :_( s_s;;;;_~_ss_o;.E"'/-'(_a
) 1')
(1444)
o SSe /[a(n1)1] SSE /[a(n1)1]
expresión que se dio anteriormente como la ecuación 1430. Por lo tanto, utilizando la prueba general de
significación de la regresión, se ha justificado el desarrollo heurístico del análisis de covarianza de la sec
ción 143.1.
143 ANÁLISIS DE COVARJANZA 619
14-3.4 Experimentos factoriales con covariables
El análisis de covarianza puede aplicarse a estructuras de tratamientos más complejas, como los diseños
factoriales. Siempre que existan datos suficientes para cada combinación de tratamientos, prácticamente
cualquier estructura de tratamientos compleja puede analizarse mediante el enfoque del análisis de cova
rianza. A continuación se indica cómo podría usarse el análisis de covarianza en la familia más común de
diseños factoriales utilizados en la experimentación industrial, los factoriales 2k.
Al establecer el supuesto de que la covariable afecta a la variable de respuesta de manera idéntica
para todas las combinaciones de tratamientos, podría construirse una tabla del análisis de covarianza si
milar al procedimiento dado en la sección 143.1. La única diferencia sería la suma de cuadrados de los
tratamientos. Para un factorial 22 con n réplicas, la suma de cuadrados de los tratamientos (TY.Y) sería (1/n)
~ ;~1 ~ ~~1 y~ - y= /(2)(2)n. Esta cantidad es la suma de las sumas de cuadrados de los factores A, By la in
teracciónAB. Entonces podría hacerse la partición de la suma de cuadrados ajustada de los tratamientos
en componentes de los efectos individuales, es decir, la suma de cuadrados de los efectos principales ajus
tados SSA y SS8, y una suma de cuadrados de la interacción, SSAB.
El número de réplicas es un aspecto clave cuando se amplía la estructura de los tratamientos del dise
ño. Considere un arreglo factorial 23• Se necesita un mínimo de dos réplicas para evaluar todas las combi
naciones de tratamientos con una covariable separada para cada combinación de tratamientos. (una
covariable por interacción de tratamientos). Esto es equivalente a ajustar un modelo de regresión simple
a cada combinación de tratamientos o celda del diseño. Con dos observaciones por celda, un grado de li
bertad se usa para estimar la ordenada al origen (el efecto del tratamiento), y el otro se usa para estimar la
pendiente (el efecto de la covariable ). Con este modelo saturado, no se cuenta con ningún grado de liber
tad para estimar el error. Por lo tanto, se necesitan al menos tres réplicas para un análisis de covarianza
completo, suponiendo el caso más general. Este problema se agudiza cuando se incrementa el número de
celdas distintas del diseño (combinaciones de tratamientos) y las covariables.
Si el número de réplicas está limitado, pueden hacerse varios supuestos para permitir un análisis útil.
El supuesto más simple (y típicamente el peor) que puede hacerse es que la covariable no tiene ningún
efecto. Si la covariable, incorrectamente, deja de tomarse en consideración, el análisis completo y las con
clusiones subsecuentes podrían tener graves errores. Otra elección es suponer que no hay ningún trata
miento por interacción de la covariable. Aun cuando este supuesto sea incorrecto, el efecto promedio de
la covariable en todos los tratamientos seguirá incrementando la precisión de la estimación y la prueba de
los efectos de los tratamientos. Una desventaja de este supuesto es que si varios niveles de los tratamien
tos interactúan con la covariable, los diferentes términos pueden cancelarse entre sí y el término de la co
variable, si se estima solo sin ninguna interacción, puede resultar no significativo. Una tercera elección
sería suponer que algunos de los factores (como algunas interacciones de dos factores y de órdenes supe
riores) no son significativos. Esto permite usar parte de los grados de libertad para estimar el error. Sin
embargo, este curso de acción deberá emprenderse con cuidado, y los modelos subsecuentes deberán
evaluarse a profundidad, ya que la estimación del error será relativamente imprecisa a menos que se le
asignen suficientes grados de libertad. Con dos réplicas, cada uno de estos supuestos liberará algunos gra
dos de libertad para estimar el error y permitirá realizar pruebas de hipótesis útiles. El supuesto que se es
tablecerá deberá ser dictado por la situación experimental y por el riesgo que el experimentador esté
dispuesto a correr. Cabe hacer notar que en la estrategia de construcción del modelo de los efectos, si se
elimina el factor de uno de los tratamientos, entonces las dos "réplicas" resultantes de cada factorial 23
original no son en realidad réplicas. Estas "réplicas ocultas" liberan grados de libertad para la estimación
de parámetros, pero no deberán usarse como réplicas para estimar el error puro porque la ejecución del
diseño original quizá no se haya aleatorizado para ello.
Tabla 1414 Datos de la respuesta y la covariahle para un diseño Z3 con

2 réplicas
A B e X y
-1 1 1 4.05 30.73
1 1 1 0.36 9.07
1 1 1 5.03 39.72
1 1 1 1.96 16.30
1 1 1 5.38 26.39
1 1 1 8.63 54.58
1 1 1 4.10 44.54
1 1 1 11.44 66.20
1 1 1 3.58 26.46
1 1 1 1.06 10.94
1 1 1 1.5.53 103.01
1 1 1 2.92 20.44
1 1 1 2.48 8.94
1 1 1 13.64 73.72
1 1 1 0.67 15.89
1 1 1 5.13 38.57
Para ilustrar algunas de estas ideas, considere el diseño factorial 23 con dos réplicas y una covariable
que se muestra en la tabla 1414. Si la variable de respuesta y se analiza sin tomar en cuenta la covariable,
resulta el siguiente modelo: ·
y== 25.03+11.20A+18.05B+7.24C18.91AB+ l4.80AC
El modelo global es significativo en el nivel de a = 0.01 con R2 = O. 786 y MSE = 470.82. El análisis residual
no indica problemas con este modeJo, excepto porque la observación con y = 103.01 es inusual.
Si se elige el segundo supuesto, que las pendientes son comunes con ningún tratamiento por interac
ción de la covariable, pueden estimarse el modelo de los efectos completo y el efecto de la covariable. La
salida de Minitab (de la rutina General LinearModels) se muestra enla tabla 1415. Observe queMSE se
ha reducido considerablemente al tomar en consideración la covariable. El análisis final resultante des
pués de eliminar de manera secuencial cada interacción no significativa y el efecto principal C se muestra
en la tabla 1416. Este modelo reducido proporciona unMSE todavía menor que el modelo completo con
la covariable de la tabla 1415.
Por último, podría considerarse un tercer curso de acción, suponiendo que ciertos términos de in
teracción son insignificantes. Se considera el modelo completo que permite pendientes diferentes entre
los tratamientos y la interacción tratamiento por covariable. Se supone que no son significativas las in
teracciones de tres factores (tantoABC comoABCx) y se usan los grados de libertad asociados con ellas
para estimar el error en el modelo de los efectos más general que pueda ajustarse. Éste es con frecuencia
un supuesto práctico. Las interacciones de tres factores son por lo general insignificantes en la mayoría de
los ambientes experimentales. La versión actual de Minitab no puede modelar covariables que interac
túan con los tratamientos, por lo que se usa PROC GLM de SAS. Las sumas de cuadrados tipo III son las
sumas de cuadrados ajustadas que se necesitan. En la tabla 1417 se presentan los resultados de SAS para
este modelo.
Con un modelo casi saturado, la estimación del error será bastante imprecisa. Incluso cuando unos
cuantos términos son individualmente significativos en el nivel a = 0.05, el sentido general es que este
modelo es mejor que los dos escenarios previos (basados en R2 y el cuadrado medio del error). Debido a
que el aspecto de los efectos de los tratamientos del modelo es de mayor interés, se eliminan de manera
secuencial términos de la porción de la covariable del modelo a fin de agregar grados de libertad para esti
143 ANÁLISISDECOVARIANZA 621
Tabla 1415 Análisis de covarianza de Minitab para el experimento de la tabla 1414, suponiendo una
pendiente común

A
B
fixed
fixed
2 -1
2 -1
1
,
e fixed 2 -1 1
Analysis of Variance for y, using Adjusted SS for Tests

X 1 12155.9 2521.6 2521.6 28 .10 0.001
A 1 1320.7 1403.8 1403.8 15.64 0.005
B 1 3997.6 4066.2 4066.2 45.31 0.000
e 1 52.7 82.3 82.3 0.92 0.370
A*B 1 3788.3 3641.0 3641.0 40.58 0.000
A*C 1 10.2 1 .1 1.1 0.01 0.913
B*C 1 5.2 8.4 8.4 0.09 0.769
A*B*C 1 33.2 33.2 33.2 0.37 0.562
Error 7 628.1 628.1 89.7
Total 15 21992.0
Term Coef StDev T p
Constant -1.016 5.454 -0.19 0.858
X 4.9245 0.9290 5.30 0.001
mar el error. Si se elimina secuencialmente el términoACx seguido de BCx, el MSE decrece a O. 7336 y va
rios términos no son significativos. En la tabla 1418 se muestra el modelo final después de eliminar
secuencialmente Cx, AC y BC.
Este ejemplo destaca la necesidad de contar con grados de libertad para estimar el error experimen
tal a fin de incrementar la precisión de las pruebas de hipótesis asociadas con los términos individuales
del modelo. Este proceso deberá hacerse de manera secuencial para evitar la eliminación de términos sig
nificativos enmascarados por una estimación pobre del error.
Tabla 1416 Análisis de covariarua de Minitab, modelo reducido para el experimento de la tabla 1414

A fixed 2 1 1
B fixed 2 1 1
Analysis of Variance for y, using Adjusted SS for Tests

X 1 12155.9 8287.9 8287.9 119.43 0.000
A 1 1320. 7 1404.7 1404.7 20.24 0.001
B 1 3997.6 4097.7 4097.7 59.05 0.000
A*B 1 3754.5 3754.5 3754.5 54 .1 o 0.000
Error 11 763.3 763.3 69.4
Total 15 21992.0
Term Coef StDev T p

Constant -1.878 3.225 -0.58 o. 572
X 5.0876 0.4655 10.93 0.000
e: 11'\ u..Oroo.O..:tl""IOl""ICIO.oO
IO 0 ONrl"').Qf'0..:tO..:tN,.._
Cll 00 11 oo,.,,.._o,.,Nl""l.00,... • ..,,.
EN N0000.-0000,.._00-CIO
o L • • • • • • • • • • 111 1 "
> • a..0000000000000
11"1
N
.
QI 11'\ a¡N.,.._ONN4'00.0U'IOll'\
::::1..:t ::::11""1...,0.NOl"')..l"')Of"'IOO
_, ~ ••••• 11 111 ••• 1 ••
"''°N
>0
nil""IO..:tNOOU'l..:tCIOCOOO
> N.. l""IN0 ..:t
N
........... ......
e QI '° ,.., 11..:tO..:tll'IN..:trCIOO..:tO,.._'O
"'
QI ni,.._
r.. 11'\ o
N
r.. O. . O. ,., ,.._ f' CIO CIO O CIO ,.._ O 00
n10,.,0.'0..:t"4'NN8,.._'00.1""1
E ::::1 r o
.
::::10.U'l,.._1""11'.,.._.8,.._l"')NON
C'4' "4'
Cf) .
..........
trO. N CIO . ,.._ l""I -8 N ..:t CIO l""I N ,.._
en 11'\ 11"10 O N 41'0
ooo.0"4'NO,.._.o.oo
,.._ N ,.._O -O
e e • • • • • •••
'°
'<'"
ni.,,.,.,
Cll
11\
... ,.,....
o o°',.,
..,,.rt'IO.
11'\ o'°rt'l 00
lE rt'l
'tCllCI00..,,. •O Cf>°'4'0."4'11"1N"4',.._CIOO..,,.O,.._'O
cQINO,., >N en O . O. l""I ,.._ ,.._ CIO CIO O 00 ,.._ O. CIO
' CIO..,,. N • 00 '0...,0.0..:t4NN..,,.,.._'00.,.,
enioo..
:i ::::INCIOO
uo ,.,,.._ ""°'"',.._,.,,.._,._.,..,,.,.._,.,NON
""'0NCIO.,.._rt'l..,,.N8CIOl"')N,.._
en C' • • • ""'11\11'\00N..:t,.._0,.._N,.._0'0
Cf>ONN 000..0..,,.No.,.._.ooo
CIO °' cu • • • 1111 • • IJ • • • • • •
e o o
.... °'
. C.4' rt'l 11"11'
)...
1
.... ,..,....
o°',., 11"1 o'°
4'1'1"10. ,.,
,.,
Q
N N
11
'
.Q
.....
....r.."' ....ni
e
> "' 1
.... .,,
e
.,,e
GI ....
GI
GI u GI
u_, r.. GI u
11 r.. 11 e r.. r..
c. ::::11:;1 r.. r.. ::::1 ><><><
11 e e r.. o e muv ><><><mvu
Q Cf> E LLI u en<mu<<m><<mu<<m
622
......... ..._ooN."4'.......
o .-0000000 ~
o o
1\
r..
o "ºººººººº
r.. ºººººººº
• •
000000..:tr...11"1'011"1
ONll"lll"lO.O.N4'
r.. GIO.OOl")OQN:tll"IOC)O
O ... o. ..... "4',._,....,._0"N
1:1..0 1:1..00000000
r.. "' 11"1 °' ,., ,., ""' ,._
' EON"4'N,._CIO..'(),._
e ""' ,.,
W•r"4'r.lV\N,,,,..N....
..,ll"lll"lll"IP'l 11"1................
"'O en • • • • •
1&1,.,,....:tOOOQ..Ol"'\OO +'WOOOOOOOOO
:::100..:t..OCIOll"ICIO en
'° '° °' ,._ ,._ 00 00
..,,,,, • • • • 11 • • •
co ,.,
>N"4'001"'10.CIO,._O
N NN00
.CICIN."4'.....
Qy-0000000
1\ ººººººººº
ººººººººº
CCll0.0
ce r..ooo
w""'
en ..:t
G1 00 O CO 00 11"1 ,._ ..... O
r..ll"IO.CO.N00..:t r.. 000000000
C11 CUNO E"4' cu..:t0011"111"111"10. 1:1..
E :::10.. o ::1r...,._11"111"1'()..:tQCIO
"' 000. .
C'N 00 ... o 0'0. . l"'I l"'I N l"I l"'I 'O
e e 11) 11"1 IV\ '4' '() ,._ Qo. 11"1 N
o • .ON,._OOl"cfl'I
,._ a:o e ' •. ' ....
""' IQ(>.OON..Ol"ION
...:t ,.,
.,Q"4''()11"1N'()"4',._ll"l0
o 11 ,._00000.NNOOCIO
:e c.. • • • • • •
'° '() 11"1
N l&I ..... ,., ,., ,., 11"\ ..:t
E N NNll"lll"I cu 00 ""' e e e ,._
r..+'. . 1 ..NN
O GI 1
...... E!
...... ,_ ...
ce
..... 111..:t0"4'
o ........ '°,., >.
cnoo000001n,._.o
ce
. '°
Cl>ll"l(>.'00.N00"4'
'()ll"IN
l..
em,_,,._,.... V,._ ....:t'OOll"lll"lll"I(>.
............ 11"111"1'0'4'000
Ci.
:::1:::1...,00 e .,. O. .. rt'I rt'I N fl'I fl'I O

11"1 .,. 11"1 I" ..:t 'O ,._ O. 11\ N
., . .
U') "' •
U'l..Oll"IN .QN,._OOl"'\..1"
00 e .
°'........e >. e ,.,,.,...,..:t
Q.Qo. 00 N . O O N
11"1'4'
CllOOO.N0,._0.,._(>.
.... .... l"'I ,._ '() 11"1 I" ...:t O. N
N N 1 N NNll"\11"1 ftlOOl"IN0000000.N
ECI00'00-0..-NON
•r1"'111"10.'0Ml'l'l'l..:t:t
.... "4'0011"111"10"4'0MI"
CllNl'0..:tMOOOO
LLI • • • 1
ONl""lll"IMNNlt'll'l'I
..... 1 1
.....
...o
IO
,_
"'O ......
GI cJ
...
Cll
l&I
cu
... Cll
cu cJ
Q.
cJ ..... r.. l&I u E r..

l.. GI O l.. r.. 111 GI
:::1 "O r.. r.. ::1 >< r..... ><
o o r.. o O CD ><><m 111c m ><><m
en E u.l v cncmuC><<mc l:l..14CIDU<><<CD<
623
.624 CAPÍTULO 14 OIBOS TÓPICOS DE DISEÑO Y ANÁLISIS
Al revisar los resultados obtenidos de los tres enfoques, se observa que cada método mejora de mane
ra sucesiva el ajuste del modelo en este ejemplo. Si hay una razón fundada para creer que la covariable no
interactúa con los factores, quizá sea mejor establecer ese supuesto desde el principio del análisis. Esta
opción también puede ser dictada por el software. Aun cuando los paquetes de software para diseños ex
perimentales quizá sólo tengan capacidad para modelar covariables que no interactúan con los trata
mientos, el analista puede tener una oportunidad razonable de identificar los factores principales que
influyen en el proceso, incluso si hay alguna covariable por interacción de tratamientos. Se observa asi
mismo que las pruebas usuales de la adecuación del modelo siguen siendo apropiadas y se recomiendan
enérgicamente como parte del proceso de construcción del modelo del análisis de covarianzaANCOVA.
144 MEDICIONES REPETIDAS
En el trabajo experimental de las ciencias sociales y el comportamiento, así como en algunos aspectos de
la ingeniería y las ciencias físicas, las unidades experimentales son con frecuencia personas. Debido a las
discrepancias en experiencia, capacitación o formación, en algunas situaciones experimentales las dife
rencias en las respuestas de distintas personas al mismo tratamiento pueden ser muy grandes. A menos
que esté controlada, esta variabilidad entre las personas se convertirá en parte del error experimental, y
en algunos casos inflará significativamente el cuadrado medio del error, haciendo más difícil detectar las
diferencias reales entre los tratamientos.
Es posible controlar esta variabilidad entre las personas utilizando un diseño en el que cada uno de
los a tratamientos se usa en cada persona (o "sujeto"). A éste se le llama diseño de mediciones repetidas.
En esta sección se ofrece una breve introducción a los experimentos de mediciones repetidas con un solo
factor.
Suponga que un experimento incluye a tratamientos y que cada tratamiento se va a usar exactamente
una sola vez en cada uno den sujetos. Los datos aparecerían como en la tabla ,1419. Vea que la observa
ción Yij representa la respuesta del sujeto j al tratamiento i y que sólo se usan n sujetos. El modelo que se
utiliza para este diseño es
(1445)
donde T¡ es el efecto del tratamiento iésimo y {Jj es un parámetro asociado con el sujeto jésimo. Se supone
que los tratamientos son fijos (de donde ~~~1 •, = O) y que los sujetos empleados son una muestra aleato
ria de alguna población más grande de individuos potenciales. Por lo tanto, colectivamente los sujetos re
presentan un efecto aleatorio, por lo que se supone que la media de {Jj es cero y que la varianza de {Jj es o~.
Puesto que el término /3j es común a todas las a mediciones del mismo sujeto, la covarianza entre Yij yyi'j no
Tabla 1419 Datos de un diseño de mediciones repetidas con un solo factor

Sujeto Totales de
Tratamiento 1 2 n los tratamientos
1 Yu Y12 Yin
2 Y~1 Y!z Y!n
a Ya1 Yai Yan Y a.
Tutales de los sujetos Y.1 Y.z Y.n y_

144 MEDICIONES REPETIDAS 625
es, en general, cero. Se acostumbra suponer que la covarianza entre Yij y y;'j es constante a lo largo de todos
los tratamientos y los sujetos.
Considere una partición en el análisis de varianza de la suma de cuadrados total, por ejemplo
~ L.i
L.i ~ ( v, Y..
)2 = ª e:
~ (Y.j Y.. )2 + L.i
~ L.i
{, ( v, Y.j )2 (1446)
;~1 j=l j;;;1 ;1 I1
El primer término del miembro derecho de la ecuación 1446 puede considerarse como una suma de cua
drados que resulta de las diferencias entre los sujetos, y el segundo término es una suma de cuadrados de
las diferencias dentro de los sujetos. Es decir,
SST = SS Entrelos sujetos +SS Dentrode jos sujetos
Las sumas de cuadrados SSEntre los sujetos y SS0entrodc 10, sujetos son estadísticamente independientes, con grados
de libertad
an-1 = (nl)+n(a1)
Las diferencias dentro de los sujetos dependen tanto de las diferencias en los efectos de los trata
mientos como de la variabilidad no controlada (ruido o error). Por lo tanto, la suma de cuadrados resul
tante de las diferencias dentro de los sujetos puede descomponerse de la siguiente manera:
LL L rn. Y. ) + L L
a n a a n
(yij - Y.¡ )2 =n 2 (Y;¡ J;. - Y.¡ +Y. )2 (1447)

j:::::;:]
El primer término del miembro derecho de la ecuación 1447 mide la contribución de la diferencia entre
las medias de los tratamientos a SS0entro de 10, sujeto"y el segundo término es la variación residual debida al
error. Ambos componentes de SSoentro de 10, sujetos son independientes. Por lo tanto,
SS Dentro de to.. ujetos = SS Tratamientos +SS E
con los grados de libertad dados por
n(a1)= (al)+(al)(n1)
respectivamente.
Para probar la hipótesis de que no hay ningún efecto de los tratamientos, es decir,
H0:r1=r2=···=r.=0
H1: Al menos una r; ;t: O
se usaría el cociente
F. = SS Tratamientos / (a - 1) = MS Tratamientos
(1448)
0
SSE /(al)(n1) MSE
Si los errores del modelo siguen una distribución normal, entonces bajo la hipótesis nula, H0: T; = O, el es
tadístico F0 sigue una distribuciónF._1.c•l)(nl)· La hipótesis nula se rechazaría siF0 »F¿ •l,(al)(nl)·
En la tabla 1420 se resume el procedimiento del análisis de varianza, donde se presentan también
fórmulas convenientes de cálculo para las sumas de cuadrados. El lector deberá identificar el análisis de
varianza de un diseño de un solo factor con mediciones repetidas como el equivalente del análisis de un
diseño de bloques completos aleatorizados, donde los sujetos se consideran como los bloques.
§
o j ,.....1 ,......,
,.....
:ao
6 J
'':)
'::l
'':l"' X
~
1
.g 11
'':) ......
..."'
'O
~
1'i
1
'::l
''
o:I ~ 11
8 ¡: '':l"'
~ ~
145 PROBLEMAS 627
14.. 5 PROBLEMAS
141. Considere nuevamente el problema 522. Usar el procedimiento de BoxCox para determinar si es apropiada
(o útil) una transformación de la respuesta para analizar los datos de este experimento.
142. En el ejemplo 63 se seleccionó una transformación logarítmica para la respuesta velocidad de avance de una
perforadora. Usar el procedimiento de BoxCox para demostrar que se trata de una transformación de datos
apropiada.
143. Considere de nuevo el experimento del proceso de fundición del problema 823, donde se usó un diseño fac
torial fraccionado 26 3 para estudiar el peso del material de empaque que se adhiere a ánodos de carbono
después de la cocción. Se hicieron tres réplicas de las ocho corridas del diseño, y el peso promedio y el rango
de los pesos de cada combinación de prueba se trataron como las variables de respuesta. lExiste algún indi
cio de que se necesite una transformación para cualquiera de las dos respuestas?
144. En el problema 824 se usó un diseño factorial fraccionado con réplicas para estudiar el abombamiento o
combadura del sustrato en la fabricación de semiconductores. Se usaron como variables de respuesta tanto la
media como la desviación estándar de las mediciones de la combadura. lExiste algún indicio de que se nece
site una transformación para cualquiera de las dos respuestas?
145. Considere nuevamente el experimento del recubrimiento fotoprotector del problema 825. Usar la varianza
del espesor del recubrimiento en cada combinación de prueba como la variable de respuesta. lExiste algún
indicio de que se necesite una transformación?
146. En el experimento defectos en la rejilla del problema 829 se empleó una variante de la transformación de la
raíz cuadrada en el análisis de los datos. Usar el método de BoxCox para determinar si ésta es la transforma
ción apropiada.
147. En el diseño central compuesto del problema 1114 se obtuvieron dos respuestas, la media y la varianza del
espesor del óxido. Usar el método de BoxCox para investigar la utilidad potencial de una transformación
para estas dos respuestas. lEs apropiada la transformación logarítmica sugerida en el inciso e de ese proble
ma?
148. En el diseño factorial 33 del problema 1133, una de las respuestas es la desviación estándar. Usar el método
de BoxCox para investigar la utilidad de las transformaciones para esta respuesta. lCambiaría su contesta
ción si se usara la varianza como la respuesta?
149. En el problema 1134 se sugiere usar ln(s2) como la respuesta (referirse al inciso b). lEI método de BoxCox
indica que es apropiada una transformación?
1410. Un distribuidor de bebidas gaseosas está estudiando la efectividad de los métodos de descarga. Se han desa
rrollado tres tipos diferentes de carretillas, y se lleva a cabo un experimento en el laboratorio de ingeniería de
métodos de la compañía. La variable de interés es el tiempo de descarga en minutos (y); sin embargo, el tiem
po de descarga también guarda una estrecha relación con el volumen de las cajas descargadas (x). Cada ca
rretilla se usó cuatro veces y se obtuvieron los datos siguientes. Analizar estos datos y sacar las conclusiones
apropiadas. Utilizar a = 0.05.
Tipo de carretilla
1 2 3
y X y X y X
27 24 25 26 40 38
44 40 35 32 22 26
33 35 46 42 53 50
41 40 26 25 18 20
1411. Calcular las medias ajustadas de los tratamientos y los errores estándar de éstas para los datos del problema
1410.
1412. A continuación se presentan las sumas de cuadrados y los productos de un análisis de covarianza de un solo
factor. Terminar el análisis y sacar las conclusiones apropiadas. Utilizar a = 0.05.
63 2 BIBLIOGRAFÍA
Conover, W.J. y R.L. Iman. [30b.] "Rank Transformations as a Bridge Between Parametric and Nonpara
metric Statistics" (con comentarios), en The American Statistician, vol. 35, pp. 124133.
Conover, W.J., M.E. Johnson y M.M. Johnson. [31.] ·~ Comparative Study ofTests for Homogeneity of
Variances, with Applications to the Outer Continental Shelf Bidding Data", en Technometrics, vol. 23, pp.
351361.
Cook, D.R. [32a.] "Detection of Influential Observations in Linear Regression", en Technometrics, vol.
19, pp. 1518.
Cook, D.R. [32b.] "Influential Observations in Linear Regression", enJoumal oftheAmerican Statistical
Association, vol. 74, pp. 169174.
Cornell, J.A [33.] Experiments with Mixtures: Designs, Models, and theAnalysis of Mixture Data. 2a. edi
ción, Wiley, Nueva York.
Cornfield, J. y J.W Tukey. [34.] 'Average Value of Mean Squares in Factorials", enAnnals of Mathemati-
cal Statistics, vol. 27, pp. 907949.
Daniel, C. [35a.] "Use ofHalfNormal Plots in Interpreting Factorial 1Wo Level Experiments", en Tech-
nometrics, vol. 1, pp. 311342.
Daniel, C. [35b.] Applications of Statistics to Industrial Experimentation. Wiley, Nueva York.
Davies, O.L. [36.] Design andAnalysis of Industrial Experiments. 2a. edición, Hafner Publishing Company,
Nueva York.
Derringer, G. y R. Suich. [37.] "Simultaneous Optimization of Several Response Variables", enloumal of
Quality Technology, vol. 12, pp. 214219.
Dolby, J.L. [38.] ''.A Ouick Method for Choosing a Transformation", en Technometrics, vol. 5, pp. 317326.
Draper, N.R. y W.G. Hunter. [39.] "Transformations: Sorne Examples Revisited", en Technometrics, vol.
11, pp. 2340.
Duncan, AJ. [ 40.] Quality Control and Industrial Statistics. Sa. edición, Richard D. Irwin, Homewood, Ill.
Duncan, D.B. [41.] "Multiple Range and Multiple F Tests", en Biometrics, vol. 11, pp. 142.
Dunnett, C.W. [42.] "New Tables for Multiple Comparisons with a Control", en Biometrics, vol. 20, pp.
482491.
Eisenhart, C. [43.] "The Assumptions Underlying the Analysis of Variance", en Biometrics, vol. 3,
pp. 121.
' '
Fisher, R.A [44a.] Statistical Methodsfor Research Workers. 13ava edición, Oliver & Boyd, Edimburgo.
Fisher, R.A. ( 44b.] The Design of Experimenis. 8a. edición, Hafner Publishing Company, Nueva York.
Fisher, R.A y F. Yates. [45.] Statistical Tablesfor Biological, Agricultural, and Medical Research, 4a. edi
ción, Oliver & Boyd, Edimburgo.
Fries, A yWG. Hunter. [46.] "MinimumAberration 2k·p Designs", en Technometrics, vol. 22, pp. 601608.
Gaylor, D.W y T.D. Hartwell. [47.] "Expected Mean Squares for Nested Classifications", en Biometrics,
vol. 25, pp. 427430.
Gaylor, D. W. y F.N. Hopper. [48.] "Estimating the Degrees of Freedom far Linear Combinations of Mean
Squares by Satterthwaite's Formula", en 'Iechnometrics, vol. 11, no. 4, pp. 699706.
Graybill, F.A y D.L. Weeks. [49.] "Combining Interblock and Intrablock Information in Balanced Incom
plete Blocks", en Annals of Mathematical Statistics, vol. 30, pp. 799805.
Graybill, EA [50.] An Introduction to Linear Statistical Models. Vol. 1, McGrawHill, Nueva York.
BIBLIOGRAFÍA 633
Graybill, F.A. y C.M. Wang. [51.] "Confidence Intervals on Nonnegative Linear Combinations ofVarian
ces", en Joumal of the American Statistical Association, vol. 75, pp. 869873.
Hamada, M. y N. Balakrishnan. [52.] ''Analyzing Unreplicated Factorial Experiments: A Review with
Some New Proposals" (con comentarios), en Statistica Sínica, vol. 8, pp. 141.
Hamada, M. y C.F.J. Wu. [53.] ''Analysis of Designed Experiments with Complex Aliasing", ea Ioumal of
Quality Technology, vol. 24, no. 3, pp. 130137.
Hill, W.G. y W.G. Hunter. [54.] ''.A Review of Response Surface Methodology: A Literature Survey", en
Technometrics, vol. 8, pp. 571590.
Hines, W.W. y D.C. Montgomery. [55.] Probability and Statistics in Engineering and Management Science.
3a. edición, Wiley, Nueva York.
Hocking, R.R. [56.] ''.A Discussion of the 1\voWay Mixed Model", en The American Statistician, vol. 27,
no. 4, pp. 148152.
Hocking, R.R., O.P. Hackney y FM. Speed. [57.J "The Analysis of Linear Models with Unbalanced Data",
en Contributions to Survey Sampling and Applied Statistics, H.A. David (ed.), Academic Press, Nueva
York.
Hocking, R.R. y F.M. Speed. [58.] ''.A Full Rank Analysis of Sorne Linear Model Problems", enloumal of
the American Statistical Association, vol. 70, pp. 706712.
Hunter, J.S. [59a.] "Statistical Design Applied to Product Design", enloumal of Quality Technology, vol.
17, pp. 210221.
Hunter, J.S. [59b.] "Let's Ali Beware the Latín Square", en Quality Engineering, vol. 1, pp. 453465.
John, J.A. y P. Prescott. [60.] "Critica! Values of a 'Iest to Detect Outliers in Factorial Experiments", en
Applied Statistics, vol. 24, pp. 5659.
John, P.WM. [6la.] "The ThreeQuarter Replicates of 24 and 25 Designs", en Biometrics, vol. 17, pp.
319321.
John, P.WM. [61b.] "ThreeOuarter Replicates of 2n Designs", en Biometrics, vol. 18, pp. 171184.
John, P.W.M. [6lc.] "Blocking a 3(2n k) Design", en Technometrics, vol. 6, pp. 371376.
John, P.WM. [6ld.] Statistical Design and Analysis of Experiments. Macmillan, Nueva York.
Kackar, R.N. [62.] "OffLine Ouality Control, Para.meter Design, and the Taguchi Method", ets Journal of
Quality Technology, vol. 17, ]Pp. 176188.
Kempthorne, O. [63.] The Design and Analysis of Experiments, Wiley, Nueva York.
Keuls, M. [64.] "The Use of the Studentized Range in Connection with anAnalysis ofVariance", enEuph-
ytica, vol. l, pp. 112122.
Kiefer, J. [65a.] "Optimum Experimental Designs", enloumal of the Royal Stutistical Society B, vol. 21, pp.
272304.
Kiefer, J. [65b.] "Optímum Designs in Regression Problems", enAnnals of Mathematical Statistics, vol. 32,
pp. 298325.
Kiefer, J. y J. Wolfowitz. [66.) "Optimum Designs in Regression Problems", enAnnals of Mathematical
Statistics, vol. 30, pp. 271294.
Khuri, A.Ly J.A. Cornell. [67.] Response Surfaces: Designs andAnalyses. 2a. edición, Dekk:er, Nueva York.
Kruskal, WH. y W.A. Wallis. [68.] "Use of Ranks on One Criterion Variance Analysis", enloumal of the
American StatisticalAssociation, vol. 47, pp. 583621 (las correcciones aparecen en el vol. 48, pp. 907911).
634 BIBLIOGRAFÍA
Lamtz, K. y P. Whitcomb. [ 69.] "Use of Replication in Almost Unreplicated Factorials", ponencia presen
tada en la Conferencia Técnica de Otoño, Coming, N.Y.
Lenth, R.V [70.] "Quick and Easy Analysis of Unreplicated Factorials", en Technometrics, vol. 31, pp.
469473.
Leon, R.V, A.C. Shoemaker y R.N. Kackar. [71.] "Performance Measures Independent of Adjustment",
en Technometrics, vol. 29, pp. 253265.
Levene, H. [72.] "Robust 'Iests for Equality of Variance", en Contributions to Probability and Statistics, Z.
Olkin, ed., Stanford University Press, Palo Alto, CA, pp. 278292.
Loughin, TM. [73.] "Calibration of the Lenth Test for Unreplicated Factorial Designs", en Joumal of
Quality Technology, vol. 30, pp. 171175.
Loughin, TM. y W. Noble. [74.] ·~ Permutation Test for Effects in an Unreplicated Factorial Design", en
Technometrics, vol. 39, pp. 180190. ·
Margolin, B.H. [75a.] "Systematic Methods of Analyzing 2n3m Factorial Experiments with Applications",
en Technometrics, vol. 9, pp. 245260.
Margolin, B.H. [75b.] "Results on Factorial Designs of Resolution IV for the zn and 2n3m Series", en Tech-
nometrics, vol. 11, pp. 431444.
McCullagh, P. y J .A. N elder. [76.] Generalized Linear Models. 2a. edición, Chapman & Hall, Nueva York.
Miller, R.G. [77.] Simultaneous Statistical Inference. SpringerVerlag, Nueva York.
Miller, R.G., Jr. [78.] "Developments in Multiple Comparisons, 19661976", enloumal oftheAmerican
Statistical Association, vol. 72, pp. 779788.
Milliken, G.A. y D.E. Johnson. [79.]Analysis of Messy Data, Vol. 1. Van Nostrand Reinhold, Nueva York.
Montgomery, D.C. [80a.] lntroduction to Statistical Quality Control. 3a. edición, Wiley, Nueva York.
Montgomery, D.C. [80b.] "Experimental Design for Product and Process Design and Development", en
Journal of the Royal Statistical Society, D, vol. 48, pp. 159177.
Montgomery, D.C., C.M. Borrory J.D. Stanley. [81.] "Sorne Cautions in the Use of PlackettBurmanDe
signs", en Quality Engineering, vol. 10, pp. 371381.
Montgomery, D.C. y E.A. Peck. [82.] Introduction to Linear RegressionAnalysis. 2a. edición, Wíley, Nueva
York.
Montgomery, D.C. y G.C. Runger. [83a.] "Gauge Capability Analysis and Designed Experiments. Part 1:
Basic Methods", en Quality Engineering, vol. 6, pp. 115135.
Montgomery, D.C. y G.C. Runger. [83b.) "Gauge Capability Analysis and Designed Experiments. Part II:
Experimental Design Models and Variance Component Estimation", en Quality Engineering, vol. 6, pp.
289305.
Montgomery, D.C. y G.C. Runger. [83c.] "Foldovers of 2k-p Resolution IV Designs", enloumal of Quality
Technology, vol. 24, pp. 446450.
Montgomery, D.C. y G.C. Runger. [83d.] Probabilidad y estadística aplicadas para ingenieros. 2a. edición,
LimusaWiley, México.
Myers, R.H. [84.] Classical and Modern Regression with Applications. 2a. edición, PNSKent, Boston.
Myers, R.H. y D.C. Montgomery. [85a.] Response Surface Methodology: Process and Product Optimization
Using Designed Experiments, Wiley, Nueva York.
Myers, R.H. y D.C. Montgomery. [85b.] ''A Tutorial on Generalized Linear Models", enloumal of Quality
Technology, vol. 29, pp. 274291.
BIBLIOGRAFÍA 635
Nair, V.N. et al. (eds.) [86.] "Iaguchi's Parameter Design: A Panel Discussion", en Technometrics, vol. 34,
pp. 127161.
Nelder, J.A. y R.W.M. Wedderbum. [87.] "Generalízed Linear Models", enloumal ofthe Royal Statistical
Society, A, vol. 135, pp. 370384.
Nelson, L.S. [88a.] "Using Nested Designs 1: Estimatíon of Standard Deviations", en Joumal of Quality
Technology, vol. 27, no. 2, pp. 169171.
Nelson, L.S. [88b.] "Using Nested Designs 11: Confidence Límits for Standard Deviations", enloumal of
Quality Technology, vol. 27, no. 3, pp. 265267.
Nelson, L.S. [88c.] "Variance Estimation Using Staggered, Nested Designs", enloumal of Quality Techno-
logy, vol. 15, pp. 195198.
Nelson, P.R. [89.] "Múltiple Comparison of Means Using Simultaneous Confidence Intervals", enloumal
of Quality Technology, vol. 21, No. 4, pp. 232241.
Newman, D. [90.] "The Distribution of the Range in Samples from a Normal Population, Expressed in
Terms of an Independent Estimate of Standard Deviation", en Biometrika, vol. 31, pp. 2030.
O'Neill, R. y G.B. Wetherill. [91.] "The Present State of Multiple Comparison Methods", enloumal ofthe
Royal Statistical Society, B, vol. 33, pp. 218241.
Ostle, B. [92.] Statistics in Research, 2a. edición, Iowa State Press, Ames, Iowa.
Pearson, E.S. y H.O. Hartley. [93a.] Biometrika Tablesfor Statisticians. Vol. 1, 3a. edición, Cambridge Uni
versity Press, Cambridge.
Pearson, E.S. y H.O. Hartley. [93b.] Biometrika Tables for Statisticians. Vol. 2, Cambridge University
Press, Cambridge.
Pignatiello, J.J., Jr. y J.S. Ramberg. [94.] "Tup Ten 'Iriumphs and Tragedies of Genichi Tuguchi", en Qua-
lity Engineering, vol. 4, pp. 211225.
Plackett, R.L. y J.P. Burman. [95.] "The Design of Optimum Multifactorial Experiments", enBiometrika,
vol. 33, pp. 305325.
Ouenouille, M.H. [96.] The Design and Analysis of Experiments, Charles Griffin & Company, Londres.
Satterthwaite, F.E. [97.] "An Approximate Distribution of Estimates of Variance Components", en Bio-
metrics Bull., vol. 2, pp. 110112.
Scheffé, H. [98a.] ''A Method for Judging All Contrasts in the Analysis of Variance", en Biometrika, vol.
40, pp. 87104.
Scheffé, H. [98b.] ''A 'Mixed Model' for the Analysis of Variance", ea Annals of Mathematical Statistics,
vol. 27, pp. 2336.
Scheffé, H. [98c.] ''Altemative Models for the Analysis of Variance", enAnnals of Mathematical Statistics,
vol. 27, pp. 251271.
Scheffé, H. [98d.] The Analysis of Variance. Wiley, Nueva York.
Searle, S.R. [99a.] Linear Models. Wiley, Nueva York.
Searle, S.R. [99b.] "Tupíes in Variance Component Estimation", en Biometrics, vol. 27, pp. 176.
Searle, S.R. [99c.] Linear Models for Unbalanced Data. Wiley, Nueva York.
Searle, S.R., G. Casella y G.E. McCulloch. [100.] Variance Components, Wiley, Nueva York.
Searle, S.R. y R.F. Fawcett. [101.] "Expected Mean Squares in Variance Component Models Having Fini
te Populations", en Biometrics, vol. 26, pp. 243254.
636 BIBLIOGRAFÍA
Searle, S.R., FM. Speed y H.V Henderson. [102.] "Sorne Computational and Model Equivalences in
Analyses of Variance of UnequalSubclassNumbers Data", en The American Statistician, vol. 35, pp.
1633.
Smith, H.F. [103.] "Interpretations of Adjusted Treatment Means and Regressions in Analysis of Cova
riance", en Biometrics, vol. 13, No, 3, pp. 282308.
Smith, J.R. y J.M. Beverly. [104.] "The Use and Analysis of Staggered Nested Factorial Designs", ess Iour-
nal of Quality Technology, vol. 13, pp. 166173.
Speed, F.M. y R.R. Hocking. [105.] "The Use of the R( )Notation with Unbalanced Data", en The Ameri-
can Statistician, vol. 30, pp. 3033.
Speed, F.M., R.R. Hocking y O.P. Hackney. [106.] "Methods of Analysis of Linear Models with Unbalan
ced Data", en Journal of the American Statistical Association, vol. 73, pp. 105112.
Stefansky, W. [107.] "Rejecting Outliers in Factorial Designs", en Technometrics, vol. 14, pp. 469479.
Taguchi, G. [108a.] System of Experimental Design: Engineering Methods to Optimize Quality and Minimize
Cost. UNIPUB, White Plains, Nueva York.
Taguchi, G. [108b.] lntroduction to Quality Engineering. Asian Productivity Organization, UNIPUB, Whi
te Plains, Nueva York.
'Iaguchi, G. y Y. Wu. [109.] Introduction to Off-Line Quality Control. Central Japan Quality Control Asso
ciation, Nagoya, Japón.
Ting, N., R.K. Burdick, F.A. Graybill, S. JeyaratnamyT.F. C. Lu. [110.] "Confidence Intervals on Linear
Combinations of Variance Components That Are Unrestricted in Sign", en Journal of Statistical Compu-
tation and Simulation, vol. 35, pp. 135143.
Tukey, J.W [llla.] "OneDegree ofFreedomforNonAdditivity", enBiometrics, vol. 5, pp. 232242.
Tukey, J.W. [lllb.] "Comparing Individual Means in the Analysis ofVariance", enBiometrics, vol. 5, pp.
99114.
Tukey, J.W. [lllc.] "Quick and Dirty Methods in Statistics, Part 11, Simple Anaíysis for Standard De
signs", enProceedings of the FifthAnnual Convention, American Society for Quality Control, pp. 189197.
Tukey, J.W. [llld.] "The Problem of Multiple Comparisons", notas inéditas, Princeton University.
Winer, B.J. [112.] Statistical Principies in Experimental Design. 2a. edición, McGrawHill, Nueva York.
Yates, F. [113a.] "The Analysis of Multiple Classi:fications with Unequal Numbers in the Different Clas
ses", en Joumal of the American Statistical Association, vol. 29, pp. 5266.
Yates, F. [113b.] Design and Analysis of Factorial Experiments. Comunicado técnico No. 35, Imperial Bu
reau of Soil Sciences, Londres. ·
Yates, F. [113c.] "The Recovery of Interblock Information in Balanced Incomplete Block Designs", en
Annals of Eugenics, vol. 10, pp. 317325.
Ye, K. y M. Ramada. [114.] "Critical Values ofthe Lenth Method for Unreplicated Factorial Designs", en
Joumal of Quality Technology, vol. 32, pp. 5766.
Apéndice
1 Distribución normal estándar acumulada

11 Puntos porcentuales de la distribución t
111 Puntos porcentuales de la distribución x2
IV Puntos porcentuales de la distribución F
V Curvas de operación característica para el análisis de varianza del modelo con efectos fijos
VI Curvas de operación característica para el análisis de varianza del modelo con efectos aleatorios
VII Rangos significativospara la prueba del rango múltiple de Duncan
VIII Puntos porcentuales del estadístico del rango studentizado
IX Valores críticos para la prueba de Dunnett para comparar tratamientos con un control
X Coeficientes de polinomios ortogonales
XI Números aleatorios
XII Relaciones de alias para diseños factoriales fraccionados zt P con k s 15 y n s 64
XIII Glosario para el uso de Design Expert
637
638 APÉNDICE
l.
~(t) = r
Distribución normal estándar acumulada
_1_ e-"'12 du
~ \12;
z .00 .01 .02 .03 .04
.o .50000 .50399 .50798 .51197 .51595 o
.1 .53983 .54379 .54776 .55172 .55567 .1
.2 .57926 .58317 .58706 .59095 .59483 .2
.3 .61791 .62172 .62551 .62930 .63307 .3
.4 .65542 .65910 .66276 .66640 .67003 .4
.5 .69146 .69497 .69847 .70194 .70540 .5
.6 .72575 .72907 .73237 .73565 .73891 .6
.7 .75803 .76115 .76424 .76730 .77035 .7
.8 .78814 .79103 .79389 .79673 .79954 .8
.9 .81594 .81859 .82121 .82381 .82639 .9
1.0 .84134 .84375 .84613 .84849 .85083 1.0
1.1 .86433 .86650 .86864 .87076 .87285 l.l
1.2 .88493 .88686 .88877 .89065 .89251 1.2
1.3 .90320 .90490 .90658 .90824 .90988 1.3
1.4 .91924 .92073 .92219 .92364 .92506 1.4
1.5 .93319 .93448 .93574 .93699 .93822 1.5
1.6 .94520 .94630 .94738 .94845 .94950 1.6
1.7 .95543 .95637 .95728 .95818 .95907 1.7
1.8 .96407 .96485 .96562 .96637 ;96711 1.8
1.9 .97128 .97193 .97257 .97320 .97381 1.9
2.0 .97725 .97778 .97831 .97882 .97932 2.0
2.1 .98214 .98257 .98300 .98341 .93882 2.1
2.2 .98610 .98645 .98679 .98713 .98745 2.2
2.3 .98928 .98956 .98983 .99010 .99036 2.3
2.4 .99180 .99202 .99224 .99245 .99266 2.4
2.5 .99379 .99396 .99413 .99430 .99446 2.5
2.6 .99534 .99547 .99560 .99573 .99585 2.6
2.7 .99653 .99664 .99674 .99683 .99693 2.7
2.8 .99744 .99752 .99760 .99767 .99774 2.8
2.9 .99813 .99819 .99825 .99831 .99836 2.9
3.0 .99865 .99869 .99874 .99878 .99882 3.0
3.1 .99903 .99906 .99910 .99913 .99916 3.1
3.2 .99931 .99934 .99936 .99938 .99940 3.2
3.3 .99952 .99953 .99955 .99957 .99958 3.3
3.4 .99966 .99968 .99969 .99970 .99971 3.4
3.5 .99977 .99978 .99978 .99979 .99980 3.5
3.6 .99984 .99985 .99985 .99986 .99986 3.6
3.7 .99989 .99990 .99990 .99990 .99991 3.7
3.8 .99993 .99993 .99993 .99994 .99994 3.8
3.9 .99995 .99995 .99996 .99996 .99996 3.9
"Reproducida con permiso de Probability and Statistics in Engineering and Management Science, 3a. ed., W.W.
Hines y D.C. Montgomery, Wtley, Nueva York
APÉNDICE 639
el>(~) = r
L Distribución normal estándar acumulada (continuación)
1
- .. V21T
e ..'12 du
z .os .06 .rn .08 .09 z

.o .51994 .52392 .52790 .53188 .53586 .O
.1 ..55962 .56356 .56749 ..57142 .57534 .1
.2 .59871 .60257 .60642 .61026 .61409 .2
.3 .63683 .64058 .64431 .64803 .65173 .3
.4 .67364 .67724 .68082 .68438 .68793 .4
.5 .70884 .71226 .71566 .71904 .72240 .5
.6 .74215 .74537 .74857 .75175 .75490 .6
.7 .77337 .77637 .77935 .78230 .78523 .7
.8 .80234 .80510 .8fí785 .81057 .81327 .8
.9 .82894 .83147 .83397 .83646 .83891 .9
1.0 .85314 .85543 .85769 .85993 .86214 1.0
1.1 .87493 .87697 .87900 .88100 .88297 l.l
1.2 .89435 .89616 .89796 .89973 .90147 1.2
1.3 .91149 .91308 .91465 .91621 .91773 1.3
1.4 .92647 .92785 .92922 .93056 .93189 1.4
1.5 .93943 .90462 .94179 .94295 .94408 1.5
1.6 .95053 .95154 .95254 .95352 .95448 1.6
1.7 .95994 .96080 .96164 .96246 .96327 l.7
1.8 .96784 .96856 .96926 .96995 .97062 1.8
1.9 .97441 .97500 .97558 .97615 .97670 1.9
2.0 .97982 .98030 .98fí77 .98124 .98169 2.0
2.1 .98422 .98461 .98500 .98537 .98574 2.1
2.2 .98778 .98809 .98840 .98870 .98899 2.2
2.3 .99061 .99086 .99111 .99134 .99158 2.3
2.4 .99286 .99305 .99324 .99343 .99361 2.4
2.5 .99461 .99477 .99492 .99506 .99520 2.5
2.6 .99598 .99609 .99621 .99632 .99643 2.6
2.7 .99702 .99711 .99720 .99728 .99736 2.7
2.8 .99781 .99788 .99795 .99801 .99807 2.8
2.9 .99841 .99846 .99851 .99856 .99861 2.9
3.0 .99886 .99889 .99893 .99897 .99900 3.0
3.1 .99918 .99921 .99924 .99926 .99929 3.1
3.2 .99942 .99944 .99946 .99948 .99950 3.2
3.3 .99960 .99961 .99962 .99964 .99965 3.3
3.4 .99972 .99973 .99974 .99975 .99976 3.4
3.5 .99981 .99981 .99982 .99983 .99983 3.5
3.6 .99987 .99987 .99988 .99988 .99989 3.6
3.7 .99991 .99992 .99992 .99992 .99992 3.7
3.8 .99994 .99994 .99995 .99995 .99995 3.8
3.9 .99996 .99996 .99996 .99997 .99997 3.9
640 APÉNDICE
IL Puntos porcentuales de la distribución t"
.40 .25 .10 .05 .025 .01 .005 .0025 .001 .0005
.325 1.000 3.078 6.314 12.706 31.821 63.657 127.32 318.31 636.62
2 .289 .816 1.886 2.920 4.303 6.965 9.925 14.089 23.326 31.598
3 .277 .765 1.638 2.353 3.182 4.541 5.841 7.453 10.213 12.924
4 .271 .741 1.533 2.132 2.776 3.747 4.604 5.598 7.173 8.610
5 .267 .727 1.476 2.015 2.571 3.365 4.032 4.773 5.893 6.869
6 .265 .727 1.440 1.943 2.447 3.143 3.707 4.317 5.208 5.959
7 .263 .711 1.415 1.895 2.365 2.998 3.499 4.019 4.785 5.408
8 .262 .706 1.397 1.860 2.306 2.896 3.355 3.833 4.501 5.041
9 .261 .703 1.383 1.833 2.262 2.821 3.250 3.690 4.297 4.781
10 .260 .700 1.372 1.812 2.228 2.764 3.169 3.581 4.144 4.587
11 .260 .697 l.363 1.796 2.201 2.718 3.106 3.497 4.025 4.437
12 .259 .695 1.356 l.782 2.179 2.681 3.055 3.428 3.930 4.318
13 .259 .694 1.350 1.771 2.160 2.650 3.012 3.372 3.852 4.221
14 .258 .692 1.345 1.761 2.145 2.624 2.977 3.326 3.787 4.140
15 .258 .691 1.341 1.753 2.131 2.602 2.947 3.286 3.733 4.073
16 .258 .690 1.337 1.746 2.120 2.583 2.921 3.252 3.686 4.015
17 .257 .689 1.333 1.740 2.110 2.567 2.898 3.222 3.646 3.965
18 .257 .688 1.330 1.734 2.101 2.552 2.878 3.197 3.610 3.922
19 .257 .688 1.328 1.729 2.093 2.539 2.861 3.174 3.579 3.883
20 .257 .687 1.325 1.725 2.086 2.528 2.845 3.153 3.552 3.850
21 .257 .686 1.323 1.721 2.080 2.518 2.831 3.135 3.527 3.819
22 .256 .686 1.321 1.717 2.074 2.508 2.819 3.119 3.505 3.792
23 .256 .685 1.319 1.714 2.069 2.500 2.807 3.104 3.485 3.767
24 .256 .685 1.318 1.711 2.064 2.492 2.797 3.091 3.467 3.745
25 .256 .684 1.316 1.708 2.060 2.485 2.787 3.078 3.450 3.725
26 .256 .684 1.315 1.706 2.056 2.479 2.779 3.067 3.435 3.707
27 .256 .684 1.314 1.703 2.052 2.473 2.771 3.057 3.421 3.690
28 .256 .683 1.313 1.701 2.048 2.467 2.763 3.047 3.408 3.674
29 .256 .683 1.311 1.699 2.045 2.462 2.756 3.038 3.396 3.659
30 .256 .683 1.310 1.697 2.042 2.457 2.750 3.030 3.385 3.646
40 .255 .681 1.303 1.684 2.021 2.423 2.704 2.971 3.307 3.551
60 .254 .679 1.296 1.671 2.000 2.390 2.660 2.915 3.232 3.460
120 .254 .677 1.289 1.658 1.980 2.358 2.617 2.860 3.160 3.373
00 .253 .674 1.282 1.645 1.960 2.326 2.576 2.807 3.090 3.291
v =
grados de libertad.
"Adaptada con permiso de Biometrika Tables for Statisticians,vol. 1, 3a. ed., E.S. Pearson y H.O. Hartley,
Cambridge University Press, Cambridge
APÉNDICE 641
III. Puntos porcentuales de la distribución xi•
a
V .995 .990 .975 .950 .500 .050 .025 .010 .oos
0.00 + 0.00 + 0.00 + 0.00 + 0.45 3.84 5.02 6.63 7.88
2 0.01 0.02 0.05 0.10 1.39 5.99 7.38 9.21 10.60
3 0.07 0.11 0.22 0.35 2.37 7.81 9.35 11.34 12.84
4 0.21 0.30 0.48 0.71 3.36 9.49 11.14 13.28 14.86
5 0.41 0.55 0.83 1.15 4.35 11.07 12.38 15.09 16.75
6 0.68 0.87 1.24 1.64 5.35 12.59 14.45 16.81 18.55
7 0.99 1.24 1.69 2.17 6.35 14.07 16.01 18.48 20.28
8 1.34 1.65 2.18 2.73 7.34 15.51 17.53 20.09 21.96
9 1.73 2.09 2.70 3.33 8.34 16.92 19.02 21.67 23.59
10 2.16 2.56 3.25 3.94 9.34 18.31 20.48 23.21 25.19
11 2.60 3.05 3.82 4.57 10.34 19.68 21.92 24.72 26.76
12 3.07 3.57 4.40 5.23 11.34 21.03 23.34 26.22 28.30
13 3.57 4.11 5.01 5.89 12.34 22.36 24.74 27.69 29.82
14 4.07 4.66 5.63 6.57 13.34 23.68 26.12 29.14 31.32
15 4.60 5.23 6.27 7.26 14.34 25.00 27.49 30.58 32.80
16 5.14 5.81 6.91 7.96 15.34 26.30 28.85 32.00 34.27
17 5.70 6.41 7.56 8.67 16.34 27.59 30.19 33.41 35.72
18 6.26 7.01 8.23 9.39 17.34 28.87 31.53 34.81 37.16
19 6.84 7.63 8.91 10.12 18.34 30.14 32.85 36.19 38.58
20 7.43 8.26 9.59 10.85 19.34 31.41 34.17 37.57 40.00
25 10.52 11.52 13.12 14.61 24.34 37.65 40.65 44.31 4<i.93
30 13.79 14.95 16.79 18.49 29.34 43.77 46.98 50.89 53.67
40 20.71 22.16 24.43 26.51 39.34 55.76 59.34 63.69 66.77
50 27.99 29.71 32.36 34.76 49.33 67.50 71.42 76.15 79.49
60 35.53 37.48 40.48 43.19 59.33 79.08 83.30 88.38 91.95
70 43.28 45.44 48.76 51.74 69.33 90.53 95.02 100.42 104.22
80 51.17 53.54 57.15 60.39 79.33 101.88 106.63 112.33 116.32
90 59.20 61.75 65.65 69.13 89.33 113.14 118.14 124.12 128.30
100 67.33 70.06 74.22 77.93 99.33 124.34 129.56 135.81 140.17
v = grados de libertad
"Adaptada con permiso de Biometrika Tables far Statisticians, vol. 1, 3a. ed., E.S. Pearson y H.O. Hartley,
Cambridge University Press, Cambridge '

e e ('f";

V"'I N 00\0000
e"'"! ro"!~~~ ~ l""l ~ ~ ~
gg. ~$s.; .
~ . _; ;:i;...:
"° ~
°'
~
f"'.
~ ~ ('f"~
'(f'
l""l
·
~ ~ ~·~ ~
~
~~~~~

~~;:¡~C] ~~~~~
1f.\OV)V"i
r:~~=~~ ,..
,.. ,.. ~
~~~~~
.. "'"" ~.~
~[::¡<?~~
. . ~ ..; .....:

~~~~~
O\OOoOOOt
~ ~ ~ ~ ff1
~;;:; <;¡. l!l O\

f"IJ
...... "'
....( ~4 ""~
t4')
~

.....; .....; .,...(
>D oO~MM
e
~oo ~ :?1 ~
('n ("'I ~

t""o N
~ "". "'t ~ ~
t"1
642
: 5 e: s
..,.... .... ~ s..; ~ .,, ....
~ ~ ~ :e¡ "'
: "': :::! "' ! ~ ~
e
8 ..; ~ .,.¡ ..;
~ ""
"l "' 8.... § ~
.,.; :! ~ ~ f:!
..... :::! :! ~ .....
~
"' N
"'
s... ....~ . ..,"'!

-o
. .
~ ~ ~ r: ~ rt ~ ~
~ :B "' .,.¡ .... ..; .... .... ;:¡
~ N N
"'! "'!::; ....,"' ~ ~ ~ ;!
...; ~ s :5 ~ ~
:;:¡
...; ..... "': 5
.,,
~ ! ~... ~

!:;
.,,
~ fCl~ .,.¡ "'
\;¡;
""
~ le ;;;; ~ Ñ
..,r: ..; .... .... .... .... ~ ~"' ~ ~
.,.; ~ "' r:
r:
.,,
~ ~ s~~
QO
~ :e¡ "': oa
:! 5 "' ""!
"1
~ !
....
! ~ :
i
...."l \;¡; ~ i
r<l "'
.,.¡ ...; "'
...; r:
00
"' "'
~ ~
.... ....
.... t'i"' .... a,...; ~ :;; :!"' ~ ~ ~

.,,....,
"'
r: ¡:: $¡ ~ ~ ~ :e¡ $.
~
:~ 5
"1 ~ ~ ~
~
~ :<i ~
!:; &!
.,.¡ ...;
!:;
...;
i ~ ~ ~
.... .... .... .... ...."' ~.,.; o.... ~ s ~: "'!
.
...., ~ ~ ~
o
'.:; !s
e
~ ~
...; ~ !~"' § ~ ~ ;¡: :3;
8~ ~
~ ~ .,.¡ ~
..,
"'
. "'"' ."' "'
"' "'.... .....,,
..;
00 ~
....
00 o ;g
.,.;
ee ....
5 ó'; ~ "'! ~ 5 "" I"'; ¡::; .,,...., ........, ....
"': ~ ~
oa
"'! ~ $ :a ~ :!
e
'.'.J
:t;l ....,
QO
]' ~ ~
;o
~ ~ ~
.,.¡ ...;
"'
;::¡
...; .... .... .....
~ .,,"' o.......; ¡;:¡
N
~ 8 o
,..¡ ,..¡ .... .... ~ ~ : "" "' ...,. ..,...,
""
"'!
..,
~ '.'.'.l '.::;
....,
00
"':
N
'.::; 5 ~ ~ ~
..."'! §
~
.
<t: ~
~
€
§
J;.
¡:;¡ ~ ¡;:¡ ....
~ :;; .,.¡ ...; ~
....
.... ~ "'
"'
.
.... ~.... ~,..¡ ~,..¡N
!:;
,..¡
~ .....
Ñ
<=! .... o...; S; ~ o; ~ : ~ ~
ail .... "'!
QO
¡:.:
~ i!; ~
......., ~
~ ~ "' ""
"1 "!:
'<..
¡:;: E
¡:: ;; ~ ....N ~ !O s: ~ . .,, = a a.... .., .., o;
: .... :~ ~ ~ : 5 5 ~ ~ "'"'
i" ~ ~ ~ "' 00
'O
·o .... .... Ñ N N ~ ...;"" ""...; "'! "'!
"'
.,.¡ ..; ...; ,..¡ <i
!:!
"'
<i
~ ('Í ('Í
il
]5
~ i;.
~
"il
=: $"' "'"'l"' .,,~ ~..; ..,~ ~ = ~.... ~
"': ....N ~
,,¡ "',,¡ ~ ~ ~ ¡:;¡ ~ ~
N 5
"' . "3-. ~ ~ "' .
"'! O'!
....
~ ~ ~ ~ "'! "' ....,"'
"'! ¡:: :a ~
"'
,...; Ñ
~ o•. 'O N
"' "' N
~ ¿
"''<..
..!l
l
~ ~ ~ ~ ;, ...."' ~ ... ~
N .... ~
.....
....,,¡ "' ~ "'....
... ...
"' N
~ ~
8 .....
,,¡ <i ~ ~ ~ ~ ~ ~
o; ~ ~ . ... ..... "'
"'! :! "'! ~ :~ ~ ~
B¡:;: " "" ~
'O
.,.¡ ...; ..;
"' "' "'
4J
u
el
g
'O
... . .... a ...."'! ...
"' "' "'
Ei
o.
::¡: .... ~ :s;
.... ~
.... ~ "'
lQ ;'.:) r<t: .... ~ ~ ¡;:¡ "' ~ g 8 ;g
;::¡ ,,¡ .... .... 8 ~ &; ~ ó'; ~ ro; §~ ~ :i¡
5 '.: ~
"' "'
.,; .,.¡ ...;
"" ~ N
"' N
8
§
o.. ;: ~
..... cci ::..,.¡ ~.., ¡:; E; ~ ..... ;¡: ~
.... ~.... .... .,.._¡ ... <'i
. .... "'
N ¡:¡
;::¡
.
"' ;::¡.... ~.... o.... 8 ...
....
... ~ ~ ~ ~ :s; ;, ~ ~
;g el ;:¡ 00
: N
"'!
....
'.::: :
N
"'
.,., ...;
"'
<i <i N
;:::;
.,, ~ .,., ....
~ ...."' "l""
~ "' ~
....
....¡; a...; "" ...
!;; "l ....
¡¡'; ........
... ~...
00
'1 ¡::¡
... ;:¡
QO
;::¡ ;:¡ ~ ~ 8
.... .... ...;
a
"' ~
Sj e; 8 8
.... ...; ~ ~
"'
§ s ~ ¡:.:
"'
,,¡
"' "'
.,.._¡
"' N N
g¡ ....,.¡ ~ .... "'

...... .,,"' .,,<t: ~...; "'<"! .., ¡:; ~ ~ ~ ;::¡ . ....~
g s.... ....8 8.... ...9.
"' ...
::2 :!
.,, ~ ~ .... <'i"' ... ... N ... ...
~ ~ ~ ~ ~ ~
"' "' • "' "'
,..; ...; ...; N <'i <i
. "'
... ~ ;.t; .....;
"" ~<i ... ~ :¡;
.... N~ ""
~ ~
....
"" ~ ;:¡ ;j.... ~
...
..."l ;!:! "'~ .......<i ;::¡.... "' ~ !'.:;
.... .... ::2<i ....:::i
!:;
...
:?:
~ ~
.... ~ ~
..,. .,.¡ .,.¡
• "' ..;
"' Ñ N
"' "'
,,¡
"' "'
"'
"'.,,...; "' "'.,.¡"' "' fCl ~
.... ~...; ~ ~
~ ;8
"" ~<i
N
~ "' ; ~ ~ .... "' ......,
"' ....
;1;
.., ....., ~ ... ¡?!! ~ ~
""<'i ...; ;:¡ ... "'.... .... l!!l ~...; ...
...<=!
"' •
.....
.... ""'. "1 ...;
.....
"'
...; ..;
"' "' "'
<i
"' Ñ
"'
('Í
"' N
"' "'
o
"'..,. 8 .,.¡~ ~ ~
...; ~ ..,
~ o ~.,.._¡
.., . "' ......~ fO ~
R ,,¡ s ;o.... ....SI; i;:¡
"''° "'"' ~,,¡
... ~...; ;;:; o o °'<t: ; ~ ..... o
....
"' "' •
"' "'<'i
"' "'
")
.... ....
00
..,¡
"' "' "'
,,¡ ...; N ...;
"' "'
N ..; ...; .,.._¡ N N <'l
""
~ . .
...."1 ~ ~ ~ ...., ~ ~ ..,.... ~ ....... ~ .... s
.... ...; .... ..; ... ...; ..; ..; ...;
00 .....
o a... q....... O. g: :;: ..,
"'.... ~ '3- ~ ...
... ;: ~
.... ~N
.... ... "'...
J ~ ...., ¡:::
"' "'
O)
¡¡; ~
"' "' "'
.,.¡ .¡; ...; .,.._¡
"' Ñ Ñ
~
>:
... "' . .,,
"' ... . "' s ::: t! ~ :!;. ~ ::2 !:; ~ ~ ¡¡¡ Ñ ... "'...
N
~ ~ ~ r
"' ~ ~ ~ ~ $ ~ 8
(0it) J0pl!U!U10U:>p ¡:ip puu:iqi1 "P sopl!lD
643
~ ~ ~ ¡::¡ ~
8 M N N MN
~Q~~
MNN
~;!~a¡?!:
~ rn m ~ M
~~~~~
MMMMN
~¡::;t.~~
~~~MN
:g~~;t.i:;
M<ir.1~N
~~s~a
NN i:i MM
i;; ~ :;p:!
~ ~ ("'; ~ M
& ~ ~
M ~ ~
~ :=::!
r4 ri
sNNMM
asss
:g ~ ::¡: :!l ~ ~~~~~ ~~~~~ ~gb:gs ~

~ "'1 ~ ~ N N~i~NN NNNN~ ~ ci N N t"l M
:;j~fó~~ ~"""'~ @88~8

M N MM N NMt:'iNC"'i C"".iNMNN
il!l 8:;:; ~ B
~~M~~
~~~~~
N N N M ei
'°N ~N MM
S! o
;::i
gs~~~
<'i"'
!!: ~ ~ ;;¡
~ ~ M ~ ~
::!: ~~;~~
M ~ N MM
~ íl ~ ~ 00
N ~~MM
~ :=
~ ~
F8 ~ ~
("') ('f".i ~
~~~~~
NNNNÑ
~P.;t.~~
M ~ ~ C'i N
~ ~ ~ ~ íl
N MM M C"'i
MMq~~
(".{ N N
~~~3~ Ñ ~ ~ 8 3..
~ ~ ~ """M NNNc:"i_;
gg¡::¡g:~~
~ -..i ~ ~ ~
~~~~~
N M N N IÑ
..., ~ ~ :;¡;
MMMNN
:;¡! :::: ~
ei N M N M
!:::.: so
q:::; 3.. ~ ~~~~~ ¡!:;:;!:¡;:'.:8~ :;;! ;n:i t: s

"' ;t. ~ .,.; ,¿ ~ ~ ~ ~ i:r) N N ~ ri M d N N MN
"'
""" gN~o~
e:i o\ \O
~~~
... , ... ~·
. ~!
,., ,.,
~~
~ ""1 ~
srrl sN ~:Goof::~
N N N N N
r ~~~&1
M M M N e'
~~!;i~~
ei M N M M
~~P.~~
N M ~ M N
"'
~~~~~
..n ~ ~ ~ {""¡
.~~:;;:~ g;~¡¡::2~ ~B~$o 8:1:'!~~~ ~l~~~

~ ei ~ !""\ ~ tri ~ ~ rñ ri ~ M ~ ~ ("') C"i N N M ,... N ('.1 N N M
~~~~~ ~~~~~ 35~~~~ ~~~~¡ ~~~;!!;~

~~rr:~~
~~~~8
~l""\~~r.r.
.,..¡ ~ .:t= ~ ~ ot:i~('\~"'"' f'l'"i~("')~~ f'")('t"';t"t)ti":r....;
8;1;~f;;;~ ~~:Q:;~ ~~~g,'l~ ~~"'¡;:¡"" !:::~8~;;

.¡.~~~"'4" ..;.""~~~ ~~~rr:frri ~~.q.~~ .,,j-cf~(f":~
s:
644
~ ~ ~ ~
"° ~ ~ ~
S::Q~!D~
,...¡
(:)
MMMNM
:!~~~:::¡ ~~~~~
~....a N N ~ MMM~N
~e;~~"!~~°'~~~"!~~~
~ ~ ~ M ~ ~ ~ N M M N N N M M
~~N~~
N N N N N
~b~~~ "'·' N ~ ~;::: ~ &1 ~ 3 ~ ""~.., g

ei M N N M
"°u;""" t""i N N M NMNNM
~ '.::! ~ ~ :;¡ ~rr-: ~~ S.~ ~N ~Ñ g ~ ~~~ ;.'!¡ i1::: !::; ~

'6 ~ "lf ~ ,.,.. NNNNN MMNNN
'° ~ ~ ""
~ ro. ~ a ~r: ~r.i :;~~.MM
q ~ ~ ~("'¡MM
~ ~ ;g "' ~~~~~
c:'"i N NNNMM
g ~ ~ :::¡ ;::¡
NNMMM
~ ~ ~ t3 ~ ~~~~~ &::; ¡;; ~ ~ ~ ~ g; :st ~ ¡;:

~~~~M NMMMN N N N N ('I N N t-.i M M
!;l ¡;:; !;; ¡;a !;¡;

...o r,;i ~ ~ ~
~~~~:s
~ ~,...: rrí f""I
~~!:::a~
~MM M
8 g: ~ ¡::~~~~
..¿ir;...,..(""': ~~~~~
~~~g~ !;¡; ¡;) :Q~t:;~~ ;¡:; ~ ~ ~ ~
M,...; ~ ii ~ ~NMNM MMMNM NMNMM MNMNM
~ s:; ~ ~ ~ :!:Qg(~::l ~¡~¡:::~ ~~:<¡;a:f:

~,...; ~. r.;,...., M N <"".i M ~('iMNM ('.¡ NNMNM
~ ~ ~ :; ~
'/) .ri Ti .q. ~
~("'; .s~ "'! ~ ~
~ M ~
?:l ~Ulo~
~ ~ ~ ~ C"i
~ r;: ~ ~ ~
MMNNN
~.¿,ir.~~
~ s ::::l ¡;a
-ti
~ }e ~ ~ ~
tri ~ ~ f"¡,....;
~~~~~
rt"i ~ ~ i;,,.; t"'")
¡; gg ~ ~ ~
.,¡.,.,; ~ rr) ~
;
t"'i ~
~ ~
~,..;
~ r
~
~gas~
~rñ,.,.;~N
r.; ~ ~ ~:;:
MMNNN
~g~~~ ;:!i~~i:::g ~ ~ 3 ~ ¡::: ~~~83 ª~¡?:!;;&;

rviiri~.:t .. ~ rri ~ ~ ~ ~ ~ ~ t"t'Í ~,.,.¡,.,.¡~t"t'i t"l'\MMMM
~~~ª~
. . : '° 115
v) -.:f
~ ~ !::!
~ ~
8 ~ ál ~
.,¡ ~ ~
~ ;a ~
t"i ('!'")
(9"I t""I M
.....
ei
~ ~ ~ ~
(""¡ (""'¡ ("""¡ ~
r;:~M~~
~~f'l'"i~~
~~~~~
(""itrÍtrlNN
~ ~ !;; ~ ~
.,¡. .,¡. .,¡. ..rj ,,,¡
:'.:l
~~~~tri
ssss ~ ¡;) ~ ~ ~
,..; ~ ~ ei ~
:;~;:1;8;:::
<»~~ICivi
~~~S;~
V")v)v)V~
g¡¡:¡~~~
..,¡. -.:i ~ ~ ~
= a g¡ Mi $
-et ~ ~ t"i
~ '.:! ~ ~ ~
.o ..o \O "") vl
~:~~~
vl vi
.....;
sv) u)
sss e
v)v)v).,,)r,ri
&::; ~ ~ ~
~uiuiv)v)
21
'.:!~:'!: ~:!?~=~ lia;::¡¡::¡::¡;:!i ~l$i::;~~ ~¡:zi~s

(!A) 1opVU!WOU:ip pp pu11~q![ ~p sopuio
645
s e a s z ;;~~~¡;¡ ~ ::: ~ ~ 8
NNMMN
8 °''°.,.;..;~ M~~~~
°' S;..o ~ ir} ~

~
"l:f' .
!ij! ~~~~g
("'") ("'") ~ ~
8~~:§¡¡!;
NNNNN
¡:; ¡:¡ ¡;¡ ~ ::!
~NNNN
~ ::l g¡ i!l :::¡

MNNM~
~ :!: ~ ~ ~ ~~~~~ $ ;z ~ ;;t; ~

o\ ~ V'i _,..; ..f ..t tri~~~ MMMMM
..,. ..... ~~¡;; ~;;;S~~ ~S¡?:'~:;j! ~~¡gg~ ~~~~§ ~~~~~

NNMf-iM
~~~~°'
MMN...::f"::
N ~ & ~ ~ ~ e ..O V: ~ --:i- -rt:i C"\ ~ ~ tri t'"i t'"i ~ M M N M .... ""'
"'
~~~~=
'° .,.; ..
a:; r,
~8 ~
"'t ~ C""\ ~
:s ~f") ~~~~s
~~r""l~(""li
~gg~~tt
M~NMN
~ ~ ~ ~ r;;
NMMMM
~ !::; ~ ~ ~
~~~~M
i$~~~ ~~~N~ ::: g 8 8 8 ~i ~!; ~

tf'i ~ f""l tr. ('I'"¡ i:or) ~ ~ r""i ~ M~~~~ MNNMM
~~~;:~ ~~~~ª
~"t:t•..c:f..f.
2~i,cit<}.,}
~~~$~
M f"':i ~ ~ ~
~ !ij! ~ ~ i!l
f'f'i ~ (f) ~ ~
~
t'l"I
00
~
~ ~
t"'i C"'"i
g¡ b
ei
('11
gj ~ ~ ~
M C'i N r>l
8 ill ¡;!: ¡:: ~

..,¡. ~ r"i f'l'*i ~
~~~;~
("') ei ~ ~ ~
¡:.j
~
1!l ~ ~
~ ~ ('f'l
¡;;.¡
(")
~g::~:g
~ N <'i N M
.....
::! ~ ~ ~ ¡:: ~ ~ ~ ;;t; ~

~ 117 ~ ~ ~ tr'í Mm("!') ei
r.; ~ ~ r;; i ~ ¡;¡ ~ ::;

~.,,¡...,¡....,¡tri
<Ji f.Ooo:.'Z¡::G m~~Cl~
~MM~~
~~!:!~i
("")~~~N
~ 00 ro: 1.6 ,,.¡ ~ct)~l""}("I'\
!:;
~
~ ~
~~t'i~~
g:: ss ~ ~ ~ ~ ¡:;
rri rt"i ~ ~ ~
¡;::"' ;;i;
~~~~~
!:; $
~::i: .. s;;
~ --i ..r:f ..,¡ ..,,¡
E!i:3~~~
e ~ ~ ~ f'"i
~g¡ B:5 ~ :3 i¡¡ e:¡ ;;t;

V"¡ v) vi \r} V") ...¡ ..,,¡. ..,,¡ ~ ~
~~~~~
'1'i.,..:; ....¡. ~
¡::~~:3~ ~;;::!!~m
r: ~ ~ ro: r: i::~c'6...C
(Z~) JOP'llll!l"Onap jop pell<lQ!I op sop1llD
646
APÉNDICE 64 7
V. Curvas de operación característica para el análisis de varianza del modelo con efectos fijos•
1.00
.80
.70
.60
.60
.40
"'CD
·¡¡;
.30
':e8.
., .20
~
~
.
"'u .10
"'
'C .08
'C
.07
~ .06
'iS .05
i .04
.03
.02
.01
1.6 2 2.5 3 3.5 • (para u= .06)
41 (para a= .01)............. 2 3 4 5
1.00
.80
.70
.60
.50
.40
"'
·¡¡¡
CD .30
.oa.
:e .20
J
lB
..,
'CI
.10
.08
1.
.07
.06
.05
,Q
.04
~
.03
.02
2 3 111 (parall= .05)

'll(paraa= .01)+ 1 2 3 4 5
111 =grados de libertad del numerador, 112 =grados de libertad del denomin!ldor.
•Adaptada con permiso de Biometrika Tablesfor Statisticians, vol. 2, E.S. Pearson y H.O. Hartley, Cambridge
University Press, Cambridge
648 APÉNDICE
V. Curvas de operación característica para el análisis de varianza

del modelo con efectos fijos (continuación)
1.00 r~.rr,r,
.80 1.;,......+"'ll
.70
.60
.50
.40
.30
.10 1~IWt:W~:lF
.08 1lffilt\\'~C\ .'.....=*'i:\'~;+\\:;T~ttrt
.07 1-----fl\\tt-l~r-\-"'~
.061--------t\1f\\'\-\1t\\-'\-\,.;j--+-\--\-~'"*-\-T-"\-'\---Pl,.-----+---i
.05f------+-tt-i~~~~~~l-+-+-'"""1~~~-+--T--+~-----1-----1
.041------+-\\-\c\+~r\-\M\---\--\-~;--\--\-'~t-'l<--t---'t----+---i
.03~-----+--\J"-'-'""'~\-44---+..\--'l-+++4--++-+--+---+----+-----i
2 3 (parau= .01) 1 2 3 4 5
1.00..-------.-------.-----.,.-------.-------.-----,
.80
.70
.60
.50
.40
.30 1----''rW~~\d)<"=
1 ~~~~
"'
Q_
Q)
<;)
.10 1"""'~~ r-
~"' .08
"C .071-----\-\r\+~\-\-ir-\-+:.-+-\-+-+-~¡-\-f\--\-T-~-~-----+----1
:g"' .061------\-~.-\-lr\-\-\-\-++-~'""'""-\-\-tt-'r-;~-->¡--lf------+----1
:¡; .051------~f+-lr-H.-H-+--+t---<i-t---+-+-t-'...--.~r'<~t-'-t-'t-'------t----i
e"'
.J3
.041-------H"'"-'".\--\~.\--\--l--+4,.....\--+-+-tt--+-+-+---+-+-....,...------t----i
a,
.031-------ft-\\-'l-+\-+\-\--\-f+---++-'~t-\t;,-----,r-'c-"c-'tl-"-T----t------1
2 3 <l>(paraa= ,05)
<l>(parau= .01) 1 2 3 4 5
APÉNDICE 649
1.00
.80
.70
.80
.50
.40
"'
·¡¡;
CD
.30
~
z .20
"'._
..!!!
"'
15.
CD .10
.,,""' ·8ª
CD
.7
~ .06
:iS .05
E .04
.t .03
.02
2 3 4' (paraa= .05)

4'(paraa= .01) 1 2 3 4 5
1.00 r-----:--,-----~-=---""T""----,r----"'T'"--,
.80 lloi.::'+~
.70
.60
.50
.40
.301---"'~~~----~-~~~~~~~l------+-----I
:89 t____,rttt~~~=
.06 ttttttt~r't:~:>"'E=
.05 t+ttttttH::l"'.~I:=
.041-----+t-ti\-f\>llfl~~C:f"'::..&------'t-t:::t.t..-t-7~tr-\"~.-:-"""k;
.031------\-l~~~~:-4--------1l-1:+-\--"~rf-\-\--\---\-~
2 3 +4'(paraa= .06)
4'(paraa= .011 1 2 3 4
650 APÉNDICE

1.00.---------.-------.------r-------.-------.---~
.80 lo::---'-------+------"1Wll
.70
.60
.50
.40
.301~~~~"k++\'ltT"<l'lr""<'~~"Tl+l
.1 O t\"ttttttW\"'U'?''9='
.08 l\..l~AAWH:.ir'\,..9F
.07 1H'H.¡..\..\\~..q,4,,~
.06 1Hr+Hl+ll+to+::r'i"::=
.05 lHHl\\.\}0Ari
.04 1------+-H-+H+ll~Y"'H=
.OJf------jk-+\tt-\-:;""""""""""~:;._.;;.;.._
__ --ir+-+-+-+-+-+-H.--\~r--\---f_....,COL--t
2 3 cl> (para O:= .05)

<l>(parao:=.01)1 2 3 4
1.00
.80
.70
.60
.50
.40
"'
·¡¡¡
·oo.
O}
.30
:E
<I) .20
!'!
a"'
O}
o
"'
Q)
.10
"O
.08
al .07
~
.n .06
lllo .05
d: .04
.03
.02
2 3 _<l>(parao:=.05)
cl>(parao:=.01)1 2 3 4
APÉNDICE 651
VI.' Curvas de operación característica para el análisis de varianza
del modelo con efectos aleatorios"
1.00
.80._v, m 1
.•
,.

.70
"'
·¡¡;
:~
u• •'<;>,.
~c. .40
:.c .30
"'
.!!! .20 Q.

".>
la
., ~'3
".
15.
. 10
.08
.07 ~ ,,...
6~ v2
8
.
Q)
"O .06

"O 10
.05 1 / /v 20
lf1g ::::
~ .04 1 ..... ~
:s., .03
.e ~ r>
et .02
20 V
1
.01
10 30 50 70 90 110 130 150 170 190~ A (para a= .05)
Á(parao.= .01) .10 30 50 70 90 110 130 150 170 190
1.00
.80
.70
.60
.50
.40
~ .30
.oc.
:.e .20
"'
21.
"'tt
.
"., .10
"O .08
"i .07
~
.
.06
:s .05
.e
2 .04
a,
.03
.02
3 5 7 9 ,, 13 15 17 19 21 23 + ;\. (para a= .05)

A (para o.= .01) 1 3 5 7 9 11 13 16 17 19 21 23 25
"Reproducida con permiso de Engineering Statistics, Za. ed., A.H. Bowker y G.J. Lleberman, PrenticeHall,
Inc., Englewood Cliffs, NJ.
652 APÉNDICE
VI. Curvas de operación característica para el análisis de varianza del

modelo con efectos aleatorios (continuación)
1.00......::::.,.........~,.,.......,.
.80l'lk'++'
..
. 70
.60
.50
.40
.30
t~
. 10ttt
·ºª ttt
.07
.06 tttt
.05 t+
.04 t+
.03 >++
2 3 4 5 6 7 8 9 10 11 ._ A. (para a= .05)
~(para u= .01)_. 1 2 3 4 5 6 7 8 9 10 11 12 13
1.00 ,..,...:.0::..rrr..,.rri
.80 ,.......~+!'
.70
.60
.50
.40
"'
·¡¡;
.30
i
:e: .20
"'
.!l!
!.,
o . 1 o 1i''I\'
"'.,
o .081ift
o .07 1iH'tw.
]"' .06 1i+~
:e., .05 1t+..l(\W
..e
o .04 1t+~r.Y.~
d:
.031-----11-----1~--+~{(N<~~----1--~~lµ~~~~--3'~-+--+----I
2 3 4 5 6 7 8 .._A. (para U= .05)

A.(paraa=.01)..,._ 1 2 3 4 5 6 7 8 9 10 11 12
APÉNDICE 653
modelo con efectos aleatorios (continuación)
1.00 ........""T""".:.
.80
.70
.60
.so
.40
.30
.20
.1011
.oe 1+
.01----
.06+
.05 111
.04~++
.031t~
2 3 4 5 6 7~ A.(paraa= .05)
2 3 4 5 6 7 8 9 10
1.00 .. ....... ..

.80 i.r1:+++
.70
.60
.so
.40
.30
.20
.10
.08
.07
.061+
.05 1il~l\Wft'.ri
.04 1+l~~¡Q:::::.,,¡.c:::_
.03ll~M\,W!~t..4""7"'=t
2 3 4 5 6 1..A.(paraa=.01)
A.(paraa= .05) _. 1 2 3 4 5 6 7 8 9
654 APÉNDICE

modelo con efectos aleatorios (continuaci6n)
1.00 .,........,...... .. :. ........ ..,.,.,........,,...,........
.80
.70
.60
.50
AO
.30
.20
.10
.08 rHttM\1.tt---¡,..-
.07 1+\\\ ""'kW:+?-
.06 lH~~Ml""""7"
f
.05 ~~~~
.04
.03 1+\~.\W"'4;:.;
2 3 4 5 6 A.(paraa~ .05)
A. (para Q;= .01) _. 1 2 3 4 5 6 7 8
1.00
.80
.70
.60
.50
.40
"'
·¡¡¡
.30
i
:E .20
12....
~
~ .10
"'
"O .08
.07
~ .06
~ .05
..2!o .04
d:
.03
.02
2 3 4 5 6 . i\,(paraa= .01)
A.(para tt= .05)+ 1 2 3 4 5 6 7 8
APÉNDICE 655
VIL Rangos significativos para la prueba del rango múltiple de Duncan
10.91 (p, f)
p
f 2 3 4 5 6 7 8 9 10 20 so 100
l 90.0 90.0 90.0 90.0 90.0 90.0 90.0 90.0 90.0 90.0 90.0 90.0
2 14.0 14.0 14.0 14.0 14.0 14.0 14.0 14.0 14.0 14.0 14.0 14.0
3 8.26 8.5 8.6 8. 7 8.8 8.9 8.9 9.0 9.0 9.3 9.3 9.3
4 6~ 6.8 6.9 ~o 7.l 7.1 7.2 7.2 7.3 1.s rs 7.5
5 s. 70 5.96 6.11 6.18 6.26 6.33 6.40 6.44 6.5 6.8 6.8 6.8
6 5.24 S.51 5.6!1 S.13 S.81 5.88 5.95 6.00 6.0 6.3 6.3 6.3
7 4.95 S.22 5.37 S.45 5.53 5.61 !1.69 5.73 !1.8 6.0 6.0 6.0
8 4.74 5.00 S.14 5.23 5.32 5.40 5.47 5.51 5.5 5.8 5.8 S.8
9 4.60 4.86 4.99 5.08 5.17 5.25 5.32 S.36 5.4 S.7 S.1 5.7
10 4.48 4.73 4.88 4.96 5.06 S.13 5.20 5.24 5.28 5 . .55 5.55 5.5.5
11 4.39 4.63 4. 77 4.86 4.94 5.01 5.06 5.12 S.IS 5.39 5.39 5.39
12 4.32 4.55 4.68 4.76 4.84 4.92 06 5.02 S.01 5.26 S.26 5.26
13 4.26 4.48 4.62 4.69 4.74 4.84 4.88 4.94 4.98 5.IS .5.15 5.15
14 4.21 4.42 4.SS 4.63 4.70 4.78 4.83 4.87 4.91 ssn s.rn 5.07
15 4.17 4.37 4.SO 4.58 4.64 4.72 4.77 4.81 4.84 .5.00 5.00 5.00
16 4.13 4.34 4.45 4.54 4.60 4.67 4.n 4.76 4.79 4.94 4.94 4.94
17 4.10 4.30 4.41 4.SO 4.S6 4.63 4.68 4.73 4.75 4.89 4.39 4.89
18 4.07 4.27 4.38 4.46 4.53 4.59 4.64 4.68 4.71 4.85 4.85 4.8S
19 4.05 4.24 4.35 4.43 4.'° 4.56 4.61 4.64 4.67 4.82 4.82 4.82
20 4.02 4.22 4.33 4.40 4.47 4.53 4.58 4.61 4.65 4.79 4.79 4.79
30 3.89 4.06 4.16 4.22 4.32 4.36 4.41 4.45 4.48 4.6!1 4.71 4.71
40 3.82 3.99 4.10 4.17 4.24 4.30 4.34 4.37 . 4.41 4.59 4.69 4.69
60 3.76 3.92 4.03 4.12 4.17 4.23 4.Z7 4.31 4.34 4.53 4.66 4.66
100 3.71 3.86 3.98 4.06 4.11 4.17 4.21 4.25 4.29 4.48 4.64 4.65
00 3.64 3.80 3.90 3.98 4.04 . 4.09 4.14 4.17 4.20 4.41 4.60 4.68
f = grados de libertad
Reproducida con permiso de "Multiple Range and Multiple F 'Iests", D.B. Duncan, Biometrics,
vol. l, no. 1, pp, 1·42
T0.05 (p, f)
p
f 2 3 4 s 6 1 8 9 10 20 .so 100
1 18.0 18.0 18.0 18.0 18.0 18.0 18.0 18.0 18.0 18.0 18.0 18.0
2 6.09 6.09 6.09 6.09 6.09 6.09 6.09 6.09 6.09 6.09 6.09 6.09
3 4.50 4.50 4.50 4.SO 4.SO 4.SO 4.50 4.50 4.50 4.50 4.SO 4.50
4 3.93 4.01 4.02 4.02 4.02 4.02 4.02 4.02 4.02 4.02 4.02 4.02
s 3.64 3.74 3.79 3.83 3.83 3.83 3.83 3.83 3.83 3.83 3.83 3.83
6 3.46 3.58 3.64 3.68 3.68 3.68 3.68 3.68 3.68 3.68 3.68 3.68
7 3.35 3.47 354 3.58 3.60 3.61 3.61 3.61 3.61 3.61 3.61 3.61
8 3.26 3.39 3.47 3.S2 3.SS 3.56 3.56 3.56 3.56 3.56 3.S6 3.56
9 3.20 3.34 3.41 3.47 3 . .SO 3 . .52 3.52 3.S2 3.52 3~2 3~2 3~2
10 3.15 3.30 3.37 3.43 3.46 3.47 3A1 3.41 3.47 3.48 3.48 3.48
11 3.11 3.27 3.3S 3.39 3A3 3.44 3.45 3.46 3.46 3.48 3.48 3.48
12 3.08 3.23 3.33 3.36 3.40 3A2 3.44 3.44 3.46 3.48 3.48 3.48
13 3.06 3.21 3.30 3.35 3.38 3.41 3.42 3.44 3.4S 3.47 3.47 3A7
14 3.03 3.18 3.27 3.33 3.37 3.39 3.41 3.42 3.44 3A7 3.47 3.47
15 3.01 3.16 3.25 3.31 3.36 3.38 3.40 3.42 3.43 3.47 3.47 3.47
16 3.00 3.15 3.23 3.30 3.34 3.37 3.39 3.41 3.43 3.47 3.47 3.47
17 2.98 3.13 3.22 3.28 3.33 3.36 3.38 3.40 3.42 3.47 3.47 3.47
18 2.97 3.12 3.21 3.27 3.32 3.35 3.37 3.39 3.41 3.47 3.47 3.47
19 2.96 3.11 3.19 3.26 3.3) 3.35 3.37 3.39 3.41 3A7 3.47 3.47
20 2.9S 3.lO 3.18 3.25 3.30 3.34 3.36 3.38 3.40 3.47 3.47 3.47
30 2.89 3.04 3.12 3.20 3.25 3.29 3.32 3.35 3.37 3.47 3.47 3.47
40 2.86 3.01 3.10 3.17 3.22 3.27 3.30 3.33 3.35 3.47 3.47 3.47
60 2.83 as 3.08 3.14 3.20 3.24 3.28 3.31 3.33 3.47 3.48 3.48
100 2.80 2.95 3.05 3.12 3.18 3.22 3.26 3.29 3.32 3.47 3.53 3.S3
2.77 2.92 3.02 3.09 3.15 3.19 3.23 3.26 3.29 3.47 3.61 3.67
:i::28l;;~ ~~:g~~ ~ :9 ~ g:; ~
~ o\ a\ oc) oó ....: ....: ....: . . .: r: .....:....:.c>D.é
s.....:....:0'6..0
8 ;;: ~ ¡e
~:g~~~
o °' oO oó oci
~~~~~
r: . . .: ....: l'" .....:
~~!::;~~:e
'°'°'°"'viv)
c;os:;~~:!; 80!;;:¿~¡:::
....: ....: l'" r: ....: ....: \Ó .e) \Ó \Ó
'°s¡;;;~g!2..o
11"1\CNC\
N t'l r "" O\ ~ ~ ~ ?:l ~ ~~8~t:;;jt;
ó a\ oci oc) ....: ....: i: .....: .....: I" IÓ \Ó \Ó \O\Ól.cill"IV"l.,.;
:2 ; Ñ S! ~ ~~8~~~
'° ..o '° '°
~ ~ ~ ~ s:;
.....: ....: .....: ....: l'" IÓIÓ\Óll"lin.n
IÓ
°' O'i
~ N :g ::: 00
oó oci ....:
~~"'ª~
....:....:.....:r:..o
NMll"IOON
oc t IO 11'1 11"1
\Ó \Ó \Ó '° ..o ~ :!; ~
..¿..¿,n.,.;.,.;.,.;
g: ~ ~
oc;g;sr:: ~~s~~
o\a\oóocir'. .....:.....:..:..0..0 \Ó '°
~ ~ §; ~ :g ~
ll"Í .,.; .,..; .,..;
~ o ~ to :;¡ ~
:2~;::;;;:@
'°
IOt'",.....1""\C IDtOrt'lt
O'ioooór'.r:
,..., o
..: r:....: ..c ..c
00 r
'°
\011"111"\'<l't'l
\Ó ,¿ \Ó
.,¿..¿.,...,.;<n<n
~¡:::oo~~ ~ 8 ~ :::: ~ ~:::~~g¡

"' oO oc) r: r: i.'.r'...0D..C ..¿.,.;.,.;.,.,<n<n
\O ID '<t
00
~ :g ¡;; ~ ~ ::: ~ ~ $ :g :ff~;;=;~°'
..o 8~~~~8
..., C'i....:
V"l ('() flll"(
ri o
...!
a\o0o0....:.....: ....:..0.00D \Ó \Ó IÓ \Ó \Ó .,.; 11"1 .,..; <n .,..
N
sO'ioci....:..:.....:
~ ¡:;; ~ g::;;;ro;;i;:; :qÑ~:!;g; ~ ~ @ ~ g :e
'° '°
Ñ
'° '° '° ..e IÓ \Ó -.a \Ó
tri vi v-i v.; vi i.r)
V r--. M ~...,.
¡;;; ~ ~ ~ 8 00 ~ ~ ~
..e '° ..e ..e
OOIOll"l'<t.., ~11"1~88\ Ñ~
oóoórr'.r'. IÓ \ÓIÓ\Ó\Óll"Í .,..; .,..; .,.; <n ll"Í ll"Í
¡¡;~~"'&;
oó .....: ....: ....: IÓ
fO;;:ji;;~ID
IÓ \O ICÍ \Ó '° ..oss a s s \Ó ll"Í .,..; .,..;
$ ~ ~ ~ S:1
.,.;.n.,.;.,.;.,.;.,r
&
~ ~ ~ ;;: ro ~~'.:::~g::
o0.....:....:..o..o '° \Ó ICÍ \Ó .,..;
~~~~$
.,..; 11"1 11"1.,...,..;
~ ~
V"ii.riv-i~"1~
~ tf) ~ ~
IDNIDC\
.... ~..01.Cioriv).,i
s ~ gg ~ ~~~:g;¡::; ::;;~:::g::¡;;;~
1() .,.; .,.. .,..; .,..; ,,..;.,.;.,.;..,¡..,,=..:¡:
\O ~~;!cioó
11"1
t""'10.~
~~rrio\ao
ID N
~º~~~
..:....:..00..0
:;; ~ ~ ~ :g
.,..; .,..; .,..; .,..; .,.;
~~~8
'l-lV1tr;1.f".ll(')
gi ~8~6;.l¡::::@
<nvi..,,=..:t«t--.i
s;;i;~~r.:
. . : ..o ..o .,. ; .,. ; ~ ~ ~ ~ ;!:¡
.,..; .,.; .,..; .,.. .,.;
°':!g;88
.,..; .,.; .,..; vi .,.;
°'-i ~..,f g @ ~ ~
.,¡. .,¡. .,¡. ..,,:
...,
......
o \O
"".,.,o\ooó..O
,.....
~ ~ ~.,. ; :2.,. ; ~.,. ; Ñ
S\ ..o ~~~g:;g;¡ ~ ~ g
.,. ; ir) .,.; .,¡. .,¡. ..,,: -i .,¡. ..,,:
::; s 8 8 8
ro.,¡. ~..,,: ;;!; ~ ~
-i-i-.i..j-..f..:t
~ ~ ~ ¡e ~ ~
~ g N
~~~@~
.,.; .,¡. .,¡. ' <fi
656
~:e!;;~!;¡: ~ ~ ~ ~ ¡::
r: r'. loÓ IÓ IÓ .,.; .,.; .,.¡ V) .,.¡
Ñ !!:l ~ ~ ~ ~ ~ rt ~ ~
.,.¡.,.¡.,;.,.¡"1
:g ~ ~ ~ ~ S;
.,.¡.,;.,.¡ll"l"1.,;
..Oóc1n.,.¡
s.¿,¿.¿.,.¡.,.¡
sssa ~~$~~
.,.¡.,.,.,.;.,.;.,.,
~ ~ ~ :!:! ~ ~
.,.¡ .,; .,.; .,; 11"1 .,;
~._. .: ~'° ..o:a ;..o ~\() :! g ~ ~ ~ ~~~~~

.,..; .,.¡
o.¿.,.;.,.¡.,.
;~~-8~
.,.¡ .,.¡ .,.¡ .,.¡ .,.¡ .,.¡.,.;.,;
V)
~~~~~
"° .,.; .,..¡ .,.¡ .,.,
~~~~~ ~~~~~ s::.,..¡ :g ~ ~ ~ ~Ñ ~~~

._. . : .¿ "° ..o .¿ .,.¡V'l.,.;.,.;V'l .,.¡ .,.¡ V'l .,., .,.¡.,.¡.,.¡.,.,.q."<t
~:2~2:8
t'....0cci.0
s.,..¡.,;.,.¡.,).,.¡
ssss ~ !;¡: ~ ~ ~
.,.; .,.; .,..; .,.¡ .,.¡
:q!!):gg~~
.,.¡.,..; .,.¡.,;.,; .....
e; ~ .,.¡
~ .,.;
~ ~.,.¡ ~~~~~ ~ ~ ~ :i& re ~
.,.¡ V) .,.; .,.¡ .,.¡.,.; .,.¡ .,.¡.,.;.,;.,;.,;"<t
~ ~ ~ ~ &l ~ ;:;; Ñ ~ ~ ~8*;;or:'.~

.,.; .,..; .,..; .,.¡ .,.¡ .,.¡ .,.; .,; .,; .,; .,;
c.O.O.n.,.;
~ ~ :g ~ ~ ~r:;~::?;::
c..0..0vi.n .,.; vi .,.¡ .,.¡ .,..;
'° '° .,.; tt ~

~ !l ~
.,.¡ .,.,
~.,.¡ ~ ~.,.¡.,.,.,.;
ll"l
:q ~ .vi.,.¡.,.¡.,.¡.,.j
,., ;: : ; s ~o ~ ~ i! :a ~
.,; .,; .,; .,; .,; .
~
~ g; ~ ~ ~ ~ Ñ 2: :! ~
>évi.,.;.,.;.,, vivivi.,.;ori
~i~~~ ~ ~ CQ g: ;
.¿ .,..; vi .,..; .,.¡ vi .,..; "' .,; .,;
"'
8
§
8 ~ ~ ~ ~ ~
.n ~ :l8 ~ ~
o. ~~~~N ;;:;
.n.n.n.,.;.,.; "<t .,; .,; .,; .,; .,; ..,¡. .,; .,; .,;
""V'ltN
IC...,_00\ i;;j~$:$~
.,.¡ .,.; .,.¡ .,.; .,; .,; .,; .,; .,; .,;

O\""""' ..... ~
;:;;8~;e~ ;.t;;;:; ~ ~ ~
"'
N
._. . : o ._. . : ..o .,... .,.; .n .,; .,; .,;
O<¡ "' <'"> '(!
.,; .,; .,; "<t •
.
""'
lS q 8 ~ ~ ~ et ~ ~ $ ~
.,; .,; ...; ""'
...; ...¡ ...¡ ""' ...¡ ...¡
;,t;o~~:ig
.,; .,; .,; ....; ,..¡
~~R~~
....; ...¡ ..., .... ....;
.,.,N_0\00
\O IC >O V'l
...; ,..¡ ...¡ ...¡ ...¡
11") ¡;:¡ ~ ~ ~ ~ ~
...; ""'...,...; ...¡ ...¡
~~~~~ 8 ~ ¡; ~ ~
,..¡ ,..¡ ,...¡....; ,..¡ ....; C'i N N N
~~~~ \01"~2:~ ~~~~~8

657
658 APÉNDICE
IX. Valores críticos para la prueba de Dunnett para comparar tratamientos con un control
do.os(a 1, f)
Comparaciones de dos colas
a 1 =número de medias de tratamientos (sin incluir el control)
f 1 2 3 4 5 6 7 8 9
5 2.57 3.03 3.29 3.48 3.62 3.73 3.82 3.90 3.97
6 2.45 2.86 3.10 3.26 3.39 3.49 3.57 3.64 3.71
7 2.36 2.75 2.97 3.12 3.24 3.33 3.41 3.47 3.53
8 2.31 2.67 2.88 3.02 3.13 3.22 3.29 3.35 3.41
9 2.26 2.61 2.81 2.95 3.05 3.14 3.20 3.26 3.32
10 2.23 2.57 2.76 2.89 2.99 3.07 3.14 3.19 3.24
11 2.20 2.53 2.72 2.84 2.94 3.02 3.08 3.14 3.19
12 2.18 2.50 2.68 2.81 2.90 2.98 3.04 3.09 3.14
13 2.16 2.48 2.65 2.78 2.87 2.94 3.00 3.06 3.10
14 2.14 2.46 2.63 2.75 2.84 2.91 2.97 3.02 3.07
15 2.13 2.44 2.61 2.73 2.82 2.89 2.95 3.00 3.04
16 2.12 2.42 2.59 2.71 2:80 2.87 2.92 2.97 3.02
17 2.11 2.41 2.58 2.69 2.78 2.85 2.90 2.95 3.00
18 2.10 2.40 2.56 2.68 2.76 2.83 2.89 2.94 2.98
19 2.09 2.39 2.55 2.66 2.75 2.81 2.87 2.92 2.96
20 2.09 2.38 2.54 2.65 2.73 2.80 2.86 2.90 2.95
24 2.06 2.35 2.51 2.61 2.70 2.76 2.81 2.86 2.90
30 2.04 2.32 2.47 2.58' 2.66 2.72 2.77 2.82 2.86
40 2.02 2.29 2.44 2.54 2.62 2.68 2.73 2.77 2.81
60 2.00 2.27 2.41 2.51 2.58 2.64 2.69 2.73 2.77
120 1.98 2.24 2.38 2.47 2.55 2.60 2.65 2.69 2.73
00 1.96 2.21 2.35 2.44 2.51 2.57 2.61 2.65 2.69
f = grados de libertad
"Reproducída con permiso de C.W. Dunnett, "New Tablesfor Multiple Comparison with a Control",
Biometrics, vol. 20, no. 3, y de C.W. Dunnett, "A Multiple ComparisonProcedure for Cornparing Severa!
Treatmentswith a Control", Ioumal of the American Statistical Association, vol. 50
APÉNDICE 659
IX. Valores críticos para la prueba de Dunnett para comparar tratamientos con un control
d0•01 (a 1, f)
Comparaciones de dos colas (continuación)
a - 1 =número de medias de tratamientos (sin incluir el control)
f 2 3 4 5 6 7 8 9
s 4.03 4.63 4.98 S.22 5.41 S.56 S.69 5.80 S.89
6 3.71 4.21 4.51 4.71 4.87 5.00 5.10 5.20 5.28
7 3.50 3.9S 4.21 4.39 4.53 4.64 4.74 4.82 4.89
8 3.36 s.n 4.00 4.17 4.29 4.40 4.48 4.56 4.62 .
9 3.25 3.63 3.85 4.01 4.12 4.22 4.30 4.37 4.43
10 3.17 3.S3 3.74 3.88 3.99 4.08 4.16 4.22 4.28

11 3.11 3.4S 3.65 3.79 3.89 3.98 4.0S 4.11 4.16
12 3.0S 3.39 3.58 3.71 3.81 3.89 3.96 4.02 4.07
13 3.01 3.33 3.S2 3.65 3.74 3.82 3.89 3.94 3.99
14 2.98 3.29 3.47 3.59 3.69 3.76 3.83 3.88 3.93
IS 2.95 3.2S 3.43 3..55 3.64 3.71 3.78 3.83 3.88

16 2.92 3.22 3.39 3.Sl 3.60 3.67 3.73 3.78 3.83
17 2.90 3.19 3.36 3.47 3.56 3.63 3.69 3.74 3.79
18 2.88 3.17 3.33 3.44 3.53 3.60 3.66 3.71 3.75
19 2.86 3.IS 3.31 3.42 3.50 3.57 3.63 3.68 3.72
20 2-SS 3.13 3.29 3.40 3.48 3.55 3.60 3.65 3.69

24 2.80 3.07 3.22 3.32 3.40 3.47 3..52 3.57 3.61
30 2.7S 3.01 3.IS 3.2S 3.33 3.39 3.44 3.49 3.S2
40 2.70 2.95 3.09 3.19 3.26 3.32 3.37 3.41 3.44
60 2.66 2.90 3.03 3.12 3.19 3.2S 3.29 3.33 3.37
120 2.62 2.8S 2.97 3.06. 3.12 3.18 3.22 3.26 3.29
2.58 2.79 2.92 3.00 3.06 3.11 3.15 3.19 3.22
do.os<ª 1, f)
Comparaciones de una cola
a 1 =número de medias de tratamientos (sin incluir el control)
f 2 3 4 5 6 7 8 9
s 2.02 2.44 2.68 2.8S 2.98 3.08 3.16 3.24 3.30
6 l.94 2.34 2.!16 2.71 2.83 2.92 3.00 3.07 3.1.2
7 l.89 2.27 2.48 2.62 2.73 2.82 2.89 2.95 3.01
8 l.86 2.22 2.42 2.5s 2.66 2.74 2.81 2.87 2.92
9 1.83 2.18 2.37 2.SO 2.60 2.68 2.75 2.81 2.86
10 1.81 2.15 2.34 2.47 2.56 2.64 2.70 2.76 2.81
11 l.80 2.13 2.31 2.44 2..53 ,2.60 2.67 2.72 2.77
12 1.78 2.11 2.29 2.41 2.50 2.58 2.64 2.69 2.74
13 1.n 2.09 2.27 2.39 2.48 2.s5 2.61 2.66 2.71
14 1.76 2.08 2.2S 2.37 2.46 2.53 2.S9 2.64 2.69
IS 1.75 2.07 2.24 2.36 2.44 2.51 2.57 2.62 2.67
16 l.75 2.06 2.23 2.34 2.43 2.SO 2.56 2.61 2.65
17 l.74 2.05 2.22 2.33 2.42 2.49 2.S4 2.59 2.64
18 1.73 2.04 2.21 2.32 2.41 2.48 2.S3 2.58 2.62
19 1.73 2.03 2.20 2.31 2.40 2.47 2.52 2.57 2.61
20 1.72 2.03 2.19 2.30 2.39 2.46 2.Sl 2.56 2.60
24 1.71 2.01 2.17 2.28 2.36 2.43 2.48 2.53 2.57
30 1.70 1.99 2.15 2.25 2.33 2.40 2.45 2.SO 2.54
40 1.68 1.97 2.13 2.23 2.31 2.37 2.42 2.47 2.51
60 l.67 1.95 2.10 2.21 2.28 2.35 2.39 2.44 2.48
120 1.66 1.93 2.08 2.18 2.26 2.32 2.37 2.41 2.45
1.64 1.92 2.06 2.16 2.23 2.29 2.34 2.38 2.42
660 APÉNDICE
lX. Valores críticos para la prueba de Dunnett para comparar tratamientos con un control
do.01 (a 1, f)
Comparaciones de una cola (continuación)
a 1 = número de medias de tratamientos (sin incluir el control)
f 2 3 4 5 6 7 8 9
5 3.37 3.90 4.21 4.43 4.60 4.73 4.85 4.94 5.03
6 3.14 3.61 3.88 4.07 4.21 4.33 4.43 4.51 4.59
7 3.00 3.42 3.66 3.83 3.96 4.07 4.15 4.23 4.30
8 2.90 3.29 3.51 3.67 3.79 3.88 3.96 4.03 4.09
9 2.82 3.19 3.40 3.55 3.66 3.75 3.82 3.89 3.94
10 2.76 3.11 3.31 3.45 3.56 3.64 3.71 3.78 3.83
11 2.72 3.06 3.25 3.38 3.48 3.56 3.63 3.69 3.74
12 2.68 3.01 3.19 3.32 3.42 3.50 3.56 3.62 3.67
13 2.65 2.97 3.15 3.27 3.37 3.44 3.51 3.56 3.61
14 2.62 2.94 3.11 3.23 3.32 3.40 3.46 3.51 3.56
15 2.60 2.91 3.08 3.20 3.29 3.36 3.42 3.47 3.52
16 2.58 2.88 3.05 3.17 3.26 3.33 3.39 3.44 3.48
17 2.57 2.86 3.03 3.14 3.23 3.30 3.36 3.41 3.45
18 2.55 2.84 3.01 3.12 3.21 3.27 3.33 3.38 3.42
19 2.54 2.83 2.99 3.10 3.18 3.25 3.31 3.36 3.40
20 2.53 2.81 2.97 3.08 3.17 3.23 3.29 3.34 3.38
24 2.49 2.77 2.92 3.03 3.11 3.17 3.22 3.27 3.31
30 2.46 2.72 2.87 2.97 3.05 3.11 3.16 3.21 3.24
40 2.42 2.68 2.82 2.92 2.99 3.05 3.10 3.14 3.18
60 2.39 2.64 2.78 2.87 2.94 3.00 3.04 3.08 3.12
120 2.36 2.60 2.73 2.82 2.89 2.94 2.99 3.03 3.06
00 2.33 2.56 2.68 2.77 2.84 2.89 2.93 2.97 3.00
o
'O
'O
'O '<t 1~

e:; 1
onOOVl
í 1
.....1 """"
1 1 .....,1
rt'I N N r;
1 1
'O
'<t r
-N
N
~
11 c:(·ír:'<t¡¡.,.., 1
i;:
e
00
r:( ""
1
V) ..... Q
1 1 r
Q
e

o
N N ... o

1
o V)
1
O'I .,..
1
V)
1
= V)
1
N
1
Q
r:i:'lí'í
N<"l'<t'Vl'Ot'"OOO'IO

661
662 APÉNDICE
XL Números aleatorios
10480 15011 01536 02011 87647 91646 69179 14194 62590

22368 46573 25595 85393 30995 89198 27982 53402 93965
24130 48360 22527 97265 76393 64809 15179 24830 49340
42167 93093 06243 61680 07856 16376 39440 53537 71341
37570 39975 81837 16656 06121 91782 60468 81305 49684
77921 06907 11008 42751 27756 53498 18602 70659 90655
99562 72905 56420 69994 98872 31016 71194 18738 44013
96301 91977 05463 07972 18876 20922 94595 56869 69014
89579 14342 63661 10281 17453 18103 57740 84378 25331
85475 36857 53342 53988 53060 59533 38867 62300 08158
28918 69578 88231 33276 70997 79936 56865 05859 90106
63553 40961 48235 03427 49626 69445 18663 72695 52180
09429 93969 52636 92737 88974 33488 36320 17617 30015
10365 61129 87529 85689 48237 52267 67689 93394 01511
07119 97336 71048 08178 77233 13976 47564 81056 97735
51085 12765 51821 51259 77452 16308 60756 92144 49442
02368 21382 52404 60268 89368 19885 55322 44819 01188
01011 54092 33362 94904 31273 04146 18594 29852 71585
52162 53916 46369 58586 23216 14513 83149 98736 23495
07056 97628 33787 09998· 42698 06691 76988 13602 51851
48663 91245 85828 14346 09172 30168 90229 04734 59193
54164 58492 22421 74103 47070 25306 76468 26384 58151
32639 32363 05597 24200 13363 38005 94342 28728 35806
29334 27001 87637 87308 58731 00256 45834 15398 46557
02488 33062 28834 07351 19731 92420 60952 61280 50001
81525 72295 04839 96423 24878 82651 66566 14778 76797
29676 20591 68086 26432 46901 20849 89768 81536 86645
00742 57392 39064 66432 84673 40027 32832 61362 98947
05366 04213 25669 26422 44407 44048 37937 63904 45766
91921 26418 64117 94305 26766 25940 39972 22209 71500
00582 04711 87917 77341 42206 35126 74087 99547 81817
00725 69884 62797 56170 86324 88072 76222 36086 84637
69011 65795 95876 55293 18988 27354 26575 08625 40801
25976 57948 29888 88604 67917 48708 18912 82271 65424
09763 83473 73577 12908 30883 18317 28290 35797 05998
91567 42595 27958 30134 04024 86385 29880 99730 55536
17955 56349 90999 49127 20044 59931 06115 20542 18059
46503 18584 18845 49618 02304 51038 20655 58727 28168
92157 89634 94824 78171 84610 82834 09922 25417 44137
14577 62765 35605 81263 39667 47358 56873 56307 67607
"Reproducida con permiso de Probability ami Statistics in Engineering and Management Science, 3a. ed., W.W.
Hines y D.C. Montgomery, Wiley, Nueva York
APÉNDICE 663
XII. Relaciones de alias para diseños factoriales fraccionados 2k-p con k S 15 y n :S 64

Diseños con 3 factores
a) 231; fracción 1/2 de Resolución m
3 factores en 4 corridas Generadores del diseño
C=AB
Relación de definición: l = ABC
Alias
A=BC
B=AC
C=AB
b) 241; fracción 1/2 de Resolución IV
D=ABC
Relación de definición: l = ABCD
Alias
A=BCD
B=ACD
C=ABD
D:ABC
AB=CD
AC=BD
AD=BC
Diseños ron 5 factores
e) 2S2; fracción 1/4 de Resolución m
D:AB E=AC
Relación de definición: I = ABD = ACE = BCDE
Alias
A=BD=CE
B=AD=CDE
C=AE=BDE
D=AB=BCE
E=AC=BCD
BC=DE=ACD=ABE
CD= BE= ABC = ADE
d) 2S1; fracción 1/2 de Resolución V
E=ABCD
Relación de definición: I ABCDE =
Alias
Cada efecto principal es alias de una sola interacción de 4 factores
AB=CDE BD=ACE
AC=BDE BE=ACD
AD==BCE CD=-ABE
AE=BCD CE=ABD
BC=ADE DE=ABC
2 bloques de 8:
s ~
=
e :s:=
·g .e"'
'a =
~"' &!"'
~
~
i 11
fZ
u
11
~
a§ ~
~
11
~ 11
e ~
'°VI u
~ ~~~ ~ ~
~
¡:: 11 11
ei:r¡
11 11 11 Q:j
11 ~
"'
>
b ssu ~~~~~tJS 11
VI o ~ Q:j i:r¡~~ o
11 11 11 11 11 11 11 b~
~
i::: ·=o
"'
;a
11 11
~~ ~¡::¡~
11 11 11 •S::
(!)
"'
;a
A
~t3
11
~~~~~~iis 11
N
,,,8
1 o
"O
u~ 11 11 11
~ 11 ·""~i:r¡i:r¡
"'juuk¡
o
"O
11 ~
~u~~ "'I
~~
i:riu
e
~
.g ...."'
o "'~ "'....
(!) 11
]5 ~ ~ ~~e
11 11
o
] ~~ ~ 11 11 11 o
"'
i:::
·ao
"O
"'
.... ~¡¿
:s
~~~~~~b~
CiUi:ri~
~
~
o= ~·2<i:lo
(!)
ID 11 00
¡;j 11 11 11 11 11 11 11 11 11
., §
(!) (!)
<J:!
ca·¡:::"' o"'
o ~~
11
~~~b
~ ~ "O
~~~b~S~~
i:r¡~Q:¡CJ~
O:)
"O
~;:::!
o ·="'
(!) ..... 11 11 11 11 (!)
"O 11 11 11 11 11 11 11 11 C"
o
:a
s ·e=
~ ~~~~ o ~o:iUCit.tl~CiA
~ ¡¿ uui:r¡i:r¡ N
B ~~
.,
,¡::: ~ 11 11 11 11 o"'
~ ] tlbiis~ ~
""'...."' ~ 11 11 11 11
"'
o.
(!)
"O Q~~i:r¡
i:r¡ .:i:.:i:
ca~ ]= 11 11 11 11
~Q:¡UQ
~
.,"' ~
i:::
.:2
¡;j
~
...."'
(!)
"'e
~ ] B
~
ID »o
(!) O)
"O "O
e!?.
..... :::!:.
,..... "'
,§ ~ =.@·s
e·e
·
""oo
"O c
·~ 8
J:l
,;,•00 .. '°
.J: ,.....
~,....._d~ ~d~
~
"'
664
"'o
•d
u
s"'
e
'O
"' ·a
j
r
·a
l::l
u
u
"O
"O
~ s::
IO 'O
..... ·~
.... ·e
~~ ~
]s
,. IO
;r ';
Nu
'""'
1:!
665
VI
666
~ ::r:
~~
11 ~
::r:::i::::r:::z::::i::;x::~
Ql¡;¡~Ut:!)~¡¡;,
~ ~
t311 11 11 11 11 11 11 11
(.:) ~
11
8~~8~~tl
11 11 11 11 11 11 11
~~
ct:i
11 11
lil~ti~S~~
11 11 11 11 11 11 11
sc ~ ~~~~~~~
~~
11
~
ct:i ~
::r: 11 11 11
o (.:) ::r: ~~~~~~~~
"'e
~¡¡;¡Quct:i""!
811
~~~e
•c::l uU e 11 11 11 11 11 11 11 11
::r:tEa:;::z::~15;x::t:!)
.....~ 'O 11 11 11
tluct:ie3CiCi~~ ~
00 'O(.:)~ ;x:: 11
"'
8 ~ ~~
~
~
~111 11 11 11 ti 11 11 11
~~~~tltl~2 ~
,g"' ~ ~ 11 11 ~ "l:!ct:iuu 00
.~ ~ 11 ~ ~
11 11 11 11 11 11 11 11 ~
e º~u
o
u
"I:! ~
8 11 11
~~~~~§~~ o!
11 11 11 11 11 11 11 11
ct:i~ ::z:: li
118 t3
~ct:i "I:!
88~~~2~ti
ct:¡"I:! ct:¡ct:jct:¡
N
11 11 11 11 11 11 11 11 11 11
......
e: ~~~~~~~~
11 11 ti 11 11 11 11 11
~
;§ ~~~t388~~
UUct:ict:ict:i"I:!
~ 11 11 11 11 11 il 11 11
~ "l:!ct:iUQ~~(.:)::t:
i
~

........
667
'
1
668
669
VI
670
671

l/"\
672
a
;¡=w
!
~ ~ª~ s,
~
!"'
~
11 ~~¡¿
u ~:.::~n~
o ::i::Qil<
~ .._c:::iut3 11
11 lt.l 11 11 .... il<
~~t.. ll~il<~~
~ ~t3~l!i~
~ 11Q11 t¡ul§~U
11 ~
n ~uc:s~~~~ Qil<11
~~~....
~ r..iu 1111u5:!
Q u 11 ;:¡!'.~il<~c.:J
u 11 ~~:t:ít::i::
~~[iu~n&S~S
'"1 ti~
11 11
~
11
~
11
11 ~ C)....,c::¡:O::CCI~ ~
...,
11
11f¿~c.:J11C!:í11
'"1 ~il<
~¡¿~~~~~ ~
g ,g Q t:i ~S!~~~~
11 11 11 11 11 11 11
~t:l28~~t:i
~
11
CQ
~ ~ ~~~~~ 118112 11 11 11 11 11 11 11 11
~
o o o:\ 11 Cj~~~~t:l:i
11
...... "C:X:":i::t:J C!JllC!:í11 ~~~~~~s~ s
i::I ~ c.:Je,:,~ llsil<~il< ~111111111111111 11
8
"'
o
,g5Su11~o:\~11~
e11) ~ ~11 ~ts~ il<11 ~~~
.... ~~~~~~ e
~
e ¡;¡.;
•i::I
11 .... ;i::CQS¡¡; 11 tjS óci
11)
.l"!l
Q o C!J'"l~!~~il<~t:l:i ~~~~~~~~ ~
i::¡~'l:i¡;¡.;11c:Q~Jlll 11 JI 11 11 11 11 11 11 ~
:::i
u1111t:J¡:a11uil<~
o:\ ~ ;?:: o:\ il< CQ !S ~ts:t:~~~Q:ltl C'
o
11Ab11~¡:s 11~~
11 11 11 11 11 11 11 11 :eN
~ ~ ~t".CCluil< 11 ~ "'l:!o:\UC¡~~t:l:t;
u1111~~~~~n
~¡.:.¡~ 11 JIQ ~
U ~~lt.li1<UQ5:j
JI~ Sc::i~ti~~r..i
~ 1111111111JI1111
.....
"'~o
,§
] ·o
o...... ;§
11)
~ "C
11)
"C
! i::I
i::I "'
...... e
e "C
cu ·~
·g·e 'ü
e:::
cu 8
"'.=. \()
!~ .....i::I
N 11)
;::
673
~
.§
·e
•
~
"'
,.
,§
·~
·a
!::z
VI
¡¡::
.,..,;;...
....
VI
..1(
~
8
~
"'
~
§
·e
.s
"'u
711
·e:
j
"'o
•l'l
u
:6
~
Q,,
~
~
674
675
=
;s
.e"" ~ ~ ~
1i
~ ~ tJ u~~~
..., ~ Q:)s;a 11 ~ ...
s~ll ll:J:;~Q:)t:l
~ 11Ei:j~ :;¡ ~Q:i:;llQ:)
? ~u::r:: ~ c:;,~CJ~ 11
:siu ::t::~CJ N~ ~ s;3
~
·l§ s
.,.,
~
11 e:;, ~
~~~11~~~
~~Q;:;
11~~11¡:.:¡c::i
~~~~~
QCJ 11 11 CJ 11 A~
i:::
Cl u ¡:.:¡ Ui:.:; 11u..,N .._ u
~ ~ 11 11 11 11..,~Q:)~t§~=H~~~ 11
. .¡ ~
'<!"
"°VI 11~~~~~~~~~~~~11~~~
~UCjf!¡CJ 11 ~Cj 11 tJ~~~s~
i:::
~ ~11A11bU~~u~~i:t:¡11CJui:.:;c:;,
"'
,....., c:;,U~~~~(.511
11~~.._
Cjll...:¡bi:t:¡~¡:.:¡
~~11.._N~~llQ:)Q
~~iE
UQ ~~~
VI 11 11 11 11 11 11
.;¿ ~ t:l ¡:.:¡ 11 11 11 u::r::...iSc::ic::i 11 ~ 11 11
11 Q[i;~~~CjCj~~~ ::r:~~ CJc:;,CJ::t::::C:~c:;, ~
8
'i'.
s~~~Cj~~ll~b11~~~füt3~
~ r,:., e:., 11 ~ 11 ¡_.,;:¡~Ui:t:i...:¡ 11 ~U¡_.,;:¡CJ
i:t:ie:.,Qi:t:¡Cj~¡:.:¡
11 11 11 11 11 11 11
11
~ ~Q...,A~i:t:i..,..~ll:J:: llA~~A ~t:l~8~~ti ~
"'o "' o 11 11[¿~CJ11 (.!i 11 ...;ifü~...:¡U U 11
'"O
<!)
11 11 11 11 11 11 11
·~ ..., ~ ::t::A 11 ~~i:J~~u¡:.:¡:tj 11 11 11 ~
"'i:lo ~.s ;a ¡:.:¡CjU!"". :J::i:t:i::X::All 11C!l~~~11 ~~~~~s~ ~
11
:g ~
~
~¡...,~...¡~~~~
,....., Q ~~~ 118112~::E~Sc.::i::r:t3~ 11 11 11 11 11 11 11
,....., u
.J:l i:l "' Q:¡ 11 i:.:;~~~;:;i:c:i c.::ie5 11 QCJu~ Q:¡
ca"' o"'
O)
·e
c.>
o
2
~ 11 11 ::t::t:J Cj 11 (.:; 11 11 ~U...:¡~ 11 11
.g ::r: c.::i~ 11 s~~t><..,:¡ ~~ 11 ~~~
~
11
•i:l ~Au~11~Q:)~11~2~11~~~sQ
B
~ Q
"'
<!)
~U~n~~ll~~~ll~~Q.._~~~
O ~ ~ ~i:t:iA~ 11¡;jQ...:¡~~11 ~u 11 11
tF~ ~ t5 crl ::E~~
11 11 11 11 11 11 11 11
¿¿
<1)
"O
"' "'
o
•d
<!)
11 ¡:.:¡ ~ 11 U¡::¡ u~~u~...:iu
CJ ~~~A~~
~ i:c:i~ 11Q:¡~11 11s~11 ~~~~~
11 ~~
~~·~~tJ~~~ ~
o
;a"' A 11 11t:J~11u~~1111NA11iEu~
11 11 11 11 11 11 11 11
:eN
"'o.
..... ~ ... ~i:c:i~~i:c:i~~...:¡...:i~~~~~u ~~~t:)2f;;;~ti
"' 11 S ti 11 '::\~ 11 Q:¡~~iEu .._ 11 11 11 11 11 11 11 11 11 11
~i:t:ií...lQ~e:..c::i::r:
"'
~"'
.._ i:c:i ~~~u~ 11 ~ 11 11 11 Q 11 ~
<1)
11 11
U~::t'.:11
fil~~~
llQ ~11~
11 ..,:¡~;::J 11 ~~Eti
;:¡::~~
'"O
"'i::l
<1)
"'
~~~~~~~~~~~S~~~Stl
11 UQ í...l ~i:t:i Q:)i:t:¡~ ~et)
·8 B
<1)
..... ¡:.:¡ 11 11 11 ti 11 11 11 11 11 11 11 11 11 11 11 11
.....
"'
~ ~
,....., d
a
,....., o
O) ·o
"O ]
~
,.....,
O)
"O
~ O)
'"O
d ~
·e·e
'º"O
~
~8• "\O ~
'I
::: d
N <U
,._
::!
676
677
678 APÉNDICE
XII. Relaciones de alias para diseños factoriales fraccionados 2"-P con k :s; 15 y n :s; 64 (continuación)
w) 212ll; fracción 1/256 de 12 factores Resolución m
en 16 corridas
Generadores del diseiío
E=ABC F=ABD G=ACD H=BCD
J=ABCD K=AB L=AC M=AD
Alias
A= HJ = BK = CL = DM
B = GJ = AK =EL = FM
C = FJ = EK =AL= GM
D=El =FK =GL =AM
E= DI= CK = BL = HM
F=G=DK=HL=BM
G = BJ = HK = DL =CM
H =Al= GK = FL = EM
I =DE= CF = BG =AH
=
K AB =CE= DF = GH
L = AC =BE= DG = FH
M =AD= BF = CG =EH
AE = BC = FG = DH = KL = JM
AF = BD = EG =CH= JL =KM
AG = EF =CD= BH = JK = LM
2 bloques de 8:AE = BC = FG = DH = KL = JM
x) 2139; fracción 1/512 de 13 factores Resolución 111
en 16 corridas
Generadores del diseño
E=ABC F=ABD G=ACD H=BCD
I=ABCD K=AB L=AC M=AD N=BC
Alias
A= HJ = BK = CL = DM =EN
=
B GJ = AK =EL= FM = CN
=
C = FJ EK =AL = GM = BN
D =El= FK = GL = AM = HN
E= DI= CK = BL = HM = AN
F =a= DK = HL = BM = GN
=
G = BJ HK = DL =CM,= FN
H =AJ= GK = FL = EM = DN
I =DE= CF = BG =AH= MN
K =AB=CE=DF=GH =LN
L=AC=BE=DG=FH =KN
M =AD= BF = CG =EH= JN
N = BC = AE = FG = DH = KL = IM
AF = BD = EG "' CH = IL = KM
AG=EF=CD=BH =!K =LM
=
2 bloques de 8:AF = BD EG =CH= IL =KM
APÉNDICE 679
X1L Relaciones de alias para diseños factoriales fraccionados 24 con k :s; 15 y n s 64 (continuación)
y) 21410; fracción 1/1024 de 14 Resolución 111
factores en 16 corridas
E=ABC F=ABD G=ACD H=BCD l=ABCD
K=AB L=AC M=AD N=BC O=BD
Alias
A= HJ = BK = CL = DM =EN= FO
B = GJ = AK =EL= FM = CN =DO
C = FJ = EK =AL= GM = BN = HO
D = FJ = FK = GL = AM = HN = BO
E=Dl=CK =BL=HM=AN=GO
F = CJ = DK = HL = BM = GN = AO
G = BJ = HK = DL =CM= FN = EO
H =AJ= GK = FL = EM = DN = CO
J =DE= CF = BG =AH= MN =LO
K = AB =CE= DF = GH = LN = MO
L = AC =BE= DG = FH = KN =JO
M =AD= BF = CG =EH= IN= KO
N = BC = AE = FG = DH = KL = JM
O= BD = AF = EG =CH= JL =KM
AG = EF =CD= BH = JK = LM =NO
2 bloquesde8:AG =EF =CD =BH=JK=LM =NO
z) 21'111; fracción 1/2048 de 15 Resolución 111
factores en 16 corridas
E=ABC F=ABD G=ACD H=BCD l=ABCD
K = AB L = AC M =AD N = BC O= BD P =CD
Alias
A= HJ = BK = CL = DM =EN= FO= GP
B = GJ = AK =EL= FM = CN =DO= HP
C = FJ = EK =AL= GM = BN = HO = DP
D =El= FK = GL = AM = HN = BO = CP
E= DI= CK = BL = HM = AN = GO = FP
F = CJ = DK = HL = BM = GN = AO = EP
G = BJ = HK = DL =CM= FN = EO = AP
H =AJ= GK = FL = EM = DN =ca= BP
J =DE= CF = BG =AH= MN =LO= KP
K = AB =CE= DF = GH = LN = MO = JP
L = AC =BE= DG = FH = KN =JO= MP
M =AD= BF = CG =EH= JN = KO = LP
N = BC = AE = FG = DH = KL = JM = OP
O= BD = AF = EG =CH= JL =KM= NP
P =CD= EF = AG = BH = JK = LM =NO
680 APÉNDICE
Tabla Xlfl, Glosario para el uso de Design Expert

Actual value Valor real
Adeq precision Precisión adecuada
Adj MS (adjusted mean square) Cuadrado medio ajustado
Adj R-squared R cuadrada ajustada
Adj SS (adjusted sum of squares) Suma de cuadrados ajustada (SS ajustada)
Analysis of variance Análisis de varianza
Coefficient estímate Estimación del coeficiente
C. V. (coefficient of variation] Coeficiente de variación
CI (confidence interval) Intervalo de confianza
Cook's distance Distancia de Cook
Cor total (corrected total) Total corregido. Suma de los valores de
respuesta corregidos por la media. Se llama
comúnmente suma de cuadrados totales
DF (degrees of freedom) Grados de libertad
DDF (denominator degrees of freedom) Grados de libertad del denominador
Diagnostic case statistics Estadísticos de diagnóstico del caso
Error term Término del error
Estimated mean Media estimada
Expected mean square Cuadrado medio esperado
Lack of fit Falta de ajuste
Least squares means for strength Medias de mínimos cuadrados de la
resistencia
Leverage Acción de palanca. Potencial de un punto del
diseno para influir en los coeficientes del
ajuste del modelo. Deben evitarse valores
cercanos a uno
Mean Media
Mean difference Diferencia media
Mean square Cuadrado medio
Means for covariates Medias de las covariables
NDF (numerator degrees of freedom) Grados de libertad del numerador
Operator fixed Operador fijo
Operator random Operador aleatorio
Outlier t Punto atípico t
Pred R-squared R cuadrada predicha
Predicted value Valor predicho
PRESS (Prediction error sum of squares) Suma de cuadrados del error de predicción
Pure error Error puro
R-squared R cuadrada
Root MSE (root mean square error) Raíz cuadrada del cuadrado medio del error
Seq SS (sequential sum of squares) Suma de cuadrados secuencial
Std. Dev. (standard deviation) Desviación estándar
Standard error (SE) Error estándar
SE of difference (standard error of difference) Error estándard de la diferencia
Std. error of estimation Error estándar de la estimación
SE mean (standard error of the mean) Error estándar de la media
Standard order Orden estándar
Student residual Residual de Student
Sum of squares Suma de cuadrados
Variance component Componente de la varianza
,
Indice
Aberración, 326 Combinación de información interbloques e intrabloques,

Aditividad del modelo de bloques aleatorizados, 136. Vt!r 162
también Prueba de interacciones (no aditividad) Combinación de los cuadrados medios para estimar el
Aleatorización, 12, 13, 61, 126, 148 error, 535
Algoritmo de análisis para el diseño 2•, 242 Comparación de medias por pares, 96104
Algoritmo de intercambio, 469 Comparación de todos los contrastes, 95
Alias, 304 Comparación de tratamientos con un control, 103
Alias parciales, 344, 380, 383 Comparación gráfica de medias, 89
Análisis canónico del modelo de superficie de respuesta de Comparaciones múltiples, 88, 133, 182
segundo orden, 440 Componente I de una interacción, 366
Análisis de covaríanza, 15, 126, 604 Componente J de una interacción, 366
Análisis de residuales, 76, 79, 185, 224, 400, 416, 563 Componente W de una interacción, 372
Análisis de varianza, 60, 63, 66 Componente X de una interacción, 372
Análisis de varianza de dos factores, 177 Componente Y de una interacción, 372
Análisis de varianza de un solo factor, 64 Componente Z de una interacción, 372
Análisis de varianza simple o de una variable, 64 Componentes de la varianza, 65, 511, 512, 518, 565
Análisis interbloques, 161 Componentes de una interacción, 204, 366
Análisis intrabloques, 161 Condiciones óptimas, 427, 429, 430, 436
Arreglo exterior, 491 Conexión entre análisis de varianza y regresión, 112
Arreglo interior, 491 Confusión completa, 299
Ascenso más pronunciado, 227, 430, 435 Confusión en el diseño 2•, 288
Aumento del diseño, 409. Jí!r también Separación de alias cuatro bloques, 296
en las interacciones y Contracción de diseños facto dos bloques, 289
riales fraccionados más de cuatro bloques, 297
Confusión en el diseño Y, 373
más de nueve bloques, 378
Bloque principal, 291, 297, 373 nueve bloques, 377
Bloques completos, 127 tres bloques, 373
Bloques incompletos, 154 Confusión parcial, 299
Construcción de diseños factoriales fraccionados, 307, 318,
337, 379381
Cálculos en el análisis de varianza, 70, 72 Contracción completa, 340
Cambio en el efecto de la media en una operación evoluti Contracción parcial, 349
va (EVOP), 484, 488 Contraste estandarizado, 92
Carácter iterativo de la experimentación, 17, 20. Ver tam- Contraste ortogonal, 93, 221, 231
bién Experimentación secuencial Contrastes, 90, 93, 221, 231, 290
Ciclo en Í~ operación evolutiva (EVOP), 484 Cordillera creciente, 448
Codificación de los datos en un análisis de varianza. 72 Cordillera estacionaria, 448
Coeficiente de confianza, 42 Corridas axiales, 274, 365, 478
Coeficiente de variación, 104 Covariable, 604
Coeficientes de regresión parcial, 393 Covarianza, 26
Combinación de fracciones para estimar efectos, 303, 306, Criterio de predicción adecuada, 104
315, 339, 347, 348 Criterio para seleccionar un diseño, 455
681
682 ÍNDICE
Criterios de diseño, 455 Diseño optima! G, 468

Cuadrado latino estándar, 148 Diseiío optima! V, 468
Cuadrados latinos ortogonales, 151, 365 Diseño pentagonal, 461
Cuadrados medios, 68, 179 Diseño robusto, 488. Ver también Estudios de robustez de
Cubo con centros en las caras, 459 procesos
Curioseo o sondeo de datos, 94 Diseño rotable, 457
Curva de operación característica, 40, 107, 139, 189, 529 Diseño símplex para el modelo de primer orden, 456
Curva OC. Ver Curva de operación característica Diseños 2"1, 304317
Curvatura, 174, 272, 432 Diseños »«, 317
Diseños 2•-P, 326
D de Cook, 420 Diseños 3k, 363, 372
Datos no balanceados en el análisis de varianza, 75, 600 Diseño 3•i, 379
Datos proporcionales en un diseño factorial no balanceado, Diseiíos 3k-P, 382
600 Diseños alternados o entrecruzados, 150
Definición de contrastes, 290, 296, 373 Diseños anidados, 557568
Desviación estándar muestral, 27 Diseños anidados por etapas escalonados, 566
Determinación analítica de una transformación, 590 Diseños centrales compuestos pequeños, 461
Determinación del tamaño de la muestra, 40, 107110, 139, Diseños cuboidales, 450
189, 529 Diseños de bloques incompletos balanceados, 154
Diagrama de caja, 23, 62 Diseiíos de cuadrados grecolatinos, 151, 383
Diagrama de dispersión, 662 Diseños de puntos frontera, 478
Diagrama de puntos, 21, 22 Diseños de resolución 111, 306, 337
Dirección del ascenso más pronunciado. Ver Ascenso más Diseños de resolución IV; 306, 347
pronunciado Diseños de resolución V, 307, 347
Diseño anidado de dos etapas, 557 Diseños de segundo orden, 456
Diseño anidado de m etapas, 566 Diseños de superficie de respuesta, 11, 364, 429
Diseño anidado de tres etapas, 566 · Diseños en parcelas con doble subdivisión, 580
Diseño balanceado, 154, 558, 600 Diseños equirradiales, 461
Diseño básico, 307, 317, 381 Diseños esféricos, 457
Diseño central compuesto, 11, 274, 275, 365, 441, 456 Diseños generados por computadora, 409, 466, 479
Diseño de aberración mínima, 326 Diseños híbridos, 461
Diseno de arreglo combinado, 492, 494 Diseños mínimos de resolución IV, 347
Diseño de arreglo cruzado, 491 Diseños no geométricos, 343
Diseño de bloques aleatorizados, 50, 126, 207 Diseños optimales, 468
bloques completos, 127 Diseños optimales alfabéticos, 468469
bloques incompletos, 154 Diseños ortogonales, 231, 404, 455
Diseño de BoxBehnken, 458 Diseños para modelos de primer orden, 455
Diseño de comparaciones pareadas, 47, 50 Diseños PlackettBurman, 343347
Diseno del cuadrado latino, 144, 148, 209, 365 Diseños saturados, 337
Diseño en parcelas subdivididas, 557, 573, 578 Diseños simétricos, 155
Diseño en parcelas subdivididas en franjas, 583 Diseños símple:x: de centroide para mezclas, 475
Diseño experimental completamente aleatorizado, 33, 64, Diseños símplex de retícula para mezclas, 474
176, 207 Distribución de muestreo, 29
Diseño experimental y diseño de productos, 8, 11 Distribución de probabilidad, 23
Diseño factorial 22, 5, 219 Distribución de probabilidad continua, 24
Diseño factorial 23, 6, 228 Distribución de probabilidad discreta, 24
Diseño factorial 24, 7, 246 Distribución de referencia, 35
Diseño factorial 2k, 7, 218, 242 Distribución F, 32
Diseno factorial anidado, 569 Distribución jicuadrada, 30
Diseño factorial no balanceado, 600 Distribución normal, 29
Diseño hexagonal, 461 Distribución normal estándar, 29
Diseño jerárquico. Ver Diseños anidados Distribución sesgada, 30
Diseño no balanceado, 75, 144, 600 Distribución t, 31
Diseño no replicado. Ver Réplica única Doblez de diseños factoriales fraccionados, 339, 340, 347,
Diseño optima! A, 468 348. Ver también Separación de alias en las interac
Diseño optima! D, 468 ·iones
ÍNDICE 683
Ecuaciones normales de mínimos cuadrados, 112, 151, 159, Experimentación secuencial, 10, 17, 18, 20, 303, 315, 365,
186187, 395 429, 456
Ecuaciones normales. Ver Ecuaciones normales de mínimos Experimentador, 2
cuadrados Experimento aleatorizado, Ver Diseño experimental comple
Efecto del tratamiento, 64 tamente aleatorizado
Efecto principal, 5, 170, 220 Experimento comparativo, 21
Efecto total de un factor, 221 Experimento con mediciones repetidas, 624
Efectos cuadráticos, 88, 204, 432 Experimento de caracterización, 8. ~r también Experimen
Efectos cúbicos, 88 to de tamizado
Efectos de dispersión, 110, 241, 260, 264, 323 Experimento de tamizado, 9, 15, 218, 303
Efectos de localización, 111, 260, 323 Experimento factorial, 4, 170, 218
Efectos de los factores, 5, 6, 220 en bloques, 207, 287
Efectos de los tratamientos ajustados, 157, 161 en parcelas subdivididas, 578
Efectos ortogonales, 221, 231 Experimento factorial fraccionado, 7, 303, 379
Efectos residuales de tratamientos, 150 Experimentos con un factor a la vez, 4
Eficiencia relativa de los diseños factoriales, 174 Experimentos de mezclas, 472
Eigenvalores (valores propios), 440 Experimentos de seguimiento. Ver Pruebas de confirmación
Eigenvectores (vectores propios), 446 Experimentos industriales y experimentos agrícolas, 18
Elemento identidad, 231 Experimentos no planeados, 392
Enfoque de grupo en el diseño de experimentos, 14
Enfoque de Ja mejor conjetura para la experimentación, 3 Factor cruzado, 170. Ver también Experimento factorial
Enfoque no paramétrico del análisis de varianza, 116 Factores, 1, 2, 3, 5, 14, 21, 60
Error, 22 Factores controlables, 2, 14, 15, 489, 493
Error de la parcela completa, 575, 579, 584 Factores cualitativos, 86, 201, 275, 368
Error de la subparcela, 575, 579, 584 Factores cuantitativos, 86, 171, 201, 272, 363, 368, 511
Error estadístico, 22, 64, 412 Factores de ruido. Ver Factores no controlables
Error estándar de los efectos en un diseño 2•, 241 Factores no controlables, 2, 15, 489
Error estándar de un coeficiente de regresión, 239, 412 Factores que se mantienen constantes, 14
Error experimental, 11, 12, 34, 64 Falta de ajuste, 239, 272, 431
Error intrabloques, 163 Familia de potencias de transformaciones, 84, 591
Error puro, 239 Familia exponencial de distribuciones, 594
Escala codificada, 172 Familia factorial fraccionada, 306
Espacio inferencia! de un experimento, 511 Fase en una operación evolutiva (EVOP), 484
Estadístico del rango studentizado, 97, 102 Forma no restringida del modelo mixto, 526, 540, 573
Estadístico R2 ajustada, 104, 411. Ver también R2 Forma restringida del modelo mixto, 523, 531, 539, 559,
Estimación, 27 569
Estimación de los componentes de la varianza, 513 Formación de bloques, 12, 13, 15, 50, 126, 127, 130, 207,
máxima verosimilitud, 547 209, 287, 289, 296, 298, 315, 331, 373, 462, 574, 576,
método de máxima verosimilitud con restricciones, 549 579, 580, 604
método del análisis de varianza, 513, 518, 524 Formación de bloques de diseños de superficie de respues
Estimación de los parámetros del modelo en el análisis de ta, 462466
varianza, 74, 112, 185 Fracción alterna, 305, 319
Estimación de máxima verosimilitud, 547, 549, 595 Fracción complementaria. Ver Fracción alterna
Estimación de mínimos cuadrados de parámetros, 88, 112, Fracción irregular, 346
141, 159, 186, 394 Fracción principal, 305
Estimación de valores faltantes, 139, 148, 602 Fracción un medio, 7, 304
Estimaciones de efectos, 220 Fuerza de una transformación, 84
magnitud y dirección, 221 Función de enlace, 595
Estimador, 27 Funciones con condición de deseables, 451454
Estimador de la varianza mínima, 27 Funciones estimables, 113, 11.4, 188, 189
Estimador de momentos, 54 7
Estimador insesgado, 27 Generador de diseños. ~r Generador de diseños factoria
Estrategia de experimentación, 1, 3 les fraccionados
Estudios de capacidad o aptitud de los instrumentos de Generador de diseños factoriales fraccionados, 304, 318
medición, 519, 524 Grados de libertad, 29, 30, 31
Estudios de robustez de procesos, 1, 127, 176, 488 Gráfica de contorno, 10, 204
····
684__ ÍNDICE
Gráfica de cubo, 242, 262 Método de BoxCox, 590

Gráfica de inferencia condicional para diseños factoriales Método de grandes muestras modificado, 545
no replicados, 253 Método de la diferencia significativa mínima (LSD) para
Gráfica de probabilidad normal de los efectos, 246, 264 comparar medías, 99
Graficación de residuales, 7686 Método de Lenth para diseños sin réplicas, 254
Gráficas de probabilidad normal, 38, 72 Método de los cuadrados de las medias ponderados, 603
Método de medias no ponderadas, 603
Herencia de la agricultura, 17, 18 Método de mínimos cuadrados. ver Estimación de mínimos
Hípercuadrados, 154 cuadrados de parámetros
Hipótesis alternativa, 34 Método de momentos, 547
Hipótesis alternativa de dos colas, 34 Método de Satterthwaite. ver Pruebas F aproximadas
Hipótesis alternativa de una cola, 35 Método del ascenso más pronunciado. ver Ascenso más
Hipótesis nula, 34 pronunciado
Histograma, 23 Metodología de superficies de respuesta (MSR), 11, 427
Métodos de medias no ponderadas en el análisis de varian
Importancia de los conocimientos no estadísticos, 19 za, 603
Índice de error en el modo del experimento, 75 Mezclado lineal, 476
Influencia y acción de palanca, 419, 420 Mezclado sinérgico en mezclas, 476
Información relativa para efectos confundidos, 300 Mezclas antagónicas en mezclas, 476
Interacción, 4, 137, 171, 174 Mezclas binarias, 472
Interacción entre tratamientos y bloques, 137 Mezclas de verificación, 4 78
Interacción generalizada, 296, 299, 377 Mezclas puras, 474
Intervalo de confianza, 42 Mínimos cuadrados esperados, 68, 179
Intervalo de confianza para Ja media de un tratamiento, 74, reglas para, 531
75, 100 Mínimos cuadrados ponderados, 595
Intervalo de confianza para la respuesta promedio en el Mitad de gráfica normal de los efectos, 253
modelo de regresión, 416 Modelo completo, 115, 116, 142, 413
Intervalo de confianza simultáneo, 75 Modelo con efectos aleatorios, 65, 511, 512, 557
Intervalo de predicción, 416 Modelo con efectos fijos, 65, 511
Intervalos de confianza aproximados para los componentes Modelo de la respuesta o de reacción de un diseno robus
de Ja varianza, 543 to, 492
Intervalos de confianza para los componentes de la varian Modelo de las medias, 64, 128, 177
za, 516, 491 Modelo de los efectos, 64, 128, 145, 177
intervalos aproximados tipo Satterthwaite, 543 Modelo de primer orden, 226, 427, 455
intervalos exactos, 51.6, 543 Modelo de regresión, 87, 172, 177, 201, 204, 223, 235, 364,
método de grandes muestras modificado, 545 392, 604
procedimientos de máxima verosimilitud, 552 Modelo de regresión lineal múltiple, 393
Intervalos de confianza simultáneos, 75, 95 Modelo de superficie de respuesta de segundo orden, 429
Intervalos de confianza uno a la vez, 75 Modelo empírico, 17, 87, 392
Modelo estadístico, 34, 48, 64, 87, J.28, 155, 177, 190, 191,
Jerarquía del modelo, 203, 286 194, 207, 210, 393, 427, 429, 436, 476, 492, 493, 512,
517, 522, 526, 558, 567, 569, 575, 576, 578, 581, 584,
Límites de confianza, 42 594, 605, 624
Localización, como en la tendencia central, 22 Modelo factorial sin interacciones, 190
Modelo jerárquico, 203, 286
Matriz de covarianza, 397 Modelo lineal,. 64. ver también Modelo estadístico
Matriz del diseño, 228 Modelo lineal generalizado, 594
Matriz gorro, 417 Modelo mixto, 522, 559, 569
Media, 12, 25 error estándar de la media con efectos fijos, 524
Media global, 64 estimación de los componentes de la varianza, 524
Media muestra!, 12, 26, 27 formas alternativas, 526
Medias ajustadas de los tratamientos en análisis de cova modelo con restricciones, 523
rianza, 607 modelo sin restricciones, 526
Mediciones duplicadas en la respuesta, 265 Modelo reducido, 116, 143, 413, 520
Método de Bonferroni de intervalos de confianza simultá Modelos aditivos, 135, 145, 432
neos, 75 Modelos con mezclas, 476
ÍNDICE 685
Muestreo aleatorio, 26 Prueba de Tukey, 96
Prueba del rango múltiple de Duncan, 100
Navaja de Ockham, 310 Prueba F parcial, 413
Nivel de significación, 34, 37 Prueba general de la significación de la regresión, 114, 141,
Niveles de los factores, 14, 21, 60, 245 626
Niveles de los factores naturales, 224, 226, 431 Prueba t combinada. J!ér Prueba t de dos muestras
Niveles imprecisos de los factores del diseño, 405 Prueba t de dos muestras, 35
Niveles mixtos de Jos factores en un diseño factorial, 383 varianzas diferentes, 44
Notación geométrica para experimentos factoriales, 228 Prueba t pareada, 49
Pruebas de aleatorización, 40, 73
Observaciones faltantes en un diseño de bloques aleatoriza Pruebas de confirmación, 17, 317
dos, 139 Pruebas F aproximadas, 535, 539, 540
Observaciones faltantes en un diseño de cuadrado latino, Pseudocomponentes, 479
148 Pseudopruebas F. Ver Pruebas F aproximadas
Observaciones faltantes en un diseño factorial 2•, 404 Punto de respuesta máxima, 436, 437
Operación evolutiva (EVOP), 484488 Punto de respuesta mínima, 436, 438
Operador de la varianza, 25 Punto estacionario, 436, 440
Operador del valor esperado, 25 Punto silla, 436, 439
Optimización de un proceso, 9, 427 Puntos atípicos, 78, 417
Orden de Yates. Ver Orden estándar Puntos centrales, 271, 365, 431, 458, 461
Orden estándar, 223, 228, 242 Puntos de acción de palanca, 420. Ver también Influencia y
Ortogonalidad, 93, 221, 231 acción de palanca
Palabras en la relación de definición, 318

Parcelas completas, 574, 579, 583 R2, 104, 411. Ver también Estadístico R2 ajustada
Pautas generales para el diseño de experimentos, 13 R1 para predicción, 104, 419
Pendiente de la superficie de respuesta, 493 Realización de réplicas, 5, 12, 16, 60, 247
Planeación previa al experimento, 14, 16 Región crítica, 34
Potencia, 34 Región de rechazo. Ver Región crítica
Predictor lineal, 594 Reglas para expectativas, 26
PRESS (Prediction Error Sum of Squares, Predicción de Reglas para los cuadrados medios esperados, 531
suma de cuadrados de error), 104 Relación de definición para un diseño factorial fraccionado,
Principio de efectos esparcidos, 245, 303 304, 318, 379
Principio jerárquico en Ja construcción de modelos, 203, Relación generadora, 318
2S6 Relación señal a ruido, 491
Procesos robustos, l. Ver también Estudios de robustez de Repetibilidad, 519
procesos Réplica oculta, 247, 619
Programación no lineal, 451 Réplica única, 191, 244. Ver también Una observación por
Propagación del error, 495 celda
Propiedad de reducción de ruido con la formación de blo Réplicas de cuadrados latinos, 148
ques, 51, 132133 Reproducibilidad, 519
Propiedades de los estimadores de mínimos cuadrados, 397 Residuales escalados, 417
Proyección de diseños factoriales, 246, 303, 307, 331 Residuales estandarizados, 78, 417
Proyección del diseño, 247, 303, 310 Residuales PRESS, 418
Proyectividad, 345 Residuales studentízados, 418
Prueba de Bartlett para la igualdad de varianzas, 81 Resolución del diseño, 308
Prueba de Dunnett, 103 Resolución de un diseño factorial fraccionado. Ver Resolu
Prueba de hipótesis, 21, 33, 409 ción del diseño
Prueba de interacciones (no aditividad), 192 Respuestas múltiples, 448
Prueba de KruskalWallis, 116 Restricción sobre la aleatorízacíón, 130, 145, 207, 209
Prueba de Levene modificada. Ver Prueba de Levene Restricción sobre la aleatorización, Ver Restricción sobre la
Prueba de Levene para la igualdad de la varianza, 82 aleatorización; ver también Formación de bloques
Prueba de NewmanKeuls, 102 RStudent, 419
Prueba de Scheffé, 95
Prueba de significación. Ver Prueba de hipótesis
Prueba de significación de una regresión, 409 Selección empírica de una transformación, 81, 84
686 ÍNDICE
Separación de alias en las interaccíones, 306, 315, 339, 348, Tratamientos ortogonales a los bloques, 139
407. Ver también Doblez de diseños factoriales frac Trayectoria del ascenso más pronunciado. Ver Ascenso más
cionados pronunciado
Significación práctica vs significación estadística, 19
Sistemas de cordilleras, 44 7 Una observación por celda, 191
Submuestreo, 578 Unidad experimental, 13, 64, 126
Subparcelas, 574, 579
Suma de cuadrados corregida, 28 Valor esperado, 25
Suma de cuadrados de los residuales, 397 Valores P, 37
Sumas de cuadrados extras, 412 Variabilidad, 22, 323
Sumas de cuadrados tipo III, 620 Variabilidad dentro de un tratamiento, 66
Superficie de respuesta, 10, 173, 201, 204, 225, 235, 364, Variabilidad entre los tratamientos, 66
393, 427 Variable aleatoria, 22
Supuesto de desigualdad de la varianza, 80 Variable aleatoria continua, 22
Supuesto de independencia en la prueba t y el análisis de Variable aleatoria discreta, 22
varianza, 3840, 79 Variable aleatoria F no central, 107
Supuesto de normalidad en las pruebas t y el análisis de Variable concomitante, 604
varianza, 38, 77 Variable de regresión, 392
Variable de respuesta, 1, 2, 14, 15, 392
Tendencia central, 22 Variable dependiente, 392
Teorema de Cochran, 69 Variable independiente, 392
Teorema del límite central, 30 Variable perturbadora, 13, 126
Totales de los tratamientos ajustados, 157 Variables aleatorias independientes, 26
'Iransformación de datos, 40, 81, 8486, 257 Variables codificadas, 172, 223, 431
Transformación de rangos, 117, 118 Variables indicadoras, 203
Transformación para corregir la violación de los supuestos, Varianza, 25
40, 81, 8486, 257, 590 Varianza de la predicción como criterio de diseño, 455,
Transformaciones para estabilizar la varianza, 81, 8486, 457, 468
257 Varianza muestral, 26, 27
Transmisión del error, 493, 495 Varianza no constante, 38, 44, 79, 80
Tratamiento de control, 103 Verificación de supuestos, 38, 7686, 135, 185, 224, 242,
'Iratamientos, 21, 60 251, 258, 261, 416
LA EDICIÓN, COMPOSICIÓN, OISEÑO E IMPRESIÓN DE ESTA OBRA FUERON REALIZADOS

BAJO LA SUPERVISIÓN DE GRUPO NORIEGA EDITORES.
BALDERAS 95, COL CENTRO. M8<1co, D.F. C.P. 06040
2225750000704658DP92331E
O? •
'
...
]l]UU

Disec3b1o de Experimentosmontgomery

Cargado por

Copyright:

Formatos disponibles

Disec3b1o de Experimentosmontgomery

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Disec3b1o de Experimentosmontgomery

Cargado por

Copyright:

Formatos disponibles

DISEÑO Y

LA PRESENTACIÓN Y DISPOSICIÓN EN CONJUNTO OE

DISEÑO Y ANÁLISIS DE EXPERIMENTOS

SON PROPIEDAD DEL EDITOR. NINGUNA PARTE DE ESTÁ OBRA PUEDE

e 2004, EDITORIAL LIMUSA, S.A. DE C.V.

CANIEM NúM. 121

ACERCA DEL LIBRO

MATERIAL SUPLEMENTARIO DEL TEXTO

En el sitio web http://www. wiley.com/legacy/college/engi.n/montgomery316490/student/student.html está

Capítulo 2. Experimentos comparativos simples 21

Capítulo 3. Experimentos con un solo factor: el análisis de varianza 60

3­4 Verificación de la adecuación del modelo 76

Capítulo 4. Bloques aleatorizados, cuadrados latinos y diseños relacionados 126

4­1 Diseño de bloques completos aleatorizados 126

Capítulo 5. Introducción a los diseños factoriales 170

Capítulo 6. Diseño factorial 2" 218

Capítulo 7. Formación de bloques y confusión en el diseño factorial 2" 287

Capítulo 8. Diseños factoriales fraccionados de dos niveles 303

Capítulo 10. Ajuste de modelos de regresión 392

Capítulo 11. Métodos de superficies de respuesta y otros enfoques para la optimización de

11­3.4 Respuestas múltiples 448

Capítulo 12. Experimentos con factores aleatorios 511

Capítulo 13. Diseños anidados y en parcelas subdivididas 557

Capítulo 14. Otros tópicos de diseño y análisis 590

14­1.1 Selecciónde una transformación: el método de Box­Cox 590

S. lQué método de análisis de datos deberá usarse?

l. El tipo de palo usado (grande o normal).

Figura 1·2 Resultados de la estrategia de un factor a la vez para el experimento de golf.

Figura 1­3 Interacción entre el Figura 1-4 Experimento factorial de dos

Ef ecto d e l pa l o = 92+94+93+91 88+ 91+88+ 90 = 3.25

GB(goma GB(goma GB (goma

88+91+92+94 88+90+93+91 = 0.75 .

: . ~+~+M+W 88+ 91+93+ 91 = 0.25

Figura 1·6 Experimento factorial de tres factores que

Figura 1·7 Experimento factorial de cuatro factores que incluye el tipo de

Figura 1­8 Experimento factorial fraccionado de cuatro factores que incluye

1~2 ALGUNAS APLICACIONES TÍPICAS DEL DISEÑO EXPERIMENTAL

EJEMPLO 1~1 ····················•················•······················

1. El espesor de la tarjeta de circuitos impresos.

SegUlldo experimento de optimización

0.5 1.0 1.5 2.0 2.5

Figura 1­9 Gráfica de contorno del rendimiento como una fun­

1. La distancia que se desplaza el cilindro.

La consecuencia práctica de lo anterior es que si se hicieron n = 1 réplicas y se observó y1 = 145 (tem­

1­4 PAUTAS GENERALESPARA DISEÑAR EXPERIMENTOS

Tabla 1­1 Pautas generales para diseñar un experimento

1 ..5 BREVE HISTORIA DEL DISEÑO ESTADÍSTICO

1­6 RESUMEN: USO DE TÉCNICAS ESTADÍSTICAS EN LA

Tabla 2­ 1 Datos de la fuerza de la tensión de

2­2 CONCEPTOS ESTADÍSTICOS BÁSICOS

Descripción gráfica de la variabilidad

••- eel••• o OQoai!OCO

.Y1 '"' 16.76 .Y2"' 17.92 o " Mortero sin modificar

Figura 2­2 Histograma de 200 observacionesde la recuperación de metal (rendimiento) en

Diagramas de caja y bigotes

Figura 2·3 Diagramas de caja del experimento de la fuerza de la ten·

a) Una distribución discreta

b) Una distribución continua

Figura 2­4 Distribuciones de probabilidad discreta y continua.

y discreta: O:S P(Y¡ ):s; 1 todos los valores de Y¡

34 Verificación de la adecuación del modelo 76

41 Diseño de bloques completos aleatorizados 126

113.4 Respuestas múltiples 448

141.1 Selecciónde una transformación: el método de BoxCox 590

Figura 13 Interacción entre el Figura 1-4 Experimento factorial de dos

Figura 18 Experimento factorial fraccionado de cuatro factores que incluye

Figura 19 Gráfica de contorno del rendimiento como una fun

La consecuencia práctica de lo anterior es que si se hicieron n = 1 réplicas y se observó y1 = 145 (tem

14 PAUTAS GENERALESPARA DISEÑAR EXPERIMENTOS

Tabla 11 Pautas generales para diseñar un experimento

16 RESUMEN: USO DE TÉCNICAS ESTADÍSTICAS EN LA

Tabla 2 1 Datos de la fuerza de la tensión de

22 CONCEPTOS ESTADÍSTICOS BÁSICOS

Figura 22 Histograma de 200 observacionesde la recuperación de metal (rendimiento) en

Figura 24 Distribuciones de probabilidad discreta y continua.

V(y) = El(y- µ )2] = ai (25)

E(SS)= E[~ (Y; y)2 J (29)

f(y) = _1_ e(1/2)[(yµ)/a]' oo<y<oo (212)

sigue la distribución jicuadrada con k grados de libertad. La función de densidad de la distribución

En la figura 26 se ilustran varias distribuciones jicuadrada. La distribución es asimétrica, o sesgada,

Figura 26 Varias distribuciones jicuadrada.

Es decir, SS!a2 sigue una distribución jicuadrada con n - 1 grados de libertad.

Figura 27 Varias distribuciones t.

Potencia = 1 p = P( rechazar H0 H 0 1 es falsa)

52 = (n1 l)S12 +(n2 l)Si

24.2 Elección del tamaño de la muestra

24.3 Intervalos de confianza

es un intervalo de confianza de 100(1 a) por ciento para µ1 µ2•

'Thbla23 Pruebas para medias con varianza conocida

25.1 El problema de las comparaciones pareadas

Tabla 25 Datos del experimento de

t (d¡ J)2]1/2 [}: d:-~(t d¡l2]1/2

26 INFERENCIAS ACERCA DE LAS VARIANZAS

El estadístico de prueba para la ecuación 244 es

H0 :a¡ =a; (247)

La distribución de referencia apropiada para F, es la distribuciónF con a¡ 1 grados de libertad en el nu

H0 :a; =ai Fa> F,,,.,1,.,1

211. A continuación se presenta el tiempo de combustión de dos cohetes químicoscon formulacionesdiferentes.

221. Suponga que se está probando