Tutorial Sobre Superficie de Respuesta
Tutorial Sobre Superficie de Respuesta
Tutorial Sobre Superficie de Respuesta
M É TO D O S Y D I S E Ñ O S .
Cuando decimos que el valor real esperado, η, que toma la variable de interés considerada
está influido por los niveles de k factores cuantitativos, X1, X2, ..., Xk, esto significa que existe
alguna función de X1, X2, ..., Xk (que se supone continua en Xi, ∀ i = 1, ..., k) que proporciona el
correspondiente valor de η para alguna combinación dada de niveles:
η = f (X1, X2, ..., Xk)
de tal forma que la variable respuesta puede expresarse como:
Y = η + ε = f (X1, X2, ..., Xk) + ε
donde ε es el error observado en la respuesta.
La relación η = f (X1, X2, ..., Xk) existente entre η y los niveles de los k factores puede
representarse a través de una hipersuperficie (subconjunto de un espacio euclídeo (k+1)-
dimensional) a la que llamaremos superficie de respuesta.
Una técnica utilizada para ayudar a visualizar la forma que puede tener una superficie de
respuesta tridimensional consiste en representar la gráfica de contornos de la superficie, en la
que se trazan las denominadas líneas de contorno, que son curvas correspondientes a valores
constantes de la respuesta sobre el plano X1X2 (plano cuyos ejes coordenados vienen dados por
los niveles X1 y X2 de los factores). Geométricamente, cada línea de contorno es una proyección
sobre el plano X1X2 de una sección de la superficie de respuesta al intersecar con un plano
paralelo al X1X2. La gráfica de contornos resulta útil para estudiar los niveles de los factores en los
que se da un cambio en la forma o altura de la superficie de respuesta.
En este ejemplo, dado que hay dos factores de influencia (k = 2), la superficie de respuesta se
visualiza en un espacio tridimensional en el que la tercera dimensión representa la producción
esperada de almendras sobre el plano bidimensional definido por las combinaciones de los niveles
de los dos factores, X1 y X2.
Fig 1.2.- Sección de la superficie de respuesta por planos paralelos al plano X1X2,
en los valores esperados de producción: 11.5, 12.1, 12.7, 13.3, 13.9.
Cada línea de contorno representa un número infinito de combinaciones de las cantidades de los
dos fertilizantes, para las producciones de almendras esperadas consideradas. La producción
máxima, que es de 14.12 Kg./Ha. se localiza en el centro de la elipse más pequeña y corresponde
a los niveles X1 = 170.06 del fertilizante A y X2 = 246.65 del fertilizante B.
La forma de la función f que determina la relación entre los factores y la variable respuesta
es, en general, desconocida, por lo que el primer objetivo de la RSM consiste en establecer
experimentalmente una aproximación apropiada de la función f. Para ello, se propone un modelo
de ecuación, generalmente polinómico, en los k factores X1, X2, ..., Xk y se selecciona un conjunto
de tratamientos sobre los que realizar las observaciones experimentales, que se utilizarán tanto
para obtener estimaciones de los coeficientes en el modelo propuesto (por ejemplo, a través del
método de mínimos cuadrados) como para obtener una estimación de la variación del error
experimental (para lo que es necesario tener al menos 2 observaciones por cada tratamiento). Se
realizan, entonces, contrastes sobre las estimaciones de los parámetros y sobre el ajuste del
modelo y si el modelo se considera adecuado, puede utilizarse como función de aproximación. En
tal caso, el estudio de la superficie de respuesta se hace en términos de la superficie ajustada, pues
su análisis será aproximadamente equivalente al del sistema real.
Los polinomios usados más frecuentemente como funciones de aproximación son los de
órdenes uno y dos, que nos proporcionan, respectivamente los siguientes modelos:
k
modelo de primer orden ≡ Y = β 0 + ∑ β i X i + ε
i =1
k k
modelo de segundo orden ≡ Y = β 0 + ∑ β i X i + ∑ β ii X 2i + ∑ β ij X i X j + ε
i =1 i =1 i, j
i <j
Una fórmula que suele resultar útil para codificar los valores de los factores es la siguiente:
X + X iNSup
X i - iNInf
xi = 2 =
Xi - Xi
~
( )
i = 1, 2, ..., k
X iNSup - X iNInf X iNSup - X iNInf
donde XiNInf ≡ valor del nivel más bajo del factor i y XiNSup ≡ valor del nivel más alto del factor i y
~ X iNInf + X iNSup
Xi = , es la media entre los valores más alto y más bajo del nivel i = 1, ...,n. La
2
k
~ ~
fórmula anterior verifica que ∑ xi = 0 y transforma las medias X 1 , ..., X k en el punto
i =1
(x1, ..., xk) = (0, ..., 0) al que se denomina centro del diseño.
La forma general de un modelo de primer orden con k factores, X1, X2, ..., Xk, es:
k
Y = β0 + ∑β
i =1
i Xi + ε (2.1)
Si el modelo está bien ajustado, la parte no aleatoria del modelo representa la respuesta
real esperada y ε es el error experimental. Sin embargo, si el modelo no está ajustado a la función
respuesta real, lo que ocurre cuando la relación entre la respuesta y los factores está demasiado
simplificada, ε contiene, además del error experimental, una parte de error no aleatorio que se
debe a la falta de ajuste.
La forma general de un modelo de segundo orden con k factores, X1, X2, ..., Xk es:
k k k -1 k
Y = β 0 + ∑ β i X i + ∑ β ii X 2i + ∑ ∑ β ij X i X j + ε (2.2)
i =1 i =1 i =1 j = 2
j> i
De manera análoga a como se hizo para los modelos de primer orden se obtiene que el
modelo ajustado de segundo orden es:
k k k -1 k
Yˆ = b 0 + ∑ b i X i + ∑ b ii X 2i + ∑∑ b ij X i X j
i =1 i =1 i =1 j = 2
j> i
En general, se sabe muy poco o nada acerca de la relación existente entre la variable
respuesta y los factores, así que, en un principio, se propone el modelo de aproximación más
simple posible, el de primer orden, que suministra la base para ejecutar un conjunto inicial de
experimentos que proporcionarán datos correspondientes a los puntos del diseño de primer
orden. Si los datos recogidos permiten hacer una estimación de la varianza del error, se puede
llevar a cabo un contraste para evaluar el ajuste del modelo. Esto nos lleva a una segunda etapa,
que consiste en localizar áreas de la región experimental en las que se sospeche que puedan estar
los valores más deseables de la variable respuesta. El plan que vamos a seguir, que nos llevará
hacia valores máximos en la respuesta, se conoce como método de máxima pendiente en
ascenso (en descenso si lo que queremos es minimizar los valores de la respuesta).
Si los tests de ajuste detectan que puede haber curvatura en la superficie, se aumenta un
grado al modelo añadiéndole los términos del producto cruzado y/o los términos cuadráticos
puros y se completa el diseño de primer orden añadiéndole los puntos necesarios para ajustar el
nuevo modelo de segundo orden. Si el modelo de segundo orden se ajusta adecuadamente, se
utiliza para describir la forma de la superficie a través de la gráfica de contornos en la región
experimental. Se utiliza entonces el modelo ajustado de segundo orden para localizar, en el lugar
en el que la pendiente de la superficie ajustada es cero, las coordenadas del punto estacionario,
que es el punto que proporciona el valor óptimo de la variable respuesta y, si se detecta que éste
se encuentra dentro de los límites de la región experimental, se pasa a determinar su naturaleza (si
es máximo, mínimo o punto de silla). Si, por el contrario, el punto estacionario no se halla dentro
de la región experimental, hemos de realizar una nueva experimentación en la dirección en la que
éste se encuentra. Una vez que se ha localizado el punto que proporciona valores óptimos de la
variable respuesta, se describe la superficie en un entorno próximo a éste.
Además de las propiedades mencionadas, sería muy conveniente que el diseño elegido
fuera ortogonal y/o invariante por rotación:
Un diseño ortogonal es aquel en el que los términos del modelo ajustado son
incorrelados y, por tanto, también las estimaciones de los parámetros lo son, en cuyo caso, la
varianza de la respuesta esperada en cualquier punto de la región experimental se puede expresar
como la suma ponderada de las varianzas de los parámetros estimados del modelo.
Por otro lado, en un diseño invariante por rotación, la varianza de Ŷ(x), que depende de
la situación del punto x, es función únicamente de la distancia del punto al centro del diseño, lo
que significa que es la misma en todos los puntos equidistantes del centro del diseño. Teniendo
en cuenta que el objetivo de la RSM es la optimización de la respuesta y que se desconoce la
localización del óptimo antes de ejecutar el experimento, esta propiedad resulta muy interesante,
puesto que garantiza que el diseño proporciona estimaciones igualmente precisas en todas las
direcciones.
tanto, consideraremos únicamente aquellos diseños de primer orden que son ortogonales y, en
particular, los diseños factoriales 2k y las fracciones de diseños factoriales 2k.
DISEÑOS FACTORIALES 2K
En un diseño factorial 2k, para cada factor se consideran dos niveles, que pueden
codificarse en los valores +1 (para el más alto) y –1 (para el más bajo). Considerando todas las
posibles combinaciones de los niveles de los k factores, se obtiene una matriz de diseño de 2k
filas, cada una de las cuales representa un tratamiento.
Los diseños factoriales 2k presentan el inconveniente de que, salvo que se repitan algunas
observaciones, no permiten la estimación del error experimental. Una técnica habitual para incluir
repeticiones consiste en aumentar el diseño con algunas observaciones en el centro, pues esto no
influye sobre las estimaciones de los parámetros y no altera la ortogonalidad del diseño, aunque
como resultado, la estimación de β0 es la media de todas las observaciones.
Estamos considerando los diseños factoriales 2k para ajustar los modelos de primer orden,
pero si se recogen datos en todos los puntos es posible, en realidad, estimar todos los coeficientes
de un modelo de la forma:
k k k
Y = β 0 + ∑ β i x i + ∑ ∑ β ij x i x j + ∑∑ ∑β ijl x i x j x l + ... + β12...k x 1 x 2 ... x k + ε
i =1 i =1 < j i =1 < j < l
en el que los términos adicionales de mayor orden están asociados con las interacciones entre los
factores. De esta manera, el número de puntos del diseño, y por tanto, el número de
observaciones, junto con el número de posibles términos del modelo con parámetros estimables,
se incrementan rápidamente a medida que aumenta el número k de factores.
Así pues, hay que valorar, en función del coste del experimento, si para ajustar un modelo
de primer orden es necesario llevar a cabo las 2k combinaciones, o si es más conveniente omitir
algunas utilizando únicamente un subconjunto de los puntos de un diseño factorial 2k. Se puede
considerar en este último caso una fracción 2-m de un diseño 2k que consiste en 2k-m tratamientos
(k ≥ m), siempre y cuando el diseño resultante tenga, al menos, k+1 puntos, que es el número de
parámetros que han de estimarse y mantenga las mismas propiedades que las del factorial
completo, en particular, sea ortogonal.
DISEÑOS FACTORIALES 3K
En los diseños factoriales 3k cada uno de los k factores presenta 3 niveles, de manera que
el número de observaciones experimentales es N = 3k. Este número puede hacerse excesivamente
grande, especialmente cuando se están estudiando muchos factores, de manera que en ocasiones
conviene más considerar diseños fraccionales 3k-m de los diseños factoriales 3k, tal y como se hizo
para los diseños factoriales 2k.
Los diseños compuestos centrales se presentan como una alternativa a los diseños
factoriales 3k.
En principio, los diseños compuestos centrales así definidos no tienen por qué ser ni
ortogonales ni invariantes por rotación. Se convierten en invariantes por rotación mediante una
elección adecuada del valor de α, que debe depender del número de puntos de la parte factorial
del diseño para conseguirlo. Por otro lado, a través de una elección apropiada de n0 el diseño
puede hacerse ortogonal o incluso de precisión uniforme (diseño que verifica que Var(Ŷ) en el
origen es la misma que en un punto a una distancia unitaria del origen), que permite mayor
protección que un diseño ortogonal contra el sesgo de los coeficientes de regresión producido
2 3 4 5 5 6 6 7 8
k
½ rep. ½ rep. ½ rep. ½ rep.
puntos
4 8 16 32 16 64 32 64 128
factoriales
puntos
4 6 8 10 10 12 12 14 16
axiales
DISEÑO ORTOGONAL
n0 8 9 12 17 10 24 15 22 33
N 16 23 36 59 36 100 59 100 177
n0 5 6 7 10 6 15 9 14 20
N 13 20 31 52 32 91 53 92 164
Una propiedad muy interesante de los diseños centrales compuestos es que se pueden
construir a partir de un diseño de primer orden (el 2k) sin más que agregar los puntos axiales y
quizá algunos puntos centrales.
Por todas las propiedades que verifican, los diseños compuestos centrales son
posiblemente los más utilizados para ajustar superficies de respuesta de segundo orden.
En los diseños de superficies de respuesta es frecuente que, por diversas causas, se haga
necesaria la utilización de bloques para asegurar la homogeneidad de las condiciones de trabajo.
Por ejemplo:
cuando se construye un diseño de segundo orden a partir de uno de primer orden, puede
ocurrir que las condiciones de trabajo se vean modificadas durante el tiempo que transcurre
entre la ejecución de los experimentos iniciales y la ejecución de los experimentos
complementarios, lo que hace necesaria la formación de bloques,
si el número de factores es tan elevado como para necesitar que una gran cantidad de
observaciones se lleven a cabo bajo las mismas condiciones y esto no es posible, la creación
de bloques garantiza la homogeneidad de las condiciones de trabajo.
EXPERIMENTOS DE MEZCLA
Los desarrollos acerca de la RSM que se han llevado a cabo en los epígrafes anteriores se
han hecho bajo la suposición de que los niveles de cada factor son independientes de los niveles
de los demás factores. Sin embargo, puede ocurrir que esto no sea así, como es el caso de los
experimentos de mezcla, en los que los factores son ingredientes de una mezcla y sus niveles
no son independientes. En este caso, se supone que la variable respuesta depende únicamente de
las proporciones relativas de los componentes presentes en la mezcla.
EVOP
En muchas ocasiones puede resultar inviable, por diversas razones, llevar a cabo los
procedimientos experimentales de la RSM en procesos de producción a gran escala. En estos
casos es frecuente que la RSM se aplique a operaciones en plantas piloto, para posteriormente
extrapolar las conclusiones obtenidas a los procesos a escala normal. El problema que plantean
estos procedimientos es que el paso del entorno de trabajo de la planta piloto al real puede llevar
aparejada una distorsión en las condiciones óptimas, pues aunque la planta a escala normal
comienza su operación con niveles óptimos, generalmente se desvía de estos niveles como
consecuencia de la variación en las condiciones del entorno de trabajo. El objetivo en estos casos
es hacer un seguimiento del proceso en su escala normal que permita ir redirigiendo las
condiciones de operación hacia el óptimo o, en todo caso, permita hacer un seguimiento de las
desviaciones que aparezcan. Con este fin se emplean los métodos de operación evolutiva o
EVOP, que consisten en introducir sistemáticamente pequeños cambios en los niveles de los
factores de tal manera que no se provoquen alteraciones importantes en el rendimiento, calidad
o cantidad, pero que permitan la detección de potenciales mejoras en el desempeño del proceso.
Para llevarlas a cabo se emplean, en general, diseños factoriales 2k.
§ 5. UN EJEMPLO NUMÉRICO
El rendimiento (Y) de un determinado proceso químico se puede medir en términos de
la cantidad de material residual eliminado durante la reacción, resultando así una medida de la
pureza del producto final, y se conoce que depende, entre otros factores, de la temperatura (X1)
y el tiempo de reacción (X2). El proceso opera actualmente en un rango de porcentaje de pureza
entre el 55% y el 75%, pero se cree que es posible un mayor porcentaje de rendimiento, así que
un investigador, interesado en determinar si efectivamente esto es así, decide llevar a cabo un
experimento variando la temperatura y el tiempo de reacción pero manteniendo fijos el resto de
los factores. Para el conjunto inicial de experimentos, considera dos niveles de temperatura (70º
C y 90º C) y dos niveles de tiempo (30 seg. y 90 seg.) y realiza dos observaciones de cada una de
las posibles combinaciones temperatura-tiempo. Los datos recogidos, que se muestran en la tabla
5.1., se utilizarán para ajustar el modelo bifactorial Y = α0 + α1 X1 + α2 X2.
Tiempo
(seg.)
30 90
Temp.
(º C)
49.8 65.7 (5.1.)
70
48.1 69.4
57.3 73.1
90
52.3 77.8
X1 - 80 X 2 - 60
x1 = x2 =
10 30
La localización de los cuatro puntos del diseño sobre la región completa de combinaciones
temperatura-tiempo se muestra a continuación:
Fig 5.1.- Valores observados en los cuatro tratamientos iniciales sobre la región
experimental definida por los niveles de los dos factores que influyen en el porcentaje de
rendimiento del proceso químico considerado.
Los valores del porcentaje de rendimiento, expresados en función de las variables codificadas,
vienen dados a través del siguiente modelo:
Y = β0 + β1 x1 + β2 x2 + ε (5.2)
en el que los parámetros β0, β1, β2 son función de α0, α1, α2:
β0 = α0 + 80 α1 + 60 α2 β1 = 10 α1 β2 = 30 α2
y el término ε representa el error aleatorio.
En notación matricial:
Y = X β + ε
49.8 1 - 1 - 1 ε1
48.1 1 - 1 - 1 ε
2
57.3 1 1 - 1 ε 3
β 0
52.3 = 1 1 - 1 β + ε 4
65.7 1 - 1 1 1 ε 5
β 2
69.4 1 - 1 1 ε 6
73.1 1 1 1 ε
7
77.8 1 1 1 ε 8
Los estimadores de los parámetros del modelo de primer orden se obtienen resolviendo la
ecuación normal:
1
8 0 0
8 0 0 b 0 493.5 b0 493.5 61.6875
0 8 0 b = 27.5 b = 0 1 27.5 = 3.4375
1 ⇒ 1 0
8
0 0 8 b 2 78.5 b 2 0 1 78.5 9.8125
0
8
Por tanto, el modelo ajustado de primer orden en las variables codificadas es:
Ŷ(x) = 61.6875 + 3.4375 x1 + 9.8125 x2 (5.3)
Las sumas de cuadrados necesarias para llevar a cabo el análisis de la varianza se calculan como
sigue:
(1' Y) 2
S.C.Total = Y' Y - = 898.749 con 7 g.l.
8
(1' Y) 2
S.C.Regresión = b' X' Y - = 864.812 con 2 g.l.
8
S.C.Error =
1
2
[
(49.8 - 48.1)2 + (57.3 - 52.3)2 + (65.7 - 69.4 )2 + (73.1 - 77.8)2 = ]
= 31.835 con 4 g.l.
Suma de Media
Fuente cuadrados gl cuadrática F
Regresión 864,812 2 432,406 63,709
Residual 33,936 5 6,787
Falta de Ajuste 2,101 1 2,101 0,264
Error 31,835 4 7,959
Total 898,749 7
El primer paso consiste en determinar si el modelo ajustado es adecuado. En vista de los datos
contenidos en la tabla, dado que FFalta de ajuste = 0.264 < F0.05,1,4 = 7.71, podemos considerar que el
modelo ajustado es una buena aproximación de la superficie de respuesta en la región
experimental en que estamos trabajando.
Como consecuencia de la conclusión a la que hemos llegado, el siguiente paso que debemos dar
es ejecutar contrastes por separado para determinar los efectos que, sobre el rendimiento, pueden
tener la temperatura y el tiempo:
1
Est.[σ 2 ] = SC Residuos = 6.7873 ⇒ Est.[Var(b i )] = Est.[σ 2 ] = 0.8484 i = 0, 1, 2
8
De esta manera obtenemos que t1 = 3.73 > t0.025,5 = 2.571 y t2 = 10.75 > t0.025,5 = 2.571, lo que
nos lleva a rechazar la hipótesis nula en ambos casos. Esto significa que tanto la temperatura
como el tiempo tienen efecto sobre el porcentaje de rendimiento. Es más, dado que tanto b1
como b2 son positivos, los efectos de x1 y x2 son positivos, lo que significa que si se eleva la
temperatura o se aumenta el tiempo, se produce un incremento significativo en el rendimiento del
proceso.
El modelo ajustado (5.4.) puede utilizarse ahora para representar, a través de una gráfica de
contornos, valores de la superficie de respuesta estimada sobre la región experimental, tal y como
se muestra a continuación:
La flecha perpendicular a las líneas de contorno de la superficie ajustada apunta hacia arriba y
hacia la derecha, lo que indica que los valores más altos de la respuesta se espera que se consigan
Por tanto, en la región de las condiciones iniciales de que partíamos hemos ajustado una
superficie de respuesta plana, que nos indica que es posible una mejora en el rendimiento, en
términos de un mayor valor de la variable respuesta. Así que, llegados a este punto, resulta natural
preguntarse que, si es posible ejecutar experimentos adicionales, con qué valores de tiempo y
temperatura deberían realizarse. Esto nos lleva a la segunda etapa en el proceso secuencial de
experimentación que estamos llevando a cabo, que es determinar qué estrategia seguir que nos
permita movernos en la dirección que indicaba la flecha de la gráfica anterior. Para ello recurrimos
al método de máxima pendiente en ascenso.
Dado que b2 > 0 en el modelo ajustado (5.3.), sabemos que la superficie crece en altura a medida
que aumenta el valor de x2, esto es, para valores de tiempo mayores de 60 seg. Vamos a buscar
ahora el valor del multiplicador de Lagrange µ que corresponde a un incremento arbitrario en el
tiempo (X2) de ∆2 = 45 seg., incremento que en las variables codificadas corresponde a un
aumento de 45/30 = 1.5 unidades. Por tanto:
b2 9.8125 b1 3.4375
µ= = = 3.27 ⇒ x1 = = = 0.536
2 ⋅ x 2 2 ⋅ 1.5 2 ⋅ µ 2 ⋅ 3.27
El primer punto en la pendiente de máximo ascenso se localiza, por tanto, en las coordenadas
(x1, x2) = (0.53, 1.5) (que corresponde, en las variables originales a (X1, X2) = (85.3, 105)). Para
comprobar si es de esperar aquí un incremento en el valor de la variable respuesta, se compara la
estimación del modelo en dicho punto con la estimación en el centro del diseño:
Los valores observados de porcentaje de rendimiento crecen hasta un valor de 84.7% para valores
de temperatura de 95.9º C y de tiempo de 195 seg. y entonces el valor cae hasta 80.1% para
valores de temperatura de 101.2º C y de tiempo de 240 seg. Esto nos lleva a pensar que o bien
101.2º C es una temperatura demasiado alta o bien 240 seg. es un tiempo demasiado largo para la
reacción. Así pues, no sería útil ejecutar experimentos adicionales a lo largo de la pendiente para
valores más altos de X1 y X2. Lo que se hace entonces es llevar a cabo un nuevo grupo de
experimentos para intentar ajustar de nuevo un modelo de primer orden, tal y como se hizo en un
primer momento, pero tomando como centro de diseño el punto (X1, X2) = (95.9, 195), pues es
aquí donde se ha observado un mayor rendimiento. Por tanto, se codifican nuevamente las
variables X1 y X2 pero utilizando ahora las siguientes transformaciones:
X 1 - 95.9 X 2 - 195
x1 = x2 =
10 30
que nos proporcionan los siguientes valores reales para los valores estándar de las variables
codificadas:
x1 X1 x2 X2
-1 85.9 -1 165
1 105.9 1 225
Tiempo
(seg.)
165 195 225
Temp.
(º C)
82.9 74.6
85.9 (5.5.)
81.4 77.0
84.7
95.9
81.9
87.4 84.5
105.9
89.5 83.1
El modelo ajustado de primer orden en las variables codificadas, obtenido tal y como se hizo para
el conjunto inicial de observaciones, es:
Ŷ(x) = 82.7 + 3.575 x1 – 2.750 x2 (5.6)
Suma de Media
Fuente cuadrados gl cuadrática F
Regresión 162,745 2 81,373 42,334
Residual 13,455 7 1,922
Falta de Ajuste 2,345 2 1,173 0,53
Error 11,110 5 2,222
Total 176,200 9
Ahora, como el test de significación genera un valor Fregresión= 42.34 altamente significativo, la
información obtenida del modelo ajustado (5.6.) puede utilizarse para obtener una nueva
dirección en la cual ejecutar experimentos adicionales en busca de valores más altos de porcentaje
de rendimiento, tal y como se hizo con el primer modelo de primer orden que se utilizó. Se indica
a continuación, de manera esquemática, el proceso seguido:
Dado que b1 > 0 en el modelo ajustado (5.6.), sabemos que la superficie crece en altura a medida
que aumenta el valor de x1, esto es, para valores de temperatura mayores de 95.9º C. Para un
incremento en la temperatura (X1) de ∆1 = 10º C, incremento que en las variables codificadas
En primer lugar, se lleva a cabo una nueva observación (paso 5) en el punto (115.9, 148.8), que
era el que correspondía, en el anterior grupo de experimentos, a un mayor porcentaje de
rendimiento. El valor obtenido en esta nueva observación confirma el alto valor observado en
aquel momento. Se realiza entonces (paso 6) una observación en la que se espera obtener un valor
más alto de rendimiento, incrementando los valores tanto de temperatura como de tiempo a
partir del punto (115.9, 148.8). De hecho, en el paso 6 las variables codificadas de las
combinaciones de tiempo y temperatura son +1 en ambos casos, en una replicación 3/4 de un
factorial 22 consistente en los puntos de los pasos 1, 3 y 6 con el punto 5 como centro. Dado que
Como el valor observado en el paso 8 es más bajo que el del paso 7, se decide no ir más allá del
paso 8, así que se establece un nuevo diseño usando como centro el punto del paso 7, (X1, X2) =
(135.9, 195). Por tanto, se codifican nuevamente las variables X1 y X2 pero utilizando ahora las
siguientes transformaciones:
X 1 - 135.9 X 2 - 195
x1 = x2 =
10 23.1
Se realiza una serie de observaciones hasta completar un diseño 22 aumentado con observaciones
en el centro, lo que nos proporciona la siguiente tabla de datos:
Tiempo
(seg.)
171.9 195 218.1
Temp.
(º C)
125.9 93.6 91.7 (5.8.)
96.2
135.9
97.0
A partir de estos datos, el modelo de primer orden ajustado que se obtiene es el siguiente:
Ŷ(x) = 93.983 + 0.025 x1 – 0.375 x2 (5.9)
Suma de Media
Fuente cuadrados gl cuadrática F
Regresión ,565 2 ,282 ,038
Residual 22,183 3 7,394
Falta de Ajuste 21,863 2 10,931 34,159
Error 0,320 1 0,320
Total 22,748 5
La secuencia de experimentos completa hasta llegar a este último modelo ajustado de primer
orden se muestra en la gráfica siguiente:
Resulta obvio de los datos contenidos en la tabla ANOVA que, dado que Fregresion = 0,038, el
modelo ajustado (5.9) no explica una cantidad significativa de toda la variación en el porcentaje de
rendimiento. Así pues, debemos recurrir a un ajuste de la superficie de respuesta a través de un
modelo de segundo orden:
Y = β0 + β1 x1 + β2 x2 +β11 x12 + β22 x22 +β12 x1 x2 + ε (5.10)
Se considera entonces el último diseño de primer orden que habíamos considerado, del que ya
disponemos de datos, y se completa con observaciones en los puntos axiales (x1, x2) = (±√2, 0) y
(x1, x2) = (0, ±√2) para conseguir un diseño central compuesto. Los datos recogidos se muestran
en la siguiente tabla:
Tiempo
(seg.)
162.3 171.9 195 218.1 227.7
Temp.
(º C)
121.75 92.7
150.04 92.8
A partir de estos datos, el modelo de segundo orden ajustado que se obtiene es el siguiente:
Ŷ(x) = 96.60 + 0.03 x1 – 0.31 x2 – 1.98 x12 – 1.83 x22 + 0.58 x1 x2 (5.12)
Suma de Media
Fuente cuadrados gl cuadrática F
Regresión 25,447 5 5,089 44,447
Residual ,458 4 ,115
Falta de Ajuste ,138 3 ,046 0,144
Error ,320 1 ,320
Total 25,905 9
El test para comprobar el ajuste del modelo (5.12.) proporciona un valor F < 1 que es claramente
no significativo y las estimaciones de los coeficientes cuadráticos puros son todas altamente
significativas (p < 0.0001), lo que indica que existe curvatura en la superficie ajustada y que ésta es
una buena aproximación de la superficie de respuesta real. Entonces se representa en la región
experimental la gráfica de contornos asociada a la superficie ajustada:
Fig 5.6.- Puntos del diseño utilizados para ajustar la superficie de segundo orden,
sobre la gráfica de contornos de la superficie ajustada de segundo orden.
Las líneas de contorno son elípticas y el punto de respuesta máxima, esto es el punto estacionario,
se hallará en el centro de la elipse más pequeña. El siguiente paso consiste, entonces, en
determinar las coordenadas del punto estacionario. Para ello, representamos la ecuación (5.12) en
notación matricial:
Ŷ(x) =b0 + x’ b + x’ B x
0.58
Yˆ (x 1 ) 0.03 - 1.98 2 x1
ˆ = b 0 + [x 1 x2 ] + [x 1 x2 ]
0.58
Y (x )
2 - 0.31 − 1.83 x 2
2
Se igualan a cero las derivadas parciales de Ŷ(x) con respecto a x1 y x2, y resolviendo para los
valores de los xi se obtiene que las coordenadas del punto estacionario vienen dadas de la
siguiente manera:
x B-1 b - 0.0486
x 0 = 01 = -
x 02 2 - 0.08568
que en las variables originales corresponden al punto X0 = (x10, x20) = (135.85, 193.02), que se
muestra en la gráfica siguiente:
Fig 5.7.- Punto estacionario del sistema, representado sobre la gráfica de contornos
de la superficie ajustada.
Así pues, el máximo valor de porcentaje de rendimiento se alcanza, según nos indican las
coordenadas del punto estacionario, para una temperatura de 135.85º C y un tiempo de reacción
de 193.02 seg. Si nos alejamos de este punto, aumentando o disminuyendo los valores de
temperatura o tiempo, el valor esperado de la variable respuesta decrece. Por tanto, para alcanzar
un porcentaje de rendimiento óptimo en el proceso químico que estamos considerando, debemos
trabajar con los valores de temperatura y tiempo que nos indica el punto estacionario, esto es,
135.85º C y 193.02 seg.
§ 6. BIBLIOGRAFÍA
[1] RESPONSE SURFACES. DESIGN AND ANALYSES.
Khuri, André I., Cornell, John A.
Statistics: Textbooks and monographs. 81.
Marcel Dekker, 1987. New York.