Tutorial Sobre Superficie de Respuesta

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 29

S U P E R F I C I E S D E R E S P U E S TA .

M É TO D O S Y D I S E Ñ O S .

Carmen Dolores Fernández Melcón


Montserrat Piñeiro Barcia
S U P E R F I C I E S D E R E S P U E S TA .
M É TO D O S Y D I S E Ñ O S .

§ 1. INTRODUCCIÓN A LA METODOLOGÍA DE SUPERFICIES DE RESPUESTA


La Metodología de Superficies de Respuesta (RSM) es un conjunto de técnicas
matemáticas utilizadas en el tratamiento de problemas en los que una respuesta de interés está
influida por varios factores de carácter cuantitativo. El propósito inicial de estas técnicas es
diseñar un experimento que proporcione valores razonables de la variable respuesta y, a
continuación, determinar el modelo matemático que mejor se ajusta a los datos obtenidos. El
objetivo final es establecer los valores de los factores que optimizan el valor de la variable
respuesta.

Cuando decimos que el valor real esperado, η, que toma la variable de interés considerada
está influido por los niveles de k factores cuantitativos, X1, X2, ..., Xk, esto significa que existe
alguna función de X1, X2, ..., Xk (que se supone continua en Xi, ∀ i = 1, ..., k) que proporciona el
correspondiente valor de η para alguna combinación dada de niveles:
η = f (X1, X2, ..., Xk)
de tal forma que la variable respuesta puede expresarse como:
Y = η + ε = f (X1, X2, ..., Xk) + ε
donde ε es el error observado en la respuesta.
La relación η = f (X1, X2, ..., Xk) existente entre η y los niveles de los k factores puede
representarse a través de una hipersuperficie (subconjunto de un espacio euclídeo (k+1)-
dimensional) a la que llamaremos superficie de respuesta.

Una técnica utilizada para ayudar a visualizar la forma que puede tener una superficie de
respuesta tridimensional consiste en representar la gráfica de contornos de la superficie, en la
que se trazan las denominadas líneas de contorno, que son curvas correspondientes a valores

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 1


1. Introducción a la Metodología de Superficies de Respuesta

constantes de la respuesta sobre el plano X1X2 (plano cuyos ejes coordenados vienen dados por
los niveles X1 y X2 de los factores). Geométricamente, cada línea de contorno es una proyección
sobre el plano X1X2 de una sección de la superficie de respuesta al intersecar con un plano
paralelo al X1X2. La gráfica de contornos resulta útil para estudiar los niveles de los factores en los
que se da un cambio en la forma o altura de la superficie de respuesta.

La existencia de gráficas de contorno no está limitada a 3 dimensiones a pesar de que en el


caso en que haya más de 3 factores de influencia no es posible la representación geométrica. No
obstante, el hecho de poder representar gráficas de contorno para problemas en que haya 2 o 3
factores permite visualizar más fácilmente la situación general.

[EJEMPLO.-] Un agricultor quiere maximizar su producción de almendras


(medida en Kg./Ha.) en función de las cantidades (medidas en Kg./Ha.) de dos tipos de
fertilizante, A y B, que utiliza. Una superficie de respuesta para la producción de almendras viene
dada por la gráfica siguiente:

Fig 1.1.- Superficie de respuesta tridimensional en la que se observa la producción


esperada de almendras (η) en función de las cantidades de fertilizante A (X1) y
fertilizante B (X2) utilizadas.

En este ejemplo, dado que hay dos factores de influencia (k = 2), la superficie de respuesta se
visualiza en un espacio tridimensional en el que la tercera dimensión representa la producción
esperada de almendras sobre el plano bidimensional definido por las combinaciones de los niveles
de los dos factores, X1 y X2.

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 2


1. Introducción a la Metodología de Superficies de Respuesta

Para generar la gráfica de contornos correspondiente se secciona la superficie de respuesta usando


planos paralelos al X1X2 en ciertos valores de respuesta considerados, por ejemplo:

Fig 1.2.- Sección de la superficie de respuesta por planos paralelos al plano X1X2,
en los valores esperados de producción: 11.5, 12.1, 12.7, 13.3, 13.9.

Cada línea de contorno representa un número infinito de combinaciones de las cantidades de los
dos fertilizantes, para las producciones de almendras esperadas consideradas. La producción
máxima, que es de 14.12 Kg./Ha. se localiza en el centro de la elipse más pequeña y corresponde
a los niveles X1 = 170.06 del fertilizante A y X2 = 246.65 del fertilizante B.

Fig 1.3.- Gráfica de contornos de la superficie de respuesta con líneas de contorno


correspondientes a los valores esperados de producción: 11.5, 12.1, 12.7, 13.3, 13.9.

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 3


2. Superficies de Respuesta Polinómicas. Modelos de Primer y Segundo Orden

La gráfica de contornos correspondiente a la superficie de respuesta del ejemplo que estamos


considerando nos indicaría que ésta tiene forma de loma.

A la hora de planificar el programa de experimentación que nos va a permitir llevar a


cabo el estudio acerca del efecto de los factores sobre la variable respuesta, el primer paso que
debemos dar es la elección de los factores que usaremos en el experimento. Una vez
determinados, el siguiente paso es seleccionar los rangos de valores de cada factor que se
considerarán, pues aunque en el experimento es posible explorar la región correspondiente al
espacio completo de los factores de influencia o región operativa, lo más frecuente consiste en
explorar únicamente una región de interés limitada, la región experimental, contenida en la
región general. De este modo, durante la ejecución del experimento, sólo se utilizarán niveles de
los factores correspondientes a valores que caigan en esta región, a menos que se descubra,
durante el conjunto inicial de experimentos, que pueda ser necesario explorar niveles que estén
más allá de los límites de la región considerada.

§ 2. SUPERFICIES DE RESPUESTA POLINÓMICAS. MODELOS DE PRIMER Y


SEGUNDO ORDEN

La forma de la función f que determina la relación entre los factores y la variable respuesta
es, en general, desconocida, por lo que el primer objetivo de la RSM consiste en establecer
experimentalmente una aproximación apropiada de la función f. Para ello, se propone un modelo
de ecuación, generalmente polinómico, en los k factores X1, X2, ..., Xk y se selecciona un conjunto
de tratamientos sobre los que realizar las observaciones experimentales, que se utilizarán tanto
para obtener estimaciones de los coeficientes en el modelo propuesto (por ejemplo, a través del
método de mínimos cuadrados) como para obtener una estimación de la variación del error
experimental (para lo que es necesario tener al menos 2 observaciones por cada tratamiento). Se
realizan, entonces, contrastes sobre las estimaciones de los parámetros y sobre el ajuste del
modelo y si el modelo se considera adecuado, puede utilizarse como función de aproximación. En
tal caso, el estudio de la superficie de respuesta se hace en términos de la superficie ajustada, pues
su análisis será aproximadamente equivalente al del sistema real.

Los polinomios usados más frecuentemente como funciones de aproximación son los de
órdenes uno y dos, que nos proporcionan, respectivamente los siguientes modelos:

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 4


2. Superficies de Respuesta Polinómicas. Modelos de Primer y Segundo Orden

k
modelo de primer orden ≡ Y = β 0 + ∑ β i X i + ε
i =1

k k
modelo de segundo orden ≡ Y = β 0 + ∑ β i X i + ∑ β ii X 2i + ∑ β ij X i X j + ε
i =1 i =1 i, j
i <j

§ 2.1. UTILIZACIÓN DE VARIABLES CODIFICADAS


En la construcción de modelos de superficies de respuesta, es muy común la codificación
de los valores reales de los niveles de los factores, pues las distancias medidas sobre los ejes de las
variables codificadas en el espacio k-dimensional se convierten en estándar, lo que facilita
considerablemente los cálculos que deben llevarse a cabo para obtener el modelo de
aproximación e incrementa el ajuste en la estimación de los coeficientes.

Una fórmula que suele resultar útil para codificar los valores de los factores es la siguiente:

X + X iNSup 
X i -  iNInf 
xi =  2  =
Xi - Xi
~
( )
i = 1, 2, ..., k
X iNSup - X iNInf X iNSup - X iNInf

donde XiNInf ≡ valor del nivel más bajo del factor i y XiNSup ≡ valor del nivel más alto del factor i y

~ X iNInf + X iNSup
Xi = , es la media entre los valores más alto y más bajo del nivel i = 1, ...,n. La
2
k
~ ~
fórmula anterior verifica que ∑ xi = 0 y transforma las medias X 1 , ..., X k en el punto
i =1

(x1, ..., xk) = (0, ..., 0) al que se denomina centro del diseño.

La fórmulas empleadas para la codificación dan lugar a transformaciones biyectivas entre


variables reales y codificadas, de manera que cualquier ecuación polinómica en los valores de xi se
puede expresar equivalentemente como una ecuación polinómica del mismo grado en los valores
de Xi. Por tanto, a partir de ahora se trabajará con las variables codificadas, pues las conclusiones
que se obtengan sobre éstas pueden extrapolarse a las variables reales.

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 5


2. Superficies de Respuesta Polinómicas. Modelos de Primer y Segundo Orden

§ 2.2. MODELOS DE PRIMER ORDEN


Cuando no se tiene suficiente información acerca de la forma que presenta la superficie de
respuesta, el primer intento de ajuste se hace, generalmente, aproximando a través de un modelo
de primer orden.

La forma general de un modelo de primer orden con k factores, X1, X2, ..., Xk, es:
k
Y = β0 + ∑β
i =1
i Xi + ε (2.1)

variable parámetros error


respuesta desconocidos aleatorio

o, equivalentemente, en forma matricial:


Y = Xβ + ε

donde la matriz X puede escribirse alternativamente como X = [ 1 : D ], con D la matriz de


combinaciones de niveles de los factores, denominada matriz de diseño.

Si la matriz X es de rango completo, entonces el estimador de β obtenido por el método


de mínimos cuadrados es b = (X’ X)-1 X’ Y (que es, de hecho, el mejor estimador lineal insesgado
de β) y la matriz de varianzas-covarianzas de b viene dada por Var(b) = (X’ X)-1 σ2.

El modelo de primer orden ajustado es, entonces:


k
Yˆ = b 0 + ∑bi =1
i Xi

Si el modelo está bien ajustado, la parte no aleatoria del modelo representa la respuesta
real esperada y ε es el error experimental. Sin embargo, si el modelo no está ajustado a la función
respuesta real, lo que ocurre cuando la relación entre la respuesta y los factores está demasiado
simplificada, ε contiene, además del error experimental, una parte de error no aleatorio que se
debe a la falta de ajuste.

§ 2.3. MODELOS DE SEGUNDO ORDEN


Cuando existe curvatura en la superficie de respuesta, el modelo de primer orden no es
una aproximación adecuada y es necesario utilizar un modelo que ajuste mejor. Se emplea
entonces un modelo de segundo orden.

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 6


2. Superficies de Respuesta Polinómicas. Modelos de Primer y Segundo Orden

La forma general de un modelo de segundo orden con k factores, X1, X2, ..., Xk es:
k k k -1 k
Y = β 0 + ∑ β i X i + ∑ β ii X 2i + ∑ ∑ β ij X i X j + ε (2.2)
i =1 i =1 i =1 j = 2
j> i

variable parámetros desconocidos error


respuesta aleatorio

De manera análoga a como se hizo para los modelos de primer orden se obtiene que el
modelo ajustado de segundo orden es:
k k k -1 k
Yˆ = b 0 + ∑ b i X i + ∑ b ii X 2i + ∑∑ b ij X i X j
i =1 i =1 i =1 j = 2
j> i

§ 2.4. NATURALEZA SECUENCIAL DE LA METODOLOGÍA DE SUPERFICIES DE RESPUESTA


La RSM es una técnica secuencial. A menudo, la estimación inicial de las condiciones
óptimas de operación está alejada del óptimo real, así que el objetivo es, usando un método lo
más simple y menos costoso posible, moverse rápidamente hacia las cercanías del óptimo.

En general, se sabe muy poco o nada acerca de la relación existente entre la variable
respuesta y los factores, así que, en un principio, se propone el modelo de aproximación más
simple posible, el de primer orden, que suministra la base para ejecutar un conjunto inicial de
experimentos que proporcionarán datos correspondientes a los puntos del diseño de primer
orden. Si los datos recogidos permiten hacer una estimación de la varianza del error, se puede
llevar a cabo un contraste para evaluar el ajuste del modelo. Esto nos lleva a una segunda etapa,
que consiste en localizar áreas de la región experimental en las que se sospeche que puedan estar
los valores más deseables de la variable respuesta. El plan que vamos a seguir, que nos llevará
hacia valores máximos en la respuesta, se conoce como método de máxima pendiente en
ascenso (en descenso si lo que queremos es minimizar los valores de la respuesta).

MÉTODO DE MÁXIMA PENDIENTE EN ASCENSO

El método de máxima pendiente en ascenso consiste en ejecutar una secuencia de


experimentos a lo largo de la línea de máximo incremento de la respuesta. Si el modelo ajustado
de primer orden es adecuado, la información que éste proporciona se utiliza para determinar una
dirección en la cual se espere observar mayores valores de la variable respuesta. A medida que se
avanza sobre la superficie ajustada en la dirección en que se incrementan los valores de la

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 7


3. Diseños de superficies de respuesta

respuesta y se va llegando a una región en la que haya curvatura en la superficie real, el


incremento en la respuesta se estabilizará en el punto más alto de la superficie ajustada. Si se
continúa en esta dirección y la altura de la superficie disminuye, se lleva a cabo un nuevo conjunto
de experimentos y se ajusta de nuevo el modelo de primer orden. Se determina una nueva
dirección hacia valores crecientes de la respuesta y se ejecuta otra secuencia de experimentos en la
dirección determinada. Este proceso continúa hasta que se hace evidente que a partir del método
no se puede obtener un incremento en la respuesta o éste es muy pequeño.

Si los tests de ajuste detectan que puede haber curvatura en la superficie, se aumenta un
grado al modelo añadiéndole los términos del producto cruzado y/o los términos cuadráticos
puros y se completa el diseño de primer orden añadiéndole los puntos necesarios para ajustar el
nuevo modelo de segundo orden. Si el modelo de segundo orden se ajusta adecuadamente, se
utiliza para describir la forma de la superficie a través de la gráfica de contornos en la región
experimental. Se utiliza entonces el modelo ajustado de segundo orden para localizar, en el lugar
en el que la pendiente de la superficie ajustada es cero, las coordenadas del punto estacionario,
que es el punto que proporciona el valor óptimo de la variable respuesta y, si se detecta que éste
se encuentra dentro de los límites de la región experimental, se pasa a determinar su naturaleza (si
es máximo, mínimo o punto de silla). Si, por el contrario, el punto estacionario no se halla dentro
de la región experimental, hemos de realizar una nueva experimentación en la dirección en la que
éste se encuentra. Una vez que se ha localizado el punto que proporciona valores óptimos de la
variable respuesta, se describe la superficie en un entorno próximo a éste.

§ 3. DISEÑOS DE SUPERFICIES DE RESPUESTA


La elección de un diseño adecuado del experimento a realizar es fundamental para
modelar y explorar la superficie de respuesta usada para ajustar un modelo polinómico al
conjunto de datos recogidos en los puntos del diseño. Así pues, sería deseable que el diseño
tuviera, de las características que se enumeran a continuación, y dado que algunas de ellas resultan
conflictivas entre sí, las que más sirvan al interés del experimento:
1. Generar una distribución razonable de puntos y, por tanto, de información, en toda la
región de interés, pero utilizando el menor número posible de puntos experimentales.
2. Asegurar que, para cada punto x, el valor ajustado, Ŷ(x), está tan cerca como sea posible
del valor real, Y(x).

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 8


3. Diseños de superficies de respuesta

3. Permitir la detección de falta de ajuste en el modelo.


4. Permitir la ejecución de los experimentos en bloques.
5. Permitir la construcción secuencial de diseños de orden creciente.
6. Proporcionar una estimación interna de la varianza del error.
7. Asegurar simplicidad en los cálculos de las estimaciones de los parámetros del modelo.

Además de las propiedades mencionadas, sería muy conveniente que el diseño elegido
fuera ortogonal y/o invariante por rotación:

Un diseño ortogonal es aquel en el que los términos del modelo ajustado son
incorrelados y, por tanto, también las estimaciones de los parámetros lo son, en cuyo caso, la
varianza de la respuesta esperada en cualquier punto de la región experimental se puede expresar
como la suma ponderada de las varianzas de los parámetros estimados del modelo.

Por otro lado, en un diseño invariante por rotación, la varianza de Ŷ(x), que depende de
la situación del punto x, es función únicamente de la distancia del punto al centro del diseño, lo
que significa que es la misma en todos los puntos equidistantes del centro del diseño. Teniendo
en cuenta que el objetivo de la RSM es la optimización de la respuesta y que se desconoce la
localización del óptimo antes de ejecutar el experimento, esta propiedad resulta muy interesante,
puesto que garantiza que el diseño proporciona estimaciones igualmente precisas en todas las
direcciones.

§ 3.1. DISEÑOS DE PRIMER ORDEN


Si el modelo (2.1) es una representación adecuada de la respuesta real esperada, entonces
el diseño elegido para estimar los parámetros debe proporcionar valores razonables de la
respuesta sobre la región de interés. Los diseños considerados con el propósito de recoger datos
para ajustar un modelo de primer orden se conocen como diseños de primer orden.

Un criterio razonable para la elección de un diseño de primer orden adecuado es la


minimización de Var(Ŷ), lo que se logra minimizando la varianza de los estimadores de los
parámetros βi, i = 1, ..., k. Hay una única clase de diseños que lo consiguen, los ortogonales, que
en los modelos de primer orden son aquellos para los que se verifica que los elementos de fuera
de la diagonal principal de la matriz X’X son cero, lo que nos permite determinar de manera
independiente los efectos de los k factores (medidos a través de los valores de bi, i = 1, ..., k).
Además, se verifica que todo diseño ortogonal de primer orden es invariante por rotación. Por

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 9


3. Diseños de superficies de respuesta

tanto, consideraremos únicamente aquellos diseños de primer orden que son ortogonales y, en
particular, los diseños factoriales 2k y las fracciones de diseños factoriales 2k.

DISEÑOS FACTORIALES 2K

En un diseño factorial 2k, para cada factor se consideran dos niveles, que pueden
codificarse en los valores +1 (para el más alto) y –1 (para el más bajo). Considerando todas las
posibles combinaciones de los niveles de los k factores, se obtiene una matriz de diseño de 2k
filas, cada una de las cuales representa un tratamiento.

Los diseños factoriales 2k presentan el inconveniente de que, salvo que se repitan algunas
observaciones, no permiten la estimación del error experimental. Una técnica habitual para incluir
repeticiones consiste en aumentar el diseño con algunas observaciones en el centro, pues esto no
influye sobre las estimaciones de los parámetros y no altera la ortogonalidad del diseño, aunque
como resultado, la estimación de β0 es la media de todas las observaciones.

FRACCIONES DE DISEÑOS FACTORIALES 2K

Estamos considerando los diseños factoriales 2k para ajustar los modelos de primer orden,
pero si se recogen datos en todos los puntos es posible, en realidad, estimar todos los coeficientes
de un modelo de la forma:
k k k
Y = β 0 + ∑ β i x i + ∑ ∑ β ij x i x j + ∑∑ ∑β ijl x i x j x l + ... + β12...k x 1 x 2 ... x k + ε
i =1 i =1 < j i =1 < j < l

en el que los términos adicionales de mayor orden están asociados con las interacciones entre los
factores. De esta manera, el número de puntos del diseño, y por tanto, el número de
observaciones, junto con el número de posibles términos del modelo con parámetros estimables,
se incrementan rápidamente a medida que aumenta el número k de factores.

Así pues, hay que valorar, en función del coste del experimento, si para ajustar un modelo
de primer orden es necesario llevar a cabo las 2k combinaciones, o si es más conveniente omitir
algunas utilizando únicamente un subconjunto de los puntos de un diseño factorial 2k. Se puede
considerar en este último caso una fracción 2-m de un diseño 2k que consiste en 2k-m tratamientos
(k ≥ m), siempre y cuando el diseño resultante tenga, al menos, k+1 puntos, que es el número de
parámetros que han de estimarse y mantenga las mismas propiedades que las del factorial
completo, en particular, sea ortogonal.

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 10


3. Diseños de superficies de respuesta

§ 3.2. DISEÑOS DE SEGUNDO ORDEN


Los diseños utilizados para recoger observaciones que permitan estimar los parámetros de
los modelos de segundo orden se denominan diseños de segundo orden. Éstos deben tener, al
menos, (k+1)(k+2)/2 puntos, que es precisamente el número de coeficientes del modelo que se
necesita estimar y deben involucrar, como mínimo 3 factores, dado que el modelo contiene
términos cuadráticos puros. Por otro lado, sería conveniente, por las razones que se han
comentado, que fueran ortogonales y/o invariantes por rotación. Así pues, se van a considerar los
diseños factoriales 3k, que son ortogonales, pero no invariantes por rotación, y los diseños
compuestos centrales, que verifican ambas propiedades.

DISEÑOS FACTORIALES 3K

En los diseños factoriales 3k cada uno de los k factores presenta 3 niveles, de manera que
el número de observaciones experimentales es N = 3k. Este número puede hacerse excesivamente
grande, especialmente cuando se están estudiando muchos factores, de manera que en ocasiones
conviene más considerar diseños fraccionales 3k-m de los diseños factoriales 3k, tal y como se hizo
para los diseños factoriales 2k.

Los diseños 3k y sus fracciones presentan el inconveniente de que, aunque son


ortogonales, no son invariantes por rotación, lo que hace que no sean muy buena elección como
diseños de superficies de respuesta de segundo orden.

DISEÑOS COMPUESTOS CENTRALES

Los diseños compuestos centrales se presentan como una alternativa a los diseños
factoriales 3k.

Un diseño compuesto central consiste en:


1. parte factorial: un diseño factorial 2k, completo o fraccional, en el que los niveles
están codificados en la forma habitual como ±1 ,
2. n0 ( ≥ 1) puntos centrales,
3. parte axial: dos puntos axiales en los ejes correspondientes a cada uno de los
factores, situados a una distancia α del centro del diseño.
de manera que el número total de puntos del diseño es N = 2k + 2k + n0.

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 11


3. Diseños de superficies de respuesta

En principio, los diseños compuestos centrales así definidos no tienen por qué ser ni
ortogonales ni invariantes por rotación. Se convierten en invariantes por rotación mediante una
elección adecuada del valor de α, que debe depender del número de puntos de la parte factorial
del diseño para conseguirlo. Por otro lado, a través de una elección apropiada de n0 el diseño
puede hacerse ortogonal o incluso de precisión uniforme (diseño que verifica que Var(Ŷ) en el
origen es la misma que en un punto a una distancia unitaria del origen), que permite mayor
protección que un diseño ortogonal contra el sesgo de los coeficientes de regresión producido

por la presencia de términos de orden mayor que 2 en la superficie real. Se muestra a


continuación una tabla con los valores que deben tomar α y n0, según el número de factores del
modelo, para que el diseño correspondiente sea ortogonal o de precisión uniforme:

2 3 4 5 5 6 6 7 8
k
½ rep. ½ rep. ½ rep. ½ rep.
puntos
4 8 16 32 16 64 32 64 128
factoriales
puntos
4 6 8 10 10 12 12 14 16
axiales
DISEÑO ORTOGONAL

n0 8 9 12 17 10 24 15 22 33
N 16 23 36 59 36 100 59 100 177

DISEÑO DE PRECISIÓN UNIFORME

n0 5 6 7 10 6 15 9 14 20
N 13 20 31 52 32 91 53 92 164

α 1.414 1.682 2 2.378 2 2.828 2.378 2.828 3.364

Una propiedad muy interesante de los diseños centrales compuestos es que se pueden
construir a partir de un diseño de primer orden (el 2k) sin más que agregar los puntos axiales y
quizá algunos puntos centrales.

Por todas las propiedades que verifican, los diseños compuestos centrales son
posiblemente los más utilizados para ajustar superficies de respuesta de segundo orden.

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 12


4. Algunas consideraciones finales

§ 4. ALGUNAS CONSIDERACIONES FINALES


BLOQUES

En los diseños de superficies de respuesta es frecuente que, por diversas causas, se haga
necesaria la utilización de bloques para asegurar la homogeneidad de las condiciones de trabajo.
Por ejemplo:

si se ha de trabajar con varias remesas de material, diferentes entre sí por cuestiones de


composición, procedencia u otras características cualesquiera, resulta conveniente hacer
bloques para asegurar la homogeneidad del material,

cuando se construye un diseño de segundo orden a partir de uno de primer orden, puede
ocurrir que las condiciones de trabajo se vean modificadas durante el tiempo que transcurre
entre la ejecución de los experimentos iniciales y la ejecución de los experimentos
complementarios, lo que hace necesaria la formación de bloques,

si el número de factores es tan elevado como para necesitar que una gran cantidad de
observaciones se lleven a cabo bajo las mismas condiciones y esto no es posible, la creación
de bloques garantiza la homogeneidad de las condiciones de trabajo.

EXPERIMENTOS DE MEZCLA

Los desarrollos acerca de la RSM que se han llevado a cabo en los epígrafes anteriores se
han hecho bajo la suposición de que los niveles de cada factor son independientes de los niveles
de los demás factores. Sin embargo, puede ocurrir que esto no sea así, como es el caso de los
experimentos de mezcla, en los que los factores son ingredientes de una mezcla y sus niveles
no son independientes. En este caso, se supone que la variable respuesta depende únicamente de
las proporciones relativas de los componentes presentes en la mezcla.

En los experimentos de mezcla, el propósito del programa experimental es modelar la


superficie a través de una función que permita, por un lado, determinar empíricamente los
valores esperados de la variable respuesta para alguna combinación de ingredientes y, por otro,
obtener alguna medida de la influencia de cada componente sobre la variable respuesta, tanto
por separado como en combinación con los otros ingredientes.

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 13


5. Un ejemplo numérico

EVOP

En muchas ocasiones puede resultar inviable, por diversas razones, llevar a cabo los
procedimientos experimentales de la RSM en procesos de producción a gran escala. En estos
casos es frecuente que la RSM se aplique a operaciones en plantas piloto, para posteriormente
extrapolar las conclusiones obtenidas a los procesos a escala normal. El problema que plantean
estos procedimientos es que el paso del entorno de trabajo de la planta piloto al real puede llevar
aparejada una distorsión en las condiciones óptimas, pues aunque la planta a escala normal
comienza su operación con niveles óptimos, generalmente se desvía de estos niveles como
consecuencia de la variación en las condiciones del entorno de trabajo. El objetivo en estos casos
es hacer un seguimiento del proceso en su escala normal que permita ir redirigiendo las
condiciones de operación hacia el óptimo o, en todo caso, permita hacer un seguimiento de las

desviaciones que aparezcan. Con este fin se emplean los métodos de operación evolutiva o
EVOP, que consisten en introducir sistemáticamente pequeños cambios en los niveles de los
factores de tal manera que no se provoquen alteraciones importantes en el rendimiento, calidad
o cantidad, pero que permitan la detección de potenciales mejoras en el desempeño del proceso.
Para llevarlas a cabo se emplean, en general, diseños factoriales 2k.

§ 5. UN EJEMPLO NUMÉRICO
El rendimiento (Y) de un determinado proceso químico se puede medir en términos de
la cantidad de material residual eliminado durante la reacción, resultando así una medida de la
pureza del producto final, y se conoce que depende, entre otros factores, de la temperatura (X1)
y el tiempo de reacción (X2). El proceso opera actualmente en un rango de porcentaje de pureza
entre el 55% y el 75%, pero se cree que es posible un mayor porcentaje de rendimiento, así que
un investigador, interesado en determinar si efectivamente esto es así, decide llevar a cabo un
experimento variando la temperatura y el tiempo de reacción pero manteniendo fijos el resto de
los factores. Para el conjunto inicial de experimentos, considera dos niveles de temperatura (70º
C y 90º C) y dos niveles de tiempo (30 seg. y 90 seg.) y realiza dos observaciones de cada una de
las posibles combinaciones temperatura-tiempo. Los datos recogidos, que se muestran en la tabla
5.1., se utilizarán para ajustar el modelo bifactorial Y = α0 + α1 X1 + α2 X2.

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 14


5. Un ejemplo numérico

Tiempo
(seg.)
30 90
Temp.
(º C)
49.8 65.7 (5.1.)
70
48.1 69.4
57.3 73.1
90
52.3 77.8

Se codifican las variables X1 y X2 utilizando las transformaciones siguientes:

X1 - 80 X 2 - 60
x1 = x2 =
10 30

que nos proporcionan los siguientes valores codificados:


X1 x1 X2 x2
70 -1 30 -1
90 1 90 1

La localización de los cuatro puntos del diseño sobre la región completa de combinaciones
temperatura-tiempo se muestra a continuación:

Fig 5.1.- Valores observados en los cuatro tratamientos iniciales sobre la región
experimental definida por los niveles de los dos factores que influyen en el porcentaje de
rendimiento del proceso químico considerado.

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 15


5. Un ejemplo numérico

Los valores del porcentaje de rendimiento, expresados en función de las variables codificadas,
vienen dados a través del siguiente modelo:
Y = β0 + β1 x1 + β2 x2 + ε (5.2)
en el que los parámetros β0, β1, β2 son función de α0, α1, α2:
β0 = α0 + 80 α1 + 60 α2 β1 = 10 α1 β2 = 30 α2
y el término ε representa el error aleatorio.

En notación matricial:

Y = X β + ε
 49.8  1 - 1 - 1  ε1 
 48.1  1 - 1 - 1 ε 
    2
57.3  1 1 - 1 ε 3 
    β 0   
52.3 =  1 1 - 1 β  + ε 4 
65.7   1 - 1 1  1 ε 5 
    β 2   
69.4  1 - 1 1 ε 6 
 73.1  1 1 1 ε 
     7
77.8  1 1 1 ε 8 

donde εi, i = 1, 2, ..., k, se suponen independientes e igualmente distribuidos según una


distribución N(0,σ2).

Los estimadores de los parámetros del modelo de primer orden se obtienen resolviendo la
ecuación normal:

X’X b = X’Y ⇒ b = (X’X)-1 X’Y

1 
8 0 0
8 0 0   b 0  493.5 b0    493.5 61.6875
0 8 0   b  =  27.5  b  = 0 1  27.5  =  3.4375 
   1   ⇒  1 0    
 8 
0 0 8 b 2   78.5  b 2  0 1  78.5   9.8125 
 0
8 
Por tanto, el modelo ajustado de primer orden en las variables codificadas es:
Ŷ(x) = 61.6875 + 3.4375 x1 + 9.8125 x2 (5.3)

y el modelo equivalente en las variables originales es:


Ŷ(x) = 14.5625 + 0.3437 X1 + 0.3271 X2 (5.4)

Las sumas de cuadrados necesarias para llevar a cabo el análisis de la varianza se calculan como
sigue:

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 16


5. Un ejemplo numérico

(1' Y) 2
S.C.Total = Y' Y - = 898.749 con 7 g.l.
8

(1' Y) 2
S.C.Regresión = b' X' Y - = 864.812 con 2 g.l.
8

S.C.Residual = Y' Y - b' X' Y = 33.936 con 5 g.l.

S.C.Error =
1
2
[
(49.8 - 48.1)2 + (57.3 - 52.3)2 + (65.7 - 69.4 )2 + (73.1 - 77.8)2 = ]
= 31.835 con 4 g.l.

S.C.Falta de Ajuste = SCResidual - SCError = 2.101 con 1 g.l.

El análisis de la varianza (ANOVA) se muestra en la siguiente tabla:

Suma de Media
Fuente cuadrados gl cuadrática F
Regresión 864,812 2 432,406 63,709
Residual 33,936 5 6,787
Falta de Ajuste 2,101 1 2,101 0,264
Error 31,835 4 7,959
Total 898,749 7

El primer paso consiste en determinar si el modelo ajustado es adecuado. En vista de los datos
contenidos en la tabla, dado que FFalta de ajuste = 0.264 < F0.05,1,4 = 7.71, podemos considerar que el
modelo ajustado es una buena aproximación de la superficie de respuesta en la región
experimental en que estamos trabajando.

Al no descubrir evidencia de la falta de ajuste del modelo, el siguiente paso es determinar si el


modelo ajustado explica una cantidad significativa de la variación de los valores de rendimiento
observado. Para ello se realiza el siguiente contraste:

H0 : β1 = β2 = 0 ⇔ la temperatura y el tiempo no influyen sobre el rendimiento


del proceso
H1 : β1 ≠ 0 o β2 ≠ 0 ⇔ la temperatura y/o el tiempo influyen sobre el
rendimiento del proceso
Los datos contenidos en la tabla, dado que Fregresión= 63.71 > F0.01,2,5 = 13.27, nos llevan a rechazar
la hipótesis nula, lo que significa que uno de los parámetros β1 o β2, o ambos, son no nulos en la
ecuación (5.2.).

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 17


5. Un ejemplo numérico

Como consecuencia de la conclusión a la que hemos llegado, el siguiente paso que debemos dar
es ejecutar contrastes por separado para determinar los efectos que, sobre el rendimiento, pueden
tener la temperatura y el tiempo:

1. H01 : β1 = 0 ⇔ la temperatura no tiene efecto sobre el rendimiento del proceso


2. H02 : β2 = 0 ⇔ el tiempo no influye sobre el rendimiento del proceso
bi - 0
para los que se calcula el valor de t i = i = 1, 2 , utilizando que:
Est[Var(b i )]

1
Est.[σ 2 ] = SC Residuos = 6.7873 ⇒ Est.[Var(b i )] = Est.[σ 2 ] = 0.8484 i = 0, 1, 2
8
De esta manera obtenemos que t1 = 3.73 > t0.025,5 = 2.571 y t2 = 10.75 > t0.025,5 = 2.571, lo que
nos lleva a rechazar la hipótesis nula en ambos casos. Esto significa que tanto la temperatura
como el tiempo tienen efecto sobre el porcentaje de rendimiento. Es más, dado que tanto b1
como b2 son positivos, los efectos de x1 y x2 son positivos, lo que significa que si se eleva la
temperatura o se aumenta el tiempo, se produce un incremento significativo en el rendimiento del
proceso.

El modelo ajustado (5.4.) puede utilizarse ahora para representar, a través de una gráfica de
contornos, valores de la superficie de respuesta estimada sobre la región experimental, tal y como
se muestra a continuación:

Fig 5.2.- Gráfica de contornos de la superficie de respuesta dada por la ecuación


(5.4.). La flecha, perpendicular a las líneas de contorno de la superficie ajustada, indica
la dirección de máximo ascenso.

La flecha perpendicular a las líneas de contorno de la superficie ajustada apunta hacia arriba y
hacia la derecha, lo que indica que los valores más altos de la respuesta se espera que se consigan

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 18


5. Un ejemplo numérico

aumentando los valores de x1 y x2 por encima de 1, acción que correspondería a aumentar la


temperatura por encima de 90º C y el tiempo de reacción por encima de 90 seg.

Por tanto, en la región de las condiciones iniciales de que partíamos hemos ajustado una
superficie de respuesta plana, que nos indica que es posible una mejora en el rendimiento, en
términos de un mayor valor de la variable respuesta. Así que, llegados a este punto, resulta natural
preguntarse que, si es posible ejecutar experimentos adicionales, con qué valores de tiempo y
temperatura deberían realizarse. Esto nos lleva a la segunda etapa en el proceso secuencial de
experimentación que estamos llevando a cabo, que es determinar qué estrategia seguir que nos
permita movernos en la dirección que indicaba la flecha de la gráfica anterior. Para ello recurrimos
al método de máxima pendiente en ascenso.

Dado que b2 > 0 en el modelo ajustado (5.3.), sabemos que la superficie crece en altura a medida
que aumenta el valor de x2, esto es, para valores de tiempo mayores de 60 seg. Vamos a buscar
ahora el valor del multiplicador de Lagrange µ que corresponde a un incremento arbitrario en el
tiempo (X2) de ∆2 = 45 seg., incremento que en las variables codificadas corresponde a un
aumento de 45/30 = 1.5 unidades. Por tanto:

b2 9.8125 b1 3.4375
µ= = = 3.27 ⇒ x1 = = = 0.536
2 ⋅ x 2 2 ⋅ 1.5 2 ⋅ µ 2 ⋅ 3.27

de manera que el cambio incremental en la temperatura es ∆1 = 0.53 · 10 = 5.3ºC

El primer punto en la pendiente de máximo ascenso se localiza, por tanto, en las coordenadas
(x1, x2) = (0.53, 1.5) (que corresponde, en las variables originales a (X1, X2) = (85.3, 105)). Para
comprobar si es de esperar aquí un incremento en el valor de la variable respuesta, se compara la
estimación del modelo en dicho punto con la estimación en el centro del diseño:

Ŷ(0.53, 1.5) –Ŷ(0, 0) = 78.2281 - 61.6875 = 16.5406

Aunque la estimación Ŷ(0.53, 1.5) corresponde a un punto de fuera de la región experimental,


parece que, dado que la diferencia es positiva, sería posible observar valores de la respuesta más
altos en la dirección especificada por el punto (x1, x2) = (0.53, 1.5).

Así pues, se ejecutan experimentos a lo largo de la pendiente de máximo ascenso en puntos


correspondientes a incrementos de la distancia de 1.5∆i, 2∆i, 3∆i y 4∆i, i = 1, 2, cuyas
coordenadas, junto con los correspondientes valores observados de porcentaje de rendimiento se
muestran en la tabla siguiente:

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 19


5. Un ejemplo numérico

DIRECCIÓN Temperatura Tiempo Porcentaje


1 (ºC) (seg.) de rendimiento
Centro 80.0 60
∆i 5.3 45
Centro + ∆i 85.3 105 74.3
Centro + 1.5 ∆i 87.95 127.5 78.6
Centro + 2 ∆i 90.6 150 83.2
Centro + 3 ∆i 95.9 195 84.7
Centro + 4 ∆i 101.2 240 80.1

Los valores observados de porcentaje de rendimiento crecen hasta un valor de 84.7% para valores
de temperatura de 95.9º C y de tiempo de 195 seg. y entonces el valor cae hasta 80.1% para
valores de temperatura de 101.2º C y de tiempo de 240 seg. Esto nos lleva a pensar que o bien
101.2º C es una temperatura demasiado alta o bien 240 seg. es un tiempo demasiado largo para la
reacción. Así pues, no sería útil ejecutar experimentos adicionales a lo largo de la pendiente para
valores más altos de X1 y X2. Lo que se hace entonces es llevar a cabo un nuevo grupo de
experimentos para intentar ajustar de nuevo un modelo de primer orden, tal y como se hizo en un
primer momento, pero tomando como centro de diseño el punto (X1, X2) = (95.9, 195), pues es
aquí donde se ha observado un mayor rendimiento. Por tanto, se codifican nuevamente las
variables X1 y X2 pero utilizando ahora las siguientes transformaciones:

X 1 - 95.9 X 2 - 195
x1 = x2 =
10 30

que nos proporcionan los siguientes valores reales para los valores estándar de las variables
codificadas:
x1 X1 x2 X2
-1 85.9 -1 165
1 105.9 1 225

Se realiza entonces un nuevo experimento en el que se llevan a cabo 2 observaciones en cada


uno de los puntos del nuevo diseño, más el centro. Los datos recogidos se muestran en la tabla
(5.5.):

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 20


5. Un ejemplo numérico

Tiempo
(seg.)
165 195 225
Temp.
(º C)
82.9 74.6
85.9 (5.5.)
81.4 77.0
84.7
95.9
81.9
87.4 84.5
105.9
89.5 83.1

El modelo ajustado de primer orden en las variables codificadas, obtenido tal y como se hizo para
el conjunto inicial de observaciones, es:
Ŷ(x) = 82.7 + 3.575 x1 – 2.750 x2 (5.6)

y el modelo equivalente en las variables originales es:


Ŷ(x) = 66.2908 + 0.3575 X1 - 0.0917 X2 (5.7)

El análisis de la varianza (ANOVA) se muestra en la siguiente tabla:

Suma de Media
Fuente cuadrados gl cuadrática F
Regresión 162,745 2 81,373 42,334
Residual 13,455 7 1,922
Falta de Ajuste 2,345 2 1,173 0,53
Error 11,110 5 2,222
Total 176,200 9

Nuevamente, el primer paso consiste en determinar si el modelo ajustado es adecuado, de


acuerdo con los datos contenidos en la tabla. Dado que Ffalta de ajuste = 0.53 < F0.05,2,5 = 5.79,
podemos considerar que el modelo ajustado es una buena aproximación de la superficie de
respuesta en la región experimental en que estamos trabajando actualmente.

Ahora, como el test de significación genera un valor Fregresión= 42.34 altamente significativo, la
información obtenida del modelo ajustado (5.6.) puede utilizarse para obtener una nueva
dirección en la cual ejecutar experimentos adicionales en busca de valores más altos de porcentaje
de rendimiento, tal y como se hizo con el primer modelo de primer orden que se utilizó. Se indica
a continuación, de manera esquemática, el proceso seguido:

Dado que b1 > 0 en el modelo ajustado (5.6.), sabemos que la superficie crece en altura a medida
que aumenta el valor de x1, esto es, para valores de temperatura mayores de 95.9º C. Para un
incremento en la temperatura (X1) de ∆1 = 10º C, incremento que en las variables codificadas

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 21


5. Un ejemplo numérico

corresponde a un aumento de 1 unidad y que supone un incremento en el tiempo de


∆2 = -077 · 30 = -23.1 seg. El primer punto en la pendiente de máximo ascenso se localiza, por
tanto, en las coordenadas (x1, x2) = (1, -0.77) (que corresponde, en las variables originales a
(X1, X2) = (105.9, 171.9)). Dado que la diferencia Ŷ(1, -0.77) –Ŷ(0, 0) = 5.6925 es positiva, sería
posible observar valores de la respuesta más altos en la dirección especificada por el punto (x1, x2).
Así, el modelo ajustado (5.7.) puede utilizarse para representar, a través de una gráfica de
contornos, valores de la superficie de respuesta estimada sobre la región experimental, tal y como
se muestra a continuación:

Fig 5.3.- Gráfica de contornos de la superficie de respuesta dada por la ecuación


(5.7.). La flecha, perpendicular a las líneas de contorno de la superficie ajustada, indica
la dirección de máximo ascenso.
La flecha perpendicular a las líneas de contorno de la superficie ajustada apunta ahora
hacia abajo y hacia la derecha, indicando la dirección en la que se espera obtener valores más altos
de porcentaje de rendimiento. Así pues, se ejecutan experimentos a lo largo de la pendiente de
máximo ascenso en puntos correspondientes a incrementos de la distancia de ∆i, 2∆i, 3∆i y 4∆i,
i = 1, 2, cuyas coordenadas, junto con los correspondientes valores observados de porcentaje de
rendimiento se muestran en la tabla siguiente:

DIRECCIÓN Temperatura Tiempo Porcentaje


Paso
2 (ºC) (seg.) de rendimiento
Centro 95.9 195
∆i 10 -23.1
1 Centro + ∆i 105.9 171.9 89.0
2 Centro + 2 ∆i 115.9 148.8 90.2
3 Centro + 3 ∆i 125.9 125.7 87.4
4 Centro + 4 ∆i 135.9 102.6 82.6

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 22


5. Un ejemplo numérico

Los valores observados de rendimiento crecen hasta un valor de 90.2%, en el punto


(X1, X2) = (115.9, 148.8) y luego vuelven a caer.

Esta secuencia de experimentos ejecutada a lo largo de la nueva dirección se muestra en la gráfica


siguiente:

Fig 5.4.- Secuencia de experimentos realizados a lo largo de la dirección indicada por


la segunda pendiente de máximo ascenso.
Para verificar los altos valores de rendimiento observados se lleva a cabo una nueva serie de
observaciones, cuyos resultados se muestran en la siguiente tabla y cuya forma de ejecución se
detalla a continuación:

DIRECCIÓN Temperatura Tiempo Porcentaje


Paso
3 (ºC) (seg.) de rendimiento
5 Centro + 2∆i 115.9 148.8 91.0
6 Centro + 3 ∆i 125.9 171.9 93.6
7 Centro + 4 ∆i 135.9 195 96.2
8 Centro + 5 ∆i 145.9 218.1 92.9

En primer lugar, se lleva a cabo una nueva observación (paso 5) en el punto (115.9, 148.8), que
era el que correspondía, en el anterior grupo de experimentos, a un mayor porcentaje de
rendimiento. El valor obtenido en esta nueva observación confirma el alto valor observado en
aquel momento. Se realiza entonces (paso 6) una observación en la que se espera obtener un valor
más alto de rendimiento, incrementando los valores tanto de temperatura como de tiempo a
partir del punto (115.9, 148.8). De hecho, en el paso 6 las variables codificadas de las
combinaciones de tiempo y temperatura son +1 en ambos casos, en una replicación 3/4 de un
factorial 22 consistente en los puntos de los pasos 1, 3 y 6 con el punto 5 como centro. Dado que

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 23


5. Un ejemplo numérico

en el paso 6 se observa un mayor rendimiento que en el paso 5, se ejecutan experimentos


adicionales (pasos 7 y 8) a partir de una tercera dirección definida por la línea que une los puntos
de los pasos 5 y 6. La elección de esta tercera dirección representa una desviación de la
aproximación convencional de la pendiente de máximo ascenso, pero se toma en un intento de
reducir el trabajo que supondría hacer un experimento correspondiente a un diseño factorial 22
completo con centro en el punto del paso 5 y el consiguiente ajuste de un nuevo modelo de
primer orden.

Como el valor observado en el paso 8 es más bajo que el del paso 7, se decide no ir más allá del
paso 8, así que se establece un nuevo diseño usando como centro el punto del paso 7, (X1, X2) =
(135.9, 195). Por tanto, se codifican nuevamente las variables X1 y X2 pero utilizando ahora las
siguientes transformaciones:

X 1 - 135.9 X 2 - 195
x1 = x2 =
10 23.1

Se realiza una serie de observaciones hasta completar un diseño 22 aumentado con observaciones
en el centro, lo que nos proporciona la siguiente tabla de datos:
Tiempo
(seg.)
171.9 195 218.1
Temp.
(º C)
125.9 93.6 91.7 (5.8.)
96.2
135.9
97.0

145.9 92.5 92.9

A partir de estos datos, el modelo de primer orden ajustado que se obtiene es el siguiente:
Ŷ(x) = 93.983 + 0.025 x1 – 0.375 x2 (5.9)

El análisis de la varianza (ANOVA) se muestra en la siguiente tabla:

Suma de Media
Fuente cuadrados gl cuadrática F
Regresión ,565 2 ,282 ,038
Residual 22,183 3 7,394
Falta de Ajuste 21,863 2 10,931 34,159
Error 0,320 1 0,320
Total 22,748 5

La secuencia de experimentos completa hasta llegar a este último modelo ajustado de primer
orden se muestra en la gráfica siguiente:

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 24


5. Un ejemplo numérico

Fig 5.5.- Secuencia completa de experimentos realizados a lo largo de las direcciones


indicadas por las sucesivas pendientes de máximo ascenso que se han ido obteniendo,
sobre la gráfica de contornos del último modelo de primer orden ajustado.

Resulta obvio de los datos contenidos en la tabla ANOVA que, dado que Fregresion = 0,038, el
modelo ajustado (5.9) no explica una cantidad significativa de toda la variación en el porcentaje de
rendimiento. Así pues, debemos recurrir a un ajuste de la superficie de respuesta a través de un
modelo de segundo orden:
Y = β0 + β1 x1 + β2 x2 +β11 x12 + β22 x22 +β12 x1 x2 + ε (5.10)

Se considera entonces el último diseño de primer orden que habíamos considerado, del que ya
disponemos de datos, y se completa con observaciones en los puntos axiales (x1, x2) = (±√2, 0) y
(x1, x2) = (0, ±√2) para conseguir un diseño central compuesto. Los datos recogidos se muestran
en la siguiente tabla:
Tiempo
(seg.)
162.3 171.9 195 218.1 227.7
Temp.
(º C)

121.75 92.7

125.9 93.6 91.7 (5.11.)


96..2
135.9 93.4 92.7
97.0

145.9 92.5 92.9

150.04 92.8

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 25


5. Un ejemplo numérico

A partir de estos datos, el modelo de segundo orden ajustado que se obtiene es el siguiente:
Ŷ(x) = 96.60 + 0.03 x1 – 0.31 x2 – 1.98 x12 – 1.83 x22 + 0.58 x1 x2 (5.12)

El análisis de la varianza (ANOVA) se muestra en la siguiente tabla:

Suma de Media
Fuente cuadrados gl cuadrática F
Regresión 25,447 5 5,089 44,447
Residual ,458 4 ,115
Falta de Ajuste ,138 3 ,046 0,144
Error ,320 1 ,320
Total 25,905 9

El test para comprobar el ajuste del modelo (5.12.) proporciona un valor F < 1 que es claramente
no significativo y las estimaciones de los coeficientes cuadráticos puros son todas altamente
significativas (p < 0.0001), lo que indica que existe curvatura en la superficie ajustada y que ésta es
una buena aproximación de la superficie de respuesta real. Entonces se representa en la región
experimental la gráfica de contornos asociada a la superficie ajustada:

Fig 5.6.- Puntos del diseño utilizados para ajustar la superficie de segundo orden,
sobre la gráfica de contornos de la superficie ajustada de segundo orden.

Las líneas de contorno son elípticas y el punto de respuesta máxima, esto es el punto estacionario,
se hallará en el centro de la elipse más pequeña. El siguiente paso consiste, entonces, en
determinar las coordenadas del punto estacionario. Para ello, representamos la ecuación (5.12) en
notación matricial:

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 26


5. Un ejemplo numérico

Ŷ(x) =b0 + x’ b + x’ B x
 0.58 
 Yˆ (x 1 )  0.03  - 1.98 2  x1 
ˆ  = b 0 + [x 1 x2 ]  + [x 1 x2 ]
0.58  
 Y (x )
2  - 0.31  − 1.83 x 2 
 2 
Se igualan a cero las derivadas parciales de Ŷ(x) con respecto a x1 y x2, y resolviendo para los
valores de los xi se obtiene que las coordenadas del punto estacionario vienen dadas de la
siguiente manera:

x  B-1 b  - 0.0486 
x 0 =  01  = -
x 02  2 - 0.08568

que en las variables originales corresponden al punto X0 = (x10, x20) = (135.85, 193.02), que se
muestra en la gráfica siguiente:

Fig 5.7.- Punto estacionario del sistema, representado sobre la gráfica de contornos
de la superficie ajustada.

Así pues, el máximo valor de porcentaje de rendimiento se alcanza, según nos indican las
coordenadas del punto estacionario, para una temperatura de 135.85º C y un tiempo de reacción
de 193.02 seg. Si nos alejamos de este punto, aumentando o disminuyendo los valores de
temperatura o tiempo, el valor esperado de la variable respuesta decrece. Por tanto, para alcanzar
un porcentaje de rendimiento óptimo en el proceso químico que estamos considerando, debemos
trabajar con los valores de temperatura y tiempo que nos indica el punto estacionario, esto es,
135.85º C y 193.02 seg.

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 27


6. Bibliografía

§ 6. BIBLIOGRAFÍA
[1] RESPONSE SURFACES. DESIGN AND ANALYSES.
Khuri, André I., Cornell, John A.
Statistics: Textbooks and monographs. 81.
Marcel Dekker, 1987. New York.

[2] DISEÑO DE EXPERIMENTOS.


Kuehl, Robert O.
International Thomson, 2001.

[3] DISEÑO Y ANÁLISIS DE EXPERIMENTOS.


Montgomery, Douglas C.
Grupo Editorial Iberoamérica, 1991.

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 28

También podría gustarte