Diseño Factorial 2k

Descargar como ppt, pdf o txt
Descargar como ppt, pdf o txt
Está en la página 1de 51

Diseños Factoriales 2k

• Referencia del libro Capítulo 6


• Caso especial diseño factorial; k factores, todos con
dos niveles
• Los dos niveles son usualmente llamados bajo y alto
(éstos podrían ser cuantitativos o cualitativos)
• Ampliamente utilizados en experimentación
industrial
• Forman una base para otros diseños experimentales
• Métodos cortos especiales para el análisis

1
El Caso Más Simple: El 22
“-” y “+” denotan los
niveles alto y bajo de
cada factor
Bajo y alto son
téminos arbitraios
Geométricamente,
las cuatro corridas
forman las esquinas
de un cuadrado.
Factores pueden ser
cuantitativos o
cualitativos, aunque
su tratamiento en el
modelo final será
diferente.
2
Ejemplo Proceso Químico

A = concentración del reactivo, B = cantidad de


catalítico, y = conversión (rendimiento) de un
proceso químico.

3
Procedimiento de Análisis para un
Diseño Factorial
• Estimar efectos del factor
• Formular el modelo
– Con réplicas, usar modelo completo
– Con un diseño no replicado, usar gráficos de
probabilidad normal
• Pruebas Estadísticas (ANOVA)
• Refinar el modelo
• Analizar residuos (gráficamente)
• Interpretar resultados

4
Estimación de Efectos del Factor
A  y A  y A
Ver texto, pg. 221 para cálculos
ab  a b  (1)
  manuales
2n 2n
 1n [ab  a  b  (1)] Los estimados de los efectos
son: A = 8.33, B = -5.00,
B  yB  yB 
AB = 1.67
ab  b a  (1)
  Interpretación práctica?
2n 2n
 1n [ab  b  a  (1)] Análisis con Minitab
ab  (1) a  b
AB  
2n 2n
 1n [ab  (1)  a  b]
5
Estimación de Efectos del Factor
Formar Modelo Tentativo
Analysis of Variance for Y (coded units)

Source DF Seq SS Adj SS Adj MS F P


Main Effects 2 283,333 283,333 141,667 36,17 0,000
2-Way Interactions 1 8,333 8,333 8,333 2,13 0,183
Residual Error 8 31,333 31,333 3,917
Pure Error 8 31,333 31,333 3,917
Total 11 323,000

6
Pruebas Estadísticas - ANOVA
Estimated Effects and Coefficients for Y (coded units)

Term Effect Coef SE Coef T P


Constant 27,500 0,5713 48,14 0,000
A 8,333 4,167 0,5713 7,29 0,000
B -5,000 -2,500 0,5713 -4,38 0,002
A*B 1,667 0,833 0,5713 1,46 0,183

7
Refinar el Modelo
Analysis of Variance for Y (coded units)

Source DF Seq SS Adj SS Adj MS F P


Main Effects 2 283,333 283,333 141,667 32,14 0,000
Residual Error 9 39,667 39,667 4,407
Lack of Fit 1 8,333 8,333 8,333 2,13 0,183
Pure Error 8 31,333 31,333 3,917
Total 11 323,000

Hay ahora una suma de cuadrados de residuos, partiocionado en el


componente “lack of fit” (la interacción AB ) y un componente de
“pure error”

8
Diagnóstico de Residuales
Residual Plots for Y
Normal Probability Plot of the Residuals Residuals Versus the Fitted Values
99

90 2

Residual
Percent

50
0

10
-2
1
-5,0 -2,5 0,0 2,5 5,0 20 25 30 35
Residual Fitted Value

Histogram of the Residuals Residuals Versus the Order of the Data


4
2
3
Frequency

Residual

2
0
1

-2
0
-2 -1 0 1 2 3 1 2 3 4 5 6 7 8 9 10 11 12
Residual Observation Order

9
La Superficie de Respuesta

Contour Plot of Y vs B. A Surface Plot of Y vs B. A


1,0
Y
< 21
21 - 24
24 - 27
0,5 27 - 30
30 - 33
> 33
35

0,0
B

30
Y

25

-0,5 1
20
0 B
-1
0 -1
A 1

-1,0
-1,0 -0,5 0,0 0,5 1,0
A

10
El Diseño Factorial 23

11
Efectos en el Diseño Factorial 23

A  y A  y A
B  yB   yB 
C  yC   yC 
etc, etc, ...

Análisis
hecho via
Minitab

12
Un Ejemplo de un Diseño Factorial 23

A = carbonatación, B = Presión, C = Velocidad, y =


desviación de llenado
13
Modelo Completo
Analysis of Variance for Y (coded units)

Source DF Seq SS Adj SS Adj MS F P


Main Effects 3 68,500 68,500 22,8333 36,53 0,000
2-Way Interactions 3 3,500 3,500 1,1667 1,87 0,214
3-Way Interactions 1 1,000 1,000 1,0000 1,60 0,242
Residual Error 8 5,000 5,000 0,6250
Pure Error 8 5,000 5,000 0,6250
Total 15 78,000

14
Propiedades de la Tabla
• Excepto para la columna I, cada columna tiene un número igual de signos + y
-
• La suma del producto de los signos en cualquiera dos columnas es cero
• Multiplicar cualquier columna por I deja esa columna sin cambiar (elemento
identidad)
• El producto de cualquiera dos columnas produce una columna en la tabla:
A  B  AB
AB  BC  AB 2C  AC

• Diseño Ortogonal
• Ortogonalidad es una propiedad importante compartida por todos los diseños
factoriales

15
Estimación de Efectos de Factores

Estimated Effects and Coefficients for


Y (coded units)

Term Effect Coef SE Coef T P


Constant 1,0000 0,1976 5,06 0,001
A 3,0000 1,5000 0,1976 7,59 0,000
B 2,2500 1,1250 0,1976 5,69 0,000
C 1,7500 0,8750 0,1976 4,43 0,002
A*B 0,7500 0,3750 0,1976 1,90 0,094
A*C 0,2500 0,1250 0,1976 0,63 0,545
B*C 0,5000 0,2500 0,1976 1,26 0,242
A*B*C 0,5000 0,2500 0,1976 1,26 0,242
16
Refinar Modelo – Remover Factores
No Significativos

Estimated Effects and Coefficients for Y (coded units)

Term Effect Coef SE Coef T P


Constant 1,0000 0,2030 4,93 0,000
A 3,0000 1,5000 0,2030 7,39 0,000
B 2,2500 1,1250 0,2030 5,54 0,000
C 1,7500 0,8750 0,2030 4,31 0,001
A*B 0,7500 0,3750 0,2030 1,85 0,092

17
Resumen Estadístico del Modelo
(pg. 239)
• Error estándar de coeficientes del modelo
2
ˆ ˆ  MS E 0.625
se(  )  V (  )  k
 k
  0.20
n2 n2 2(8)

• Intervalo de Confianza en coeficientes del


modelo
ˆ  t se( ˆ )    ˆ  t se( ˆ )
 / 2, df E  / 2, df E

18
Otros métodos para evaluar la significancia de los efectos

• Gráfico de Probabilidad Normal de Efectos


• Intervalo de confianza de 100(1-) para los
efectos:
2*S
se( Efecto) 
Efecto ± t/2, N-p* se(efecto) pag. 241 n 2k
S2= MSE, N= n*2k, p= número de parámetros del
modelo

• Utilizar estimados de interacciones altas no significativas para estimar se(efecto)

19
• Efectos de Localización
– Afectan solo el promedio de la respuesta

• Efectos de Dispersión
– Afectan la variabilidad de la respuesta
– Métodos de detección:
– Ejemplo 6-4, pag. 260 (Residuos)
– Determinar Rangos por corrida

20
Gráficos de Residuos son satisfactorios
Residual Plots for Y
Normal Probability Plot of the Residuals Residuals Versus the Fitted Values
99
1,0
90
0,5

Residual
Percent

50 0,0

-0,5
10
-1,0
1
-2 -1 0 1 2 -2 0 2 4
Residual Fitted Value

Histogram of the Residuals Residuals Versus the Order of the Data


4
1,0

3 0,5
Frequency

2
Residual 0,0

-0,5
1
-1,0
0
-1,0 -0,5 0,0 0,5 1,0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Residual Observation Order

21
Interpretación del Modelo
Interaction Plot (data means) for Y Interacción
moderada entre
A
4
-1
1

3 nivel de
2
carbonatación y
presión
Mean

-1

-2
-1 1
B

22
Interpretación del Modelo
Cube Plot (data means) for Y Gráficos de Cubo
1,0 5,5 son útiles para
visualizar
1
-0,5 2,5 resultados
experimentales

B -0,5 1,5
1

C
-2,0 0,5
-1 -1
-1 1
A

23
Efectos Principales
Main Effects Plot (data means) for Y
A B

0
Mean of Y

-1 1 -1 1
C

-1 1

24
Gráficos de Contorno y Superficie de Respuesta –
Velocidad en Nivel Alto

Surface Plot of Y vs B. A Contour Plot of Y vs B. A


Hold Values 30
Y
C 200 < -2
-2 - -1
-1 - 0
29
0 - 1
1 - 2
> 2
28 Hold Values
C 200
2

B
Y 27
0

30,0
-2 26
27,5 B
10
11 25,0
A 12

25
10,0 10,5 11,0 11,5 12,0
A

25
El Diseño Factorial 2k
• Sección 6-4, pg. 242, Tabla 6-9, pg. 243
• Habrán k efectos principales, y
k 
  two-factor interactions
 2
k 
  three-factor interactions
 3

1 k  factor interaction
26
Diseños Factoriales 2k Sin Réplicas
• Estos son diseños factoriales 2k con una
observación en cada esquina del cubo
• Un diseño factorial 2k sin réplicas es también
llamado una réplica simple del 2k
• Estos diseños son usados ampliamente
• Riesgos…si hay sólo una observación en cada
esquina, podría haber una posibilidad de
observaciones inusuales que perjudiquen los
resultados

27
Espaciamiento de los
niveles de un factor en el
diseño factorial 2k no
replicado.
Si los factores son
espaciados muy
cercanamente, esto
aumenta la probabilidad
que el ruido abundará la
señal en los datos.
Un espaciamiento más
agresivo es usualmente
mejor.

28
Diseños Factoriales No Replicados 2k
• Falta de réplicas causa problemas potenciales en
las pruebas estadísticas.
– Replicación permite un estimado del “error puro” (o
mejor dicho es un estimado interno del error).
– Sin réplicas, ajustar el modelo completo resulta en cero
grados de libertad para el error.
• Soluciones potenciales a este problema
– Agrupar interacciones de alto orden para estimar error
– Gráficos de probabilidad normal
– Otros métodos … ver texto, pp. 246

29
Ejemplo de un Diseno 2k No replicado

• Un diseño factorial 24 fue utilizado para


investigar el efecto de cuatro factores en el
índice de filtración de una resina.
• Los factores son A = temperatura, B =
presión, C = concentración del formaldehído,
D= velocidad de agitación
• Experimento se realizó en una planta piloto.

30
El experimento en la planta piloto

31
El experimento en la planta piloto

32
Estimados de los Efectos
Term Effect Coef
Constant 70,063
A 21,625 10,812
B 3,125 1,562
C 9,875 4,938
D 14,625 7,312
A*B 0,125 0,062
A*C -18,125 -9,063
A*D 16,625 8,313
B*C 2,375 1,188
B*D -0,375 -0,187
C*D -1,125 -0,563
A*B*C 1,875 0,937
A*B*D 4,125 2,063
A*C*D -1,625 -0,813
B*C*D -2,625 -1,312
A*B*C*D 1,375 0,687

33
El gráfico de probabilidad normal de
los Efectos
Normal Probability Plot of the Effects
(response is Y, Alpha = ,05)
99
Effect Type
Not Significant
95 A Significant
90 AD F actor N ame
A A
D
80 B B
C
70 C C
Percent

60 D D
50
40
30
20

10
5 AC

1
-20 -10 0 10 20
Effect
Lenth's PSE = 2,625

34
Resumen ANOVA para el Modelo
Term Effect Coef SE Coef T P
Constant 70,063 1,104 63,44 0,000
A 21,625 10,812 1,104 9,79 0,000
C 9,875 4,938 1,104 4,47 0,001
D 14,625 7,312 1,104 6,62 0,000
A*C -18,125 -9,062 1,104 -8,21 0,000
A*D 16,625 8,313 1,104 7,53 0,000

S = 4,41730 R-Sq = 96,60% R-Sq(adj) = 94,89%

Analysis of Variance for Y (coded units)

Source DF Seq SS Adj SS Adj MS F P


Main Effects 3 3116,19 3116,19 1038,73 53,23 0,000
2-Way Interactions 2 2419,62 2419,62 1209,81 62,00 0,000
Residual Error 10 195,12 195,12 19,51
Lack of Fit 2 15,62 15,62 7,81 0,35 0,716
Pure Error 8 179,50 179,50 22,44
Total 15 5730,94

35
Residuos del Modelo son Satisfactorios
Residual Plots for Y
Normal Probability Plot of the Residuals Residuals Versus the Fitted Values
99
5,0
90
2,5

Residual
Percent

50 0,0
-2,5
10
-5,0
1
-10 -5 0 5 10 40 60 80 100
Residual Fitted Value

Histogram of the Residuals Residuals Versus the Order of the Data


4
5,0

3 2,5
Frequency

Residual

0,0
2
-2,5
1
-5,0
0
-6 -4 -2 0 2 4 6 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Residual Observation Order

36
Interpretación del Modelo –
Interacciones
Interaction Plot (data means) for Y
Interaction Plot (data means) for Y
100 A
90 A
-1
-1
1
1

80 90

70
80

Mean
Mean

60
70

50

60
40
-1 1 -1 1
C D

37
Interpretación del Modelo – Gráfico
de Cubo
Si un factor es
Cube Plot (data means) for Y
eliminado, el diseño
72,5 91,0
no replicado 24 se
proyectará en dos
réplicas de un 23.
74,0 62,5
1

La proyección del
C 44,0 102,0
1
diseño es propiedad
46,5 68,0
D extremadamente útil
-1
-1 1
-1 que nos lleva a
A
factoriales
fraccionados.

38
Interpretación del Modelo – Gráficos
de Superficies de Respuesta
Contour Plot of Y vs C. A Surface Plot of Y vs C. A
1,0 Hold Values
Y
D -1
< 50
50 - 55
55 - 60
0,5 60 - 65
65 - 70
> 70

Hold Values
D -1 70
0,0
C

Y 60

50 1
-0,5
0 C
-1
0 -1
A 1

-1,0
-1,0 -0,5 0,0 0,5 1,0
A

Con concentración ya sea en nivel bajo o alto, alta temperatura y alta


velocidad de agitación resulta en altos índices de filtración.
39
El Experimento de Perforación
Ejemplo 6-3, pg. 257

A = carga de perforadora, B = rapidez de flujo, C =


velocidad de rotación, D = tipo de lodo, y = rapidez
de avance de una perforadora. 40
Estimados de Efectos - El Experimento de
la Perforación
Term Effect SumSqr % Contribution
Model Intercept
Error A 0.9175 3.36722 1.28072
Error B 6.4375 165.766 63.0489
Error C 3.2925 43.3622 16.4928
Error D 2.29 20.9764 7.97837
Error AB 0.59 1.3924 0.529599
Error AC 0.155 0.0961 0.0365516
Error AD 0.8375 2.80563 1.06712
Error BC 1.51 9.1204 3.46894
Error BD 1.5925 10.1442 3.85835
Error CD 0.4475 0.801025 0.30467
Error ABC 0.1625 0.105625 0.0401744
Error ABD 0.76 2.3104 0.87876
Error ACD 0.585 1.3689 0.520661
Error BCD 0.175 0.1225 0.0465928
Error ABCD 0.5425 1.17722 0.447757

Lenth's ME 2.27496
Lenth's SME 4.61851 41
Gráficos de Residuos
DESIGN-EXPERT Plot
XPERT Plot
Normal plot of residuals
adv._rate
Residuals vs. Predicted
2.58625

99

95
1.44875
Norm al % probability

90

80

Res iduals
70

50 0.31125
DESIGN-EXPERT Plo t
a dv ._ra te Residuals vs. Predicted
2. 58625

1. 44875

30

R es id uals
0. 31125

- 0. 82625

- 1. 96375

1.6 9 4. 70 7. 70 10. 71 13. 71

Pre d i c te d

20

10
-0.82625
5

-1.96375

-1.96375 -0.82625 0.31125 1.44875 2.58625


1.69 4.70 7.70 10.71 13.71

Res idual Predicted

42
Gráficos de Residuos

• Loa gráficos de residuos indican que hay problemas


con la suposición de igualdad de varianzas.
• El planteamiento usual es emplear una
transformación en la respuesta.
• Transformación utilizada y* = ln y
Transformaciones son típicamente realizadas para
– Estabilizar varianza
– Inducir normalidad
– Simplificar el modelo

43
Otros Ejemplos de Diseños 2k
No replicados
• El experimento de los paneles laterales
(Ejemplo 6-4, pg. 260)
– Dos factores afectan el número promedio de
defectos (Efectos de localización)
– Un tercer factor afecta variabilidad
– Gráficos de residuos fueron útiles en identificar los
efectos de dispersión.

44
Adición de Puntos Centrales en el Diseño

• Supuesto de linealidad
• Sólo para factores cuantitativos
• Basado en la idea de replicar algunas de las corridas en
un diseño factorial.
• Corridas en el centro proveen un estimado del error y
permiten al experimentador distinguir entre dos
posibles modelos:
k k k
First-order model (interaction) y   0    i xi    ij xi x j  
i 1 i 1 j i
k k k k
Second-order model y   0    i xi    ij xi x j    ii xi2  
i 1 i 1 j i i 1
45
yF  yC  no "curvature"
La hipótesis es:
k
H 0 :   ii  0
i 1
k
H1 :   ii  0
i 1

nF nC ( yF  yC ) 2
SS Pure Quad 
nF  nC
Esta suma de cuadrados tiene
solo un grado de libertad.

46
Ejemplo 6-6, Pg. 273

nC  5

Usualmente entre 3 y
6 puntos centrales
trabajarán bien.

47
ANOVA para Ejemplo 6-6
Source DF Seq SS Adj SS Adj MS F P
Main Effects 2 2,82500 2,82500 1,41250 32,85
0,003
2-Way Interactions 1 0,00250 0,00250 0,00250 0,06 0,821
Curvature 1 0,00272 0,00272 0,00272 0,06 0,814
Residual Error 4 0,17200 0,17200 0,04300
Pure Error 4 0,17200 0,17200 0,04300
Total 8 3,00222

48
Si la curvatura es significativa, aumente el diseño con corridas
axiales para crear un diseño central compuesto. El CCD es un
diseño muy efectivo para ajustar un modelo de superficie de
respuesta de segundo orden.

49
Usos prácticos de Puntos Centrales
(pg. 275)
• Usar condiciones de operación actuales como el
punto central.
• Chequear por condiciones abnormales durante el
tiempo que el experimento fue conducido.
• Chequear por tendencias en el tiempo
• Usar puntos centrales como las primeras corridas
cuando hay poca o ninguna información
disponible sobre la magnitud del error.
• Puntos centrales y factores cualitativos?

50
Puntos Centrales y Factores
Cualitativos

51

También podría gustarte