Diseño de Experimento Factorial

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 37

UNIVERSIDAD DEL ATLANTICO

PROGRAMA DE MATEMATICAS

INTRODUCCIÒN A LOS DISEÑOS FACTORIALES.

PROFESOR: KENNEDY HURTADO IBARRA


Licenciado en Matemática y Física
Especialista en Estadística Aplicada
Magister en Estadística Aplicada
Doctor en Ciencias de la Educación
Celular: 3002426058
Correo institucional: kennedyhurtado@mail.uniatlantico.edu.co
Bibliografías:
MONTGOMERY, DOUGLAS C. Diseño de Experimentos. McGraw-Hill. México 2002.
DEVORE, JAY L. Probabilidad y estadística para ingeniería y ciencia. Thomson Quinta
Edición. México 2001.
MONTGOMERY, DOUGLAS C. Probabilidad y estadística aplicadas a la Ingeniería.
McGraw-Hill. México 1996.
Plan de la sesión

1. DISEÑO FACTORIALES
1.1 DEFINICIONES Y CONCEPTOS
1.2 LA VENTAJA DE LOS DISEÑOS FACTORIALES
1.3 DISEÑO FACTORIAL DE DOS FACTORES
1.3.1 Análisis estadístico del modelo con efectos fijos
1.3.2 Tabla de Análisis de Varianza para el diseño factorial de factores
del modelo con efectos fijos
1.4 EJEMPLO
1.4.1 Tabla de ANOVA para los datos del ejemplo de batería.
1.5 UNA OBSERVACIÓN POR CELDA
1. DISEÑO FACTORIALES
1.1.- DEFINICIONES y CONCEPTOS
Definición
Para los experimentos donde interviene el estudio de los efectos de dos o más
factores los diseños más eficientes son los factoriales.
Por diseño factorial se entiende que en cada ensayo o réplica completa del
experimento se investigan todas las combinaciones posibles de los niveles de
los factores. Cuando los factores están incluidos en un diseño factorial, es
común decir que están cruzados.
Definición
El efecto de un factor se define como el cambio de la respuesta producido por
un cambio en el nivel de factor. Con frecuencia se llama efecto principal porque
se refiere a los factores de interés primario en el experimento.

Definición Existe interacción cuando en el experimento la diferencia en la


respuesta entre los niveles de un factor no es la misma para todos los niveles
de los otros factores
1.2.- LA VENTAJA DE LOS DISEÑOS FACTORIALES

Los diseños factoriales son más eficientes que los experimentos


de un solo factor a la vez.

El diseño factorial es necesario cuando puede haber interacciones


presentes a fin de evitar llegar a conclusiones incorrectas.

Los diseños factoriales permiten la estimación de los efectos de un


factor con varios niveles de los factores restantes, produciendo
conclusiones que son validas para un rango de condiciones
experimentales..
1.3 DISEÑO FACTORIAL DE DOS FACTORES
sea la respuesta observada cuando el factor A tiene el nivel i-
ésimo (i=1,…, a) y el factor B tiene el nivel j-ésimo (j=1,…, b)
en la réplica k-ésima (k=1,…, n). El orden en que se hacen las
abn observaciones se selecciona al azar, por lo que este
diseño es un diseño completamente aleatorizado.
Factor B

1 2 b

1 ,,…, ,,…, ,,…,

Factor A 2 ,,…, ,,…, ,,…,

a ,,…, ,,…, ,,…,


El modelo de un experimento factorial de los efectos:

Donde es el efecto promedio global, es el efecto del nivel –esimo del factor A de los renglones, es
el efecto del nivel–esimo del factor B de las columnas, es el efecto de la interacción entre y , y es
un componente del error aleatorio.

Se supone que ambos factores son fijos, y los efectos de los tratamientos se definen como las
desviaciones de la media global, por lo que:

Los efectos de las interacciones son fijos y se definen de tal modo que
El modelo de un experimento factorial de las medias:

Donde la media de la celda ij –esima es:

El modelo de un experimento factorial de regresión:


Se considera que

Donde es la variable respuesta, las son parámetros cuyos valores deben


determinarse, es una variable que representa al factor A, es una variable que
representa al factor B, y es un error aleatorio.
El interés se centra en probar hipótesis acerca de la igualdad de los efectos de los
tratamientos de los renglones, de las columnas y también si los tratamientos de los
renglones y las columnas interactúan, así:

Por último,
1.3.1 Análisis estadístico del modelo con efectos fijos
Sea que denote el total de observaciones bajo el nivel i-ésimo del factor A, que
denote el total de observaciones bajo el nivel j-ésimo del factor B, que denote el
total de observaciones de la celda ij-ésima, y que denote el gran total de todas las
observaciones. Se definen como los promedios correspondientes de los
renglones, las columnas, las celdas y el gran promedio.
La suma de cuadrados total corregida puede escribirse simbólicamente

Aquì,
El número de grados de libertad asociado con cada suma de cuadrados es

Efecto Grados de libertad

A a-1
B b-1
Interacción AB (a-1)(b-1)

Error ab(n-1)
Total abn-1
1.3.2 Tabla de Análisis de Varianza para el diseño factorial de factores del
modelo con efectos fijos

Fuente de variación Suma de cuadrados Grados de libertad Cuadrado medio


Tratamiento A a-1

Tratamiento B b-1

Interacción (a-1)(b-1)

Error ab(n-1)

Total abn-1
Ejemplo:
En unos laboratorios se está estudiando los factores que influyen en la
resistencia de un tipo particular de fibra. Se eligen al azar cuatro máquinas y
tres operarios y se realiza un experimento factorial usando fibras de un
mismo lote de producción. Los resultados obtenidos se muestran en la tabla
adjunta. Analizar los resultados y obtener las conclusiones apropiadas.

Tipo de Maquinas
Operarios A B C D
1 109 110 108 110

110 115 109 108


2 110 110 111 114

112 111 109 112


3 116 112 114 120

114 115 119 117


Tipo de Maquinas
Operarios A B C D
109 110 108 110
1 219 225 217 218 879
110 115 109 108
110 110 111 114
2 222 221 220 226 889
112 111 109 112
116 112 114 120
230 227 233 237 927
3 114 115 119 117

y.j. 671 673 670 681 2695


Las sumas de cuadrados se muestran a continuación

= = 12,46
= = 160,33

=262,97-12,46-160,33-44,67= 45,5
GlA = a – 1 = 3
GlB = b – 1 =2
GlAB = (a- 1)(b – 1) = 6
GlErrror= ab(n – 1) = 12
GlTotal = abn -1 =23

Suma de Cuadrados Medios

MSA = = = 4,15
MSB = = = 80,17
MSAB = = = 7,45
MSError = = = 3,8
Tabla de análisis de varianza

Fuente de variación Suma de Grados de Cuadrado


cuadrados libertad medio

Tratamiento A 12,46 3 4,15 1,09

Tratamiento B 160,33 2 80,17 21,09

Interacción 44,67 6 7,45 1,96

Error 45,5 12 3,8

Total 262,97 23
1.4. EJEMPLO
Ejemplo de la Batería
Un ingeniero está diseñando una batería que se usará en un
dispositivo que se someterá a variaciones de temperaturas extremas.
El único parámetro del diseño que se puede seleccionar en este
punto es el material de la placa a ánodo de la batería, y tiene tres
elecciones posibles. Cuando el dispositivo esté fabricado y se envíe al
campo, el ingeniero no tendrá control sobre las temperaturas
extremas en las que operará el dispositivo, pero sabe por experiencia
que la temperatura probablemente afectará la vida efectiva de la
batería. El ingeniero decide probar los tres materiales de la placa con
tres niveles de temperatura – 15, 70 y 125 ªF, ya estos niveles de
temperatura son consistentes con el medio ambiente donde se usará
finalmente el producto.
Se prueban cuatro baterías con cada combinación del material
de la placa y la temperatura, y las 36 pruebas se corren de
manera aleatoria. En este problema, el ingeniero quiere
responder las siguientes preguntas:
1. ¿Qué efectos tiene el tipo de material y la temperatura sobre
la vida de las baterías?
2. ¿Existe alguna elección del material que produzca de manera
regular una vida larga de batería independientemente de la
temperatura?
temperatura (°F)
Tipo de
material 15 70 125
1 130 155 34 40 20 70
539 229 230 998
74 180 80 75 82 58
2 150 188 136 122 25 70
623 479 198 1300
159 126 106 115 58 45
3 138 110 174 120 96 104
576 583 342 1501
168 160 150 139 82 60
1738 1291 770 3799

Los totales de los renglones y las columnas se indican en los


márgenes de la tabla y los números en rojo son totales de las
celdas
1.4.1 Tabla de ANOVA para los datos del ejemplo de batería

Fuentes de Suma de Grados de Cuadrado


Variación cuadrados libertad medio Valor P

Tipo de material 10,683.72 2 5,341.86 7.91 0.0020

Temperatura 39,118.72 2 19,559.36 28.97 0.0001

Interacción 9,613.78 4 2,403.44 3.56 0.0186

Error 18,230.75 27 675.21

Total 77,646.97 35
Puesto que , se concluye que hay una interacción significativa entre los dos tipos
de material y la temperatura. Además,, por lo que los efectos principales del tipo de
material y la temperatura también son significativos.
Como ayuda para interpretar los resultados de este experimento, es conveniente
construir una grafica de las respuestas promedio para cada combinación de los
tratamientos. Esta grafica muestra que las rectas sean paralelas e indica que la
interacción es significativa. En general, se consigue una vida más larga con una
temperatura baja, independientemente del tipo de material. Al cambiar de una
temperatura baja a una intermedia, la vida de la batería con material tipo 3 tiene un
incremento real, mientras que con los materiales tipo 1 y 2 disminuye. Con una
temperatura intermedia a alta, la vida de la batería disminuye para los materiales
tipo 2 y 3 y se mantiene en esencia sin cambio para el material tipo 1. El material
tipo 3 parece producir los mejores resultados si se quiere una perdida menor de la
vida efectiva cuando la temperatura cambia.
1.4.2 comparaciones múltiples.
Cuando el análisis indica que las medias de los renglones o las columnas difieren,
por lo general es de interés hacer comparaciones entre las medias individuales de
los renglones o las columnas para descubrir diferencias específicas.

En este ejemplo la interacción es significativa. En este caso las comparaciones


entre las medias de uno de los factores (por ejemplo, A) pueden ser oscurecidas
por la interacción AB. Una forma de abordar esta cuestión consiste en fijar el factor
B en un nivel especifico y aplicar la prueba de Tukey a las medias del factor A con
ese nivel. Para ilustrar, suponga que en el ejemplo de Batería el interés se
encuentra en detectar las diferencias entre las medias de los tres tipos de material.
Puesto que la interacción es significativa, esta comparación se hace con un solo
nivel de la temperatura, por ejemplo el nivel 2 (70ªF). Se supone que la mejor
estimación de la varianza del error es MSE de la tabla de ANOVA, utilizando el
supuesto de que la varianza del error experimental es la misma para todas las
combinaciones de tratamientos.
Los promedios de los tres tipos de material a 70ªF dispuestos en
orden ascendente son:

(material tipo 1)

(material tipo 2)

(material tipo 3)

=
=3.50
=45.47
Las comparaciones por pares dan como resultado

Este análisis indica que con el nivel de temperatura de 70ªF, la vida media de la
batería es la misma para los materiales tipos 2 y 3, y que la vida media de la
batería para el material tipo 1 es significativamente menor.
Si la interacción es significativa, el experimentador podría comparar las medias de
todas la ab celdas para determinar cuáles difieren significativamente. En este
análisis, las diferencias entre las medias de las celdas incluyen los efectos de la
interacción, así como ambos efectos principales. En el ejemplo de la batería, esto
daría 36 comparaciones entre todos los pares posibles de las nueve medias de
las celdas.
1.4.3.Verificación de la adecuación del modelo.
Normalidad.

Gráfico de Probabilidad Normal

99,9
99
95
porcentaje

80
50
20
5
1
0,1
-70 -50 -30 -10 10 30 50
RESIDUOS

La grafica de probalibidad normal no revela nada particularmente problemático,


aun cuando el residual negativo más grande ( -60.75 con 15ªF para el material
tipo 1) se aparta un poco de los demás. El valor estandarizado de este residual
es -2.37, y es el único residual cuyo valor absoluto es mayor que 2.
Homocedasticidad
Gráfico de Residuos para Vida Gráfico de Residuos para Vida

80 80

50 50

20 20
residuos

residuos
-10 -10

-40 -40

-70 -70
1 2 3 015 070 125
Tipo de material Temp

La grafica de residuales contra los valores ajustados de las


observaciones muestra una ligera tendencia de la varianza de los
residuales a incrementarse cuando la vida de la batería se
incrementa.
Independencia.
Gráfico de Residuos para Vida

80

50

20
residuos

-10

-40

-70
0 40 80 120 160 200
predichos

La grafica no revela nada particularmente problemático, aun cuando el residual


negativo más grande ( -60.75 con 15ªF para el material tipo 1) se aparta un poco de
los demás. El valor estandarizado de este residual es -2.37, y es el único residual
cuyo valor absoluto es mayor que 2.
1.4.4 Estimación de los parámetros del modelo.
Los parámetros del modelo de los efectos para el diseño factorial de los factores

Pueden estimarse por mínimos cuadrados. Puesto que el modelo tiene 1+a+aba
parámetros que deben estimarse, hay 1+a+b+ab ecuaciones normales, así:
El parámetro que corresponde a cada ecuación se indica a la izquierda. De las
ecuaciones.
Aquí hay a+b+1 dependencias lineales en este sistema de ecuaciones y no
existirá ninguna solución única.
Teniendo en cuenta las restricciones, las ecuaciones normales se simplifican, y se
obtiene la solución:
El valora ajustado de las observaciones puede encontrarse como:
1.4.5 Elección del tamaño de la muestra.
Para determinar un tamaño de la muestra (el número de replicas, n) apropiado en
un diseño factorial de dos factores, el experimento puede apoyarse en las curvas de
operación característica.

Para cuando la diferencia de las medias de dos renglones cualesquiera es D,


entonces el valor mínimo de es:

Si la diferencia de las medias de dos columnas cualesquiera es D, entonces el valor


mínimo de es:

Por último, si la diferencia entre dos efectos de interacciones cualesquiera es D,


entonces el valor mínimo de es:
Tabla
Parámetros de la curva de operación característica para el diseño factorial de
dos factores, modelo con efectos fijos

Grados de Grados de
Facto
libertad libertad
r
numerador denominador

A a-1 Ab(n-1)

B b-1 ab(n-1)

AB (a-1)(b-1) ab(n-1)
Si la diferencia en la vida media de la batería entre dos temperaturas cualesquiera
es hasta de 40 horas, D=40, y se supone que la desviación estándar de la vida de
la batería es aproximadamente 25, entonces

2 2.56 1.60 2 9 0.45


3 3.84 1.96 2 18 0.18
4 5.12 2.26 2 27 0.06
1.4.6 El supuesto de no interacción en un modelo de dos factores.
En ocasiones el experimentador siente que es apropiado un modelo de dos factores
sin interacción

Tabla
Análisis de varianza de la vida de baterías suponiendo que no hay interacción. (El
modelo sin interacciones es inadecuado).

Fuente de Suma de Grados de Cuadrado


variación cuadrados libertad medio
Tipos de 10.683,72 2 5.341,86 5.95
materiales
Temperatura 39.118,72 2 19.559,36 21.78

Error 27.844,52 31 898,21


Total 77.646,96 35
1.5. UNA OBSERVACIÓN POR CELDA.

En experimentos de dos factores con una sola replica, es decir, en los que hay solo
una observación por celda. Cuando hay dos factores, el modelo de los efectos es:

El análisis de varianza para esta situación se presenta así:

Fuente de variación Suma de cuadrados Grados de Cuadrado medio Cuadrado medio esperado
libertad

Renglón A a-1

Columna B b-1

Residual o AB sustracción (a-1)(b-1)

Total Ab-1
Una prueba desarrollada por Tukey es útil para determinar si está presente una
interacción.
Se calcula

Aquí

Si debe rechazarse la hipótesis de que no hay ninguna interacción.


GRACIAS

También podría gustarte