MANUAL-DOE - U3 A Distancia

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 22

UNIDAD 3

DISEÑO DE ESPERIMENTOS DE UN FACTOR


SERIE DE EJERCICIOS

TEMA: DISEÑO ANOVA DE UN FACTOR CON EFECTOS FIJOS

1.- INTRODUCCIÓN:

Esta práctica se analizan el ANOVA de un factor (también llamada


ANOVA unifactorial o one-way ANOVA en inglés), la cual es una técnica
estadística que señala si dos variables (una independiente y otra
dependiente) están relacionadas en base a si las medias de la variable
dependiente son diferentes en las categorías o grupos de la variable
independiente. Es decir, señala si las medias entre dos o más grupos son
similares o diferentes.

2.- OBJETIVO (COMPETENCIA):

Analizar casos de aplicaciones del Análisis de Varianza de un factor,


haciendo uso de Software estadístico.

3.- TEORÍA:

Análisis de varianza de un factor.

Un análisis de varianza (ANOVA) prueba la hipótesis de que las medias


de dos o más poblaciones son iguales. Los ANOVA evalúan la
importancia de uno o más factores al comparar las medias de la
variable de respuesta en los diferentes niveles de los factores. La
hipótesis nula establece que todas las medias de la población (medias
de los niveles de los factores) son iguales mientras que la hipótesis
alternativa establece que al menos una es diferente.
Para ejecutar un ANOVA, debe tener una variable de respuesta
continua y al menos un factor categórico con dos o más niveles. Los
análisis ANOVA requieren datos de poblaciones que sigan una
distribución aproximadamente normal con varianzas iguales entre los
niveles de factores. Sin embargo, los procedimientos de ANOVA
funcionan bastante bien incluso cuando se viola el supuesto de
normalidad, a menos que una o más de las distribuciones sean muy
asimétricas o si las varianzas son bastante diferentes. Las
transformaciones del conjunto de datos original pueden corregir estas
violaciones.
Por ejemplo, usted diseña un experimento para evaluar la durabilidad
de cuatro productos de alfombra experimentales. Usted coloca una
muestra de cada tipo de alfombra en diez hogares y mide la
durabilidad después de 60 días. Debido a que está examinando un
factor (tipo de alfombra), usted utiliza un ANOVA de un solo factor.
Si el valor p es menor que el nivel de significancia, entonces usted
concluye que al menos una media de durabilidad es diferente.
El nombre "análisis de varianza" se basa en el enfoque en el cual el
procedimiento utiliza las varianzas para determinar si las medias son
diferentes. El procedimiento funciona comparando la varianza entre las
medias de los grupos y la varianza dentro de los grupos como una
manera de determinar si los grupos son todos parte de una población
más grande o poblaciones separadas con características diferentes.
Tipo de
Modelo y propiedades del diseño
ANOVA

De un Un factor fijo (niveles establecidos por el investigador)


solo que puede tener un número desigual (no balanceado) o
factor igual (balanceado) de observaciones por tratamiento.

4.- PROCEDIMIENTO: Aquí se evaluará y dará seguimiento en base a


varios ejemplos que introducirán en el laboratorio al software para su
aprendizaje.

Realiza un análisis de varianza de un factor, con la variable de respuesta


en una columna y los niveles de factor en otra. Si se ingresa cada grupo
en su propia columna, utilice Estadísticas > ANOVA > Un factor
(Desapilado).
A) DESARROLLO: C o n base a lo explicado en la parte TEORÍA y
los videos compartidos por la docente, r esuelva en minitab y
concluya cada caso Práctico.
Entregar en un pdf los resultados con conclusiones enumerando cada
ejercicio por tema. Adjuntar el archivo minitab con todos los datos y con la
parte del análisis realizado, guardar como archivo .mpx . Nombrar de la
siguiente forma: APELLIDO PATERNO_NOMBRE_SERIE_U3. mpx

NOTA: Es importante que verifiquen que al abrir el archivo se visualicen los


cálculos realizados de otra manera no será valida su entrega y se asignará
una calificación de cero. Para ello en necesario guardar el archivo como un
proyecto minitab:

CASO I: Un fabricante de calzado desea mejorar la calidad de las


suelas, las cuales se pueden hacer con uno de los cuatro tipos de cuero
A, B, C y D disponibles en el mercado. Para ellos, prueba los cueros con
una máquina que hace pasar los zapatos por una superficie abrasiva; la
suela de estos se desgasta al pasarla por dicha superficie. Como criterio
de desgaste se usa la pérdida de peso después de un número fijo de
ciclos. Se prueban en orden aleatorio 24 zapatos, seis de cada tipo de
cuero. Al hacer las pruebas en orden completamente al azar se evitan
sesgos y las mediciones en un tipo de cuero resultan independientes de
las demás. Los datos (en miligramos) sobre el desgaste de cada tipo de
cuero se muestran en la siguiente tabla.

Tipo de OBSERVACIONES
cuero 1 2 3 4 5 6
A 264 260 258 241 263 255
B 208 220 216 200 213 206

C 220 263 219 225 230 228

D 217 226 215 227 220 222

CASO 2: Se hace un estudio sobre la efectividad de tres marcas de


spray para matar moscas. Para ellos, cada producto se aplica a un
grupo de 100 moscas, y se cuenta el número de moscas muertas
expresado en porcentajes. Se hacen seis réplicas y los resultados
obtenidos se muestran a continuación

Marca REPLICAS
de
1 2 3 4 5 6
spray
1 72 65 67 75 62 73

2 55 59 68 70 53 50

3 64 74 61 58 51 69

a) Formula la hipótesis adecuada y el modelo estadístico.


b) ¿Existe diferencia entre la efectividad promedio de los productos
en spray?
c) ¿Hay algún spray mejor? Argumente su respuesta.
d) De un intervalo al 95% de confianza para la efectividad promedio
(porcentaje) de cada una de las marcas.
e) Dibuje las gráficas de medias y los diagramas de caja
simultáneos, después interprételos.
f) Verifique los supuestos de normalidad y de igual varianza entre las
marcas.

CASO 3: En un centro de investigación se realiza un estudio para


comparar varios tratamientos que al aplicarse previamente a los frijoles
crudos reduce su tiempo de cocción. Estos tratamientos son a base de
bicarbonato de sodio y cloruro de sodio o sal. El primer tratamiento es el
control, que consiste en no aplicar ningún tratamiento. El tratamiento 2
es remojar en agua con bicarbonato de sodio, el tratamiento 3 es
remojarlo en agua con sal y el tratamiento 4 es remojar en agua con
una combinación de ambos ingredientes. La variable de respuesta es el
tiempo de cocción en minutos. Los datos se muestran en la siguiente
tabla.

CONTROL T2 T3 T4
213 76 57 84
214 85 67 82
204 74 55 85
208 78 64 92
212 82 61 87
200 75 63 79
207 82 63 90
a) ¿De qué manera el experimentador debe aleatorizar los
experimentos y el material experimental?
b) De ejemplos de factores que deben estar fijos durante las
pruebas experimentales para que no afecten los resultados y las
conclusiones.
c) Formule y pruebe la hipótesis de que las medias de los
tratamientos son iguales.
d) Obtenga el diagrama de caja y el grafico de medias, después
interprételos
e) ¿Hay algún tratamiento mejor? ¿Cuál es el tiempo de cocción
esperado para el mejor tratamiento?
f) Algo importante a cuidar en un experimento es que no haya
efectos colaterales no deseados, causados por el tratamiento
ganador; en este caso, piense en los posibles efectos colaterales
que podría causar el mejor tratamiento.
g) ¿Se cumple los supuestos del modelo? Verifique gráficamente.
h) Pruebe la hipótesis de igualdad de varianzas entre tratamientos
(que corresponde a un supuesto).
Caso 4. Para estudiar la confiabilidad de ciertos tableros electrónicos
para automóviles se someten a un envejecimiento acelerado durante
100 horas a determinada temperatura, como variable de interés se mide
la intensidad de corriente que circula entre dos puntos, cuyos valores
aumentan con el deterioro. Se probaron 20 módulos repartidos de
manera equitativa en cinco temperaturas y los resultados obtenidos
fueron los siguientes:

20°C 40°C 60°C 80°C 100°C

15 17 23 28 45

18 21 19 32 51

13 11 25 34 57

12 16 22 31 48

a) Formule la hipótesis y el modelo estadístico para el problema.


b) Realice el análisis de varianza para estos datos, a fin de estudiar si
la temperatura afecta la intensidad de corriente promedio.

¿La temperatura afecta la variabilidad de las intensidades? Es


decir, verifique si hay igual varianza entre los diferentes
tratamiento.
B) CÁLCULOS Y REPORTE: EN PDF Y MINITAB

C) RESULTADOS: Se espera que el alumno desarrolle la habilidad en el


manejo y comprensión del software MINITAB para los posteriores
problemas a resolver.

5.- CONCLUSIONES: adjuntar en el archivo pdf

6.- BIBLIOGRAFÍA:

http://es.slideshare.net/albertojeca/uso-de-software-computacional-
para-anova-con-un-factor
TEMA: COMPARACIONES O PRUEBAS DE RANGOS MULTIPLES

1.- INTRODUCCIÓN:
Pruebas de significancia son procedimientos que facilitan decidir si una Hipótesis
nula se rechaza o no se rechaza. La aplicación de estas pruebas parte del supuesto
de que se ha utilizado un diseño de muestreo probabilístico (al azar, sistemático,
estratificado o conglomerados) para obtener la información muestral que permita
tomar decisiones estadísticas.

2.- OBJETIVO (COMPETENCIA):


Analizar casos de aplicaciones de Pruebas de significancia, haciendo uso de
Software estadístico.

3.- TEORÍA:

Pruebas de Significancias (Método LSD, Método Duncan, Tukey, Dunett)

Existen varios procedimientos para determinar cuáles son los pares de medias que
son diferentes. El primero de estos procedimientos, y el más utilizado en el pasado,
es el de la Diferencia Significativa Mínima (DSM) de Fisher publicada en 1935 en su
libro The Design of Experiments. Este procedimiento es una extensión de la
prueba t de Student para el caso de comparación de dos medias con varianza
ponderada.

Otros procedimientos más recientemente usados para el mismo propósito son: la


prueba de Student-Neuman-Keuls, la prueba de Diferencia Significativa Honesta de
Tukey (DSH), la prueba del Rango múltiple de Duncan, la prueba de Dunnett y la
prueba de Scheffé, entre otras. Véase Steel and Torrie y Federer.

PRUEBA DE DIFERENCIA SIGNIFICATIVA HONESTA (DSH) DE TUKEY

La prueba de Diferencia Significativa Honesta (DSH) de Tukey, al igual que la DSM,


sólo se debe usar después que se ha rechazado la hipótesis nula en el análisis de
varianza y cuando todos los tamaños de muestra son iguales; pero a diferencia de

la DSM emplea el valor . En lugar de . Este valor q se obtiene de la


tabla T-8, para el nivel de significancia a , el número de tratamientos K y los grados
de libertad del error, entonces:

[13.7]

PRUEBA DEL RANGO MÚLTIPLE DE DUNCAN

La Prueba del Rango múltiple Duncan es otra prueba para determinar la diferencia
entre pares de medias después que se ha rechazado la hipótesis nula en el análisis
de varianza.

Este procedimiento emplea los valores de la tabla T-9 y consiste en calcular varios
"rangos" (Duncan los llama rangos significativos mínimos) dados por la fórmula:
[13.8]

donde p toma valores entre 2 y K (K es el número de tratamientos), d se obtiene de


la tabla T-9 y el CMError se obtiene de la tabla de ANDEVA respectiva.

PRUEBA DE DUNNETT

En muchos experimentos uno de los tratamientos es el control, y el investigador está


interesado en comparar cada una de las otras K- 1 medias de los tratamientos
contra el control, por lo tanto, existen K- 1 comparaciones. Un procedimiento para
realizar estas comparaciones es la prueba de Dunnett (desarrollada en 1964). Si se
supone que el control es el tratamiento a, entonces se desea probar las hipótesis

El procedimiento de Dunnett es una modificación de la prueba t. Para cada


hipótesis se calcula el valor absoluto de la diferencia de medias observadas

El rechazo de la hipótesis nula se realiza con una probabilidad de error tipo I, a si

Donde la constante se busca en la tabla T-10. Observe que f es el número de


grados de libertad del error y a es el nivel de significación asociado con todos las K-
1 pruebas y utilizado en el análisis de varianza.

4.- PROCEDIMIENTO
Uno de los métodos usados con mayor frecuencia en el análisis estadístico es la prueba
de hipótesis. Minitab ofrece muchas pruebas de hipótesis, incluyendo pruebas t y análisis
de varianza (ANOVA). Por lo general, cuando usted realiza una prueba de hipótesis,
presupone que un enunciado inicial es verdadero y luego somete a prueba dicho
enunciado utilizando datos de muestra.

Las pruebas de hipótesis incluyen dos hipótesis (enunciados): la hipótesis nula (H0) y la
hipótesis alternativa (H1). La hipótesis nula es el enunciado inicial y suele especificarse
sobre la base de investigaciones anteriores o del conocimiento común. La hipótesis
alternativa es lo que usted considera que podría ser verdadero.

Apoyándose en el análisis gráfico del capítulo anterior y en el análisis descriptivo


expuesto previamente, usted sospecha que la diferencia en el número promedio de días
de entrega entre los centros de envío es estadísticamente significativa. Para verificar esto,
usted realiza un ANOVA de un solo factor, que prueba la igualdad de dos o más medias.
Además, realiza una prueba de comparación múltiple de Tukey para ver cuáles medias de
los centros de envío son diferentes. Para este ANOVA de un solo factor, los días de
entrega son la respuesta y el centro de envío es el factor.

Realizar un ANOVA

1. Elija Estadísticas > ANOVA > Un solo factor.

2. Seleccione Los datos de respuesta están en una columna para todos los
niveles de factores.

3. Haga clic en Comparaciones.


4. En Procedimientos de comparación presuponiendo varianzas iguales,
seleccione Tukey.
5. Haga clic en Aceptar.
6. Haga clic en Gráficas. Para muchos comandos estadísticos, Minitab
incluye gráficas que ayudan a interpretar los resultados y evaluar la
validez de los supuestos estadísticos. Estas gráficas se denominan gráficas
incorporadas.
7. En Gráficas de datos, seleccione Gráfica de intervalo, Gráfica de valores
individuales y Gráfica de caja de datos.
8. En Gráficas de residuos, seleccione Cuatro en uno.

9. Haga clic en Aceptar en cada cuadro de diálogo.


ANOVA unidireccional: Días vs. Centro

Interpretar la salida de la ventana Sesión


El proceso de toma de decisiones para una prueba de hipótesis se basa en el valor p, que
indica la probabilidad de rechazar como falsa la hipótesis nula cuando en realidad es
verdadera.
• Si el valor p es menor que o igual a un nivel de significancia predeterminado
(también denominado nivel alfa o α), usted rechaza la hipótesis nula y da crédito a
la hipótesis alternativa.
• Si el valor p es mayor que el nivel α, usted no puede rechazar la hipótesis nula y
no puede apoyar la hipótesis alternativa.

A) EQUIPO: computadora de escritorio o personal.

B) MATERIAL: programa MINITAB

C) DESARROLLO: se llevara a cabo con base a lo explicado en la parte


TEORIA, Resuelva y concluya cada caso Practico.

CASO 1
El laboratorio clínico de un hospital mide con un espectrofotómetro la
concentración de colesterol en muestras de suero. Un día especifico, el laboratorio
analizó muestras de 8 pacientes y se prepararon 2 muestras de cada uno. Los
siguientes datos son las concentraciones de colesterol (mg/dl).

Paciente Colesterol (mg/dl)


1 167.3, 166.7
2 186.7 ,184.2
3 100, 107.9
4 214.5, 215.3
5 148.5, 149.5
6 171.5, 167.3
7 161.5, 159.4
8 243.6, 245.5
CASO 2
En un experimento con 5 réplicas y 4 tratamientos con un diseño totalmente
aleatorizado, se cultivaron secciones de tejido de planta de tomate con diferentes
cantidades y tipo de azucares. El crecimiento de tejidos en cada cultivo se da en la
tabla siguiente como mm x 10.

Control 3% de glucosa 3% de fructuosa 3% de sacarosa


45 25 28 31
39 28 31 37
40 30 24 35
45 29 28 33
42 33 27 34

CASO 3

Se realizó un estudio de ingeniería de transito sobre los retrasos en las inspecciones


con semáforos en las calles de una ciudad. Se usaron 3 tipos de semáforos: 1)
Programado, 2) Semiactivado y 3) Activado. Se usaron 5 intersecciones para cada
tipo de semáforo. La medida de retraso utilizada fue el promedio de tiempo que
cada vehículo permanece detenido en cada intersección (segundos/ vehículo). Los
datos son los siguientes:

Programado Semiactivado Activado


36.6 17.5 15
39.2 20.6 10.4
30.4 18.7 18.9
37.1 25.7 10.5
34.1 22 15.2

D) CALCULOS Y REPORTE: en archivo pdf y minitab

E) RESULTADOS: Se espera que el alumno desarrolle la habilidad en el manejo y


comprensión del software MINITAB para los posteriores problemas a resolver.

6.- BIBLIOGRAFÍA:

TEMA: VERIFICACION DE LOS SUPUESTOS DEL MODELO

1.- INTRODUCCIÓN:
Los supuestos del modelo en el diseño de experimentos de un factor en estadística
se refieren a las condiciones que deben cumplirse para que los resultados obtenidos
sean válidos y confiables. Estos supuestos son fundamentales para interpretar
correctamente los resultados del experimento y tomar decisiones basadas en ellos.

2.- OBJETIVO (COMPETENCIA):


En esta práctica, los estudiantes aprenderán a verificar los supuestos clave en el
diseño de experimentos de un factor, incluyendo la normalidad de los residuos y
la igualdad de varianza, haciendo uso de Software estadístico.

3.- TEORÍA:
Algunos supuestos comunes en el diseño de experimentos de un factor:

Normalidad de los datos: Este supuesto asume que los datos siguen una
distribución normal. Esto significa que la distribución de los datos se asemeja a una
campana simétrica alrededor de la media. La normalidad de los datos puede
verificarse mediante pruebas estadísticas como la prueba de Shapiro-Wilk o
visualmente mediante gráficos de probabilidad normal.

Homogeneidad de las varianzas (homocedasticidad): Este supuesto implica


que las varianzas de las diferentes muestras son iguales. En otras palabras, la
dispersión de los datos es constante en todas las condiciones del experimento. Esto
puede verificarse gráficamente mediante gráficos de dispersión o mediante pruebas
estadísticas como la prueba de Levene.
Independencia de las observaciones: Este supuesto implica que las
observaciones realizadas en el experimento son independientes entre sí. Esto
significa que los resultados de una observación no están relacionados con los
resultados de otras observaciones. La independencia de las observaciones es
importante para evitar sesgos en los resultados del experimento.

Linealidad del modelo: En un diseño de experimentos de un factor, asumimos


que la relación entre la variable independiente (factor) y la variable dependiente es
lineal. Esto significa que los cambios en el nivel del factor provocan cambios
proporcionales en la variable de respuesta.

Aleatorización: La asignación de los tratamientos a las unidades experimentales


debe hacerse de forma aleatoria para reducir el sesgo y garantizar que las
diferencias observadas sean atribuibles únicamente al tratamiento aplicado.

Es importante verificar estos supuestos antes de realizar inferencias sobre los


resultados del experimento. Si alguno de los supuestos no se cumple, puede
afectar la validez de las conclusiones obtenidas del experimento. En algunos casos,
pueden aplicarse técnicas de transformación de datos o pruebas estadísticas
robustas para mitigar los efectos de la violación de los supuestos.

A) EQUIPO: el equipo a utilizar será una computadora de escritorio o personal.

B) MATERIAL: el programa MINITAB

C) DESARROLLO: se llevará a cabo con base a lo explicado en la parte


TEORIA, Resuelva y concluya cada caso Practico.

4.- PROCEDIMIENTO

En este ejercicio, exploraremos los supuestos del modelo en diseño de


experimentos de un factor utilizando Minitab. Los supuestos que vamos a verificar
son: linealidad, homocedasticidad, colinealidad, normalidad e independencia.
Estos cálculos se han realizado en la unidad anterior.

Datos: Supongamos que estamos investigando el efecto de diferentes niveles de


temperatura en el tiempo de reacción de una determinada sustancia química.
Tomamos mediciones del tiempo de reacción a tres niveles de temperatura: 50°C,
70°C y 90°C.

Temperatura Tiempo de Reacción


(°C) (segundos)
50 20.5
50 21.1
50 19.8
70 25.3
70 24.9
70 25.6
90 30.2
90 31
90 30.5

Pasos:
1. Crear los datos en Minitab:
Ingresa los datos de tiempo de reacción para cada nivel de temperatura en una
hoja de cálculo de Minitab.
2. Verificar Linealidad:
Utiliza Minitab para generar un gráfico de dispersión del tiempo de reacción versus
la temperatura.
Ajusta un modelo lineal y verifica visualmente si la relación entre la temperatura y
el tiempo de reacción parece lineal.
3. Verificar Homocedasticidad:
Después de ajustar el modelo lineal, verifica los residuos del modelo utilizando un
gráfico de residuos frente a los valores ajustados.
Busca patrones en los residuos que puedan indicar heterocedasticidad.
4. Verificar Colinealidad:
Utiliza Minitab para ajustar el modelo lineal y verifica la matriz de correlación entre
las variables independientes (en este caso, solo hay una: temperatura).
Busca correlaciones fuertes entre las variables independientes que puedan indicar
colinealidad.
5. Verificar Normalidad:
Calcula los residuos del modelo y utiliza Minitab para generar un gráfico de
probabilidad normal de los residuos.
Verifica si los residuos se ajustan a una distribución normal.
6. Verificar Independencia:
Utiliza Minitab para generar un gráfico de autocorrelación de los residuos del
modelo.
Busca patrones en el gráfico que puedan indicar la presencia de autocorrelación en
los residuos.
7. Conclusión: Después de realizar estos pasos, analiza tus resultados para
determinar si los supuestos del modelo en diseño de experimentos de un factor se
cumplen en este estudio particular. Si alguno de los supuestos no se cumple, debes
considerar cómo esto podría afectar la validez de tus conclusiones y si es necesario
tomar medidas correctivas o realizar análisis adicionales.

CALCULOS Y REPORTE:
Agregar al reporte los siguientes cuestionamientos:
¿Qué implicaciones tienen los resultados de las pruebas de normalidad de los
residuos y homogeneidad de varianzas en la interpretación de los resultados del
experimento?
¿Qué acciones podrían tomarse si los supuestos no se cumplen?
¿Qué otras técnicas o enfoques podrían emplearse para abordar los supuestos
incumplidos?

D) RESULTADOS: Se espera que el alumno desarrolle la habilidad en el manejo y


comprensión del software MINITAB para los posteriores problemas a resolver.

6.- BIBLIOGRAFÍA:
Gutiérrez Pulido, Humberto (2008). Análisis y diseño de experimentos. México:
McGraw-Hill Interamericana Editores. Hernández, S.

También podría gustarte