Diseño Completamente Al Azar

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 15

UNIVERSIDAD NACIONAL “SANTIAGO ANTUNEZ DE MAYOLO”

FACULTAD DE CIENCIAS AGRARIAS


ESCUELA PROFESIONAL DE INGENIERIA AGRICOLA

DISEÑO COMPLETAMENTE AL AZAR


Muchas comparaciones, como las antes mencionadas, se hacen con base en el diseño
completamente al azar (DCA), que es el más simple de todos los diseños que se utilizan
para comparar dos o más tratamientos, dado que sólo consideran dos fuentes de
variabilidad: los tratamientos y el error aleatorio. En el siguiente capítulo veremos diseños
que consideran la influencia de otras fuentes de variabilidad (bloques).

Este diseño se llama completamente al azar porque todas las corridas experimentales se
realizan en orden aleatorio completo. De esta manera, si durante el estudio se hacen en total
N pruebas, éstas se corren al azar, de manera que los posibles efectos ambientales y
temporales se vayan repartiendo equitativamente entre los tratamientos.

ANOVA PARA EL DISEÑO COMPLETAMENTE AL AZAR (DCA):

El análisis de varianza (ANOVA) es la técnica central en el análisis de datos


experimentales. La idea general de esta técnica es separar la variación total en las partes
con las que contribuye cada fuente de variación en el experimento. En el caso del DCA se
separan la variabilidad debida a los tratamientos y la debida al error. Cuando la primera
predomina “claramente” sobre la segunda, es cuando se concluye que los tratamientos
tienen efecto (figura 3.1b), o dicho de otra manera, las medias son diferentes. Cuando los
tratamientos no dominan contribuyen igual o menos que el error, por lo que se concluye
que las medias son iguales (figura 3.1a). Antes de comenzar con el análisis del DCA se
introduce alguna notación que simplifica la escritura de las expresiones involucradas en
dicho análisis.

1
UNIVERSIDAD NACIONAL “SANTIAGO ANTUNEZ DE MAYOLO”
FACULTAD DE CIENCIAS AGRARIAS
ESCUELA PROFESIONAL DE INGENIERIA AGRICOLA

ANOVA PARA EL DISEÑO COMPLETAMENTE AL AZAR (DCA):

 Notación de puntos: Sirve para representar de manera abreviada cantidades numéricas


que se pueden calcular a partir de los datos experimentales, donde Yij representa la j-ésima
observación en el tratamiento i, con i = 1, 2,…, k y j = 1, 2,…, ni. Las cantidades de interés
son las siguientes:
Yi• = Suma de las observaciones del tratamiento i.
Yi• = Media de las observaciones del i-ésimo tratamiento.
Y•• = Suma total de las N = n1 + n2 +… + nk mediciones.
Y•• = Media global o promedio de todas las observaciones.
Note que el punto indica la suma sobre el correspondiente subíndice.

2
UNIVERSIDAD NACIONAL “SANTIAGO ANTUNEZ DE MAYOLO”
FACULTAD DE CIENCIAS AGRARIAS
ESCUELA PROFESIONAL DE INGENIERIA AGRICOLA

DIAGRAMAS DE CAJAS SIMULTÁNEOS


Los diagramas de cajas3 simultáneos representan una manera descriptiva de comparar
tratamientos. En la figura 3.3 se presentan los diagramas de cajas simultáneos para los
cuatro métodos de ensamble del ejemplo 3.3. Se observa que el método C parece diferente
a los métodos A y B en cuanto a sus medias; la media del método D también se ve diferente
a la media del método A. Por otra parte, se observa un poco más de variabilidad en el
método C que en todos los demás. Lo que sigue es verificar que lo que se observa en el
diagrama de caja implica diferencias significativas entre los distintos tratamientos; por lo
tanto, es necesario hacer pruebas estadísticas porque los datos que se analizan en los
diagramas de cajas son muestras. En general, cuando los diagramas no se traslapan es
probable que los tratamientos correspondientes sean diferentes entre sí, y la probabilidad es
mayor en la medida que los diagramas están basados en más datos. Cuando se traslapan un
poco puede ser que haya o no diferencias significativas, y en cualquier caso es conveniente
utilizar una prueba estadística para determinar cuáles diferencias son significativas.
Estas pruebas se verán en la siguiente sección.
GRÁFICOS DE MEDIAS:
Cuando se rechaza H0 mediante el ANOVA, y se concluye que no hay igualdad entre las
medias poblacionales de los tratamientos, pero no se tiene información específica sobre
cuales tratamientos son diferentes entre sí, el grafico de medias (means plot) permite hacer
una comparación visual y estadística de las medias de los tratamientos (métodos de
ensamble). En la figura 3.4 se presenta el grafico de medias con intervalos de confianza de
acuerdo con la prueba LSD, la cual se estudiara más adelante. Como se explicó en el
capítulo anterior, si dos intervalos de confianza se traslapan, los tratamientos
correspondientes son estadísticamente iguales en cuanto a sus medias; pero si no se
traslapan, entonces son diferentes. Así, podemos ver que el método LSD detecta con una
confianza de 95% que A ƒÎ C, A ƒÎ D y B = C. De esta forma, la conclusión práctica del
experimento es que el mejor método de ensamble parece ser el A, ya que estadísticamente
sus tiempos son menores que los de los métodos C y D. Le sigue el método B, ya que este
es mejor que el C. Pero no es posible Pero no es posible concluir que el método A sea

3
UNIVERSIDAD NACIONAL “SANTIAGO ANTUNEZ DE MAYOLO”
FACULTAD DE CIENCIAS AGRARIAS
ESCUELA PROFESIONAL DE INGENIERIA AGRICOLA

mejor que el método B, ya que sus intervalos se traslapan. Si se quisiera decidir en forma
estadística sobre la diferencia entre los métodos A y B, una forma de hacerlo es tomar más
datos para incrementar la potencia de la prueba, o bien, recurrir a otros criterios para tomar
la decisión. Concluir que el método A sea mejor que el método B, ya que sus intervalos se
traslapan. Si se quisiera decidir en forma estadística sobre la diferencia entre los métodos A
y B, una forma de hacerlo es tomar más datos para incrementar la potencia de la prueba, o
bien, recurrir a otros criterios para tomar la decisión.

4
UNIVERSIDAD NACIONAL “SANTIAGO ANTUNEZ DE MAYOLO”
FACULTAD DE CIENCIAS AGRARIAS
ESCUELA PROFESIONAL DE INGENIERIA AGRICOLA

COMPARACIONES O PRUEBAS DE RANGO MÚLTIPLES:


Después de que se rechazó la hipótesis nula en un análisis de varianza, es necesario ir a
detalle y ver cuáles tratamientos son diferentes. A continuación veremos tres estrategias
distintas para ir a ese detalle.

 Comparación de parejas de medias de tratamientos: Cuando no se rechaza la


hipótesis nula H0: m1 = m2 =… mk = m, el objetivo del experimento está cubierto y
la conclusión es que los tratamientos no son diferentes. Si por el contrario se
rechaza H0, y por consiguiente se acepta la hipótesis alternativa HA: mi π mj para
algún i π j, es necesario investigar cuáles tratamientos resultaron diferentes, o cuáles
provocan la diferencia. Como se acaba de ilustrar en la gráfica de medias, estas
interrogantes se responden probando la igualdad de todos los posibles pares de
medias, para lo que se han propuesto varios métodos, conocidos como métodos de
comparaciones múltiples o pruebas de rango múltiple. La diferencia primordial
entre los métodos radica en la potencia que tienen para detectar las diferencias entre
las medias. Se dice que una prueba es más potente si es capaz de detectar
diferencias más pequeñas.

 Comparación de tratamientos con un control (método de Dunnet): Una vez que


se rechaza H0 con el ANOVA, en ocasiones uno de los k tratamientos a comparar es
el llamado tratamiento control y el interés fundamental es comparar los k – 1
tratamientos restantes con dicho control. En muchos casos el tratamiento control se
refiere a un tratamiento estándar de referencia o también a la ausencia de
tratamiento. Por ejemplo, al comparar varios medicamentos para el resfriado es
conveniente que uno de los tratamientos sea que los pacientes no utilicen ningún
medicamento; esto sirve como referencia para decidir la posible utilidad de los
medicamentos. Por facilidad, denotemos como tratamiento control al k-ésimo
tratamiento. Hacer comparaciones con respecto al control implica probar las k – 1
hipótesis dadas por:

5
UNIVERSIDAD NACIONAL “SANTIAGO ANTUNEZ DE MAYOLO”
FACULTAD DE CIENCIAS AGRARIAS
ESCUELA PROFESIONAL DE INGENIERIA AGRICOLA

Donde Da (k – 1, l) se encuentra en las tablas del apéndice; l son los grados de


libertad del cuadrado medio del error. Se recomienda que el tamaño de muestra del
tratamiento control sea grande, a fin de estimar su media con mayor precisión.

 Comparación por contrastes: No siempre interesa probar solo las k(k . 1)/2
hipótesis dos a dos dadas por H vs 0 i j : ƒÊ = ƒÊ . H i j 0 i j : ƒÊ ‚ ƒÊ para ‚ , y
no siempre estas hipótesis dos a dos interesan todas por igual. En ocasiones, el
objetivo del estudio lleva a contrastar hipótesis que involucran a más de dos medias.
En esta sección se presentan este tipo de alternativas en la comparación de medias,
pero antes se definen los conceptos de contraste y contrastes ortogonales.

VERIFICACIÓN DE LOS SUPUESTOS DEL MODELO:

La validez de los resultados obtenidos en cualquier análisis de varianza queda supeditada a


que los supuestos del modelo se cumplan. Estos supuestos son: normalidad, varianza
constante (igual varianza de los tratamientos) e independencia. Esto es, la respuesta (Y) se
debe distribuir de manera normal, con la misma varianza en cada tratamiento y las
mediciones deben ser independientes. Estos supuestos sobre Y se traducen en supuestos
sobre el término error (e) en el modelo. Es una práctica común utilizar la muestra de
residuos para comprobar los supuestos del modelo, ya que si los supuestos se cumplen, los
residuos o residuales se pueden ver como una muestra aleatoria de una distribución normal
con media cero y varianza constante. Los residuos, eij, se definen como la diferencia entre
la respuesta observada (Yij) y la respuesta predicha por el modelo (Yˆ ij), lo cual permite
hacer un diagnóstico más directo de la calidad del modelo, ya que su magnitud señala qué
tan bien describe a los datos el modelo.

6
UNIVERSIDAD NACIONAL “SANTIAGO ANTUNEZ DE MAYOLO”
FACULTAD DE CIENCIAS AGRARIAS
ESCUELA PROFESIONAL DE INGENIERIA AGRICOLA

Recordemos de (3.2), que el modelo que se espera describa los datos en el DCA. Está dado por:

Donde Yij (i = 1, 2, ¡K, k; j = 1, 2, ¡K, n) es el j-esimo dato en el tratamiento i; m es la


media global, ti es el efecto del tratamiento i y eij representa al error asociado con la
observación Yij. Cuando se realiza el ANOVA, y solo cuando este resulta significativo,
entonces se procede a estimar el modelo ajustado o modelo de trabajo dado por:

Donde Yˆij es la respuesta predicha, mˆ es la media global estimada y tˆi es el efecto


estimado del tratamiento i; los gorros indican que son estimadores, es decir, valores
calculados a partir de los datos del experimento. El término del error desaparece del modelo
estimado, por el hecho de que su valor esperado es igual a cero (E (eij) = 0).

Como la media global se estima con Y•• y el efecto del tratamiento con Yi• – Y••, el
modelo ajustado del DCA se puede escribir como:

7
UNIVERSIDAD NACIONAL “SANTIAGO ANTUNEZ DE MAYOLO”
FACULTAD DE CIENCIAS AGRARIAS
ESCUELA PROFESIONAL DE INGENIERIA AGRICOLA

Para comprobar cada supuesto existen pruebas analíticas y gráficas que veremos a
continuación. Por sencillez, muchas veces se prefieren las pruebas gráficas. Éstas tienen el
inconveniente de que no son “exactas”, pero aun así, en la mayoría de las situaciones
prácticas proporcionan la evidencia suficiente en contra o a favor de los supuestos. El uso
de las pruebas gráficas requiere una fuerte evidencia visual para concluir que el supuesto en
cuestión no se cumple, ya que se requiere que la evidencia en contra de un supuesto esté
soportada por más de dos puntos. Cuando son uno o dos los puntos que se salen del
comportamiento esperado de las gráficas se puede tratar de un problema de puntos
aberrantes, no de violación del supuesto en cuestión. En ese caso debe investigarse la
obtención de dichas mediciones atípicas, ya que ese tipo de puntos pueden afectar
sensiblemente los resultados del análisis. Se puede utilizar una prueba analítica para
subsanar las ambigüedades que surjan en la interpretación visual (subjetiva) de las gráficas.
Es mejor prevenir en lo posible que los supuestos no se violen, para ello se aplican los tres
principios básicos del diseño de experimentos: repetición, aleatorización y bloqueo. Es fácil
encontrar situaciones en las que por no aplicar alguno de estos principios no se cumplen los
supuestos del modelo. Por ejemplo, por no aleatorizar el orden en que se corren las pruebas
pueden surgir problemas con el supuesto de independencia.

 Normalidad: Un procedimiento gráfico para verificar el cumplimiento del supuesto


de normalidad de los residuos consiste en graficar los residuos en papel o en la
gráfica de probabilidad normal que se incluye casi en todos los paquetes
estadísticos. Esta gráfica del tipo X-Y tiene las escalas de tal manera que si los
residuos siguen una distribución normal, al graficarlos tienden a quedar alineados en
una línea recta; por lo tanto, si claramente no se alinean se concluye que el supuesto
de normalidad no es correcto. Cabe enfatizar el hecho de que el ajuste de los puntos
a una recta no tiene que ser perfecto, dado que el análisis de varianza resiste
pequeñas y moderadas desviaciones al supuesto de normalidad. En las figuras 3.6a
y 3.6b se representan, en la gráfica de probabilidad normal, dos aspectos de los
residuos, en los cuales el supuesto de normalidad no se cumple.

8
UNIVERSIDAD NACIONAL “SANTIAGO ANTUNEZ DE MAYOLO”
FACULTAD DE CIENCIAS AGRARIAS
ESCUELA PROFESIONAL DE INGENIERIA AGRICOLA

 Varianza constante: Una forma de verificar el supuesto de varianza constante (o


que los tratamientos tienen la misma varianza) es graficando los predichos contra
los residuos (Yˆij vs. ei), por lo general Yˆij va en el eje horizontal y los residuos en
el eje vertical. Si los puntos en esta gráfica se distribuyen de manera aleatoria en
una banda horizontal (sin ningún patrón claro y contundente), entonces es señal de
que se cumple el supuesto de que los tratamientos tienen igual varianza. Por el
contrario, si se distribuyen con algún patrón claro y contundente, como por ejemplo
una forma de “corneta o embudo”, entonces es señal de que no se está cumpliendo
el supuesto de varianza constante (figura 3.6c). Un claro embudo en los residuales
indicará que el error de pronóstico del modelo tiene una relación directa (positiva o
negativa) con la magnitud del pronóstico (predicho). Otra gráfica que ayuda a
verificar el supuesto es la gráfica de niveles de factor contra residuos. En el eje X de
esta gráfica se ponen los tratamientos o los niveles de un factor, y en el eje vertical
se agregan los residuos correspondientes a cada tratamiento o nivel de factor. Si se
cumple el supuesto de varianza constante, se espera que la amplitud de la dispersión
de los puntos en cada nivel de factor tenderá a ser similar; y no se cumplirá el
supuesto si hay diferencias fuertes en esta amplitud, como se muestra en la figura
3.6d. En la interpretación de esta gráfica debe considerarse que, en estadística, las
pequeñas diferencias por lo general no son significativas, y también debe tomarse
en cuenta la cantidad de observaciones hechas en cada nivel del factor, puesto que
este hecho puede impactar la dispersión aparente en cada tratamiento. Otra
interpretación de la gráfica de factor contra residuos es que cuando los tratamientos
o niveles muestran una dispersión diferente de sus residuales correspondientes
(como en la figura 3.6d), es que el factor o los tratamientos tienen un efecto
significativo sobre la variabilidad de la respuesta. Con base en esta información se
podría proponer un nivel de operación para dicho factor que minimice la dispersión
y optimice la media. Así, cuando hay una evidencia contundente en las gráficas
anteriores, donde no se cumple el supuesto de varianza constante, entonces se debe
ver en qué sentido resultan afectadas las conclusiones que se obtienen con el

9
UNIVERSIDAD NACIONAL “SANTIAGO ANTUNEZ DE MAYOLO”
FACULTAD DE CIENCIAS AGRARIAS
ESCUELA PROFESIONAL DE INGENIERIA AGRICOLA

ANOVA y las pruebas de rangos múltiples. Por ejemplo, si se aprecia que el mejor
tratamiento también es el que tiene menor dispersión, entonces se debe mantener tal
tratamiento como la elección correcta, y ver si es de interés investigar por qué la
diferencia en variabilidad con algunos de los otros tratamientos. Pero, si al que se le
considera el mejor tratamiento es el que tiene la varianza más grande, entonces es
difícil mantenerlo como la elección correcta. En este caso se debe replantear la
decisión y el análisis. Una forma de volver a hacer el análisis y reconsiderar la
situación es transformar los datos u observaciones Yij, de manera que se
disminuyan las diferencias en dispersión y se pueda ver más claramente lo que ha
pasado en el experimento. Existe una gran cantidad de transformaciones propuestas
que logran lo anterior, entre las más frecuentes se encuentran la logarítmica y la raíz
cuadrada. La transformación se hace de la siguiente manera: se saca logaritmo a los
datos u observaciones por ejemplo, y con los datos transformados se vuelve a hacer
el análisis completo. En la sección “Transformaciones para estabilizar varianzas”
del capítulo 5 aborda el tema con detalle. En general, siempre se debe investigar por
qué no se ha cumplido el supuesto de varianza constante, ya que eso ayuda a
entender mejor el proceso o sistema con el que se experimenta. Por ejemplo, una
razón frecuente que hace que tal supuesto no se cumpla es que algunas variables
tienen una dispersión directamente proporcional a su magnitud, de tal forma que si
sus valores son pequeños, éstos tienden a ser más homogéneos en comparación con
la variabilidad que entre sí tienen los valores grandes. Ahora veamos una prueba
analítica para la igualdad de varianzas.

10
UNIVERSIDAD NACIONAL “SANTIAGO ANTUNEZ DE MAYOLO”
FACULTAD DE CIENCIAS AGRARIAS
ESCUELA PROFESIONAL DE INGENIERIA AGRICOLA

 Independencia: La suposición de independencia en los residuos puede verificarse


si se grafica el orden en que se colectó un dato contra el residuo correspondiente. De
esta manera, si al graficar en el eje horizontal el tiempo (orden de corrida) y en el
eje vertical los residuos, se detecta una tendencia o patrón no aleatorio claramente
definido, esto es evidencia de que existe una correlación entre los errores y, por lo
tanto, el supuesto de independencia no se cumple (véanse figuras 3.6e y 3.6f ). Si el
comportamiento de los puntos es aleatorio dentro de una banda horizontal, el
supuesto se está cumpliendo. La violación de este supuesto generalmente indica
deficiencias en la planeación y ejecución del experimento; asimismo, puede ser un

11
UNIVERSIDAD NACIONAL “SANTIAGO ANTUNEZ DE MAYOLO”
FACULTAD DE CIENCIAS AGRARIAS
ESCUELA PROFESIONAL DE INGENIERIA AGRICOLA

indicador de que no se aplicó en forma correcta el principio de aleatorización, o de


que conforme se fueron realizando las pruebas experimentales aparecieron factores
que afectaron la respuesta observada. Por ello, en caso de tener problemas con este
supuesto, las conclusiones que se obtienen del análisis son endebles y por ello es
mejor revisar lo hecho y tratar de investigar por qué no se cumplió con ese supuesto
de independencia, a fin de reconsiderar la situación. Una prueba analítica para
verificar la independencia entre residuos consecutivos es la prueba de Durbin-
Watson, que se presenta en el capítulo 11. El problema con dicha prueba es que no
es capaz de detectar otros patrones de correlación entre residuos (no consecutivos)
que también son violatorios del supuesto de independencia.

GRÁFICA DE PROBABILIDAD EN PAPEL NORMAL Y EN


PAPEL ORDINARIO:

12
UNIVERSIDAD NACIONAL “SANTIAGO ANTUNEZ DE MAYOLO”
FACULTAD DE CIENCIAS AGRARIAS
ESCUELA PROFESIONAL DE INGENIERIA AGRICOLA

GRÁFICAS DE RESIDUOS PARA LOS TIPOS DE CUERO:

13
UNIVERSIDAD NACIONAL “SANTIAGO ANTUNEZ DE MAYOLO”
FACULTAD DE CIENCIAS AGRARIAS
ESCUELA PROFESIONAL DE INGENIERIA AGRICOLA

COMPONETES MULTIPLES «DMS- TUKEY»


 El ANOVA solo resuelve la pregunta planteada en la Ho: de que si las medias
estimadas son iguales o no.

 Si la probabilidad de F > 0.05 No hay problema NO se puede rechazar la Ho y por


tanto las medias son iguales.

Pero:

 Si el valor obtenido de F tiene una probabilidad MENOR a 0.05 entonces si se


rechaza Ho.

 Esto quiere decir que al menos una de las medias es diferente.

Por lo cual:

 En el caso más simple

 Ho: µ1 = µ2 = µ3

• Hay cuatro opciones:

• Que todas las medias sean diferentes entre si

• Que 1 y 2 sean iguales y 3 sea diferente

• Que 1 y 3 sean iguales y 2 diferente o

• Que 2 y 3 sean iguales y 1 diferente.

PRUEBAS MÚLTIPLES:
Para solucionar este problema hay dos caminos

• Contrastes a Priori de antemano se planean ciertas comparaciones que son


de interés al investigador y se incluyen en la tabla de ANOVA (no serán
contemplados en este Curso

• Comparaciones múltiples de Medias. Cuando no se tienen comparaciones


planeadas sino que se quiere ver que pasa. Son pruebas generales que
comparan todas las posibles combinaciones.

14
UNIVERSIDAD NACIONAL “SANTIAGO ANTUNEZ DE MAYOLO”
FACULTAD DE CIENCIAS AGRARIAS
ESCUELA PROFESIONAL DE INGENIERIA AGRICOLA

LA METODO DE TUKEY:
 Se conoce como Tukey-Kramer cuando las muestras no tienen el mismo número de
datos.

 Dado que el análisis de varianza acuse un efecto significativo, la prueba de Tukey


provee un nivel de significancia global de α cuando los tamaños de las muestras son
iguales y de α a lo sumo a cuando no son iguales.

 Se basa en la construcción de intervalos de confianza de las diferencias por pares. Si


estos intervalos incluyen al 0, entonces no se rechaza la hipótesis nula.

Un método más conservador para comparar pares de medias de tratamientos es el método de Tukey,
el cual consiste en comparar las diferencias entre medias muéstrales con el valor crítico dado por:

Donde CME es el cuadrado medio del error, n es el número de observaciones por


tratamiento, k es el número de tratamientos, N – k es igual a los grados de libertad para el
error, a es el nivel de significancia prefijado y el estadístico qa(k, N – k) son puntos
porcentuales de la distribución del rango estudentizado, que se obtienen de la
correspondiente tabla en el apéndice. Se declaran significativamente diferentes los pares de
medias cuya diferencia muestral en valor absoluto sea mayor que Ta. A diferencia de los
métodos LSD y Duncan, el método de Tukey trabaja con un error a muy cercano al
declarado por el experimentador.

15

También podría gustarte