Filminas ANOVA 1
Filminas ANOVA 1
Filminas ANOVA 1
ANALISIS ESTADISTICO DE
DATOS E INTERPRETACION DE
RESULTADOS
1
Análisis Estadístico en Estudios
Comparativos
• Pruebas t
•Análisis de Varianza
• DCA y Técnicas No-paramétricas
•Estructura de Parcelas, Tratamientos y Aleatorización
•DBCA y Estructura Factorial de Tratamientos
• DCL y DPD
2
¿Qué es un estudio observacional?
Sobre un proceso existente se observan (registra información) una o más
variables aleatorias.
¿Qué es un experimento?
“Prueba o serie de pruebas en las cuales se inducen cambios deliberados
en las variables de entrada de un proceso o sistema de manera que sea
posible observar e identificar las causas de los cambios en la respuesta
de salida” (Montgomery 1991).
3
Experimentos Comparativos
4
Estudios Planificados
5
Estudios Planificados
6
Ejemplo:
Objetivos:
a) Determinar si efectivamente la Jarilla actúa
como planta madrina en el caso del algarrobo.
7
Vocabulario asociado a Proyectos de Investigación
que generan Datos
•Unidad Experimental
•Unidad Observacional
•Factor, niveles de los factores
•Tipo de Factores: cualitativos y cuantitativos
•Tratamientos
•Repetición. Pseudo-réplicas
•Submuestras
•Contraste o comparación
•Precisión
8
Preguntas asociadas a Proyectos de Investigación
que generan Datos
¿Cuántos tratamientos se desean estudiar?
¿Cuántas veces necesita observar la respuesta?
¿Es necesario observar la evolución de la respuesta en el tiempo?
¿Cuáles son las unidades experimentales?
¿Cuáles son las unidades de observación?
¿Son las unidades experimentales homogéneas?
¿Son las unidades experimentales suficientes para realizar todos
los tratamientos?
¿Cómo se asignan los tratamientos a las unidades experimentales?
El objetivo del experimento, ¿es la comparación y/o la estimación?
¿Los tratamientos tienen alguna estructura?
¿Puede el diseño resultante ser analizado y/o las comparaciones
deseadas llevadas a cabo?.
9
Comparación de dos medias (prueba t)
11
Comparación de dos medias (prueba t)
Muestras dependientes: los tratamientos se aplican a pares de
unidades experimentales gemelas o parecidas; aleatorizando
dentro de los pares
Hipótesis
H0 : 1 2 0 H1: 1 2 0
Ejemplo:
Un técnico desea evaluar el comportamiento de dos tipos de picos aspersores de riego. Para esto
Selecciona 10 campos aleatoriamente, y en cada uno de ellos pone a prueba los 2 picos. Se conoce
que el tipo de agua influye sobre la calidad de la aspersión, ya que las sales disueltas en ella suelen
tapar los picos. Por este motivo, la variable a evaluar es el caudal entregado por los picos luego de
1 mes de funcionamiento. Los datos obtenidos en litros por hora son los siguientes:
Productor 1 2 3 4 5 6 7 8 9 10
Pico A 9 7 9 10 11 5 8 4 11 7
Pico B 5 4 4 6 10 6 7 3 10 7
12
Análisis de Varianza (ANAVA)
La técnica de análisis de la varianza presupone un modelo
para la variable respuesta. Permite descomponer la
variación total de las observaciones en la variación entre
tratamientos y la variación dentro de tratamientos
(entre unidades experimentales que reciben el mismo
tratamiento).
Se denomina modelo lineal de ANAVA (a una vía de
clasificación) para la observación Yij a:
Yij = + i + ij , con i=1,...,a y j=1,..,n
donde:
Yij es la j-ésima observación del i-ésimo tratamiento
es la media general de las observaciones
i es el efecto del i-ésimo tratamiento
ij es una variable aleatoria normal independientemente distribuida con
esperanza 0 y varianza 2 i,j.
13
El objetivo del ANAVA de efectos fijos es
contrastar la hipótesis de que los efectos de
tratamientos son nulos versus que al menos
uno no lo es. En términos estadísticos:
H0: 1=...=a= 0
H1: Al menos un tratamiento tiene efecto no nulo.
14
Formato de una Tabla de ANAVA
Dentro
(Error SCD=SCT-SCE gld=N-a CMD
Experimental)
15
Ejemplo
El porcentaje de humedad relativa (HR) es determinante para el ataque de
hongos en semillas. Para evaluar la susceptibilidad de las semillas de una
forrajera al ataque de un hongo se realizó un ensayo en cámaras de cría con
tres porcentajes de HR: 70%, 80% y 90%. Cinco observaciones fueron
tomadas para cada porcentaje de HR, registrándose el número de semillas
atacadas en un grupo de 100 semillas
70 7 6 9 5 9 36
80 12 15 17 18 20 82
90 14 16 18 21 15 84
y = 202
16
Análisis de Varianza para un ensayo sobre el
efecto de hongos en la semilla de una forrajera
según tratamientos de humedad relativa.
Total 375.73 14
17
Interpretación de Resultados
18
Pruebas de Comparaciones Múltiples
19
Prueba de Tukey para el ejemplo en cuestión
1 2 3
1 - 9.2 9.6
2 - 0.4
3 -
20
Valores críticos de distintos PCM
en función del número de tratamientos
2.2
2
Valores críticos
1.8
1.6
1.4
1.2
1
0 2 4 6 8 10
Número de tratamientos
21
Verificación de Supuestos del Análisis
Los errores se suponen normales con esperanza cero,
varianza común e independientes. Los predictores de los
errores son los residuos.
22
Normalidad
Seleccionando los residuos como variable de análisis, una de
las técnicas más usadas es construir un Q-Q plot normal.
Mediante esta técnica se obtiene un diagrama de dispersión
en el que, si los residuales son normales y no hay otros
defectos del modelo, entonces se alinean sobre una recta a
45°.
3.60
3.40
3.20
Q-Q plot (normal)
3.00
obtenido a partir 2.80
de un modelo con 2.60
errores normales 2.40
2.20
2.2 2.4 2.6 2.8 3.0 3.2 3.4 3.6
23
Homogeneidad de varianzas
Cuando los errores son homocedásticos, haciendo un gráfico de
dispersión de residuos vs. valores predichos por el modelo se
debe observar una nube de puntos sin patrón alguno. Un patrón
típico que indica falta de homogeneidad en las varianzas, se
muestra en la siguiente figura, ya que a medida que crecen los
valores predichos por el modelo, aumentan las dispersiones de
los residuos respectivos.
residuales
Gráfico de residuos en
función de predichos en
un ejemplo con falta de 0
homogeneidad de
varianzas
predichos
24
Prueba de hipótesis sobre los
supuestos
• Prueba de Shapiro-Wilks
H0: Los errores tienen distribución normal
• Prueba de Levene
H0: Los errores tienen varianza homogénea
25
Versión No-Paramétrica del ANAVA
Trat. Ranks
3.00 14.00 A
1.00 25.13 B
2.00 29.87 B
Letras distintas indican diferencias significativas(p<= 0.05)
27
Para modelar es importante identificar
DOS tipos de estructuras
Estructura de parcelas
Aleatorización
Estructura de tratamientos
28
Estructura de Tratamientos
Experimento unifactorial:
29
Estructura de Tratamientos
La estructura de tratamientos de un
problema particular consiste en el
conjunto de tratamientos o poblaciones
que el experimentador ha seleccionado
para estudiar y/o comparar.
30
Experimento con Dos Factores
Con Dos niveles cada uno
31
Modelo para un Experimento Factorial
sin Repeticiones
32
Formato Tabla de ANAVA
Experimento Bifactorial sin Repeticiones
33
Ejemplo
Datos de un ensayo comparativo del efecto de distintos
potenciales agua del substrato sobre el porcentaje de
germinación en Atriplex Cordobensis.
ClNa 85 78 54 14
PEG 83 76 43 9
34
Cuadro de análisis de la varianza del experimento
bifactorial para evaluar el efecto de distintos potenciales
agua del substrato sobre el porcentaje de germinación en
Atriplex cordobensis.
Fuente de Suma de G. de Cuadrado F obs. F tabla
Variación Cuadrados Libertad Medio
Total 6195.5 7
35
Modelos con Interacción
36
Formato Tabla de ANAVA
Bifactorial con Repeticiones
Fuente de Suma de Cuadrados Grados de Libertad Cuadrado F
Variación Medio
Factor A SCA a-1 CMA CMA
CMD
37
Ejemplo
Concentración proteica (% del peso seco) en hojas de
Atriplex cordobensis cosechadas en invierno y verano de
plantas masculinas y femeninas.
Femeninas Masculinas
Invierno Verano Invierno Verano
24 17 17 24
28 18 18 25
26 16 16 23
38
Tabla de ANAVA
Error 14 8 1.75
Total 212 11
39
Gráfico para estudiar interacción
30
masculinas
contenido de proteínas
femeninas
Media error estándar
25 de la concentración de
proteínas en hojas de
Atriplex cordobensis por
efecto del sexo y la época
20
de cosecha.
femeninas masculinas
15
Verano Invierno
40
Gráfico para estudiar interacción
60
55
50
Media error
Fibras Insolubles
masculinas
estándar de la
45 concentración de
fibras insolubles en
40
hojas de Atriplex
35 femeninas cordobensis por
efecto del sexo y la
30 época de cosecha.
25
Verano Invierno
41
Ventaja de la Estructura
Factorial de Tratamientos
Ejemplo: Comparar el efecto de tres tipos de ruptura de
dormición y el efecto de tres temperaturas de cámara de
germinación bajo un DCA con tres repeticiones.
Fuente Gl Fuente GL
Error 6 Error 6
Total 8 Total 8
Número total de UE 18
42
Ventaja de la Estructura
Factorial de Tratamientos
Fuente Gl
Temperatura (A) 2
Tipo de Ruptura (B) 2
A*B 4
Error 9
Total 17
Número total de UE 18
43
Estructura de Parcelas
Diseño en Bloques
44
Principio del Diseño en Bloques
45
Diseño en Bloques Completos al Azar
Bloques Completos
Bloques al Azar
46
Comentarios
El DBCA es una estrategia experimental para disminuir el
efecto de variaciones sistemáticas entre unidades
experimentales sobre la comparación de medias de tratamiento
47
Modelo para la Respuesta de un Experimento Diseñado en Bloques
48
Estructura típica de una tabla de datos para un
ensayo unifactorial con diseño en bloques completos
aleatorizados.
Trat bloque bloque ... bloque Total
1 2 b
: : : ::: :
49
ANAVA - DBCA
Partición de la Suma de Cuadrados Total en
Sumas de Cuadrados Entre Tratamientos, Entre
Bloques y Suma de Cuadrados del Error
50
Formato Tabla ANAVA -DBCA
Fuente de Suma de Cuadrados Grados de Cuadrado F
Variación Libertad Medio
Bloques SCB glb=b-1 CMB CMB
CMD
Entre SCE gle=a-1 CMT CMT
Tratamientos CMD
51
Ejemplo DBCA
Se realizó un experimento en un diseño de bloques completos al azar para
evaluar el rendimiento en kg/parcela de maíz en suelos infectados con
Diplodia spp, en tratamiento con varios fungicidas. Los datos se presentan
a continuación:
Tratamiento
Bloque A B C D E
1 8 16 14 10 8 Tratamientos
2 8 19 16 11 7 A= control sin tratamiento
3 9 24 14 12 1 B y C= fungicidas mercúricos
4 7 22 13 8 1 D y E= fungicidas no mercúricos
I II III IV
C A D B
A E E D
Esquema del diseño
B C B E
de tratamientos
D B A C
E D C A
52
Ejemplo DBCA
Variable N R² R² Aj CV
DensidadSem 20 0.88 0.81 23.01
Test:Duncan Alfa:=0.05
Error: 6.8833 gl: 12
Trat Medias n
B 20.25 4 A
C 14.25 4 B
D 10.25 4 B C
A 8.00 4 C D
E 4.25 4 D
Letras distintas indican diferencias significativas(p<= 0.05)
53
Comparación de Medias
Pruebas exactas (contrastes ortogonales)
Ortogonal = independiente y aditivo (balanceado)
• Comparación de grupos de tratamientos
• Descomposición de la SC de tratamientos
SC Total
SC Trat SC1
Particionada SC2
SC Trat
SC4 SC Trat = SC1 + SC2 + .. +SCt-1
SC3
SC EE SC EE
54
Contrastes ortogonales
Ejemplo
Tratamientos
A= control sin tratamiento
B y C= fungicidas mercúricos
D y E= fungicidas no mercúricos
Coeficientes
A B C D E
B C D E
1. H 0 : A 4 -1 -1 -1 -1
4
B C D E
2. H 0 : 0 1 1 -1 -1
2 2
3. H 0 : B C 0 1 -1 0 0
4. H 0 : D E 0 0 0 1 -1
55
Ejemplo Contrastes Ortogonales
Resultados del análisis de los datos
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F p-valor
Modelo 614.20 7 87.74 12.75 0.0001
Bloque 12.40 3 4.13 0.60 0.6269
Trat 601.80 4 150.45 21.86 <0.0001
Error 82.60 12 6.88
Total 696.80 19
Contrastes
Trat SC gl CM F p-valor
Contraste1 57.80 1 57.80 8.40 0.0134
Contraste2 400.00 1 400.00 58.11 <0.0001
Contraste3 72.00 1 72.00 10.46 0.0072
Contraste4 72.00 1 72.00 10.46 0.0072
Total 601.80 4 150.45 21.86 <0.0001
trat Medias
B 20.25
C 14.25
D 10.25
A 8.00
E 4.25
56
ANAVA Parcelas Divididas
DISEÑO DE EXPERIMENTOS CON DOS TAMAÑOS DE PARCELA
57
ANAVA Parcelas Divididas
Modelo matemático DCA:
Yijk Ai k (i) B j ( AB)ij ijk
Donde:
Yijk = Variable de respuesta en la parcela grande i, parcela pequeña j
y repetición k
µ = La media general
Ai = El efecto principal de la parcela grande i
k (i) = El error para la parcela grande
Bj = El efecto principal de la parcela pequeña j
(AB)ij = La interacción de la parcela grande i con la parcela pequeña j
ijk = El error para la parcela pequeña
58
ANAVA Parcelas Divididas
Modelo matemático DBCA:
Yijk Ri Aj ij Bk ( AB) jk ijk
Donde:
59
ANAVA Parcelas Divididas
Croquis experimental
Bloques=2 Factor A=3 niveles Factor B=3 niveles
Bloque I Bloque II
a2 a1 a3 a3 a1 a2
b2 b2 b3 b1 b1 b2
b3 b1 b1 b3 b2 b1
b1 b3 b2 b2 b3 b3
60
ANAVA Parcelas Divididas
Ejemplo
Se realizó un experimento en DBCA para comparar dos niveles de irrigación (alta y
moderada) y cuatro variedades de caña de azúcar. La parcela grande corresponde a la
irrigación y la parcela pequeña a las variedades. Los datos de rendimiento en ton/ha son
los siguientes:
VARIEDAD
Irrigación 1 2 3 4
Alta 123.2 132.3 123.2 128.8
BLOQUE I
Moderada 118.2 123.2 115.2 116.3
Alta 128.2 138.3 128.2 125.8
BLOQUE II
Moderada 119.2 120.2 117.2 121.3
Alta 118.2 122.3 121.2 124.8
BLOQUE III
Moderada 111.2 117.2 113.2 113.3
Alta 128.2 123.3 128.2 132.8
BLOQUE IV
moderada 113.2 122.2 114.2 116.3
61
Resultados del análisis de los datos
Variable N R² R² Aj CV
Rend 32 0.85 0.75 2.70
Test:Duncan Alfa:=0.05
Error: 6.0312 gl: 3
Irrigacion Medias n
Alta 126.69 16 A
Moderada 116.98 16 B
Error: 10.8368 gl: 18
Variedad Medias n
2.00 124.88 8 A
4.00 122.43 8 A B
3.00 120.08 8 B
1.00 119.95 8 B
Letras distintas indican diferencias significativas(p<= 0.05)
62
ANAVA Diseño Cuadrado Latino
En el diseño de bloques completos al azar, se busca aislar una fuente de
variación extraña reconocible, que puede generar ruido en la comparación
de los efectos de los tratamientos a través del bloqueo. Si el bloqueo
funciona, el CME se reduce, dando una prueba más sensible que la
obtenida en un DCA.
No obstante, hay situaciones en las que se pueden presentar dos fuentes
de variación extrañas reconocibles, por lo que habría que bloquear en dos
sentidos. Si el bloqueo en los dos sentidos funciona, el CME se reduce,
dando una prueba más sensible que en un DBCA
Ventaja:
Controla la variabilidad extraña a tratamientos en doble sentido
Desventajas:
Menos grados de libertad en error experimental que DCA y DBCA
Número de repeticiones = número de tratamientos o múltiplo
Los tratamientos deben aparecer sólo una vez en hilera / columna
63
ANAVA Diseño Cuadrado Latino
Modelo matemático
Yij(k ) Hi C j T(k ) eij
Donde:
Yij = Valor de la variable de respuesta en la hilera i, columna j y tratamiento k
= Promedio general
Hi = Efecto de la hilera i
Cj = Efecto de la columna j
T(k ) = Efecto del tratamiento k
eij = Error experimental
Columnas
1 2 3
1 A B C
Hileras 2 B C A
3 C A B
Croquis experimental
64
ANAVA Diseño Cuadrado Latino
Ejemplo:
Se realizó un experimento para comparar los rendimientos en
kg/parcela de 5 variedades de maíz.En el campo donde se realizó el
Experimento, los gradientes de fertilidad se presentan en dos
sentidos: paralalamente y en ángulo recto a los surcos.
Los datos obtenidos son los siguientes:
Columnas
Filas 1 2 3 4 5
1 C (32) A (23) B (24) E (34) D (28)
2 A (28) C (36) D (33) B (32) E (38)
3 E (40) D (37) A (31) C (39) B (26)
4 D (39) B (31) E (43) A (33) C (41)
5 B (32) E (45) C (43) D (40) A (35)
65
ANAVA Diseño Cuadrado Latino
Resultado del análisis de los datos:
Variable N R² R² Aj CV
Rend 25 0.96 0.93 4.67
Test:Duncan Alfa:=0.05
Error: 2.5933 gl: 12
Trat Medias n
E 40.00 5 A
C 38.20 5 A
D 35.40 5 B
A 30.00 5 C
B 29.00 5 C
Letras distintas indican diferencias significativas(p<= 0.05)
66
ANAVA Diseño Cuadrado Latino
67
MAS DE UN CUADRADO LATINO POR EXPERIMENTO
Modelo matemático
Yijk (l) Qi F (Q) j(i) C(Q)k (i) T(l) eijk
Donde:
Yijk = Valor de la variable de respuesta en el cuadrado i, hilera j, columna k y
tratamiento l
= Media general
Qi = Efecto del Cuadrado i
F (Q) j(i) = Fila j dentro de Cuadrado i
C (Q)k (i)
= Hilera k dentro de Cuadrado i
T(l ) = Efecto del Tratamiento l
eijk = Error experimental
68
MAS DE UN CUADRADO LATINO POR EXPERIMENTO
Ejemplo
Un experimento con seis novillas de un año en una vaquería se efectúo en dos
cuadrados latinos. Los tratamientos fueron tres raciones seleccionadas en base a
la localidad y características físicas diversas y se alimentaron ad libitum. Cada
animal recibió las tres raciones sucesivamente, con una semana para cada una.
La variable observada fue libras de materia seca consumida por 100 lbs de peso
corporal. Los datos se presentan a continuación:
Cuadrado 1 2
Novilla 1 2 3 4 5 6
Semana
1 2.7(1) 2.6(2) 1.9(3) 3.3(1) 2.3(2) 0.1(3)
2 2.1(2) 0.2(3) 2.3(1) 1.7(3) 2.8(1) 1.8(2)
3 1.9(3) 2.1(1) 2.4(2) 2.1(2) 1.7(3) 2.7(1)
69
MAS DE UN CUADRADO LATINO POR EXPERIMENTO
Ejemplo
Variable N R² R² Aj CV
materia_seca 18 1.00 0.56 26.19
Test:Duncan Alfa:=0.05
Error: 0.2852 gl: 6
Trat Medias n
1.00 2.65 6 A
2.00 2.22 6 A
3.00 1.25 6 B
Letras distintas indican diferencias significativas(p<= 0.05)
70
TÉCNICAS COMBINADAS DE ANÁLISIS
ANÁLISIS DE COVARIANZA = ANAVA + Regresión
Modelo matemático:
Supuestos:
72
ANÁLISIS DE COVARIANZA
Ejemplo:
Se hizo una prueba del efecto de tres tratamientos al suelo sobre el crecimiento
en altura de arbolitos de dos años. Los tratamientos se asignaron al azar a las tres
parcelas dentro de cada uno de los 10 bloques. Cada parcela incluía 50 arbolitos.
La media del crecimiento de 5 años fue el criterio para evaluar los tratamientos.
Las alturas iniciales y los crecimientos de cinco años, todos ellos medidos en pies,
fueron:
Tratamientos
A B C
Bloque Alt. Ini Crecim Alt. Ini Crecim Alt. Ini Crecim
1 3.6 8.9 3.1 10.7 4.7 12.4
2 4.7 10.1 4.9 14.2 2.6 7.0
3 2.6 6.3 0.8 5.9 1.5 7.4
4 5.3 14.0 4.6 12.6 4.3 10.1
5 3.1 9.6 3.9 12.5 3.3 6.8
6 1.8 6.4 1.7 9.6 3.6 8.3
7 5.8 12.3 5.5 12.8 5.8 11.9
8 3.8 10.8 2.6 8.0 2.0 7.5
9 2.4 8.0 1.1 7.5 1.6 5.2
10 5.3 12.6 4.4 8.4 4.8 10.7
Existen razones para creer que, en el caso de árboles jóvenes, el crecimiento
está afectado por la altura inicial.
73
ANÁLISIS DE COVARIANZA
Resultados del análisis de covarianza:
Análisis de la varianza
Variable N R² R² Aj CV
Crecimiento 30 0.81 0.68 15.09
Test:Duncan Alfa:=0.05
Error: 2.1060 gl: 17
Tratamiento Medias n
B 10.67 10 A
A 9.30 10 A B
C 8.89 10 B
Letras distintas indican diferencias significativas(p<= 0.05)
74
ANÁLISIS DE COVARIANZA
Análisis de la varianza
Variable N R² R² Aj CV
Crecimiento 30 0.64 0.41 20.56
Tratamiento Medias n
B 10.22 10
A 9.90 10
C 8.73 10
75