Análisis Covarianza - DCA
Análisis Covarianza - DCA
Análisis Covarianza - DCA
Introducción
En el análisis de covariancia se combinan los conceptos del análisis de variancia para un diseño
experimental y de regresión. El análisis de covariancia es utilizado en casos en los que la variable
respuesta de un diseño experimental esté relacionada con una o más variables concomitantes. En
este capítulo se tratará el caso de la covariancia lineal con una sola variable concomitante y se
presentará el análisis para el DCA y DBCA. Primero se desarrollará para DCA
PARA DCA
donde:
Análisis de covarianza
La metodología para efectuar el Análisis de Covariancia se resume a continuación:
Análisis de covarianza de un experimento de un solo factor con una covariable
Grados Suma de cuadrados y productos Ajustados para la regresión
Fuente de
de
variación
libertad 𝑋 𝑋𝑌 𝑌 𝑆𝐶𝑎𝑗. 𝐺𝐿𝑎𝑗. 𝐶𝑀𝑎𝑗.
Tratamien
𝑡−1 𝑇𝑥𝑥 𝑇𝑥𝑦 𝑇𝑦𝑦
tos
𝑆𝑆𝐸
2 𝑀𝑆𝐸 =
Error 𝑡(𝑟 − 1) 𝐸𝑥𝑥 𝐸𝑥𝑦 𝐸𝑦𝑦 𝑆𝑆𝐸 = 𝐸𝑦𝑦 − (𝐸𝑥𝑦 ) /𝐸𝑥𝑥 𝑡(𝑟 − 1) − 1 𝑡(𝑟 − 1) − 1
2
Total 𝑡𝑟 − 1 𝑆𝑥𝑥 𝑆𝑥𝑦 𝑆𝑦𝑦 𝑆𝑆′𝐸 = 𝑆𝑦𝑦 − (𝑆𝑥𝑦 ) /𝑆𝑥𝑥 𝑡𝑟 − 2
𝑆𝑆𝐸′ − 𝑆𝑆𝐸
Tratamientos ajustados 𝑆𝑆𝐸′ − 𝑆𝑆𝐸 𝑡−1
𝑡−1
Los pasos para la construcción del cuadro ANCOVA son los siguientes:
t r 𝑡 𝑟 𝑡 𝑟
𝑆𝑥𝑥 = ∑ ∑ 𝑋𝑖𝑗2 − 𝑇𝐶𝑥 𝑆𝑥𝑦 = ∑ ∑ Xij Yij − 𝑇𝐶𝑥𝑦 𝑆𝑦𝑦 = ∑ ∑ 𝑌𝑖𝑗2 − 𝑇𝐶𝑦
i=1 j=1 𝑖=1 𝑗=1 𝑖=1 𝑗=1
Donde:
n = total de observaciones
Para tratamientos
𝑡 𝑡 𝑡
𝑋𝑖.2 𝑋𝑖. 𝑌𝑖. 𝑌𝑖.2
𝑇𝑥𝑥 =∑ − 𝑇𝐶𝑥 𝑇𝑥𝑦 =∑ − 𝑇𝐶𝑥𝑦 𝑇𝑦𝑦 = ∑ − 𝑇𝐶𝑦
𝑟𝑖 𝑟𝑖 𝑟𝑖
𝑖=1 𝑖=1 𝑖=1
2
𝐸𝑥𝑦 2
𝑆𝑥𝑦
𝑆𝐶𝐸 = 𝐸𝑦𝑦 − 𝑆𝐶′𝐸 = 𝑆𝑦𝑦 −
𝐸𝑥𝑥 𝑆𝑥𝑥
Pruebas de hipótesis
Para la influencia de la covariable en el experimento
a) Planteamiento de hipótesis:
b) Nivel de significancia: 𝛼
c) Estadístico de prueba
2
𝐸𝑥𝑦
𝐸𝑥𝑦
𝐹𝑐𝑎𝑙 = ~𝐹1,𝑡(𝑟−1)−1
𝑀𝑆𝐸
d) Criterio de decisión
e) Conclusión
a) Planteamiento de hipótesis:
c) Estadístico de prueba
𝑆𝑆′𝐸 − 𝑆𝑆𝐸
𝑡−1 𝐶𝑀𝑇𝑟𝑎𝑡 𝑎𝑗
𝐹𝑐𝑎𝑙 = 𝑆𝑆𝐸
= ~𝐹𝑡−1,𝑡(𝑟−1)−1
𝑀𝑆𝐸
𝑡( 𝑟 − 1) − 1
d) Criterio de decisión
e) Conclusión
𝐸𝑋𝑌
𝛽̂ =
𝐸𝑋𝑋
Las medias de Y para el tratamiento i (i=1, 2, …, t) ajustada por la regresión están dadas por:
1 1 (𝑋̅𝑖. − 𝑋̅𝑇. )2
Dunnet 𝑆𝑑 = √𝑀𝑆𝐸 ( + + )
𝑟𝑖 𝑟𝑇 𝐸𝑥𝑥
Estas fórmulas se aplican si el diseño es un DCA con ri y rj repeticiones para el par de
tratamientos que se estén comparando (rT es el número de repeticiones para el tratamiento
testigo)
Ejemplo:
Se tiene un experimento con 3 variedades de trigo y se desea averiguar en qué variedad se tiene
mayor peso en gramos de materia seca de raíces (Y). Se cree que el número de plantas (X) influye
sobre el tamaño de las raíces por lo cual se utilizará el Análisis de Covariancia en este
experimento, el mismo que se lleva a cabo utilizando cinco macetas en invernadero. El diseño
estadístico utilizado es el DCA.
Variedades
Nº de I II III
Maceta X Y X Y X Y
1 6 0.54 8 0.11 4 0.13
2 4 0.56 5 0.20 3 0.15
3 6 0.55 4 0.23 4 0.11
4 4 0.60 5 0.21 4 0.11
5 4 0.59 7 0.09 5 0.10
Total 24 2.84 29 0.84 20 0.60
donde:
• Yij es peso de materia seca de raíces observado en la i-ésima variedad de trigo, j-ésima
maceta.
• es el efecto de la media general.
• i es el efecto del i-ésima variedad de trigo.
• es el coeficiente de regresión lineal del número de plantas (X) sobre peso de materia
seca de raíces (Y).
• Xij es del número de plantas de la i-ésima variedad de trigo, j-ésima maceta.
• 𝑋̄•• es la media del número de plantas en el experimento.
• εij es el efecto del error experimental en el i-ésima variedad, y en la j-ésima maceta.
b) Presente el cuadro de ANCOVA y realice las pruebas correspondientes.
𝑡 𝑟
2 2 2
732 2
Sxx = ∑ ∑ 𝑋𝑖𝑗 − 𝑇𝐶𝑥 = 6 + 4 + ⋯ + 5 − = 25.73333
15
𝑖=1 𝑗=1
𝑡 𝑟
4.282
Syy = ∑ ∑ 𝑌𝑖𝑗2 − 𝑇𝐶𝑦 = 0.542 + 0.562 + ⋯ + 0.102 − = 0.6253733
15
𝑖=1 𝑗=1
𝑡 𝑟
(73)(4.28)
Sxy = ∑ ∑ 𝑋𝑖𝑗 𝑌𝑖𝑗 − 𝑇𝐶𝑥𝑦 = (6)(0.54) + (4)(0.56) + ⋯ + (5)(0.10) − = -0.4593
15
𝑖=1 𝑗=1
2𝑡
𝑋𝑖• 242 + 292 + 202 732
𝑇𝑋𝑋 =∑ − 𝑇𝐶𝑋 = − = 8.13333
𝑟 5 15
𝑖=1
𝑡
𝑌𝑖•2 2.842 + 0.842 + 0.602 4.282
𝑇𝑌𝑌 = ∑ − 𝑇𝐶𝑌 = − = 0.6050133
𝑟 5 15
𝑖=1
𝑡
𝑋𝑖• 𝑌𝑖• (24)(2.84) + (29)(0.84) + (20)(0.60) (73)(4.28)
𝑇𝑋𝑌 = ∑ − 𝑇𝐶𝑋𝑌 = − = 0.07466
𝑟 5 15
𝑖=1
𝐸𝑋𝑋 = Sxx − 𝑇𝑋𝑋 = 25.73333 − 8.133333=17.6
𝐸𝑌𝑌 = Syy − 𝑇𝑌𝑌 = 0.6253733 − 0.6050133=0.02036
H0: El peso materia seca de raíces no depende linealmente del número de plantas de trigo.
H1: El peso materia seca de raíces sí depende linealmente del número de plantas de trigo.
2
𝐸𝑋𝑌 (−0.5340)2
𝐸 17.6
𝐹𝑐 = 𝑋𝑋 = = 42.86255~𝐹0.95,1,11
𝑀𝑆𝐸 0.000378
> pvalue<-1-pf(42.86255,1,11)
> pvalue
[1] 4.15271e-05
Se rechaza la H0 a un nivel de significación del 0.1% , se puede afirmar que el peso materia
seca de raíces sí depende linealmente del número de plantas de trigo.
Hipótesis:
Estadístico de Prueba:
𝑆𝑆′𝐸 − 𝑆𝑆𝐸
𝑡−1 𝐶𝑀𝑇𝑟𝑎𝑡 𝑎𝑗 0.306508
𝐹𝑐𝑎𝑙 = 𝑆𝑆𝐸
= = = 810.8677~𝐹2,11
𝑀𝑆𝐸 0.00378
𝑡( 𝑟 − 1) − 1
> pvalue<-1-pf(Fcal,2,11)
> pvalue
[1] 1.139311e-12
Se rechaza la H0 a un nivel de significación del 0.1%, se puede afirmar que al menos una de
estas variedades de trigo tiene una media de peso seco de raíces diferentes de las otras.
Solución R
Planteamiento de hipótesis
H0: 1 aj. = 2 aj. H0: 1 aj. =3 aj. H0: 2 aj. =3 aj.
Ha: 1 aj. ≠ 2 aj. H0: 1 aj. ≠ 3 aj. H0: 2 aj. ≠ 3 aj.
Nivel de significancia: α = 0.05
d) Utilice la prueba t para evaluar si con la variedad I se obtienen pesos superiores en más de
0.5 gr que con la variedad II.
> pvalue<-1-pt(tc,11)
> pvalue
1
0.9999996
Se acepta H0, No se ha encontrado suficiente evidencia estadística para rechazar H0, se puede
aceptar que con la variedad I no se obtienen pesos superiores en más de 0.5 gr. que con la variedad
II.
SOLUCIÓN CON R
Planteamiento de hipótesis
H0: = 0
H1: 0
Estas hipótesis con equivalentes a:
H0: El peso materia seca de raíces no depende linealmente del número de plantas de trigo.
H1: El peso materia seca de raíces sí depende linealmente del número de plantas de trigo.
Nivel de significancia: α = 0.05
Dado que el p valor fui significativo al nivel de 0.1% (p<0.001), Se rechaza la H0; Por lo tanto,
se puede afirmar que el peso materia seca de raíces sí depende linealmente del número de plantas
de trigo.
Hipótesis:
Solución R
Planteamiento de hipótesis
H0: 1 aj. = 2 aj. H0: 1 aj. =3 aj. H0: 2 aj. =3 aj.
Ha: 1 aj. ≠ 2 aj. H0: 1 aj. ≠ 3 aj. H0: 2 aj. ≠ 3 aj.
Nivel de significancia: α = 0.05