07.3 Comparacic3b3n de Mc3baltiples Medias
07.3 Comparacic3b3n de Mc3baltiples Medias
07.3 Comparacic3b3n de Mc3baltiples Medias
Área de Estadística
Material de apoyo didáctico elaborado por S. Sühring
Si rechazamos la Ho, sólo podemos afirmar que existe por lo menos una media
poblacional de tratamientos que es diferente. Pero:
• ¿dónde están localizadas las diferencias?
• ¿cuál es la diferencia mínima requerida entre dos medias muestrales para decir que
existen diferencias significativas entre las respectivas medias poblacionales?
Para poder responder a estas preguntas debemos realizar pruebas para comparar los
valores medios de los grupos. Se pueden plantear muchas hipótesis que respondan a
diferentes objetivos de investigación, por lo que se tomará un conjunto de decisiones
simultáneas.
Por ejemplo, si evaluamos 3 tratamientos (1, 2 y 3) podríamos plantear las hipótesis nulas:
µ1 = µ2 µ1 = µ3 µ2 = µ3.
Para realizar inferencia simultánea con una tasa de error del experimento inalterada (en
un valor fijado por el investigador), se han desarrollado diversos métodos estadísticos
específicos denominados comparaciones múltiples de medias.
El método estadístico a elegir dependerá del tipo y la fuerza de la inferencia deseados.
Los tipos de inferencia pueden ser: contrastes planeados, comparaciones contra el mejor
tratamiento, comparaciones contra el tratamiento control, comparaciones de a pares.
La fuerza de la inferencia se refiere a cuánto se puede decir de la comparación:
1) Las más fuertes brindan información acerca de la magnitud y la dirección de la
inferencia. Es el caso de los intervalos de confianza simultáneos.
2) Inferencia de direcciones confiables: puedo establecer la dirección (si Ci > 0 ó Ci
< 0), pero no miden la magnitud de la diferencia.
3) Inferencia de desigualdades confiables: puedo establecer si Ci = 0 ó Ci ≠ 0, pero
no miden la magnitud ni la dirección de la diferencia.
4) Comparación individual: no tiene en cuenta que habrá una inferencia simultánea,
por lo tanto el αE será mayor.
Cuando el investigador está interesado en analizar las diferencias entre las medias de a
pares, cada comparación considera sólo dos medias y las hipótesis se plantean como:
Ho: µi = µj ó (µi - µj) = 0
H1: µi ≠ µj ó (µi - µj) ≠ 0
En estos casos el valor crítico utilizado para tomar la decisión se denomina DMS (diferencia
mínima significativa), y es la diferencia más pequeña que debe haber entre dos medias
muestrales ( Yi − Y j ) para concluir que las medias poblacionales respectivas son
diferentes (es decir, rechazar la Ho).
Prueba de Tukey
Se utiliza para determinar la significación de todas las comparaciones posibles entre pares
de medias.
Las hipótesis que se plantean son:
Ho: µi = µj ó (µi - µj) = 0 H1: µi ≠ µj ó (µi - µj) ≠ 0
Para responder se calcula la correspondiente diferencia di = Yi − Y j que se compara con el
valor de DMS. Si di> DMSTukey se rechaza la Ho ⇒ las diferencias entre las respectivas
medias poblacionales son significativas.
CMEE
DMS Tukey = q( t ;δ e )α ⋅ cuando los ri son iguales
r
1 1 CMEE
DMS Tukey = q(t ;δ e )α ⋅ +
r r 2 cuando los ri son diferentes
i j
Se deben ordenar las medias de grupos de menor a mayor en filas y columnas, calcular las
diferencias de los pares (di) y compararlas con la DMSTukey.
Es una prueba sencilla y sensible por lo cual es ampliamente utilizada.
OJO! Cuando los tamaños muestrales son muy diferentes, la prueba de Tukey puede
dejar de ser confiable, en ese caso podría utilizarse algún procedimiento de contraste
múltiple que considere tal situación, como el de Scheffé.
Con pruebas F es más fácil rechazar la hipótesis de igualdad de medias que con Tukey,
por esta razón se dice que esta última es más conservadora (menor error tipo I) y la
primera es más potente (menor error tipo II). También resulta más conservador que
Duncan.
Usando el valor de DMS pueden calcularse intervalos de confianza simultáneos para las
diferencias de medias con:
d i ± DMS Tukey
Si el intervalo de confianza calculado incluye al valor 0 (cero) se concluye que las medias
poblacionales son iguales.
Prueba de Duncan
Permite comparar medias de a pares. Se conoce como prueba de rangos múltiples, ya
que se calcula un valor de DMS para cada amplitud. La amplitud se refiere a la cantidad
de medias que abarca el contraste cuando éstas son ordenadas de menor a mayor
(diferencias o desviaciones de amplitud múltiple). Por esta razón es más eficiente, es
decir, tiene mayor capacidad de detectar diferencias entre dos medias si es que estas
diferencias existen. Con esta prueba se obtienen más diferencias significativas que con
Tukey, es decir que es más sensible.
Las hipótesis que se plantean son:
Ho: µi = µj H1: µi ≠ µj
Prueba de Dunnet
Se utiliza en experimentos que incluyen un testigo, ya que permite comparar cada una de
las medias de los tratamientos ensayados contra el testigo. Si se dispone de t grupos de
los cuales uno es el control, se pueden realizar (t – 1) comparaciones.
Las hipótesis que se plantean son:
Ho: µi = µj H1: µi ≠ µj
Para todos los contrastes planteados se calcula un único valor crítico (DMS), en función
del valor de nivel de significación establecido (α).
El valor crítico se denomina DMSDunnett = DUT
Si la diferencia entre medias observada di = Yi − Y j > DMSDunnett ⇒ rechazo la Ho de
igualdad de medias.
2CMEE
DMS Dunnett = t ′ (α ; p;δ e ). cuando los ri son iguales
r
1 1
DMS Dunnett = t ′ (α ; p; δ e ). CMEE + cuando los ri son diferentes
r r
i j
Donde t’ es un valor de la tabla de Dunnett que depende del nivel de significación (α), del
número de tratamientos incluido el control (p) y de los grados de libertad del error δe.
Pueden calcularse intervalos de confianza simultáneos para estimar la diferencia entre
medias con:
2.CMEE
d i ± t ′ (α ; p; δ e )
r
El valor de t’ se extrae de la tabla de Dunnett para comparaciones bilaterales.
Si un intervalo de confianza incluye al valor 0 (cero) se concluye que las medias son iguales.
Son combinaciones lineales de las medias o de los totales de tratamientos que expresan la
forma en que deseo realizar las comparaciones.
Por ejemplo: si se quiere comparar dos medias µ1 y µ2 , la Ho dirá que son iguales: µ1 = µ2 y
por lo tanto su diferencia sería igual a cero (µµ1 - µ2 = 0) .
Así, esta comparación puede escribirse como: Qi = c1 µ1 + c2 µ2 = 0
Los coeficientes c1 y c2 serán (1) y (-1) y el contraste queda expresado como:
Qi = (1) µ1 + (-1) µ2
Una comparación será un contraste si:
Qi = c1 µ1 + c2 µ2 + . . . + ct µt Si la ∑ ci = 0 ⇒ contraste
Qi = comparación o contraste
ci = coeficiente que corresponde a cada media
t = número de tratamientos
b) Si quiero comparar dos grupos de medias, el grupo 1 con µ1 y µ2 y el grupo 2 con µ3, µ4 y
µ1 + µ 2 µ3 + µ 4 + µ5
µ5 . La Ho será: =
2 3
Como el grupo 1 tiene 2 medias y el grupo 2 tiene 3 medias, entonces:
Contrastes ortogonales
Dados dos contrastes se dice que éstos son ortogonales si se cumple que ∑ c1i c2i = 0
Los contrastes ortogonales son independientes, es decir que no contienen información
redundante. La variación de uno de ellos es independiente de la del otro, por lo que la
información que proporciona una comparación no se solapa con la proporcionada por la otra.
Si disponemos de t medias se podrán plantear (t – 1) contrastes ortogonales.
∑
i =1 ri
t
r ∑ ci2 r ∑ ci2
i =1 i =1
Ho: Qi = 0 H1: Qi ≠ 0
Para poner a prueba hipótesis referidas a contrastes podemos utilizar las pruebas F
planeadas (si los contrastes se plantearon a priori) o las pruebas de Scheffé (cuando los
contrastes son planteados a posteriori en función de los resultados obtenidos).
Pruebas F planeadas
Se utilizan para poner a prueba comparaciones específicas que pueden incluir grupos de
medias. Los contrastes planteados deben ser ortogonales (independientes), es decir que la
información de una comparación no se solapa con la de otra comparación. En estos
contrastes se utilizan los totales de tratamientos y por eso se utiliza el estadístico Fc para
ponerlos a prueba.
Si se plantean (t - 1) contrastes ortogonales, entonces cada uno constituye una partición de
la SCTr, y por lo tanto la ∑SCCo = SCTr.
Las hipótesis que se plantean son:
Ho: Qi = 0 H1: Qi ≠ 0
CMCo
El estadístico de prueba es: Fc = ≈ F(1,δ );α
CMEE e
Prueba de Scheffé
Permite realizar muchos contrastes simultáneos utilizando las medias de tratamientos.
Las hipótesis que se plantean son:
Ho: Qi = 0 H1: Qi ≠ 0
t
ci2
DMS Scheffé = (t − 1).F( t −1),δe . CMCo = (t − 1) ⋅ F ⋅ CMEE.∑ .
i =1 ri
Esta prueba se utiliza cuando hay datos perdidos, o cuando se quieren realizar contrastes
sugeridos por los datos, o si se tienen muchos tratamientos y poca planificación (muchas
preguntas).
Es un método muy conservador o riguroso (es menos sensible), ya que se puede usar para
cualquier número de contrastes. Detecta sólo diferencias grandes, por lo que tiende a
considerar significativas menos diferencias de las que debiera. No es recomendable si se
van a plantear muchas comparaciones de a pares de medias.
Pueden calcularse intervalos de confianza simultáneos para las diferencias de medias con:
t
ci2
d i ± (t − 1) ⋅ F(t −1),δ e ⋅ CMEE ⋅ ∑
i =1 ri
donde Ai es una variable distribuida normalmente, independiente de los εij, con media 0 y
varianza σ2A.
σ2A : componente añadida a la varianza de los datos
E ( CMA ) = σ 2
+ n
∑ A i2
=σ 2
+ nσ 2
k −1
A
⋅ (CMA − CMEE )
1
σ 2
A =
r
Nos interesa entonces calcular la magnitud relativa de σ2A respecto de la varianza común
σ2 expresada como porcentaje, que para el caso de un ANOVA I sería:
100 .σ A2
σ A2 + CMEE
La magnitud relativa de las componentes da una idea de la contribución de cada una de
las dos fuentes de variabilidad.
Prueba F planeada
Se deben plantear los contrastes ortogonales y calcular para cada uno del valor de Qi y el
CMCo. Las hipótesis planteadas son:
µ + µ B + µC + µ D µ + µC µ B + µ D
1) µT = A 2) µ A = µc 3) A = 4) µ B = µ D
4 2 2
Prueba de Dunnett
2CMEE
DMS Dunnett = t ′ (α ; p;δ e ).
r
2(5.41) 2(5.41)
DMS Dunnett ,5% = 2.71. = 3.99 DMS Dunnett ,1% = 3.51. = 5.16
5 5
Tratamiento T A B C D
Media (kg) 89.2 93.8 91.8 93.4 94.2
tratamientos A B C D
Diferencias con media del T (kg) 4.6* 2.6 4.2* 5*
Cálculo de intervalos de confianza simultáneos del 95% para las diferencias con:
2.CMEE
d i ± t ′(α ; p; δ e )
r
Prueba de Tukey
Se deben calcular los valores críticos para cada nivel de significación con:
CMEE
DMS Tukey = q( t ;δ e )α ⋅
r
Las medias ordenadas se ubican en filas y columnas para calcular los valores de di. Se
comparan con el valor de DMS para decidir.
Prueba de Duncan
Debemos ordenar las medias de menor a mayor y establecer las comparaciones en función
de la cantidad de medias que abarcan:
orden de las medias
T B C A D
p 5% 1%
Z DMS Z DMS
2 3.00 3.12 4.13 4.29
3 3.15 3.28 4.34 4.51
4 3.23 3.36 4.45 4.62
5 3.30 3.43 4.54 4.72
Prueba de Scheffé
Se deben establecer los contrastes y calcular para cada uno del valor de Qi
usando las medias de cada tratamiento y el CMCo. Las hipótesis planteadas son:
µ + µ B + µC + µ D µ + µC µ B + µ D
1) µT = A 2) µ A = µc 3) µT = µ D 4) µ B = µ D 5) A =
4 2 2
DMS Scheffé ,5% = 4.(3,01).21,64 = 16,14 DMS Scheffé ,1% = 4.(4,77).21,64 = 20,31
DMS Scheffé ,5% = 4.(3,01).4,328 = 7,21 DMS Scheffé ,1% = 4.(4,77).4,328 = 9,09