Modelación y Simulación 9

Modelación y Simulación
Sebastián Pérez
Análisis de Varianza (ANAVA o ANOVA)
• ¿Que pasa si quiero comparar varios
tratamientos?
• Alternativas a evaluar
• En este caso, rechazar cualquiera de las 10 hipótesis nulas

implicaría rechazar la hipótesis nula inicial de que las cinco medias
coinciden.
• Por el contrario, si no rechazásemos ninguna de las 10 hipótesis,

tampoco rechazaríamos la hipótesis inicial.
COMPARACIÓN DE MEDIAS
• Supongamos que se están evaluando las características
de calidad de los productos de tres proveedores.
• Para ello se han realizado los ensayos cuyos resultados
se recogen en la Tabla. Si la escala de medida de la
calidad es tal que cuanto mayor sea su valor, mejor es su
calidad ¿qué proveedor suministra productos con mayor
calidad?
ANAVA ó ANOVA
• La herramienta estadística que sirve para
resolver el problema de comparar más de dos
medias es el ANÁLISIS DE LA VARIANZA, que
se llama así precisamente porque compara la
variabilidad de las medias muestrales (a través
de la varianza muestral) con la variabilidad de
los elementos dentro de la muestra.
Hipótesis requeridas
• Para que se pueda aplicar el ANÁLISIS DE LA VARIANZA es
preciso que se cumplan estas tres hipótesis:
• Los datos han de ser independientes. Para asegurar esto, las

muestras cuyas medias se desea comparar han de extraerse de
manera aleatoria.
• Las poblaciones base de donde proceden las muestras han de ser
normales.
• Las poblaciones base de donde proceden las muestras han de tener
la misma varianza.
Estas hipótesis implican que la variabilidad se distribuye según una

N(0, σ2)
• Así es posible estimar la varianza de la población σ2 a través
de la varianza de cada una de las muestras.
• Esta estimación se hace ponderando las varianzas

muestrales.
• Si k es el número de muestras (en adelante denominaremos
a cada “muestra” “tratamiento”), ni es el tamaño de la
muestra correspondiente al tratamiento i-ésimo y N es el
número total de datos disponible en las distintas muestras
• El estimador denominado “varianza residual” se define:

• Estimar la varianza de la población σ2
suponiendo que los tratamientos no tienen
ningún efecto (es decir que todos tienen la
misma media).
• En estas condiciones podremos estimar σ2 a
través de la varianza de las medias muestrales:
• De este modo, si se verifica la hipótesis de que los
tratamientos no tienen ningún efecto, ambas
estimaciones no podrán diferir mucho.
• En efecto, si la hipótesis es cierta, el estadístico
cociente de ambas varianzas muestrales se
distribuye según una F. Es decir:
• Para que el test sea aplicable se debe cumplir con la

condición de SR > ST
Tabla ANOVA
La metodología para realizar el ANÁLISIS
DE LA VARIANZA
Fijar el nivel de significación para el contraste, por ejemplo
confianza=95%.
Establecer el contraste de hipótesis:
• H0: Los tratamientos son todos iguales: m1=m2=m3=…=mk.

• H1: Alguno de los tratamientos es diferente.
Calcular los estimadores
Calcular el valor del estadístico

• Calcular el valor de Fk-1, n -k para el nivel de
significación prefijado. Si:
• La diferencia entre los tratamientos es

estadísticamente significativa con un nivel de
significación α.
• La diferencia entre los tratamientos no es

estadísticamente significativa con un nivel de
significación α.
Ejemplo
Desarrollo
A B C
x 102,58 98,18 108,91
S2 11,66 7,28 3,84
X (gen) 103,22
G.L. Cuadrados
medios
91,12 15-3 7,59
290,94 3-1 145,47
???
• Si es menor que F calculado entonces... No se cumple la

igualdad.
• Conclusión: Ho no se cumple por tanto se puede concluir

que los proveedores difieren al 95% de confianza
Prueba de bondad de Ajuste
• Se utiliza cuando no se sabe cual es la
distribución de la población. Y se desea probar la
hipótesis de que una distribución en particular
será un modelo satisfactorio de la población.
Prueba de Ji-cuadrado de bondad de ajuste
• Mediante la distribución Ji-cuadrado se realiza

un test estadístico en que se comparan los
valores de la muestra (observados) con los
valores de una distribución dada (esperados).
• k: intervalos de clase
• p: número de parámetros de la D.P. propuesta
estimado por los estadísticos muéstrales.
• Continuamos…

Modelación y Simulación 9

Cargado por

Copyright:

Formatos disponibles

Modelación y Simulación 9

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Modelación y Simulación 9

Cargado por

Copyright:

Formatos disponibles

Modelación y Simulación

• En este caso, rechazar cualquiera de las 10 hipótesis nulas

• Por el contrario, si no rechazásemos ninguna de las 10 hipótesis,

• Los datos han de ser independientes. Para asegurar esto, las

Estas hipótesis implican que la variabilidad se distribuye según una

• Esta estimación se hace ponderando las varianzas

• El estimador denominado “varianza residual” se define:

• Para que el test sea aplicable se debe cumplir con la

• H0: Los tratamientos son todos iguales: m1=m2=m3=…=mk.

Calcular los estimadores

Calcular el valor del estadístico

• La diferencia entre los tratamientos es

• La diferencia entre los tratamientos no es

• Si es menor que F calculado entonces... No se cumple la

• Conclusión: Ho no se cumple por tanto se puede concluir

• Mediante la distribución Ji-cuadrado se realiza

También podría gustarte