Modelación y Simulación 9

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 24

Modelación y Simulación

Sebastián Pérez
Análisis de Varianza (ANAVA o ANOVA)
• ¿Que pasa si quiero comparar varios
tratamientos?
• Alternativas a evaluar

• En este caso, rechazar cualquiera de las 10 hipótesis nulas


implicaría rechazar la hipótesis nula inicial de que las cinco medias
coinciden.

• Por el contrario, si no rechazásemos ninguna de las 10 hipótesis,


tampoco rechazaríamos la hipótesis inicial.
COMPARACIÓN DE MEDIAS
• Supongamos que se están evaluando las características
de calidad de los productos de tres proveedores.
• Para ello se han realizado los ensayos cuyos resultados
se recogen en la Tabla. Si la escala de medida de la
calidad es tal que cuanto mayor sea su valor, mejor es su
calidad ¿qué proveedor suministra productos con mayor
calidad?
ANAVA ó ANOVA
• La herramienta estadística que sirve para
resolver el problema de comparar más de dos
medias es el ANÁLISIS DE LA VARIANZA, que
se llama así precisamente porque compara la
variabilidad de las medias muestrales (a través
de la varianza muestral) con la variabilidad de
los elementos dentro de la muestra.
Hipótesis requeridas
• Para que se pueda aplicar el ANÁLISIS DE LA VARIANZA es
preciso que se cumplan estas tres hipótesis:

• Los datos han de ser independientes. Para asegurar esto, las


muestras cuyas medias se desea comparar han de extraerse de
manera aleatoria.
• Las poblaciones base de donde proceden las muestras han de ser
normales.
• Las poblaciones base de donde proceden las muestras han de tener
la misma varianza.

Estas hipótesis implican que la variabilidad se distribuye según una


N(0, σ2)
• Así es posible estimar la varianza de la población σ2 a través
de la varianza de cada una de las muestras.

• Esta estimación se hace ponderando las varianzas


muestrales.
• Si k es el número de muestras (en adelante denominaremos
a cada “muestra” “tratamiento”), ni es el tamaño de la
muestra correspondiente al tratamiento i-ésimo y N es el
número total de datos disponible en las distintas muestras

• El estimador denominado “varianza residual” se define:


• Estimar la varianza de la población σ2
suponiendo que los tratamientos no tienen
ningún efecto (es decir que todos tienen la
misma media).
• En estas condiciones podremos estimar σ2 a
través de la varianza de las medias muestrales:
• De este modo, si se verifica la hipótesis de que los
tratamientos no tienen ningún efecto, ambas
estimaciones no podrán diferir mucho.
• En efecto, si la hipótesis es cierta, el estadístico
cociente de ambas varianzas muestrales se
distribuye según una F. Es decir:

• Para que el test sea aplicable se debe cumplir con la


condición de SR > ST
Tabla ANOVA
La metodología para realizar el ANÁLISIS
DE LA VARIANZA
Fijar el nivel de significación para el contraste, por ejemplo
confianza=95%.
Establecer el contraste de hipótesis:

• H0: Los tratamientos son todos iguales: m1=m2=m3=…=mk.


• H1: Alguno de los tratamientos es diferente.

Calcular los estimadores

Calcular el valor del estadístico


• Calcular el valor de Fk-1, n -k para el nivel de
significación prefijado. Si:

• La diferencia entre los tratamientos es


estadísticamente significativa con un nivel de
significación α.

• La diferencia entre los tratamientos no es


estadísticamente significativa con un nivel de
significación α.
Ejemplo
Desarrollo

  A B C
x 102,58 98,18 108,91
S2 11,66 7,28 3,84
X (gen) 103,22
G.L. Cuadrados
medios
91,12 15-3 7,59
290,94 3-1 145,47
???

• Si es menor que F calculado entonces... No se cumple la


igualdad.

• Conclusión: Ho no se cumple por tanto se puede concluir


que los proveedores difieren al 95% de confianza
Prueba de bondad de Ajuste
• Se utiliza cuando no se sabe cual es la
distribución de la población. Y se desea probar la
hipótesis de que una distribución en particular
será un modelo satisfactorio de la población.
Prueba de Ji-cuadrado de bondad de ajuste

• Mediante la distribución Ji-cuadrado se realiza


un test estadístico en que se comparan los
valores de la muestra (observados) con los
valores de una distribución dada (esperados).
• k: intervalos de clase
• p: número de parámetros de la D.P. propuesta
estimado por los estadísticos muéstrales.
• Continuamos…

También podría gustarte