Clase 11 Anova
Clase 11 Anova
Clase 11 Anova
Introducción
En muchas ocasiones se necesita comparar los datos que corresponden a más de dos grupos. Ej: si una empresa necesita
medir la productividad de sus trabajadores en cinco plantas diferentes. Efectuar todas las combinaciones posibles, tomadas de
dos en dos y aplicar a cada una de estas, una prueba de t de Student, requiere de 10 pruebas. Esto además de ser un gran
trabajo, aumenta la probabilidad de cometer el error tipo I.
Análisis de varianza
El análisis de varianza es un modelo adecuado para estimar la relación entre una o más variables
categóricas independientes, respecto de una variable dependiente cuantitativa.
Se le llama factor a la variable independiente y a los niveles de factor, que son las categorías de esta
variable, también llamadas tratamientos o grupos.
El objetivo de este análisis es contratar la hipótesis (H0) de que varias medias (más de 2) son iguales.
Fuente: https://bit.ly/3fVRf6a
Análisis de varianza
Fuente: https://bit.ly/2AsEfVp
La prueba de hipótesis bajo ANOVA, se fundamenta en la distribución F de
Fisher, la cual es una distribución de probabilidad continua”.
(Alvarado, V. 2014, p.102)
Análisis de varianza
Fuente: https://n9.cl/h61gb
Análisis de varianza
1 2
Análisis de varianza
Análisis de varianza
ANOVA en Excel
Excel cuenta con una herramienta en análisis de datos, llamada “análisis de varianza de un factor”,
que realiza todas las operaciones realizadas anteriormente en el ejemplo.
ANOVA en Excel
2 3
Se selecciona “análisis de varianza de un factor”. En rango de entrada, se seleccionan todos los datos
incluyendo el rótulo.
Viene predefinido con α=5% (se puede cambiar). Y en
rango de salida se coloca la celda donde queremos que se
muestre la información.
Análisis de varianza
ANOVA en Excel
En algunas ocasiones basta saber que las medias son iguales o no, para continuar con un trabajo. Pero hay
otros casos, donde si se rechaza la hipótesis nula, es necesario conocer cuál o cuáles medias difieren de las
demás.
En este caso se comparan todos los pares posibles de medias. (Díaz, A. 2013, p.356).
Siguiendo con el mismo ejemplo del uso de parte de los directivos de los computadores de escritorio en
ciertas industrias, se revisará una forma de realizar esta comparación:
1 Se obtienen los valores absolutos de las diferencias entre todos los pares de medias posibles:
Análisis de varianza
En este caso todas las muestras son del mismo tamaño, es igual para todos los pares, en el caso de
muestras de diferente tamaño, cada variará.
Análisis de varianza
Se compara la diferencia absoluta de cada una de las medias apareadas con la diferencia significativa
3 mínima; si es mayor que la DSM, se concluye que esas 2 medias son diferentes; si es menor, se
concluye que no existe diferencia significativa. (Díaz, A. 2013, p.357).
Solo la tercera diferencia es menor que la diferencia significativa mínima y, por ello, la diferencia entre la
media de la industria de retail y la seguros no es significativa.
Por otra parte, como las medias absolutas entre las medias del rubro bancario con el retail
y la diferencia entre el rubro bancario y el de seguros son superiores a la DSM, se concluye
que las medidas de esos pares sí son diferentes.
Análisis de varianza
Bibliografía
Alvarado, V. (2014). Probabilidad y Estadística. México. Grupo Editorial Patria.
McGraw Hill.
Walpole, R., Myers, R., Myers, S. & Ye, K. (2012). Probabilidad y estadística para