Informe Anova

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 11

Introducción

En el siguiente informe usted podrá apreciar información sobre nuestro tema de


investigación ANOVA (Análisis de Varianza), esta herramienta nos permite probar la
significancia de las diferencias entre más de dos medidas muéstrales.
Evalúan la importancia de uno o más factores al comparar las medias de la variable de
respuestas en los diferentes de los factores.
La hipótesis nula establece que todas las medidas de la población son iguales, la
hipótesis alternativa establece que al menos una es diferente.
Marco Teórico
ANOVA (Análisis de Varianza)

En múltiples ocasiones el analista o investigador se enfrenta al problema de


determinar si dos o más grupos son iguales, si dos o más cursos de acción
arrojan resultados similares o si dos o más conjuntos de observaciones son
parecidos. Pensemos por ejemplo en el caso de determinar si dos niveles de
renta producen consumos iguales o diferentes de un determinado producto, si
las notas de dos grupos en una asignatura son similares, si tres muestras de
análisis químico de una sustancia son iguales, o si los municipios de cuatro
provincias colindantes tienen el mismo nivel de paro.

Una aproximación simple sería comparar las medias de estos grupos y ver si
las medias aritméticas de la variable estudiada son parecidas o diferentes. Pero
tal aproximación no es válida ya que la dispersión de las observaciones influirá
en la posibilidad de comparar los promedios o medias de cada grupo. Así,
supongamos que tenemos una variable X (consumo) y dos grupos (nivel de
renta alto y medio) y que tenemos dos resultados distintos correspondientes a
dos provincias.

Es evidente que la conclusión de que con renta alta el consumo es mayor que
con renta media es más rotundo en la provincia B que en la A. En la provincia A
existen familias de renta media con un consumo superior a otras familias de
renta alta, aunque en promedio X21 > X11. Esta situación no se produce en la
provincia B donde todas las observaciones de renta alta son superiores a las
de renta media. En consecuencia, la dispersión deberá tenerse en cuenta para
realizar una comparación de medias o de grupos y esto es lo que se pretende
con el Análisis de la Varianza. El Análisis de la Varianza puede contemplarse
como un caso especial de la modelización econométrica, donde el conjunto de
variables explicativas son variables ficticias y la variable dependiente es de tipo
continuo.
En tales situaciones la estimación del modelo significa la realización de un
análisis de la varianza clásica (ANOVA), de amplia tradición en los estudios y
diseños experimentales. Una ampliación a este planteamiento es cuando se
dispone de una variable de control que nos permite corregir el resultado del
experimento mediante el análisis de la co-variación con la variable a estudiar.
En tal situación nos encontramos frente a un análisis de la covarianza
(ANCOVA).

El análisis de la varianza es una colección de modelos estadísticos y sus


procedimientos asociados, en el cual la varianza está particionada en ciertos
componentes debidos a diferentes variables explicativas.

El primer concepto fundamental es que todo valor observado puede expresarse


mediante la siguiente función:

Yij = µ + Ti +ϵij

Donde:
Yij = sería el valor observado.
µ = sería una constante que en la recta de regresión equivale a la ordenada en el
origen.
Ti = es una variable que varía de tratamiento a tratamiento.
ϵij = es una variable aleatoria que añade a la función cierto error que desvía la
puntuación observada de la puntuación pronosticada.
Visión general
Existen tres clases conceptuales de estos modelos:

 El Modelo de efectos fijos asume que los datos provienen de poblaciones


normales las cuales podrían diferir únicamente en sus medias. (Modelo 1).

 El Modelo de efectos aleatorios asume que los datos describen una jerarquía
de diferentes poblaciones cuyas diferencias quedan restringidas por la
jerarquía. Ejemplo: El experimentador ha aprendido y ha considerado en el
experimento sólo tres de muchos más métodos posibles, el método de
enseñanza es un factor aleatorio en el experimento. (Modelo2).

 El Modelo de efectos mixtos describen situaciones que éste puede tomar.


Ejemplo: Si el método de enseñanza es analizado como un factor que puede
influir donde están presentes ambos tipos de factores: fijos y aleatorios.
(Modelo 3).
Supuestos previos

El ANOVA parte de algunos supuestos o hipótesis que han de cumplirse:


• La variable dependiente debe medirse al menos a nivel de intervalo.
• Independencia de las observaciones.
• La distribución de los residuales debe ser normal.
• Homocedasticidad: homogeneidad de las varianzas.
La técnica fundamental consiste en la separación de la suma de cuadrados (SS, 'sum
of squares') en componentes relativos a los factores contemplados en el modelo.
Como ejemplo, mostramos el modelo para un ANOVA simplificado con un tipo de
factores en diferentes niveles. (Si los niveles son cuantitativos y los efectos son
lineales, puede resultar apropiado un análisis de regresión lineal).
Tipos de modelos
1. Modelo I: Efectos fijos
El modelo de efectos fijos de análisis de la varianza se aplica a situaciones en las que
el experimentador ha sometido al grupo o material analizado a varios factores, cada
uno de los cuales le afecta sólo a la media, permaneciendo la "variable respuesta" con
una distribución normal.
Este modelo se supone cuando el investigador se interesa únicamente por los niveles
del factor presentes en el experimento, por lo que cualquier variación observada en las
puntuaciones se deberá al error experimental.
2. Modelo II: Efectos aleatorios (componentes de varianza).
Los modelos de efectos aleatorios se usan para describir situaciones en que ocurren
diferencias incomparables en el material o grupo experimental. El ejemplo más simple
es el de estimar la media desconocida de una población compuesta de individuos
diferentes y en el que esas diferencias se mezclan con los errores del instrumento de
medición.
Este modelo se supone cuando el investigador está interesado en una población de
niveles, teóricamente infinitos, del factor de estudio, de los que únicamente una
muestra al azar (t niveles) están presentes en el experimento.

Grados de libertad
Los grados de libertad pueden descomponerse al igual que la suma de cuadrados.
Así:
GLtotal = GLentre + GLdentro

- Los GLentre se calculan como: a - 1, donde a es el número de tratamientos o


niveles del factor.
- Los GLdentro se calculan como N - a, donde N es el número total de
observaciones o valores de la variable medida (la variable respuesta)..

Estimación de Anova
Hay 2 tipos de Estimación de la Varianza:
 Estimación de varianza entre columnas
Es el primer paso del análisis de varianza, en la cual indica que
debemos obtener una estimación de la varianza de la población a partir
de la varianza entre las medias de las muestras.

 Estimación de varianza dentro de columnas


Es el segundo paso de ANOVA, en el cual se requiere una segunda
estimación de la varianza de la población, basa en la varianza dentro de
la muestra.
Pruebas de significancia
El análisis de varianza lleva a la realización de pruebas de significación estadística,
usando la denominada distribución F de Snedecor.
F= Varianza entre columnas / Varianza dentro de columnas
Al momento de interpretarlos, si el denominador y el numerador son aproximadamente
iguales, la hipótesis nula es verdadera.
Cuando las poblaciones no son las mismas, la varianza entre columnas tendera a ser
mayor que la varianza dentro de columnas, y el valor de F tendera a ser grande. Esto
nos conducirá a rechazar la hipótesis nula.

Análisis de Varianza
En primer lugar, y como se realizarían simultánea e independientemente varios
contrastes de hipótesis, la probabilidad de encontrar alguno significativo por azar
aumentaría. En cada contraste se rechaza la H0 si la t supera el nivel crítico, para lo
que, en la hipótesis nula, hay una probabilidad a. Si se realizan m contrastes
independientes, la probabilidad de que, en la hipótesis nula, ningún estadístico supere
el valor crítico es (1 - a) m, por lo tanto, la probabilidad de que alguno lo supere es 1 -
(1 - a) m, que para valores de a próximos a 0 es aproximadamente igual a a m. Una
primera solución, denominada método de Bonferroni, consiste en bajar el valor de a,
usando en su lugar a/m, aunque resulta un método muy conservador.
Por otro lado, en cada comparación la hipótesis nula es que las dos muestras
provienen de la misma población, por lo tanto, cuando se hayan realizado todas las
comparaciones, la hipótesis nula es que todas las muestras provienen de la misma
población y, sin embargo, para cada comparación, la estimación de la varianza
necesaria para el contraste es distinta, pues se ha hecho en base a muestras distintas.
El método que resuelve ambos problemas es el anova, aunque es algo más que esto:
es un método que permite comparar varias medias en diversas situaciones; muy
ligado, por tanto, al diseño de experimentos y, de alguna manera, es la base del
análisis multivariante.
Uso de Anova
Puede utilizar ANOVA de una vía para evaluar si existe una diferencia significativa
entre grupos de medias.
ANOVA presupone que existe homogeneidad de varianza, es decir, que la varianza
dentro de cada uno de los grupos es equivalente. Para comprobar la homogeneidad
de la varianza, utilice la prueba de Levene.
ANOVA no indica qué grupos son diferentes entre sí, sólo indica que existe una
diferencia significativa. Tras encontrar una diferencia significativa, puede realizar
pruebas post hoc en la variable independiente para examinar las diferencias entre los
grupos.

Condiciones de uso de Anova


 En ANOVA de un factor solo se relacionan dos variables: una variable
dependiente (o a explicar) y una variable independiente (que en esta técnica se
suele llamar factor)
 La variable dependiente es cuantitativa (escalar) y la variable independiente es
categórica (nominal u ordinal).
 Se pide que las variables sigan la distribución normal, aunque como siempre
esto es difícil de cumplir en investigaciones sociales.
 También que las varianzas (es decir, las desviaciones típicas al cuadrado) de
cada grupo de la variable independiente sean similares (fenómeno que se
conoce como homocedasticidad). Aunque esto es lo ideal, en la realidad cuesta
de cumplir, e igualmente se puede aplicar ANOVA.

Análisis de la varianza con un factor


El análisis de la varianza permite contrastar la hipótesis nula de que las medias de K
poblaciones (K >2) son iguales, frente a la hipótesis alternativa de que por lo menos
una de las poblaciones difiere de las demás en cuanto a su valor esperado.
Este contraste es fundamental en el análisis de resultados experimentales, en los que
interesa comparar los resultados de K 'tratamientos' o 'factores' con respecto a la
variable dependiente o de interés.
El Anova requiere el cumplimiento los siguientes supuestos:

 Las poblaciones (distribuciones de probabilidad de la variable dependiente


correspondiente a cada factor) son normales.
 as K muestras sobre las que se aplican los tratamientos son independientes.
 Las poblaciones tienen todas igual varianza (homoscedasticidad).
Las expresiones para el cálculo de los elementos que intervienen en el Anova son las
siguientes:

Media Global:

Varianza Total:

Variación Intra-grupos:

Variación Inter-grupos:

Siendo xij el i-ésimo valor de la muestra j-ésima; nj el tamaño de dicha muestra y su


media.
Cuando la hipótesis nula es cierta SCE/K-1 y SCD/n-K son dos estimadores
insesgados de la varianza poblacional y el cociente entre ambos se distribuye según
una F de Snedecor con K-1 grados de libertad en el numerador y N-K grados de
libertad en el denominador. Por lo tanto, si H0 es cierta es de esperar que el cociente
entre ambas estimaciones será aproximadamente igual a 1, de forma que se
rechazará H0 si dicho cociente difiere significativamente de 1.
La secuencia para realizar un ANOVA es:
- Analizar
- Comparar medias
- ANOVA de un factor
- Se selecciona la variable que se considera Dependiente y la variable Factor y con el
botón Opciones se activan Estadísticos Descriptivos y Homogeneidad de varianzas.
Al aceptar en el visor de resultados aparecen los siguientes cuadros:
• Descriptivos. Recoge la media, la desviación típica, el intervalo de confianza del 95%
(por defecto) para la media correspondientes a la variable dependiente para cada uno
de los grupos definidos por el factor.
• Prueba de homogeneidad de varianzas. Contiene el valor del estadístico de Levene
del contraste de la hipótesis de homoscedasticidad con el nivel de significación crítico.
• ANOVA. Contiene las sumas de cuadrados inter-grupos, intra-grupos y total, sus
correspondientes grados de libertad y el valor del estadístico de prueba F junto con el
nivel de significación crítico.
Se selecciona en Variable la variable dependiente del ANOVA y en el Eje de
categorías la variable factor. El intervalo de confianza
para la media se calcula por defecto al 95% de confianza. Al aceptar aparece en el
visor de resultados los puntos que representan a la media de cada grupo junto con los
límites del correspondiente intervalo de confianza para la media poblacional. Si los
puntos que representan las medias están desigualmente distribuidos en el gráfico se
tiene un indicio de que a nivel poblacional no puede sostenerse la hipótesis de
igualdad de medias; es decir, por lo menos uno de los niveles del factor influye
significativamente sobre la variable dependiente.

Estadísticos que se calculan en Anova


Al aplicar ANOVA de un factor se calcula un estadístico o test denominado F y su
significación. El estadístico F o F-test (se llama F en honor al estadístico Ronald
Fisher) se obtiene al estimar la variación de las medias entre los grupos de la variable
independiente y dividirla por la estimación de la variación de las medias dentro de los
grupos. El cálculo del estadístico F es algo complejo de entender, pero lo que hace es
dividir la variación entre los grupos por la variación dentro de los grupos.
Si las medias entre los grupos varían mucho y la media dentro de un grupo varía poco,
es decir, los grupos son heterogéneos entre ellos y similares internamente, el valor de
F será más alto, y por tanto, las variables estarán relacionadas. En conclusión, cuanto
más difieren las medias de la variable dependiente entre los grupos de la variable
independiente, más alto será el valor de F. Si hacemos varios análisis de ANOVA de
un factor, aquel con F más alto indicará que hay más diferencias y por tanto una
relación más fuerte entre las variables.
La significación de F se interpretará como la probabilidad de que este valor de F se
deba al azar. Siguiendo un nivel de confianza del 95%, el más utilizado en ciencias
sociales, cuando la significación de F sea menor de 0,05 es que las dos variables
están relacionadas.
Conclusiones
- ANOVA es una herramienta que sirve como vía de evaluación y también como
un análisis de varianza para comprobar la homogeneidad de dos medias.
- La comparación de medias está basada en el contraste del formato de la t
student, sin embargo, en el momento cuando se desea comparar más de 2
medias se vuelve muy complicado ya que las probabilidades de cálculo de
hipótesis se vuelven muchas, es aquí donde ANOVA radica su importancia al
facilitarnos esta labor de comparar más de una variable de manera simultánea.
- ANOVA nos permite interpretar con claridad los resultados de la comparación
de variables, proporciona una explicación concreta del porqué de las
similitudes de dichas variables.

Recomendaciones
- Es importante al momento de utilizar la ayuda de ANOVA verificar a veracidad
de la información acerca de los datos recolectados utilizados en las variables a
comparar.
- ANOVA no es la única vía para comprobar similitudes entre variables, si bien
es cierto es una herramienta muy útil y precisa, pero hay ciertos temas que son
muy complejos de entender.
- Así como hay fórmulas matemáticas ya establecidas para desarrollar cálculos
también es recomendable saber para la utilización de ANOVA en cálculos
estadísticos que también tiene su función específica para aquellos valores que
se están evaluando u observando, esta función se representa: Yij= μ+Ti+ϵij

BIBLIOGRAFÍA

https://www.clubensayos.com/Temas-Variados/An%C3%A1lisis-de-Varianza-
Varianza-entre-columnas/3168263.html
http://www.hrc.es/bioest/Anova_1.html
http://www.ub.edu/aplica_infor/spss/cap4-7.htm
http://networkianos.com/anova-de-un-factor-que-es-como-analizar/
https://www.uam.es/personal_pdi/economicas/eva/pdf/anova.pdf
https://es.wikipedia.org/wiki/An%C3%A1lisis_de_la_varianza
https://es.wikipedia.org/wiki/An%C3%A1lisis_de_la_varianza

También podría gustarte