0% encontró este documento útil (0 votos)
5 vistas8 páginas

Estadistica II Anova

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
5 vistas8 páginas

Estadistica II Anova

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 8

UNIVERSIDAD CENTRAL DE NICARAGUA

“Agnitio Ad Verum Ducit”

UNIVERSIDAD CENTRAL DE NICARAGUA


CAMPUS DORAL

Carrera Administración de Empresas.

Curso: Estadística II – Sabatino Grupo1 – A-4


Profesor: Lic. Ismael Barrios
TEMA

ANÁLISIS DE VARIANZA

 Metodología General para la Anova


 Anova para dos o mas variables independiente
 Conceptos Importantes en Anova
-Suma de cuadrados
- Grados de libertad
- Media de cuadrados

Elaborado por:
1. Scarleth Victoria Castillo Flores.

Managua 19 de Abril 2024.


UNIVERSIDAD CENTRAL DE NICARAGUA
“Agnitio Ad Verum Ducit”

ANÁLISIS DE VARIANZA (ANOVA)

El Análisis de Varianza (ANOVA), también conocido como ANOVA por sus siglas en
inglés (ANalysis Of VAriance), es una herramienta estadística fundamental para
comparar las medias de dos o más grupos. Es ampliamente utilizada en diversos
campos, desde la investigación científica hasta el control de calidad, para determinar si
las diferencias observadas entre los grupos son estadísticamente significativas o
simplemente se deben al azar.

Metodología General para ANOVA

El proceso general del ANOVA se puede resumir en los siguientes pasos:


 Planteamiento del problema y definición de hipótesis: Se define claramente
el problema de investigación y se establecen las hipótesis nula (H0) y alternativa
(H1). La hipótesis nula plantea que no existen diferencias significativas entre las
medias de los grupos, mientras que la alternativa propone que sí existen tales
diferencias.

 Recolección de datos: Se recolectan datos de manera aleatoria e independiente


para cada grupo. Los datos deben cumplir con ciertos supuestos para que el
ANOVA sea válido, como la normalidad de los residuales y la homocedasticidad
(varianza constante entre los grupos).

 Cálculo de estadísticos: Se calculan diversos estadísticos importantes, como la


suma de cuadrados total (SCT), la suma de cuadrados entre grupos (SCE), la
suma de cuadrados dentro de grupos (SCD), los grados de libertad (gl) para cada
componente y las medias cuadradas (MC).

 Prueba de hipótesis: Se utiliza la prueba F de Snedecor para determinar si las


diferencias entre las medias de los grupos son estadísticamente significativas. La
prueba F compara la variabilidad entre grupos con la variabilidad dentro de
grupos.

 Interpretación de resultados: Se interpreta el valor de la prueba F y se toma


una decisión sobre la aceptación o rechazo de la hipótesis nula. Si el valor de p
(asociado a la prueba F) es menor que el nivel de significancia (α) previamente
establecido, se rechaza la hipótesis nula y se concluye que existen diferencias
significativas entre las medias de los grupos. De lo contrario, no se rechaza la
hipótesis nula y se concluye que no hay evidencia suficiente para afirmar que las
UNIVERSIDAD CENTRAL DE NICARAGUA
“Agnitio Ad Verum Ducit”

medias de los grupos son diferentes.

 Análisis post hoc: Si se rechaza la hipótesis nula, se pueden realizar análisis


post hoc para identificar qué grupos específicos presentan diferencias
significativas entre sí.

ANOVA para dos o más variables independientes

El ANOVA también se puede extender a situaciones con dos o más variables


independientes. En este caso, se utiliza un diseño factorial, donde cada variable
independiente se clasifica en diferentes niveles o categorías. El objetivo es determinar si
las interacciones entre las variables independientes tienen un efecto significativo sobre
la variable dependiente.

ANOVA de una vía


El ANOVA de una vía se utiliza cuando hay una variable independiente con dos o más
niveles. Compara las medias de cada grupo para determinar si existe una diferencia
estadísticamente significativa entre ellas.
Ejemplo:
Un investigador quiere comparar el rendimiento académico de estudiantes que han
tomado tres cursos diferentes de matemáticas: álgebra, trigonometría y cálculo. El
investigador podría utilizar un ANOVA de una vía para determinar si existe una
diferencia significativa en el promedio de calificaciones entre los tres grupos de
estudiantes.

ANOVA de dos vías


El ANOVA de dos vías se utiliza cuando hay dos variables independientes, cada una
con dos o más niveles. Compara las medias de cada grupo, así como las interacciones
entre las dos variables independientes.
Ejemplo:
Un investigador quiere estudiar el efecto de dos tipos de fertilizante (A y B) y tres
niveles de riego (bajo, medio y alto) en el crecimiento de las plantas. El investigador
podría utilizar un ANOVA de dos vías para determinar si existe un efecto significativo
del fertilizante, del riego, o de la interacción entre el fertilizante y el riego, en el
crecimiento de las plantas.
UNIVERSIDAD CENTRAL DE NICARAGUA
“Agnitio Ad Verum Ducit”

ANOVA factorial
El ANOVA factorial es un término general que se utiliza para referirse a cualquier
ANOVA que tenga dos o más variables independientes.

Supuestos del ANOVA


Para que los resultados del ANOVA sean válidos, se deben cumplir ciertos supuestos:
1. Los datos deben ser cuantitativos y seguir una distribución normal.
2. Las varianzas de los grupos deben ser homocedásticas.
3. Las observaciones deben ser independientes.

Conceptos importantes en ANOVA

 Suma de cuadrados (SC):


Es una medida de la variabilidad total de los datos. Se calcula como la suma de
las desviaciones cuadráticas de cada valor individual respecto a la media
general.

Existen tres tipos principales de sumas de cuadrados en ANOVA:

1. Suma Total de Cuadrados (SST):Representa la variabilidad total presente


en los datos, sin considerar ningún modelo o factor. Se calcula como la suma
de las desviaciones cuadráticas de cada valor individual de la media general.
Fórmula:
SST = Σ(Yi - Y̅ )²
Donde:
Yi es el valor de la i-ésima observación
Y̅ es la media general de todas las observaciones.

Interpretación:
La SST indica la variabilidad total presente en los datos, tanto la explicada
UNIVERSIDAD CENTRAL DE NICARAGUA
“Agnitio Ad Verum Ducit”

por el modelo como la no explicada.

2. Suma de Cuadrados Explicada (SSE): Mide la variabilidad en los datos


que se puede atribuir al modelo o a los factores considerados en el análisis.
Se calcula como la suma de las desviaciones cuadráticas de las medias de
cada grupo o nivel del factor respecto a la media general.
Fórmula:
SSE = Σ(Ȳj - Y̅ )² * nj
Donde:

Ȳj es la media del j-ésimo grupo o nivel del factor


nj es el número de observaciones en el j-ésimo grupo o nivel del factor.

Interpretación:
La SSE refleja la variabilidad en los datos que se explica por el modelo o los
factores, es decir, la cantidad de variabilidad que el modelo captura.

3. Suma de Cuadrados Residual (SSR): Representa la variabilidad en los


datos que no se puede explicar por el modelo o los factores. Se calcula como
la suma de las desviaciones cuadráticas de cada valor individual respecto a la
media de su grupo o nivel del factor.
Fórmula:
SSR = Σ(Yij - Ȳj)²
Donde:
Yij es el valor de la i-ésima observación en el j-ésimo grupo o nivel del
factor
Ȳj es la media del j-ésimo grupo o nivel del factor.

Interpretación:
La SSR refleja la variabilidad en los datos que no se explica por el modelo o
los factores, es decir, la cantidad de "ruido" o error presente en los datos.
UNIVERSIDAD CENTRAL DE NICARAGUA
“Agnitio Ad Verum Ducit”

Relación entre las sumas de cuadrados:


La relación entre las sumas de cuadrados es fundamental para comprender el
modelo ANOVA:
SST = SSE + SSR
Esta ecuación establece que la variabilidad total (SST) se puede
descomponer en la variabilidad explicada por el modelo (SSE) y la
variabilidad no explicada (SSR).

Uso de las sumas de cuadrados:


Las sumas de cuadrados se utilizan en ANOVA para calcular estadísticos de
prueba, como la razón de F, que permiten evaluar la significancia estadística
de los efectos del modelo o los factores.

 Grados de libertad (gl):


Representan el número de valores independientes que se pueden utilizar para
estimar la varianza. Se calculan de manera diferente para cada componente del
ANOVA (total, entre grupos y dentro de grupos).

Tipos de grados de libertad en ANOVA:


I. Grados de libertad totales (gl_total):
Representa el número total de observaciones menos uno (N-1).
Indica la cantidad total de información disponible para estimar las
varianzas de la población.

II. Grados de libertad entre grupos (gl_entre):


Equivale al número de grupos independientes (k) menos uno (k-1).
Mide la variabilidad entre las medias de los diferentes grupos.

III. Grados de libertad dentro de grupos (gl_dentro):


Se calcula como el número total de observaciones (N) menos el número
de grupos (k) y menos uno (N-k-1).
Representa la variabilidad dentro de cada grupo individual.
UNIVERSIDAD CENTRAL DE NICARAGUA
“Agnitio Ad Verum Ducit”

Interpretación de los grados de libertad:

Los grados de libertad proporcionan información crucial sobre la


precisión de las estimaciones de varianza.
Un mayor número de grados de libertad conduce a estimaciones más
precisas y confiables.
Los valores de los grados de libertad se utilizan para calcular los valores
p en las pruebas de ANOVA, que son esenciales para determinar la
significancia estadística de los resultados.

Ejemplo:
Supongamos que se realiza un ANOVA de un factor con 50
observaciones y 5 grupos. En este caso:

Gl_total = 50 – 1 = 49
Gl_entre = 5 – 1 = 4
Gl_dentro = 50 – 5 – 1 = 44

 Media de cuadrados (MC):


Es el resultado de dividir la suma de cuadrados por sus grados de libertad. Se
utiliza para comparar la variabilidad entre diferentes componentes del ANOVA.

Existen dos tipos de MC importantes en ANOVA:

1. Cuadrado medio entre grupos (MCG):


Mide la variabilidad entre las medias de los grupos.
Se calcula dividiendo la SC entre grupos por los gl entre grupos.
Un MCG alto indica que las medias de los grupos son significativamente
diferentes entre sí.

2. Cuadrado medio dentro de grupos (MCG):


Mide la variabilidad dentro de cada grupo.
UNIVERSIDAD CENTRAL DE NICARAGUA
“Agnitio Ad Verum Ducit”

Se calcula dividiendo la SC dentro de grupos por los gl dentro de grupos.


Un MCG alto indica que hay mucha variabilidad dentro de los grupos.

Interpretación de los MC:

Los MC se utilizan para calcular el estadístico F, que se emplea para determinar


si las diferencias entre grupos son estadísticamente significativas.
Un valor F alto junto con un valor p bajo (p < 0.05) indica que las diferencias
entre grupos son significativas y probablemente no se deban al azar.
Es importante comparar el MCG con el MCG para evaluar la magnitud de las
diferencias entre grupos en relación con la variabilidad dentro de los grupos.

El ANOVA es una herramienta poderosa para analizar la variabilidad en datos


experimentales y determinar si existen diferencias significativas entre grupos o
categorías. Su comprensión y aplicación adecuada son esenciales para realizar
investigaciones sólidas y tomar decisiones informadas en diversos campos.

También podría gustarte