Modelos Lineales Generalizados - UFLA - UNALM
Modelos Lineales Generalizados - UFLA - UNALM
Modelos Lineales Generalizados - UFLA - UNALM
Marcela Pyles:
Doctorado em Ecologia Aplicada-UFLA
Vladimir Camel:
Doctorando en Ciencias e Ingenieria Biologica-UNALM
Modelos lineales generalizados aplicados
a la ecología utilizando software R
Primer día:
• Teoría sobre muestreo y conceptos estadísticos
importantes.Introducción al lenguaje R
Según día:
• Practica en R : Explotación de datos y análisis estadísticos
a menudo utilizados en los estudios ecológicos
Tercer día:
• Presentación de modelos lineales generalizados y
practicas sobre selección de variables
“Lo bueno es que la estadística es cada
vez más fácil y accesible, lo malo es que
ella esta más fácil y accesible”
• Los errores de delineamiento comprometen todos los
análisis de datos siendo imposible reparar tales errores
después del cierre del experimento (Gotelli & Ellison
2011).
Hipótesis y objetivos;
Delineamiento experimental;
Recolección de datos
Análisis estadísticos
Interpretación
HURLBERT (1984)
Lógica de delineamiento de investigación
Observación
La muestra,
variables, escala... Preguntas
Predicciones..
.
Hipótesis biológicas
Hipótesis nulas
y alternativas Hipótesis estadísticos
Muestreo
Delineamiento de investigación
Unidad de muestreo
Delineamiento de investigación
Y
….Independencia de la muestra
Y si no las tenemos?
Pseudo-repetición: no hay independencia entre las muestras
....Dinero
….Logística
Politómica Continúa
Nominal Ordinal
Delineamiento de investigación
Discreta Continúa
Delineamiento de investigación
Predictora Respuesta
Cuantitativa Cuantitativa
Regresiones
Análisis estadísticos
Predictora Respuesta
Cualitativa Cuantitativa
Anova,
test t ...
Análisis estadísticos
Predictora Respuesta
Cualitativa Cualitativa
Chi- cuadrado
Análisis estadísticos
P - valor
P - valor
P - valor
Variable Variable
discreta continúa
Análisis estadísticos
Variable Variable
discreta continúa
Análisis estadísticos
GLMs
Introducción al lenguaje R
Introducción al lenguaje
“Uno de los objetivos del análisis estadístico es destilar
un conjunto largo y complicado de datos en un pequeño
número de estadísticas descriptivas significativas”
Introducción al lenguaje
“Uno de los objetivos del análisis estadístico es destilar
un conjunto largo y complicado de datos en un pequeño
número de estadísticas descriptivas significativas”
Lenguaje y entorno de
programación
Introducción al lenguaje
Introducción al lenguaje
Todo es entrenamiento!!!
R: Información previa
El software R es sensible a cualquier error tipográfico.
R sólo reconocerá las variables cuando el término coincide exactamente con los
términos de los datos de entrada (R es case sensitive)
-El prompt de comando en R Console : ">" (mayor) en rojo: simboliza que el R está listo para
iniciar.
-Cuando aparece un "+" es que falta algo en su comando.
Paso a paso en R: Funciones de instalación, importación y lectura de datos
Creación de datos
Grados de libertad
Presupuestos:
• Homogeneidad de la varianza
• Normalidad de los residuos
Análisis estadísticos en ecología
Modelos lineales
Regresiones lineales
R²= 0.67
0<R²<1
Análisis estadísticos en ecología
Modelos lineales
Análisis de varianza (ANOVA)
La varianza es una medida de dispersión estadística, que indica "cuán lejos"
en general los valores estimados se encuentran del valor esperado
Objetivo del ANOVA: comparación de la varianza entre grupos que fueron
muestreados aleatoriamente;
Variable cualitativa
p-value = 0.002 * (categórica)
Análisis estadísticos en ecología
p-value = 0.002 *
Hay diferencia!! Pero donde?
y=a+(b1*x1)+(b2*x2)+(b3*x3)……
y=152.9256+(-0.7522*vento)+(-1.7792*sizelog)+(0.6091*umid)+(-1.6449*temp)
Análisis estadísticos en ecología
Ejemplo de GLM
Variable respuesta (0/1)
Se busca el modelo más parsimonioso, es decir, el modelo que implica el mínimo de parámetros
posibles a ser estimados y que explique bien el comportamiento de la variable respuesta.
> m1<-lm(carbon.trees~vento + sizelog+ umid +temp , data=dados1)
m1<-lm(carbon.trees~vento+sizelog+temp+umid data=dados1)
m2<-lm(carbon.trees~umid,data=dados1)
m3<-lm(carbon.trees~vento+sizelog,data=dados1)
m4<-lm(carbon.trees~vento+temp,data=dados1)
m5<-lm(carbon.trees~temp, data=dados1)
m6<-lm(carbon.trees~vento, data=dados1)
m7<-lm(carbon.trees~sizelog, data=dados1)
m8<-lm(carbon.trees~vento+sizelog+temp, data=dados1)
m9<-lm(carbon.trees~umid+temp,data=dados1)
Se busca el modelo más parsimonioso, es decir, el modelo que implica el mínimo de parámetros
posibles a ser estimados y que explique bien el comportamiento de la variable respuesta
> m1<-lm( carbon.trees~vento + sizelog+ umid +temp , data=dados1)
Medida de incertidumbre,
cuanto mas alto el valor, mas
incierto es la importancia de
las variables
Análisis estadísticos en ecología
Selección de modelos (variables)
> m1<-lm( carbon.trees~vento + sizelog+ umid +temp , data=dados1)
y=a+(b1*x1)+(b2*x2)+(b3*x3)……
y=145.2662+(-1.7969*temp)+(0.6524*umid)+(-0.9436*vento)
Análisis estadísticos en ecología
Llamamos un efecto aleatorio una variable que agrupa los datos y que su
efecto sobre la variable respuesta no nos interesa directamente.
Análisis estadísticos en ecología
En la ecología, ¿de dónde viene ese efecto?
• Pseudo-repeticiones y bloques
Mismo individuo al
longo del tiempo
Análisis estadísticos en ecología
Ejemplo:
No es nuestra pregunta
No hay overdispersion
Residual deviance: 1641.7 on 40 degrees of freedom
Hay overdispersion
Análisis estadísticos en ecología
Sobredispersión (overdispersion)