0% encontró este documento útil (0 votos)
130 vistas8 páginas

Guia Regresión Multiple

Este documento describe la aplicación de un modelo de regresión lineal múltiple para predecir la emisión de óxido nitroso (ppm) en función de la humedad (%), temperatura (oF) y presión barométrica. Se realizó un análisis exploratorio de los datos usando gráficos de cajas, scatterplots y correlaciones. El modelo ajustado indica que la humedad influye significativamente en la emisión de óxido nitroso, con una relación negativa, mientras que la temperatura y la presión no son significativ

Cargado por

Zucy Salgado
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
130 vistas8 páginas

Guia Regresión Multiple

Este documento describe la aplicación de un modelo de regresión lineal múltiple para predecir la emisión de óxido nitroso (ppm) en función de la humedad (%), temperatura (oF) y presión barométrica. Se realizó un análisis exploratorio de los datos usando gráficos de cajas, scatterplots y correlaciones. El modelo ajustado indica que la humedad influye significativamente en la emisión de óxido nitroso, con una relación negativa, mientras que la temperatura y la presión no son significativ

Cargado por

Zucy Salgado
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 8

APLICACIÓN DE REGRESIÓN LINEAL MÚLTIPLE

Para un modelo con k variables explicativas x , x , ..., x la ecuación de regresión lineal múltiple es
1 2 k

y = β0 + β1 x1 + β2 x2 + ... + βk xk (1)
En este documento mostraremos con un ejemplo de aplicación como se realiza un ajuste de regresión lineal
múltiple mediante el método de Mínimos Cuadrados Ordinarios (MCO), haciendo uso de el programa estadístico
R. Se muestran los comandos en R con los cuales se pueden hacer grácos exploratorios y las fundiones de R
para el ajuste de la regresión, así como la interpretación de los resultados y la respuesta a preguntas especícas
de acuerdo a la teoría vista en el curso.
Se realizó un estudio acerca de camiones ligeros movidos por diessel para saber si la humedad (%), la tem-
peratura del aire (ºF) y la presión barométrica inuían en la emisión de óxido nitroso (en ppm). Las emisiones
se midieron a distintas horas, en condiciones experimentales diversas.
Los datos y la forma de como cargarlos en R para hacer los respectivos ajustes y análisis sobre estos los en-
cuentran en las diapositivas, en este documento nos centraremos en la interpretación y las funciones de R con las
que generamos los resultados.
1 Análisis exploratorio
par(mfrow=c(2,2))
boxplot(Oxido,main="Oxido de Nitrogeno",col="gray")
boxplot(Humedad,main="Humedad",col="gray")
boxplot(Temp,main="Temperatura",col="gray")
boxplot(Presion,main="Presión",col="gray")
En la gura 1, se muestra la distribución de cada una de las variables mediante diagramas de cajas. No
hay datos atípicos en cada una de las variables, la distribución de la temperatura es asimétrica, al igual que la
distribución de las variables de Humedad y Óxido.

1
Figure 1: Diagramas de cajas para cada una de las variables

pairs(datos,panel=panel.smooth)
En la gura 2 se presenta un scatterplot en el que se muestran grácos de dispersión por pares de variables.
Se observa que las variables que más se asocian con la variable respuesta óxido de nitrógeno son la humedad
seguida de la presión. Entre el óxido de nitrógeno y la humedad la relación es inversa, es decir, que a medida
que aumenta el porcentaje de humedad disminuye la concentración de óxido de nitrógeno.

2
Figura 2: Escatterplot para todas las variables

image(cor(datos),col=gray(seq(from=100,to=0,length=100)/100),axes=F)
mtext(side=1,text=names(datos),at=seq(from=1,to=0,length=4),line=1,cex=0.8)
mtext(side=2,text=names(datos),at=seq(from=1,to=0,length=4),line=1,cex=0.8)
En la gura 3, se muestra una imagen de correlaciones entre todas las variables, las tonalidades fuertes se
traducen en correlaciones positivas y las tonalidades suaves indican correlaciones negativas, el color cercano al
blanco indica baja correlación. Así, las variables óxido y presión se correlacionan de manera positiva y óxido
con la variable humedad se correlacionan en forma negativa, la correlación entre óxido y temperatura es baja
(cercana a cero) y también negativa.

3
Figure 3: Imagen de correlaciones

En las guras 4,5 y 6, se muestran grácos de contornos e imágenes de la variable óxido en función de cada
una de las variables explicativas del problema. Estos grácos evidencian el tipo de relación entre estos pares de
variables y y los lugares en los que se concentran la mayoría de los datos. Si los contornos tienen forma ovalada
esto es indicio de relación entre las variables y si los contornos tienen forma de circulos, esto indica, que muy
probablemente no exista una relación entre las variables. Dicho de otra manera, indica si hay tendencia en la
distribución de las parejas de datos, o si por el contrario, estos están dispersos o en forma aleatoria. Estos grácos
también son útiles para determinar aleatoriedad o dependencia en datos distribuidos espacialmente.
Así en la gura 4, se observa que las variables óxido y humedad se relacionan linealmente en forma negativa,
es decir, a medida de que aumenta la humedad disminuye la concetración de óxido de nitrógeno. La mayor
densidad de estos datos se encuentran en valores pequeños de humedad ( alrededor de 20%) y valores grandes en
las concentraciones de óxido (alrededor de 1.1)
library(MASS)
s1=kde2d(Humedad,Oxido)
image(s1,xlab="Humedad",ylab="Oxido")
contour(s1,add=T)

4
Figure 4: Gráco de cortornos para Óxido de Nitrógeno y Humedad

La imagen de la gura 5 muestra que las parejas de datos de óxido y temperatura están dispersos o en forma
aleatoria, es decir, no hay una tendencia entre estos. Por lo que podemos decir que el óxido de nitrógeno y la
temperatura no se relacionan linealmente. La mayor densidad de datos se encuentran en los valores medios de
cada variable.
s2=kde2d(Temp,Oxido)
image(s1,xlab="Temperatura",ylab="Oxido")
contour(s2,add=T)

5
Figure 5: Gráco de cortornos para Óxido de Nitrógeno y Temperatura

s3=kde2d(Presion,Oxido)
image(s1,xlab="Presión",ylab="Oxido")
contour(s3,add=T)

Figure 6: Gráco de cortornos para Óxido de Nitrógeno y Presión


6
cor(datos)
En la Tabla 1, se muestran las corrrelaciones por pares de variables. Esta tabla muestra un resultado numérico
de lo que ya hemos venido analizando mediante los anteriores grácos. La relación lineal entre óxido y humedad
es -0.8773, la cual es una fuerte relación lineal en forma negativa.

Oxido Humedad Temp Presión


Oxido 1.0000 -0.8773 -0.1807 0.7740
Humedad -0.8773 1.0000 0.2535 -0.7554
Temp -0.1807 0.2535 1.0000 -0.1936
Presión 0.7740 -0.7554 -0.1936 1.0000

Table 1: Correlaciones

2 Ajustar un modelo de regresión Lineal Múltiple e interpretar


reg=lm(Oxido~Humedad+Temp+Presion)
summary(reg)

Coecients:
Estimate std. Error t value Pr(>|t|)
(Intercept) -3.50777 3.0048 -1.167 0.2601
Humedad -0.00262 0.00065 -4.008 0.0010**
Temp 0.00079 0.00200 0.391 0.7012
Presión 0.15415 0.10136 1.521 0.1478

Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1
Residual standard error: 0.1584 on 6 degrees of freedom
Multiple R-squared: 0.8005, Adjusted R-squared: 0.763
F-statistic: 21.4 on 3 and 16 DF, p-value: 7.609e-06
Table 2: Salidas

El modelo de regresión lineal múltiple ajustado es


ˆ = −3.50777 − 0.00262 ∗ Humedad + 0.00079 ∗ Temp + 0.15415 ∗ Presion
Oxido

Por cada porcentaje que aumente la humedad se estima que en promedio la concentración de óxido de nitrógeno
disminuirá en 0.00262 ppm, manteniendo todas las demás variables constantes.
Para la variable temperatura, por cada ºF que esta aumente, se estima que la concentración de óxido de nitrógeno
aumentará en promedio 0.00079 ppm, manteniendo todas las demás variables constantes.
Para la variable presión, aumentando esta en una unidad, se estima que la concentración de óxido de nitrógeno
aumntará en promedio 0.15415 ppm, manteniendo todas las demás variables constantes.
Sólo la variable Humedad inluye signicativamente sobre la concentración de óxido de nitrógeno ya que el p-valor
asociado a esta variable es menor que 0.05.
7
3 Comente acerca del ajuste y la signicancia del modelo
El modelo ajustado explica en un 80.05% la variabilidad total de la concentración de óxido de nitrógeno. Este
modelo es signicativo (p-value<0.05), es decir, las variables independientes explican signicativamente a la
variable respuesta óxido de nitrógeno. El error estándar de los residuales es 0.1584, lo cual no sabemos si es
grande o pequeño si no lo comparamos sobre otro modelo ajustado sobre la misma variable respuesta. (Tabla 2)
4 Intervalos de conanza para cada coeciente
confint(reg,level=0.95)

2.5% 97.5%
(Intercept) -9.877805391 2.862249109
Humedad -0.004013237 -0.001236744
Temp -0.003536568 0.005134450
Presión -0.060734384 0.369044444
Table 3: Intervalos de conanza

Con la función anterior en R se obtienen de manera muy fácil los intervalos de conanza al 95% para cada
coeciente β del modelo de regresión. Se observa que con una conanza de 95% el verdadero valor del parámetro
β está entre -0.004013237 y -0.00123674, lo cual también nos sugiere qué la variable humedad es signicativa en
i

el modelo ya que el intervalo construido no contiene a cero (β < 0).


1
1

Los intervalos de conanza para β y β claramente contienen a cero, por lo que podemos asegurar que las
variables asociadas a estos parámetros (β y β respectivamente) no son signicativas al nivel 5%.
2 3
2 3

5 Predicción
Se pretende estimar la concentración de óxido de nitrógeno cuando la humedad es de 66%, una temperatura de
78 ºF y una presión de 29.1.
Para esto reemplazamos los valores de cada una de estas variables en el ajustado, esto es:
ˆ = −3.50777 − 0.00262 ∗ (66) + 0.00079 ∗ (78) + 0.15415 ∗ (29.1) = 0.8666
Oxido

Por lo tanto, se estima que la concentración de óxido de nitrógeno para los anteriores valores de las variables
explicativas es 0.8666 ppm

También podría gustarte