Guia Regresion Lineal
Guia Regresion Lineal
Guia Regresion Lineal
P
1. A partir
P de2 los siguientes
P datos construya la recta de regresión. Xi Yi = 384 X = 12,5 Y =
2,375 Xi = 2250 Xi = 150.
2. Siga trabajando con el ejercicio anterior. Suponga que el error estándar de la estimación de β1
es 0.015908. ¿Es la estimación significativa al 5 %? Arme un intervalo de confianza del 95 %.
3. Las variables X e Y representan la edad (en años cumplidos) y el ingreso mensual (en miles) de
cuatro personas respectivamente.
X Y
35 19
49 30
33 22
23 29
Yi = β0 + β1 lnXi + ui
Yi = β0 + β1 ln(Xi ) + ui
Yi = β0 + β1 Xi2 + ui
a) Haga un diagrama de dispersión entre el ingreso y la edad. ¿Existe relación lineal entre esas
variables? Haga la regresión entre Y y X1 para verificar esta relación lineal.
b) Verifique (con la función COEF.DE.CORREL) que la edad está correlacionada con el hecho
de haber completado o no estudios terciarios. ¿De qué signo es la correlación? ¿Cree que
tener estudios terciarios es importante para explicar el ingreso?
c) Regrese la variable Y contra X1 y X2. ¿Es la estimación del coeficiente asociado a X1
significativa? ¿Qué cree que está sucediendo?
1
d ) Volveremos a hacer lo pedido en el punto (c), pero en varias etapas.
Primero regrese la variable X1 en X2. Obtendrá 22.667 para el intercepto y 10.424 para
la pendiente.
Genere una nueva columna en donde se presente el pronóstico de la edad dado si la
persona tiene o no estudios terciarios. Por ejemplo, para la primera fila el pronósti-
co será 22.667+10.424*0, para la segunda fila será 22.667+10.424*1, para la tercera
22.667+10.424*0 y ası́ sucesivamente según el valor que tome la variable X2 en cada
fila.
Genere otra columna en donde esté la diferencia entre la edad (X1) y el pronóstico de
la edad en base a la tenencia o no de estudios terciarios que acaba de obtener.
Note que esto último representa aquella parte de la edad de las personas de la muestra
que no está explicada por el hecho de tener o no estudios terciarios. Para finalizar haga
la regresión entre Y y esta nueva variable. Compare los resultados obtenidos con los de
la parte (c).
x .34 1.38 -.65 .68 1.40 -.88 -.30 -1.18 .50 -1.75
y .27 1.34 -.53 .35 1.28 -.98 -.72 -.81 .64 -1.59
10. Considere el modelo de regresión simple yi = β0 +β1 xi +ui bajo los siguientes supuestos E(ui ) = 0
y E(xi ui ) = 0. Utilice el método de momentos para encontrar estimadores de los parámetros β0
y β1 .
2
11. Considere la siguiente ecuación estimada donde p es el precio de una casa y dist es la distancia
a un basural recientemente construido.
ˆ = 9,4 + 0,312ln(dist)
ln(p) n = 135 R2 = 0,162
3
Respuestas
3. Los promedios son 35 y 25. Las varianzas 114.67 y 28.67. La covarianza es 9.33 y el coeficiente de
correlación 0.1627. Ŷ =22.151163+0.081395X. La estimación de la pendiente no es significativa.
4. El primero y el tercero.
7. Las rectas si bien son similares no coinciden exactamente. Resulta que estamos minimizando
distintos errores según si tomamos una u otra como variable dependiente.
11. Tiene el signo esperado. No provee una estimación insesgada: posiblemente la ciudad haya deci-
dido construir el basural en algún lugar donde los terrenos (y las casas) son más baratas. Esto
evidencia una correlación entre la distancia y el error del modelo, donde el error incluye entre
otros factores, la elección de la ciudad.