Guia Regresion Lineal

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 4

Estadı́stica II

Guı́a 8: Regresión lineal

Daniel Miliá y Javier Tasso

P
1. A partir
P de2 los siguientes
P datos construya la recta de regresión. Xi Yi = 384 X = 12,5 Y =
2,375 Xi = 2250 Xi = 150.

2. Siga trabajando con el ejercicio anterior. Suponga que el error estándar de la estimación de β1
es 0.015908. ¿Es la estimación significativa al 5 %? Arme un intervalo de confianza del 95 %.

3. Las variables X e Y representan la edad (en años cumplidos) y el ingreso mensual (en miles) de
cuatro personas respectivamente.

X Y
35 19
49 30
33 22
23 29

a) Calcule las medias y las varianzas muestrales de ambas variables.


b) Calcule la covarianza y el coeficiente de correlación e interprete.
c) Obtenga la recta de regresión entre X e Y y estime el ingreso mensual de una persona de
25 años.
d ) Si el error tı́pico de la estimación de la pendiente es 0.3488, analice la significatividad de la
estimación.

4. De los siguientes modelos, ¿cuáles son lineales en los parámetros?

Yi = β0 + β1 lnXi + ui
Yi = β0 + β1 ln(Xi ) + ui
Yi = β0 + β1 Xi2 + ui

5. El objetivo de este ejercicio es ilustrar el funcionamiento de la regresión lineal múltiple. En la


tabla que se envı́a en el archivo hay datos para 20 personas que incluyen el ingreso mensual (Y),
la edad (X1) y una variable (X2) que toma valor 1 si la persona completó estudios terciarios o 0
en otro caso. Se sugiere trabajar con Excel o algún otro programa que permita hacer regresiones.

a) Haga un diagrama de dispersión entre el ingreso y la edad. ¿Existe relación lineal entre esas
variables? Haga la regresión entre Y y X1 para verificar esta relación lineal.
b) Verifique (con la función COEF.DE.CORREL) que la edad está correlacionada con el hecho
de haber completado o no estudios terciarios. ¿De qué signo es la correlación? ¿Cree que
tener estudios terciarios es importante para explicar el ingreso?
c) Regrese la variable Y contra X1 y X2. ¿Es la estimación del coeficiente asociado a X1
significativa? ¿Qué cree que está sucediendo?

1
d ) Volveremos a hacer lo pedido en el punto (c), pero en varias etapas.
Primero regrese la variable X1 en X2. Obtendrá 22.667 para el intercepto y 10.424 para
la pendiente.
Genere una nueva columna en donde se presente el pronóstico de la edad dado si la
persona tiene o no estudios terciarios. Por ejemplo, para la primera fila el pronósti-
co será 22.667+10.424*0, para la segunda fila será 22.667+10.424*1, para la tercera
22.667+10.424*0 y ası́ sucesivamente según el valor que tome la variable X2 en cada
fila.
Genere otra columna en donde esté la diferencia entre la edad (X1) y el pronóstico de
la edad en base a la tenencia o no de estudios terciarios que acaba de obtener.
Note que esto último representa aquella parte de la edad de las personas de la muestra
que no está explicada por el hecho de tener o no estudios terciarios. Para finalizar haga
la regresión entre Y y esta nueva variable. Compare los resultados obtenidos con los de
la parte (c).

6. Considere el modelo yi = µ + ui donde ui son errores independientes con media 0 y varianza σ 2 .


Muestre que el estimador de mı́nimos cuadrados de µ es Y .

7. Considere las siguientes variables.

x .34 1.38 -.65 .68 1.40 -.88 -.30 -1.18 .50 -1.75
y .27 1.34 -.53 .35 1.28 -.98 -.72 -.81 .64 -1.59

a) Haga la regresión entre y y x donde y es la variable dependiente.


b) Haga la regresión entre x e y donde x es la variable dependiente.
c) Dibuje las rectas en un mismo plano.

8. Discuta qué efectos tendrán sobre el R2 las siguientes situaciones.

Agregar una variable X2, tal que cov(X2; Y ) 6= 0


Agregar una variable X2, tal que cov(X2; Y ) = 0
Agregar una variable X2, tal que cov(X2; Y ) = 0 pero cov(X1; X2) 6= 0
Agregar una variable X2, tal que cov(X2; Y ) 6= 0 pero cov(X1; X2)) = 0
Agregar una variable X2, tal que cov(X2; Y ) 6= 0 pero cov(X1; X2) 6= 0 y R- cuadrado de
la regresión de X1 contra X2 es igual a 1
Agregar una variable X2, tal que cov(X2; Y ) 6= 0 pero cov(X1; X2) 6= 0 y R- cuadrado de
la regresión de X1 contra X2 es igual a 0,23
Agregar una variable X2, tal que cov(X2; Y ) 6= 0 pero cov(X1; X2) 6= 0 y R- cuadrado de
la regresión de X1 contra X2 es igual a 0

9. Considere el siguiente modelo de regresión simple yi = β0 + β1 xi + ui y considere el estimador


de la pendiente que obtuvo en clase usando el método de mı́nimos cuadrados. Muestre que el
estimador visto en clase es equivalente a:
P
(xi − x)(yi − y) cov(x,
ˆ y)
β̂1 = P 2
=
(x − x) V (x)

10. Considere el modelo de regresión simple yi = β0 +β1 xi +ui bajo los siguientes supuestos E(ui ) = 0
y E(xi ui ) = 0. Utilice el método de momentos para encontrar estimadores de los parámetros β0
y β1 .

2
11. Considere la siguiente ecuación estimada donde p es el precio de una casa y dist es la distancia
a un basural recientemente construido.

ˆ = 9,4 + 0,312ln(dist)
ln(p) n = 135 R2 = 0,162

a) Interprete el coeficiente asociado a la variable dist. ¿Tiene el signo esperado?


b) ¿Considera que la regresión simple provee una estimación insesgada para el coeficiente
asociado a dist? Piense en la decisión de la ciudad sobre donde construir el basural.
c) ¿Qué otros factores pueden afectar el precio de una casa? ¿Están relacionados con la dis-
tancia a un basural?

3
Respuestas

1. Ŷi = 1,45 + 0,074Xi

2. Lo es. EP=4.65. (0.03544, 0.10944)

3. Los promedios son 35 y 25. Las varianzas 114.67 y 28.67. La covarianza es 9.33 y el coeficiente de
correlación 0.1627. Ŷ =22.151163+0.081395X. La estimación de la pendiente no es significativa.

4. El primero y el tercero.

5. A cargo del alumno.

6. A cargo del alumno.

7. Las rectas si bien son similares no coinciden exactamente. Resulta que estamos minimizando
distintos errores según si tomamos una u otra como variable dependiente.

8. A cargo del alumno.

9. A cargo del alumno.


P
10. β̂0 = y − β̂1 x y β̂1 = P xi2yi −nxy2
xi −n(x)

11. Tiene el signo esperado. No provee una estimación insesgada: posiblemente la ciudad haya deci-
dido construir el basural en algún lugar donde los terrenos (y las casas) son más baratas. Esto
evidencia una correlación entre la distancia y el error del modelo, donde el error incluye entre
otros factores, la elección de la ciudad.

También podría gustarte