0% encontró este documento útil (0 votos)
87 vistas19 páginas

Práctica 2

Descargar como pdf o txt
Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1/ 19

Universidad Autónoma de Santo Domingo

Práctica 2
Francisco A. Ramírez
22 de Junio de 2020
Julia María George Brito, 100350214

1. El archivo DINERO.CSV contiene información de la oferta de dinero M y el índice de precios


para la República Dominicana durante el periodo 2000 - 2017.
a. Ajuste los datos al siguiente modelo mediante MCO, y obtenga los coeficientes estimados,
la suma de residuos al cuadrado, los errores estándar y los estadísticos t y F. Reporte los
resultados.
𝑰𝑷𝑪𝒕 = 𝜷𝟏 + 𝜷𝟐 𝑴𝒕 + 𝝐𝒕
Estimando el modelo lineal
Call:
lm(formula = IPC ~ M, data = DINERO)

Residuals:
Min 1Q Median 3Q Max
-23.4459 -5.6536 -0.6574 7.9457 15.4939

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.052e+01 9.476e-01 21.65 <2e-16 ***
M 5.359e-04 7.861e-06 68.17 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 8.405 on 262 degrees of freedom


Multiple R-squared: 0.9466, Adjusted R-squared: 0.9464
F-statistic: 4647 on 1 and 262 DF, p-value: < 2.2e-16

Suma de residuos al cuadrado


[1] 18507.97

Los errores estándar


Del (Intercept): 9.476e-01
De M: 7.861e-06
Los estadísticos t y F
t
Del (Intercept): 21.65
De M: 68.17

F
F-statistic: 4647

b. ¿Cuánto es el aumento del índice de precios (IPC) como resultado de un incremento en una
unidad de la oferta de dinero (M)?
El aumento del IPC es de 0.0005359 como resultado de un incremento en una unidad de la oferta de
dinero (M).

c. Compute e interprete la elasticidad correspondiente a (b).


Efecto Marginal
∆𝑰𝑷𝑪𝒕
𝑬𝑴𝟏 = = 𝜷𝟐
∆𝑴𝒕
Elasticidad
∆𝑰𝑷𝑪𝒕 𝑴𝒕 𝑴𝒕
𝑬𝟏 = = 𝜷𝟐
∆𝑴𝒕 𝑰𝑷𝑪𝒕 𝑰𝑷𝑪𝒕
Sustituyendo Efecto Marginal
𝟐𝟎. 𝟓𝟏𝟕
𝑬𝑴𝟏 = = 𝟐𝟎. 𝟓𝟏𝟕
𝟎. 𝟎𝟎𝟏
Sustituyendo Elasticidad
𝟐𝟎.𝟓𝟏𝟕 𝟎.𝟎𝟎𝟏
𝑬𝟏 = =20,517*00000.487401=1
𝟎.𝟎𝟎𝟏 𝟐𝟎.𝟓𝟏𝟕

Interpretación
La elasticidad correspondiente a (b) nos indica que el coeficiente es igual a 1, por lo tanto, es una
elasticidad unitaria.
d. Suponga que el modelo lineal anterior es reemplazado por el siguiente modelo log-log:
𝒍𝒏𝑰𝑷𝑪𝒕 = 𝜷𝟏 + 𝜷𝟐 𝒍𝒏(𝑴𝒕 ) + 𝝐𝒕
Resultado Modelo log-log
===============================================
Dependent variable:
---------------------------
l_IPC
-----------------------------------------------
l_M 0.698***
(0.006)

Constant -3.681***
(0.064)

-----------------------------------------------
Observations 264
R2 0.983
Adjusted R2 0.983
Residual Std. Error 0.077 (df = 262)
F Statistic 15,051.400*** (df = 1; 262)
===============================================
Note: *p<0.1; **p<0.05; ***p<0.01

𝒅𝑰𝑷𝑪
Compute la pendiente o efecto marginal ( 𝒅𝑴 𝒕) y la elasticidad. Comente la diferencia entre las
𝒕
elasticidades obtenidas en (c) y en (d).
Efecto Marginal
∆𝒍𝒏𝑰𝑷𝑪𝒕
𝑬𝑴𝟐 = = 𝜷𝟐
∆𝒍𝒏𝑴𝒕
Elasticidad
∆𝒍𝒏𝑰𝑷𝑪𝒕
𝑬𝑴𝟐 = = 𝜷𝟐
∆𝒍𝒏𝑴𝒕
Sustituyendo Elasticidad
−𝟑. 𝟔𝟖𝟏
𝑬𝟐 = = −𝟓. 𝟐𝟕𝟑𝟔𝟑𝟗
𝟎. 𝟔𝟗𝟖
Interpretación
Nombrando a la elasticidad de (c) E1 y a la elasticidad de (d) E2 la diferencia entre las elasticidades
es que en E1 el resultado con un modelo lineal fue una elasticidad unitaria mientras que en E2 con
una elasticidad igual a -5.273639 es decir menor a 1 indica una elasticidad inelástica para un
modelo log-log.
e. Compute e interprete la pendiente y la elasticidad en cada una de las siguientes especiaciones:
• log - lin : 𝐥𝐧(𝑰𝑷𝑪𝒕 ) = 𝜷𝟏 + 𝜷𝟐 𝐥𝐧(𝑴𝒕 ) + 𝝐𝒕
Resultado Modelo log-lin
===============================================
Dependent variable:
---------------------------
l_IPC
-----------------------------------------------
M 0.00001***
(0.00000)

Constant 3.314***
(0.024)

-----------------------------------------------
Observations 264
R2 0.874
Adjusted R2 0.873
Residual Std. Error 0.210 (df = 262)
F Statistic 1,815.655*** (df = 1; 262)
===============================================
Note: *p<0.1; **p<0.05; ***p<0.01

Efecto Marginal o Pendiente


∆𝒍𝒏𝑰𝑷𝑪𝒕
𝑬𝑴𝟑 = = 𝜷𝟐
∆𝑴𝒕
Elasticidad
∆𝒍𝒏𝑰𝑷𝑪𝒕
𝑬𝟑 = 𝑴𝒕 = 𝜷𝟐 𝑴𝒕
∆𝑴𝒕
Sustituyendo Efecto Marginal o Pendiente
𝟑. 𝟑𝟏𝟒
𝑬𝑴𝟑 = = 𝟑𝟑𝟏, 𝟒𝟎𝟎
𝟎. 𝟎𝟎𝟎𝟎𝟏
Sustituyendo Elasticidad
𝟑.𝟑𝟏𝟒
𝑬𝟑 = 𝟎.𝟎𝟎𝟎𝟎𝟏 ∗ 𝟎. 𝟎𝟎𝟎𝟎𝟏 =331,400*0.00001=3.314

Interpretación
La pendiente es igual a 331,400.
La elasticidad es igual a 3.314 es mayor a 1 lo que nos indica que la oferta es elástica.
• lin - log : 𝑰𝑷𝑪𝒕 = 𝜷𝟏 + 𝜷𝟐 𝒍𝒏(𝑴𝒕 ) + 𝝐𝒕
Resultado Modelo lin-log
===============================================
Dependent variable:
---------------------------
IPC
-----------------------------------------------
l_M 42.346***
(0.559)

Constant -400.976***
(6.293)

-----------------------------------------------
Observations 264
R2 0.956
Adjusted R2 0.956
Residual Std. Error 7.599 (df = 262)
F Statistic 5,743.946*** (df = 1; 262)
===============================================
Note: *p<0.1; **p<0.05; ***p<0.01

Efecto Marginal o Pendiente


∆𝑰𝑷𝑪𝒕
𝑬𝑴𝟒 = = 𝜷𝟐
∆𝒍𝒏𝑴𝒕
Elasticidad
∆𝑰𝑷𝑪𝒕 𝟏 𝟏
𝑬𝟒 = = 𝜷𝟐
∆𝒍𝒏𝑴𝒕 𝑰𝑷𝑪𝒕 𝑰𝑷𝑪𝒕
Sustituyendo Efecto Marginal o Pendiente
−𝟒𝟎𝟎.𝟗𝟕𝟔
𝑬𝑴𝟒 = =-9.469040759
𝟒𝟐.𝟑𝟒𝟔

Sustituyendo Elasticidad
−𝟒𝟎𝟎.𝟗𝟕𝟔 𝟏
𝑬𝟒 = = −𝟗. 𝟒𝟔𝟗𝟎𝟒𝟎𝟕𝟓𝟗 ∗ -0.002493915= 0.023614981
𝟒𝟐.𝟑𝟒𝟔 −𝟒𝟎𝟎.𝟗𝟕𝟔

Interpretación
La pendiente es igual a -9.469040759.
La elasticidad es igual a 0.023614981 es menor a 1 lo que nos indica que la oferta es
inelástica.
𝟏
• Recíproco : 𝑰𝑷𝑪𝒕 = 𝜷𝟏 + 𝜷𝟐 (𝑴 ) + 𝝐𝒕
𝟏

Resultado Modelo Recíproco


===============================================
Dependent variable:
---------------------------
IPC
-----------------------------------------------
Constant 74.638***
(2.235)

-----------------------------------------------
Observations 264
R2 0.000
Adjusted R2 0.000
Residual Std. Error 36.312 (df = 263)
===============================================
Note: *p<0.1; **p<0.05; ***p<0.01

La estimación del modelo reciproco solo nos ofreció el valor de la constante.


f. Presente en una tabla los resultados del contraste RESET de forma funcional. Comente los
resultados.
> resettest(mod1nr)

RESET test

data: mod1nr
RESET = 516.95, df1 = 2, df2 = 260, p-value < 2.2e-16

> resettest(mod_l)

RESET test

data: mod_l
RESET = 123.31, df1 = 2, df2 = 260, p-value < 2.2e-16

> resettest(mod2)

RESET test

data: mod2
RESET = 1723.8, df1 = 2, df2 = 260, p-value < 2.2e-16

> resettest(mod3)

RESET test

data: mod3
RESET = 280.17, df1 = 2, df2 = 260, p-value < 2.2e-16

> resettest(mod4)
RESET test

data: mod4
RESET = 4.8138, df1 = 2, df2 = 261, p-value = 0.008852

Al realizar el contraste RESET en todos los modelos estimados dígase:


Modelo Lineal, Modelo log-log, Modelo log-lin, Modelo lin-log y Modelo Reciproco a los resultad
os que pudimos llegar son que todos los modelos tienen igual p-value < 2.2e-16 el cual es may
or a 0.05 y esto indica que los modelos son consistentes excepto el último modelo este dio distin
to p-value = 0.008852 menor que 0.05

2. Escriba un resumen conciso sobre los siguientes, usando el siguiente formato: naturaleza del
problema, causas, detección, consecuencias y soluciones.

• Heterocedásticidad
1-Naturaleza del problema: Las varianzas de los errores no son constantes.
2-Causas: Hay ocasiones donde la homocedasticidad no es conveniente, pues puede llevar a
conclusiones erradas de la relación entre las variables.
3-Detección: Análisis virtual de residuos, contraste de Breusch-Pagan y contraste de White.
4-Consecuencias: Los errores estándar computados para los estimadores de MCO son
incorrectos, así como los intervalos de confianza y contrastes de hipótesis.
5-Soluciones: El estimador de mínimos cuadrados generalizados, el estimador de mínimos
cuadrados generalizados factible.

• Multicolinealidad
1-Naturaleza del problema: Es una situación en la que se presenta una fuerte correlación entre
variables explicativas del modelo.
2-Causas: Cuando los datos son recogidos de una manera no experimental y no controlada es
posible que muchas variables se muevan de manera sistemática.
3-Detección: Método del factor de inflación de la varianza y Método del determinante en la
matriz de correlación de exógenas.
4-Consecuencias: Los supuestos de los estimadores de MC no se violan, los errores estándar
tienden a inflarse, y por lo tanto el estadístico t tiende a sugerir que los coeficientes no son
distintos de cero.
5-Soluciones: Aumentar el tamaño muestral puede reducir un problema de colinealidad
aproximada, utilizar datos de corte transversal, desestacionalizar las series y quitarles la
tendencia y trabajar con las series logaritmizadas.

• Endogeneidad
1-Naturaleza del problema: Es una situación en la que hay una correlación entre el parámetro o
variable y el término de error. En términos generales, un lazo de causalidad entre los
independientes y las variables dependientes de un modelo conduce a la endogeneidad.
2-Causas: Las posibles causas que explican el problema de endogeneidad son, variables omitidas,
simultaneidad, error de medición y sesgo de selección.
3-Detección: Contraste de RESET y la prueba de endogeneidad de Hausman-Gujarati.
4-Consecuencias: El modelo no se pueda estimar de manera consistente y puede llevar a
conclusiones erróneas debido a los sesgos.
5-Soluciones: Las variables instrumentales, variables aproximadas y MC2E.
3. Del modelo de regresión 𝒚𝒊 = 𝜷𝒙𝒊 + 𝒖 donde, u es el termino de perturbaciones con
varianza 𝑬(𝒖𝒖´) = 𝝈𝟐 𝒙𝟐𝒊 :
a. Derive el estimador de Mínimos Cuadrados Generalizado (MCG) de 𝜷

𝝈𝟐𝟏 𝝈𝟏𝟐 … 𝝈𝟏𝒊


𝟐
𝑬(𝒖𝒖′ ) = 𝝈𝟐𝟏 𝝈𝟐 … 𝝈𝟐𝒊 = 𝛀
… … … …
[ 𝝈𝒊𝟏 𝝈𝒊𝟐 … 𝝈𝟐𝒊 ]
𝑬(𝒖𝒖´) = 𝛀
𝛀−𝟏/𝟐 𝒚𝒊 − 𝛀−𝟏/𝟐 𝜷𝒙𝒊 + 𝛀−𝟏/𝟐
𝒚∗𝒊 = 𝛀−𝟏/𝟐 𝒚𝒊 ; 𝒙∗𝒊 = Ω−𝟏/𝟐 𝒙𝒊 𝒀 𝒖∗ = Ω−𝟏/𝟐
El estimador de 𝛽 es:
−𝟏
𝒃𝑴𝑪𝑮 = (𝒙∗𝒊 ´𝒙∗𝒊 )−𝟏 𝒙∗𝒊 ´𝒚∗𝒊 = (𝒙𝒊 ´𝛀−𝟏/𝟐 ´𝛀−𝟏/𝟐 𝒙𝒊 ) 𝒙𝒊 ´Ω−𝟏/𝟐 ´Ω−𝟏/𝟐 𝒚𝒊

b. Pruebe que el estimador de MCG es insesgado.


𝝏
̂ 𝒙𝒊 )´𝝈𝟐 𝚺 −𝟏 (𝒚𝒊 − 𝜷
{(𝒚𝒊 − 𝜷 ̂ 𝒙𝒊 )} = 𝟎
𝝏𝜷̂

𝝏
𝝈𝟐 ̂ 𝒙𝒊 )´( 𝚺 −𝟏 𝒚 − 𝚺 −𝟏 𝜷
{(𝒚𝒊 − 𝜷 ̂ 𝒙𝒊 )} = 𝟎
𝝏𝜷̂
𝝏 ̂𝒙𝒊 ´𝚺 −𝟏 𝒚𝒊 − 𝒚𝒊 ´𝚺 −𝟏 𝜷
𝜷´ ̂ 𝒙𝒊
𝝈𝟐 {𝒚𝒊 ´𝚺 −𝟏 𝒚𝒊 − ̂ ´𝒙𝒊 ´𝚺 −𝟏 𝜷
+𝜷 ̂ 𝒙𝒊 } = 𝟎
𝝏𝜷̂ −𝟐𝜷 ̂ ´𝒙𝒊 ´𝚺 −𝟏 𝒚𝒊

̂} = 𝟎
{−𝟐𝒙𝒊 ´𝚺 −𝟏 𝒚𝒊 + 𝟐(𝒙𝒊 ´𝚺 −𝟏 𝒙𝒊 )𝜷

Se obtiene el sistema de k ecuaciones normales:


̂ 𝑴𝑪𝑮 = 𝐱 𝐢 ´𝚺 −𝟏 𝒚𝒊
(𝒙𝒊 ´𝚺 −𝟏 𝒙𝒊 )𝜷
Cuya solución, es el estimador de mínimos cuadrados generalizados

̂ 𝑴𝑪𝑮 = (𝒙𝒊 ´𝚺 −𝟏 𝒙𝒊 )−𝟏 𝐱 𝐢 ´𝚺 −𝟏 𝒚𝒊


𝜷
Se puede demostrar que el estimador MCG de β, es lineal, insesgado y óptimo dentro del marco del
modelo de regresión lineal generalizado.

Este resultado, se conoce con el nombre de Teorema de AITKEN y es una generalización del Teorema de
GAUSS-MARKOV.

4. Considere el siguiente modelo de regresión lineal:


𝒀𝒊 = 𝜷𝟏 + 𝜷𝟐 𝑿𝒊 + 𝜷𝟑 𝒁𝒊 + 𝝐𝒊 donde i =1,2,...,n, 𝒁𝒊 = 𝒃𝑿𝒊 𝒚 𝝐𝒊 un error bien comportado.
a. ¿Cuál problema adolece esta regresión?
El problema que adolece esta regresión es de:
Multicolinealidad:
El problema de la multicolinealidad hace referencia, en concreto, a la existencia de relaciones
aproximadamente lineales entre los regresores del modelo, cuando los estimadores obtenidos y la
precisión de éstos se ven seriamente afectados. Es decir, una situación en la que se presenta una
fuerte correlación entre variables explicativas del modelo.
La multicolinealidad es la relación de dependencia lineal fuerte entre más de dos variables
explicativas en una regresión múltiple que incumple el supuesto de Gauss-Markov cuando es
exacta.
¿Cuál es la consecuencia de este problema?
Básicamente las consecuencias de la Multicolinealidad dependerán del grado de Asociación
Lineal entre las Variables Explicativas y estas son:
1. Aun cuando los estimadores MCO son MELI, éstos presentan varianzas y
covarianzas grandes, que hacen difícil la estimación precisa.
2. Debido a la consecuencia 1, los intervalos de confianza tienden a ser mucho más
amplios, conduciendo a una aceptación más fácil de la "hipótesis nula de cero" (es decir,
que el verdadero coeficiente poblacional es cero)
3. También debido a la consecuencia 1, la razón t de uno o más coeficientes tiende a
ser estadísticamente no significativa.
4. Aun cuando la razón t de uno o más coeficientes sea estadísticamente no
significativa, el R², la medida global de bondad de ajuste puede ser muy alto.
5. Los estimadores MCO y sus errores estándar pueden ser sensibles a pequeños
cambios en la información.

b. ¿Cuál es una posible solución a este problema?


Entre las posibles soluciones tenemos:
La multicolinealidad puede reducirse con la eliminación de los regresores de las variables con alta
relación lineal entre ellas.
También aumentar el tamaño muestral puede reducir un problema de colinealidad aproximada,
utilizar datos de corte transversal, desestacionalizar las series y quitarles la tendencia y trabajar
con las series logaritmizadas.
5. Un investigador interesado en conocer sobre los determinantes de los salarios, regresa esta
variable contra el nivel de educación. Sospechando que el nivel de experiencia también
importa en la determinación del salario, decide hacer un test para probar si la experiencia debe
ser incluida o no en el modelo. Para implementar el test estima una regresión entre los residuos
de la regresión anterior y la experiencia. Los resultados muestran que el nivel de experiencia
no era estadísticamente significativa. El investigador, entonces, rechaza su sospecha y concluye
que el nivel de experiencia es irrelevante para los salarios. Comente la validez de los resultados
obtenidos por el investigador.
6. Considere el siguiente modelo:
𝒀𝒊 = 𝜶 + 𝜷𝑿𝒊 + 𝒖𝒊
donde 𝒀𝒊 es la variable dependiente, 𝑿𝒊 es la variable explicativa, y 𝒖𝒊 es el termino error.
Suponga que u y X no son independientes.
a. Provea tres posibles razones que expliquen la dependencia entre 𝑿𝒊 y 𝒖𝒊 .
Si hay una dependencia ente la variable explicativa 𝑿𝒊 y el error 𝒖𝒊 , esto quiere decir que existe
endogeneidad ya que la endogeneidad es un concepto estadístico que se refiere a que la relación
entre una variable explicativa X y otra que queremos explicar y viene determinada por otras
variables que no se han tenido en cuenta u y que covarían con X.
Entonces las tres posibles razones que expliquen la dependencia entre 𝑿𝒊 y 𝒖𝒊 son:

• Error de medición o sesgo de atenuación.


• Efecto tratamiento endógeno.
• Variables omitidas.
b. Cuáles son las consecuencias del problema descrito en a).

• Que el modelo no se pueda estimar de manera consistente.


• Puede llevar a conclusiones erróneas debido a los sesgos.
c. Suponga que ha decidido resolver el problema de dependencia entre las dos variables,
utilizando una variable instrumental 𝒁𝒊 . Muestre que el estimador 𝜷𝑽𝑰
𝒊 es consistente.

Cuando el corr 𝑍𝑖 , 𝑢𝑖 ≠ 0 el estimador de VI es consistente.


(Sesgo de Consistencia):
̅) ∑(𝒛 −𝒛̅)𝒀
∑(𝒛−𝒛̅ )(𝒚−𝒚 ∑(𝒛−𝒛̅)(𝜶+𝜷𝑿𝒊 +𝒖𝒊 )
𝜷𝑽𝑰
𝒊 = ∑(𝒛 −𝒛̅)(𝒙 −𝒙 = 𝒊
̅) ∑(𝒛−𝒛̅)𝑿
𝒊
= ∑(𝒛−𝒛̅)𝑿𝒊
𝒊 𝒊 𝒊

∑(𝒛−𝒛̅ )(𝒖𝒊 ) 𝒑 𝒄𝒐𝒗(𝒛𝒊 ,𝒖𝒊 )


𝜷𝑽𝑰
𝒊 =𝜷 ∑(𝒛𝒊 −𝒛̅)𝒙𝒊
→𝜷 + =𝜷
𝒄𝒐𝒗(𝒛𝒊 ,𝒙𝒊 )

∑(𝒛−𝒛̅ )(𝒙𝒊 ) ∑(𝒛−𝒛̅ )𝒖


𝜷𝑽𝑰
𝒊 =𝜷 ∑(𝒛𝒊 −𝒛̅)𝒙𝒊
+∑(𝒛 −𝒛̅)𝒙𝒊
𝒊 𝒊

7. Considere los datos de la encuesta ENFT_2000.xls. Construya las variables de salario por
hora, educación, así como otros atributos como género, experiencia (edad-6-educación), zona
donde habita (rural/urbano), entre otros controles:
a. Estime la ecuación por MCO:
𝒍𝒏(𝑺𝒂𝒍𝒂𝒓𝒊𝒐𝒊 ) = 𝜷𝟏 + 𝜷𝟐 𝒆𝒅𝒖𝒄𝒊 + ⋯ + 𝝐𝒊
Resultado Modelo lineal
===============================================
Dependent variable:
---------------------------
log(salario_hora)
-----------------------------------------------
educ 0.101***
(0.002)

exper 0.030***
(0.002)

I(exper2) -0.0003***
(0.00003)

hombre -0.216***
(0.019)

zona_urb -0.153***
(0.019)

Constant 2.036***
(0.046)
-----------------------------------------------
Observations 7,715
R2 0.233
Adjusted R2 0.233
Residual Std. Error 0.776 (df = 7709)
F Statistic 468.674*** (df = 5; 7709)
===============================================
Note: *p<0.1; **p<0.05; ***p<0.01

b. Realice las pruebas de heterocedásticidad correspondientes, reporte los resultados y provea,


en caso de que verifique heterocedásticidad, los errores corregidos e interprete los resultados.
studentized Breusch-Pagan test

data: mod5
BP = 57.91, df = 5, p-value = 3.282e-11

El p-value es 3.282e-11, menor que 0.05, si existe heterocedasticidad.


Provea en caso de que verifique heterocedásticidad, los errores corregidos e interprete los
resultados.
Call:
lm(formula = log(salario_hora) ~ educ + exper + I(exper^2) +
hombre + zona_urb)

Coefficients:
(Intercept) educ exper I(exper^2) hombre zona_urb
2.0358960 0.1014982 0.0297493 -0.0003142 -0.2156011 -0.1530546

La nueva ecuación será:


𝒍𝒐𝒈(𝒔𝒂𝒍𝒂𝒓𝒊𝒐) = 𝟐. 𝟎𝟑𝟓𝟖𝟗𝟔𝟎 + 𝟎. 𝟏𝟎𝟏𝟒𝟗𝟖𝟐𝒆𝒅𝒖𝒄 + 𝟎. 𝟎𝟐𝟗𝟕𝟒𝟗𝟑𝒆𝒙𝒑𝒆𝒓 − 𝟎. 𝟎𝟎𝟎𝟑𝟏𝟒𝟐𝒆𝒙𝒑𝒆𝒓𝟐
− 𝟎. 𝟐𝟏𝟓𝟔𝟎𝟏𝟏𝒉𝒐𝒎𝒃𝒓𝒆 − 𝟎. 𝟏𝟓𝟑𝟎𝟓𝟒𝟔𝒛𝒐𝒏𝒂_𝒖𝒓𝒃

El modelo nos indica que para educación en promedio por cada año el logaritmo de salario se incrementa
en un 10.14982% por su parte la experiencia incrementa el logaritmo de salario en un 2.97493% el
logaritmo al cuadrado es lógico que disminuya pues el capital humano se deteriora al pasar de los tiempos
en el de hombre el disminuye un -21.56011% y por ultimo para zona_urb de igual forma disminuye pero
un -15.30548%.

Así que en comparación con el modelo base la única variable que aumenta el logaritmo del salario
es educ las demás variables permanecen constante al redondear nos damos cuenta de eso.
8. Considere el siguiente modelo para estimar el efecto de un conjunto de variables, incluyendo
el consumo de cigarrillos, sobre el peso de recién nacidos:
𝑙𝑛(𝑝𝑒𝑠𝑜𝑛𝑎𝑐) = 𝛽0 + 𝛽1 ℎ𝑜𝑚𝑏𝑟𝑒 + 𝛽2 𝑜𝑟𝑑𝑒𝑛 + 𝛽3 𝑙𝑛(𝑖𝑛𝑔𝑓𝑎𝑚) + 𝛽4 𝑐𝑎𝑗𝑒𝑡𝑖𝑙𝑙𝑎𝑠 + 𝑢

donde 𝒉𝒐𝒎𝒃𝒓𝒆𝒔 es un indicador binario igual a uno si es niño, 𝒐𝒓𝒅𝒆𝒏 es una variable que
indica el orden de nacimiento del niño, 𝒊𝒏𝒈𝒇𝒂𝒎 es el ingreso familiar, y 𝒄𝒂𝒋𝒆𝒕𝒊𝒍𝒍𝒂𝒔 es el
número de cajetillas de cigarros fumadas por días durante el embarazo.
a. Por qué se espera que cajetilla esté relacionada con u?
Porque la variable cajetillas puede tener factores no observables, también puede ser debido a
que la adquisición de una cajetilla está relacionada al ingreso de la persona, los hábitos de salud
y quizás a otras variables, las cuales están en el término de error del modelo "u".
b. Suponga que tiene datos sobre el precio promedio de las cajetillas de cigarros de cada una
de las localidades donde residen las mujeres que componen la muestra. Discuta si esta
información satisface las condiciones para ser considerada un buen instrumento para la
variable 𝒄𝒂𝒋𝒆𝒕𝒊𝒍𝒍𝒂𝒔.
Si, se pudiera considerar como un buen instrumento para las variables cajetillas, ya que, si
tenemos el precio promedio de estas, entonces podemos ver qué cantidad podría consumir las
familias con menor ingreso y las familias con mayor ingreso, considerando que mientras menor
ingreso tenga menos cajetillas consume.
c. Use los datos en BWGHT.CSV para estimar la ecuación anterior. Primero estime por MCO.
Después use MC2E, donde preciocig es un instrumento para cajetillas. Discuta cualquier
diferencia que observe entre las estimaciones de MCO y MC2E.
Estimación por MCO
Resultados Modelo Lineal 6
===============================================
Dependent variable:
---------------------------
l_bwght
-----------------------------------------------
male 0.026***
(0.010)

parity 0.015***
(0.006)

l_faminc 0.018***
(0.006)
cigs -0.004***
(0.001)

Constant 4.676***
(0.022)

-----------------------------------------------
Observations 1,388
R2 0.035
Adjusted R2 0.032
Residual Std. Error 0.188 (df = 1383)
F Statistic 12.554*** (df = 4; 1383)
===============================================
Note: *p<0.1; **p<0.05; ***p<0.01

Comparando las estimaciones por MCO y MC2E


Comparando las estimaciones por MCO y MC2E
================================================================
Dependent variable:
--------------------------------
l_bwght
OLS instrumental
variable
(1) (2) (3)
----------------------------------------------------------------
male 0.026*** -0.000 -0.000
(0.010) (0.011) (0.011)

parity 0.015*** -0.000 -0.000


(0.006) (0.006) (0.006)

preciocig 1.000*** 1.000***


(0.204) (0.204)

l_faminc 0.018*** -0.000 -0.000


(0.006) (0.007) (0.007)

cigs -0.004***
(0.001)

Constant 4.676*** -0.000 -0.000


(0.022) (0.952) (0.952)

----------------------------------------------------------------
Observations 1,388 1,388 1,388
R2 0.035 0.035 0.035
Adjusted R2 0.032 0.032 0.032
Residual Std. Error (df = 1383) 0.188 0.188 0.188
F Statistic (df = 4; 1383) 12.554*** 12.554***
================================================================
Note: *p<0.1; **p<0.05; ***p<0.01
La diferencia que se observa entre las estimaciones de MCO y MC2E es que en la estimación de
VI todos los resultados fueron iguales para todas las variables excepto preciocig, mientras que
por MCO no fue así, en este modelo todas las variables rieron un resultado distinto tomando en
cuenta que la variable preciocig no se encuentra en ese modelo.
d. Estime la forma reducida de cajetillas. ¿Qué puede concluir acerca de la identificación de la ecuación
de interés utilizando preciocig? Qué implicaciones tiene este resultado sobre la respuesta de la sección
c).

La forma reducida seria:

𝑏𝑤𝑔ℎ𝑡 = 𝛽0 + 𝛽1 𝑚𝑎𝑙𝑒 + 𝛽2 𝑝𝑟𝑒𝑐𝑖𝑜𝑐𝑖𝑔 + 𝑢


Su implicación más importante es el incremento del precio de las cajetillas, de cigs -0.004 a preciocig
1.000.

8. Considere el siguiente modelo de regresión:

𝒚𝒊 = 𝜷𝟎 + 𝜷𝟏 𝒚𝟐 + 𝜷𝟐 𝒛𝟏 + 𝒖
Donde 𝒚𝟐 es una variable explicativa con problemas de endogeneidad y 𝒛𝟏 es una variable exógena,
mientras que u es el componente de error del modelo y cumple con los supuestos usuales. A esta
ecuación se le conoce como ecuación estructural para enfatizar que es una relación estructural.

a. Suponga que se dispone de un instrumento para la variable 𝒚𝟐 denominada 𝒛𝟐 . ¿Cuáles son las
condiciones que debe poseer este instrumento para ser considerado como un instrumento válido?

Este instrumento debe cumplir las condiciones de (Alonso, 2015):

• Exogeneidad (cov(z,𝜖) =0). en términos prácticos, indica que 𝑧𝑖 no debe estar correlacionado con
las variables omitidas.
• Relevancia (Corr(𝑍𝑖 , 𝑋𝑖 )-=0). cuando esta correlacionado en baja, decimos enfrentamos
instrumentos débiles.

9. Considere el modelo 𝒚𝒊 = 𝜷𝟏 + 𝜷𝟐 𝒙𝒊 + 𝒆𝒊 con varianza heterocedástica 𝑽𝒂𝒓(𝒆𝒊 ) = 𝝈𝟐𝒊 y la versión


transformada es 𝒚∗𝒊 = 𝜷𝟏 𝝈−𝟏 ∗
𝒊 + 𝜷𝟐 𝒙𝒊 + 𝒆𝒊

,donde 𝒚∗𝒊 = 𝒚𝒊 𝝈−𝟏 ∗ −𝟏
𝒊 , 𝒙𝒊 = 𝒙𝒊 𝝈𝒊 𝒚 𝒆∗𝒊 = 𝒆𝒊 𝝈−𝟏
𝒊 . Las
ecuaciones normales cuya solución arrojan los estimadores de mínimos cuadrados generalizados de 𝜷𝟏
y 𝜷𝟐 son:

(∑ 𝝈−𝟐 ̂ −𝟏 ∗ ̂ −𝟏 ∗
𝒊 )𝜷𝟏 + (∑ 𝝈𝒊 𝒙𝒊 )𝜷𝟐 = ∑ 𝝈𝒊 𝒚𝒊

∗ ̂ −𝟏 ∗𝟐 ̂ ∗ ∗
(∑ 𝝈−𝟐
𝒊 𝒙𝒊 )𝜷𝟏 + (∑ 𝝈𝒊 𝒙𝒊 )𝜷𝟐 = 𝒙𝒊 𝒚𝒊

Aclaración:

Es necesario explicar el procedimiento por cual salen estas ecuaciones, debemos dirigirnos a la clase de
problema de estimación de 𝑌 = 𝑋𝛽 + 𝜖, en el cual se busca estimar a 𝛽.

Donde el resultado fue:


−𝟏/𝟐 −𝟏/𝟐 −𝟏 −𝟏/𝟐 −𝟏/𝟐
𝒃𝑴𝑪𝑮 = (𝑿∗ ´𝑿∗ )−𝟏 𝑿∗ ´𝒚∗ = (𝑿´𝛀𝛜 ´𝛀𝛜 𝑿) 𝑿´Ω𝝐 ´Ω𝝐 𝒚

Debido a que se debe a una ecuación mínimos cuadrados generalizados.


Paso 1 igualar el modelo al error utilizando 𝑦 ∗ .

𝑦 ∗ = 𝛽1 𝜎𝑖−1 + 𝛽2 𝑥𝑖∗ + 𝑒𝑖∗

−𝛽1 𝜎𝑖−1 − 𝛽2 𝑥𝑖∗ + 𝑦 ∗ = 𝑒𝑖∗

𝑒𝑖∗ = 𝑦 ∗ − 𝛽1 𝜎𝑖−1 − 𝛽2 𝑥𝑖∗

Se le aplica la sumatoria 𝑒𝑖∗ :

(𝛽1 𝜎𝑖−1 + 𝛽2 𝑥𝑖∗ ) = ̅̅̅


𝑦∗

𝑒𝑖∗ = 𝑦𝑖∗ − (𝛽1 𝜎𝑖−1 + 𝛽2 𝑥𝑖∗ )

𝑒𝑖∗ = 𝑦𝑖∗ − 𝑦𝑖∗


2 2
𝑚𝑖𝑛𝛽1 ,𝛽2 = ∑(𝑒𝑖∗ ) = ∑ ((𝑦𝑖∗ − ̅̅̅
𝑦𝑖∗ ) ) = ∑(𝑦𝑖∗ − 𝛽𝑖 𝜎𝑖−1 − 𝛽2 𝑥𝑖∗ )

Para minimizar los valores de 𝛽1 , 𝛽2 procederemos a utilizar la condición de primer orden.


2
𝜕𝑆(𝛽1 , 𝛽2 ) 𝜕 ∑(𝑦𝑖∗ − 𝛽1 𝜎𝑖−1 − 𝛽2 𝑥𝑖∗ )
=
𝜕𝛽1 𝜕𝛽1
𝜕𝑆(𝛽1 , 𝛽2 )
= ∑ −2𝜎 −1 (𝑦𝑖∗ − 𝛽1 𝜎𝑖−1 − 𝛽2 𝑥𝑖∗ )
𝜕𝛽1
Se iguala a 0

∑ −2𝜎 −1 (𝑦𝑖∗ − 𝛽1 𝜎𝑖−1 − 𝛽2 𝑥𝑖∗ ) = 0

Se aplica la regla de∑ 𝑘𝑥𝑖 = 𝑘 ∑ 𝑥𝑖 . Y 𝜎 −1 pasa a multiplicar con (𝑦𝑖∗ − 𝛽1 𝜎𝑖−1 − 𝛽2 𝑥 ∗ )

−2 ∑(𝜎 −1 𝑦𝑖∗ − 𝛽1 𝜎𝑖−2 − 𝜎 −1 𝛽2 𝑥𝑖∗ ) = 0

El −2 pasa con su operación contraria, al otro lado. 0/x =0

∑(𝜎 −1 𝑦𝑖∗ − 𝛽1 𝜎𝑖−2 − 𝜎 −1 𝛽2 𝑥𝑖∗ ) = 0

Se aplica propiedad de la sumatoria de una suma ∑(𝑥 + 𝑦) = ∑(𝑥) + ∑(𝑦).

∑(𝜎 −1 𝑦𝑖∗ ) − ∑(𝛽1 𝜎𝑖−2 ) − ∑(𝜎 −1 𝛽2 𝑥𝑖∗ ) = 0

Se despejar y se utiliza las propiedades explicadas en los puntos anteriores para obtener la primera
ecuación normal.

∑(𝜎 −1 𝑦𝑖∗ ) = ∑(𝛽1 𝜎𝑖−2 ) + ∑(𝜎 −1 𝛽2 𝑥𝑖∗ )


∑(𝜎 −1 𝑦𝑖∗ ) = 𝛽1 ∑(𝜎𝑖−2 ) + 𝛽2 ∑(𝜎 −1 𝑥𝑖∗ )

𝛽1 ∑(𝜎𝑖−2 ) + 𝛽2 ∑(𝜎 −1 𝑥𝑖∗ ) = ∑(𝜎 −1 𝑦𝑖∗ )

Como resultado la ecuación presentada al inicio.

(∑ 𝜎𝑖−2 )𝛽1 + (∑ 𝜎 −1 𝑥𝑖∗ )𝛽2 = ∑ 𝜎 −1 𝑦𝑖∗

Procederemos a buscar la segunda ecuación, se deberán utilizar, la obtenida en este procedimiento.


2
𝜕𝑆(𝛽1 , 𝛽2 ) 𝜕 ∑(𝑦𝑖∗ − 𝛽1 𝜎𝑖−1 − 𝛽2 𝑥𝑖∗ )
=
𝜕𝛽2 𝜕𝛽2
𝜕𝑆(𝛽1 , 𝛽2 )
= ∑ −2𝑥𝑖∗ (𝑦𝑖∗ − 𝛽1 𝜎𝑖−1 − 𝛽2 𝑥𝑖∗ )
𝜕𝛽2

∑ −2𝑥𝑖∗ (𝑦𝑖∗ − 𝛽1 𝜎𝑖−1 − 𝛽2 𝑥𝑖∗ ) = 0

−2 ∑(𝑥𝑖∗ 𝑦𝑖∗ − 𝛽1 𝜎𝑖−1 𝑥𝑖∗ − 𝛽2 𝑥𝑖∗ ) = 0

∑(𝑥𝑖∗ 𝑦𝑖∗ ) − ∑(𝛽1 𝜎𝑖−1 𝑥𝑖∗ ) − ∑(𝛽2 𝑥𝑖∗2 ) = 0

∑(𝑥𝑖∗ 𝑦𝑖∗ ) = ∑(𝛽1 𝜎𝑖−1 𝑥𝑖∗ ) + ∑(𝛽2 𝑥𝑖∗2 )

∑(𝑥𝑖∗ 𝑦𝑖∗ ) = 𝛽1 ∑(𝜎𝑖−1 𝑥𝑖∗ ) + 𝛽2 ∑(𝑥𝑖∗2 )

𝛽1 ∑(𝜎𝑖−1 𝑥𝑖∗ ) + 𝛽2 ∑(𝑥𝑖∗2 ) = ∑(𝑥𝑖∗ 𝑦𝑖∗ ) → 𝐸𝑠𝑡𝑎 𝑒𝑠 𝑙𝑎 𝑒𝑐𝑢𝑎𝑐𝑖ó𝑛 𝑛𝑜𝑟𝑚𝑎𝑙 𝑞𝑢𝑒 𝑏𝑢𝑠𝑐𝑎𝑚𝑜𝑠.

̂ 𝟏y 𝜷
a. Muestre que 𝜷 ̂ 𝟐 pueden ser reescritos como:

∑ 𝝈−𝟐
𝒊 𝒚𝒊 𝒙𝒊 ∑ 𝝈−𝟐 −𝟐
𝒊 𝒚𝒊 ∑ 𝝈𝒊 𝒙𝒊
− ( )( )
∑ 𝝈−𝟐 ∑ 𝝈−𝟐 ∑ 𝝈−𝟐
̂ 𝟐=
𝜷 𝒊 𝒊 𝒊
𝟐
∑ 𝝈−𝟐 𝒙𝟐 ∑ 𝝈−𝟐 𝒙
( 𝒊 −𝟐 𝒊 ) − ( 𝒊 −𝟐 𝒊 )
∑ 𝝈𝒊 ∑ 𝝈𝒊
∑ 𝝈−𝟐
𝒊 𝒚𝒊 ∑ 𝝈−𝟐
𝒊 𝒙𝒊 ̂
̂𝟏 =
𝜷 − 𝜷𝟐
∑ 𝝈−𝟐
𝒊 ∑ 𝝈−𝟐
𝒊

Despejar 𝛽1 de la primera ecuación:

(∑ 𝝈−𝟐 ̂ −𝟏 ∗ ̂ −𝟏 ∗
𝒊 )𝜷𝟏 + (∑ 𝝈𝒊 𝒙𝒊 )𝜷𝟐 = ∑ 𝝈𝒊 𝒚𝒊

(∑ 𝝈−𝟐 ̂ −𝟏 ∗ −𝟏 ∗ ̂
𝒊 )𝜷𝟏 = ∑ 𝝈𝒊 𝒚𝒊 − (∑ 𝝈𝒊 𝒙𝒊 ) 𝜷𝟐
−𝟏 ∗ ̂
∑ 𝝈−𝟏 ∗
𝒊 𝒚𝒊 − (∑ 𝝈𝒊 𝒙𝒊 )𝜷𝟐
̂𝟏 =
𝜷
∑ 𝜎−2
𝑖

Sustituir los valores de 𝑦 ∗ , 𝑥 ∗ por los valores que nos muestran al inicio del problema.

∑ 𝝈−𝟏 −𝟏 −𝟏 −𝟏 ̂
𝒊 (𝝈 𝒚𝒊 ) − (∑ 𝝈𝒊 (𝝈 𝒙𝒊 ))𝜷𝟐
̂𝟏 =
𝜷
∑ 𝜎−2
𝑖

∑ 𝝈−𝟐 −𝟐 ̂
𝒊 𝒚𝒊 − (∑ 𝝈𝒊 𝒙𝒊 )𝜷𝟐
̂𝟏 =
𝜷
∑ 𝜎−2
𝑖
𝑥 𝑦 𝑥±𝑦
separar la resta de fracciones 𝑧 ± 𝑧 = 𝑧
.

∑ 𝝈−𝟐
𝒊 𝒚𝒊 (∑ 𝝈−𝟐
𝒊 𝒙𝒊 )
̂𝟏 =
𝜷 − ̂𝟐
𝜷
(∑ 𝝈−𝟐
𝒊 ) (∑ 𝜎−2
𝑖 )

Procedemos a despejar 𝛽1 en la segunda ecuación:

̂ 𝟏 ∑(𝜎−1
𝜷 ∗ ̂ ∗𝟐 ∗ ∗
𝑖 𝑥𝑖 ) + 𝜷𝟐 ∑(𝒙𝒊 ) = ∑(𝒙𝒊 𝒚𝒊 )

̂ 𝟏 ∑(𝜎−1
𝜷 ∗ ∗ ∗ ∗𝟐 ̂
𝑖 𝑥𝑖 ) = ∑(𝒙𝒊 𝒚𝒊 ) − ∑(𝒙𝒊 )𝜷𝟐

∑(𝑥∗𝑖 𝑦𝑖∗ ) − ∑(𝑥∗2 ̂


𝑖 )𝜷𝟐
̂𝟏 =
𝜷
∑(𝜎−1 ∗
𝑖 𝑥𝑖 )

Donde:

𝑥𝑖∗ = 𝜎 −1 𝑥𝑖

𝑦𝑖∗ = 𝜎 −1 𝑦𝑖
̂𝟐
∑(𝜎−2 𝑥𝑖 𝑦𝑖 ) − ∑(𝜎−2 𝑥2𝑖 )𝜷
̂𝟏 =
𝜷
∑(𝜎−2
𝑖 𝑥𝑖 )

∑(𝜎−2
𝑖 𝑥𝑖 𝑦𝑖 ) ∑(𝜎−2 2
𝑖 𝑥𝑖 ) ̂
̂𝟏 =
𝜷 − 2 𝜷𝟐
∑(𝜎−2
𝑖
𝑥𝑖 ) ∑(𝜎−2
𝑖 𝑥𝑖 )

̂𝟏 = 𝜷
𝜷 ̂𝟏

∑ 𝜎𝑖−2 𝑦𝑖 (∑ 𝜎𝑖−2 𝑥𝑖 ) ̂ ∑ 𝝈−𝟐


𝒊 𝒙 𝒊 𝒚𝒊 ∑(𝝈−𝟐 𝟐
𝒊 𝒙𝒊 ) ̂
− 𝜷 = − 𝜷𝟐
∑(𝜎𝑖−2 ) ∑(𝜎𝑖−2 ) 𝟐 ∑(𝝈−𝟐
𝒊 𝒙𝒊 ) ∑(𝝈−𝟐 𝟐
𝒊 𝒙𝒊 )

̂𝟐
Se despeja 𝜷

∑(𝝈−𝟐 𝟐
𝒊 𝒙𝒊 ) (∑ 𝜎−2
𝑖 𝑥𝑖 ) ∑ 𝝈−𝟐
𝒊 𝒙 𝒊 𝒚𝒊 ∑ 𝜎−2
𝑖 𝑦𝑖
̂𝟐 −
𝜷 ̂𝟐 =
𝜷 −
∑(𝝈−𝟐 𝟐
𝒊 𝒙𝒊 )
∑(𝜎−2
𝑖 ) ∑(𝝈−𝟐
𝒊 𝒙𝒊 )
∑(𝜎−2
𝑖 )
Factorización de 𝑘𝑥 ± 𝑦𝑥 − (𝑘 ± 𝑦)𝑥

∑(𝜎 −2 𝑥𝑖2 ) (∑ 𝜎𝑖−2 𝑥𝑖 ) ∑(𝝈−𝟐 𝒙𝒊 𝒚𝒊 ) ∑ 𝝈−𝟐


𝒊 𝒚𝒊
( − )𝜷̂ = −
−2 −2 𝟐 −𝟐
∑ 𝜎𝑖 𝑥𝑖 ) (∑ 𝜎𝑖 ) ∑(𝝈𝒊 𝒙𝒊 ) (∑ 𝝈−𝟐
𝒊 )

̂ 𝟐 pasará dividiendo, 𝑎𝑦 = 𝑥 → 𝑦 = 𝑥/𝑎


Todo lo que acompaña a 𝜷

∑(𝜎−2 𝑥𝑖 𝑦𝑖 ) (∑ 𝜎−2
𝑖 𝑦𝑖 )
−2 −
∑ (∑ 𝜎−2
̂ 𝟐 = (𝜎𝑖 𝑥𝑖 )
𝜷 𝑖 )
−2 2 −2
∑(𝜎 𝑥𝑖 ) (∑ 𝜎𝑖 𝑥𝑖 )

∑(𝜎−2
𝑖 𝑥𝑖 ) (∑ 𝜎−2
𝑖 )

También podría gustarte