Práctica 2
Práctica 2
Práctica 2
Práctica 2
Francisco A. Ramírez
22 de Junio de 2020
Julia María George Brito, 100350214
Residuals:
Min 1Q Median 3Q Max
-23.4459 -5.6536 -0.6574 7.9457 15.4939
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.052e+01 9.476e-01 21.65 <2e-16 ***
M 5.359e-04 7.861e-06 68.17 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
F
F-statistic: 4647
b. ¿Cuánto es el aumento del índice de precios (IPC) como resultado de un incremento en una
unidad de la oferta de dinero (M)?
El aumento del IPC es de 0.0005359 como resultado de un incremento en una unidad de la oferta de
dinero (M).
Interpretación
La elasticidad correspondiente a (b) nos indica que el coeficiente es igual a 1, por lo tanto, es una
elasticidad unitaria.
d. Suponga que el modelo lineal anterior es reemplazado por el siguiente modelo log-log:
𝒍𝒏𝑰𝑷𝑪𝒕 = 𝜷𝟏 + 𝜷𝟐 𝒍𝒏(𝑴𝒕 ) + 𝝐𝒕
Resultado Modelo log-log
===============================================
Dependent variable:
---------------------------
l_IPC
-----------------------------------------------
l_M 0.698***
(0.006)
Constant -3.681***
(0.064)
-----------------------------------------------
Observations 264
R2 0.983
Adjusted R2 0.983
Residual Std. Error 0.077 (df = 262)
F Statistic 15,051.400*** (df = 1; 262)
===============================================
Note: *p<0.1; **p<0.05; ***p<0.01
𝒅𝑰𝑷𝑪
Compute la pendiente o efecto marginal ( 𝒅𝑴 𝒕) y la elasticidad. Comente la diferencia entre las
𝒕
elasticidades obtenidas en (c) y en (d).
Efecto Marginal
∆𝒍𝒏𝑰𝑷𝑪𝒕
𝑬𝑴𝟐 = = 𝜷𝟐
∆𝒍𝒏𝑴𝒕
Elasticidad
∆𝒍𝒏𝑰𝑷𝑪𝒕
𝑬𝑴𝟐 = = 𝜷𝟐
∆𝒍𝒏𝑴𝒕
Sustituyendo Elasticidad
−𝟑. 𝟔𝟖𝟏
𝑬𝟐 = = −𝟓. 𝟐𝟕𝟑𝟔𝟑𝟗
𝟎. 𝟔𝟗𝟖
Interpretación
Nombrando a la elasticidad de (c) E1 y a la elasticidad de (d) E2 la diferencia entre las elasticidades
es que en E1 el resultado con un modelo lineal fue una elasticidad unitaria mientras que en E2 con
una elasticidad igual a -5.273639 es decir menor a 1 indica una elasticidad inelástica para un
modelo log-log.
e. Compute e interprete la pendiente y la elasticidad en cada una de las siguientes especiaciones:
• log - lin : 𝐥𝐧(𝑰𝑷𝑪𝒕 ) = 𝜷𝟏 + 𝜷𝟐 𝐥𝐧(𝑴𝒕 ) + 𝝐𝒕
Resultado Modelo log-lin
===============================================
Dependent variable:
---------------------------
l_IPC
-----------------------------------------------
M 0.00001***
(0.00000)
Constant 3.314***
(0.024)
-----------------------------------------------
Observations 264
R2 0.874
Adjusted R2 0.873
Residual Std. Error 0.210 (df = 262)
F Statistic 1,815.655*** (df = 1; 262)
===============================================
Note: *p<0.1; **p<0.05; ***p<0.01
Interpretación
La pendiente es igual a 331,400.
La elasticidad es igual a 3.314 es mayor a 1 lo que nos indica que la oferta es elástica.
• lin - log : 𝑰𝑷𝑪𝒕 = 𝜷𝟏 + 𝜷𝟐 𝒍𝒏(𝑴𝒕 ) + 𝝐𝒕
Resultado Modelo lin-log
===============================================
Dependent variable:
---------------------------
IPC
-----------------------------------------------
l_M 42.346***
(0.559)
Constant -400.976***
(6.293)
-----------------------------------------------
Observations 264
R2 0.956
Adjusted R2 0.956
Residual Std. Error 7.599 (df = 262)
F Statistic 5,743.946*** (df = 1; 262)
===============================================
Note: *p<0.1; **p<0.05; ***p<0.01
Sustituyendo Elasticidad
−𝟒𝟎𝟎.𝟗𝟕𝟔 𝟏
𝑬𝟒 = = −𝟗. 𝟒𝟔𝟗𝟎𝟒𝟎𝟕𝟓𝟗 ∗ -0.002493915= 0.023614981
𝟒𝟐.𝟑𝟒𝟔 −𝟒𝟎𝟎.𝟗𝟕𝟔
Interpretación
La pendiente es igual a -9.469040759.
La elasticidad es igual a 0.023614981 es menor a 1 lo que nos indica que la oferta es
inelástica.
𝟏
• Recíproco : 𝑰𝑷𝑪𝒕 = 𝜷𝟏 + 𝜷𝟐 (𝑴 ) + 𝝐𝒕
𝟏
-----------------------------------------------
Observations 264
R2 0.000
Adjusted R2 0.000
Residual Std. Error 36.312 (df = 263)
===============================================
Note: *p<0.1; **p<0.05; ***p<0.01
RESET test
data: mod1nr
RESET = 516.95, df1 = 2, df2 = 260, p-value < 2.2e-16
> resettest(mod_l)
RESET test
data: mod_l
RESET = 123.31, df1 = 2, df2 = 260, p-value < 2.2e-16
> resettest(mod2)
RESET test
data: mod2
RESET = 1723.8, df1 = 2, df2 = 260, p-value < 2.2e-16
> resettest(mod3)
RESET test
data: mod3
RESET = 280.17, df1 = 2, df2 = 260, p-value < 2.2e-16
> resettest(mod4)
RESET test
data: mod4
RESET = 4.8138, df1 = 2, df2 = 261, p-value = 0.008852
2. Escriba un resumen conciso sobre los siguientes, usando el siguiente formato: naturaleza del
problema, causas, detección, consecuencias y soluciones.
• Heterocedásticidad
1-Naturaleza del problema: Las varianzas de los errores no son constantes.
2-Causas: Hay ocasiones donde la homocedasticidad no es conveniente, pues puede llevar a
conclusiones erradas de la relación entre las variables.
3-Detección: Análisis virtual de residuos, contraste de Breusch-Pagan y contraste de White.
4-Consecuencias: Los errores estándar computados para los estimadores de MCO son
incorrectos, así como los intervalos de confianza y contrastes de hipótesis.
5-Soluciones: El estimador de mínimos cuadrados generalizados, el estimador de mínimos
cuadrados generalizados factible.
• Multicolinealidad
1-Naturaleza del problema: Es una situación en la que se presenta una fuerte correlación entre
variables explicativas del modelo.
2-Causas: Cuando los datos son recogidos de una manera no experimental y no controlada es
posible que muchas variables se muevan de manera sistemática.
3-Detección: Método del factor de inflación de la varianza y Método del determinante en la
matriz de correlación de exógenas.
4-Consecuencias: Los supuestos de los estimadores de MC no se violan, los errores estándar
tienden a inflarse, y por lo tanto el estadístico t tiende a sugerir que los coeficientes no son
distintos de cero.
5-Soluciones: Aumentar el tamaño muestral puede reducir un problema de colinealidad
aproximada, utilizar datos de corte transversal, desestacionalizar las series y quitarles la
tendencia y trabajar con las series logaritmizadas.
• Endogeneidad
1-Naturaleza del problema: Es una situación en la que hay una correlación entre el parámetro o
variable y el término de error. En términos generales, un lazo de causalidad entre los
independientes y las variables dependientes de un modelo conduce a la endogeneidad.
2-Causas: Las posibles causas que explican el problema de endogeneidad son, variables omitidas,
simultaneidad, error de medición y sesgo de selección.
3-Detección: Contraste de RESET y la prueba de endogeneidad de Hausman-Gujarati.
4-Consecuencias: El modelo no se pueda estimar de manera consistente y puede llevar a
conclusiones erróneas debido a los sesgos.
5-Soluciones: Las variables instrumentales, variables aproximadas y MC2E.
3. Del modelo de regresión 𝒚𝒊 = 𝜷𝒙𝒊 + 𝒖 donde, u es el termino de perturbaciones con
varianza 𝑬(𝒖𝒖´) = 𝝈𝟐 𝒙𝟐𝒊 :
a. Derive el estimador de Mínimos Cuadrados Generalizado (MCG) de 𝜷
𝝏
𝝈𝟐 ̂ 𝒙𝒊 )´( 𝚺 −𝟏 𝒚 − 𝚺 −𝟏 𝜷
{(𝒚𝒊 − 𝜷 ̂ 𝒙𝒊 )} = 𝟎
𝝏𝜷̂
𝝏 ̂𝒙𝒊 ´𝚺 −𝟏 𝒚𝒊 − 𝒚𝒊 ´𝚺 −𝟏 𝜷
𝜷´ ̂ 𝒙𝒊
𝝈𝟐 {𝒚𝒊 ´𝚺 −𝟏 𝒚𝒊 − ̂ ´𝒙𝒊 ´𝚺 −𝟏 𝜷
+𝜷 ̂ 𝒙𝒊 } = 𝟎
𝝏𝜷̂ −𝟐𝜷 ̂ ´𝒙𝒊 ´𝚺 −𝟏 𝒚𝒊
̂} = 𝟎
{−𝟐𝒙𝒊 ´𝚺 −𝟏 𝒚𝒊 + 𝟐(𝒙𝒊 ´𝚺 −𝟏 𝒙𝒊 )𝜷
Este resultado, se conoce con el nombre de Teorema de AITKEN y es una generalización del Teorema de
GAUSS-MARKOV.
7. Considere los datos de la encuesta ENFT_2000.xls. Construya las variables de salario por
hora, educación, así como otros atributos como género, experiencia (edad-6-educación), zona
donde habita (rural/urbano), entre otros controles:
a. Estime la ecuación por MCO:
𝒍𝒏(𝑺𝒂𝒍𝒂𝒓𝒊𝒐𝒊 ) = 𝜷𝟏 + 𝜷𝟐 𝒆𝒅𝒖𝒄𝒊 + ⋯ + 𝝐𝒊
Resultado Modelo lineal
===============================================
Dependent variable:
---------------------------
log(salario_hora)
-----------------------------------------------
educ 0.101***
(0.002)
exper 0.030***
(0.002)
I(exper2) -0.0003***
(0.00003)
hombre -0.216***
(0.019)
zona_urb -0.153***
(0.019)
Constant 2.036***
(0.046)
-----------------------------------------------
Observations 7,715
R2 0.233
Adjusted R2 0.233
Residual Std. Error 0.776 (df = 7709)
F Statistic 468.674*** (df = 5; 7709)
===============================================
Note: *p<0.1; **p<0.05; ***p<0.01
data: mod5
BP = 57.91, df = 5, p-value = 3.282e-11
Coefficients:
(Intercept) educ exper I(exper^2) hombre zona_urb
2.0358960 0.1014982 0.0297493 -0.0003142 -0.2156011 -0.1530546
El modelo nos indica que para educación en promedio por cada año el logaritmo de salario se incrementa
en un 10.14982% por su parte la experiencia incrementa el logaritmo de salario en un 2.97493% el
logaritmo al cuadrado es lógico que disminuya pues el capital humano se deteriora al pasar de los tiempos
en el de hombre el disminuye un -21.56011% y por ultimo para zona_urb de igual forma disminuye pero
un -15.30548%.
Así que en comparación con el modelo base la única variable que aumenta el logaritmo del salario
es educ las demás variables permanecen constante al redondear nos damos cuenta de eso.
8. Considere el siguiente modelo para estimar el efecto de un conjunto de variables, incluyendo
el consumo de cigarrillos, sobre el peso de recién nacidos:
𝑙𝑛(𝑝𝑒𝑠𝑜𝑛𝑎𝑐) = 𝛽0 + 𝛽1 ℎ𝑜𝑚𝑏𝑟𝑒 + 𝛽2 𝑜𝑟𝑑𝑒𝑛 + 𝛽3 𝑙𝑛(𝑖𝑛𝑔𝑓𝑎𝑚) + 𝛽4 𝑐𝑎𝑗𝑒𝑡𝑖𝑙𝑙𝑎𝑠 + 𝑢
donde 𝒉𝒐𝒎𝒃𝒓𝒆𝒔 es un indicador binario igual a uno si es niño, 𝒐𝒓𝒅𝒆𝒏 es una variable que
indica el orden de nacimiento del niño, 𝒊𝒏𝒈𝒇𝒂𝒎 es el ingreso familiar, y 𝒄𝒂𝒋𝒆𝒕𝒊𝒍𝒍𝒂𝒔 es el
número de cajetillas de cigarros fumadas por días durante el embarazo.
a. Por qué se espera que cajetilla esté relacionada con u?
Porque la variable cajetillas puede tener factores no observables, también puede ser debido a
que la adquisición de una cajetilla está relacionada al ingreso de la persona, los hábitos de salud
y quizás a otras variables, las cuales están en el término de error del modelo "u".
b. Suponga que tiene datos sobre el precio promedio de las cajetillas de cigarros de cada una
de las localidades donde residen las mujeres que componen la muestra. Discuta si esta
información satisface las condiciones para ser considerada un buen instrumento para la
variable 𝒄𝒂𝒋𝒆𝒕𝒊𝒍𝒍𝒂𝒔.
Si, se pudiera considerar como un buen instrumento para las variables cajetillas, ya que, si
tenemos el precio promedio de estas, entonces podemos ver qué cantidad podría consumir las
familias con menor ingreso y las familias con mayor ingreso, considerando que mientras menor
ingreso tenga menos cajetillas consume.
c. Use los datos en BWGHT.CSV para estimar la ecuación anterior. Primero estime por MCO.
Después use MC2E, donde preciocig es un instrumento para cajetillas. Discuta cualquier
diferencia que observe entre las estimaciones de MCO y MC2E.
Estimación por MCO
Resultados Modelo Lineal 6
===============================================
Dependent variable:
---------------------------
l_bwght
-----------------------------------------------
male 0.026***
(0.010)
parity 0.015***
(0.006)
l_faminc 0.018***
(0.006)
cigs -0.004***
(0.001)
Constant 4.676***
(0.022)
-----------------------------------------------
Observations 1,388
R2 0.035
Adjusted R2 0.032
Residual Std. Error 0.188 (df = 1383)
F Statistic 12.554*** (df = 4; 1383)
===============================================
Note: *p<0.1; **p<0.05; ***p<0.01
cigs -0.004***
(0.001)
----------------------------------------------------------------
Observations 1,388 1,388 1,388
R2 0.035 0.035 0.035
Adjusted R2 0.032 0.032 0.032
Residual Std. Error (df = 1383) 0.188 0.188 0.188
F Statistic (df = 4; 1383) 12.554*** 12.554***
================================================================
Note: *p<0.1; **p<0.05; ***p<0.01
La diferencia que se observa entre las estimaciones de MCO y MC2E es que en la estimación de
VI todos los resultados fueron iguales para todas las variables excepto preciocig, mientras que
por MCO no fue así, en este modelo todas las variables rieron un resultado distinto tomando en
cuenta que la variable preciocig no se encuentra en ese modelo.
d. Estime la forma reducida de cajetillas. ¿Qué puede concluir acerca de la identificación de la ecuación
de interés utilizando preciocig? Qué implicaciones tiene este resultado sobre la respuesta de la sección
c).
𝒚𝒊 = 𝜷𝟎 + 𝜷𝟏 𝒚𝟐 + 𝜷𝟐 𝒛𝟏 + 𝒖
Donde 𝒚𝟐 es una variable explicativa con problemas de endogeneidad y 𝒛𝟏 es una variable exógena,
mientras que u es el componente de error del modelo y cumple con los supuestos usuales. A esta
ecuación se le conoce como ecuación estructural para enfatizar que es una relación estructural.
a. Suponga que se dispone de un instrumento para la variable 𝒚𝟐 denominada 𝒛𝟐 . ¿Cuáles son las
condiciones que debe poseer este instrumento para ser considerado como un instrumento válido?
• Exogeneidad (cov(z,𝜖) =0). en términos prácticos, indica que 𝑧𝑖 no debe estar correlacionado con
las variables omitidas.
• Relevancia (Corr(𝑍𝑖 , 𝑋𝑖 )-=0). cuando esta correlacionado en baja, decimos enfrentamos
instrumentos débiles.
(∑ 𝝈−𝟐 ̂ −𝟏 ∗ ̂ −𝟏 ∗
𝒊 )𝜷𝟏 + (∑ 𝝈𝒊 𝒙𝒊 )𝜷𝟐 = ∑ 𝝈𝒊 𝒚𝒊
∗ ̂ −𝟏 ∗𝟐 ̂ ∗ ∗
(∑ 𝝈−𝟐
𝒊 𝒙𝒊 )𝜷𝟏 + (∑ 𝝈𝒊 𝒙𝒊 )𝜷𝟐 = 𝒙𝒊 𝒚𝒊
Aclaración:
Es necesario explicar el procedimiento por cual salen estas ecuaciones, debemos dirigirnos a la clase de
problema de estimación de 𝑌 = 𝑋𝛽 + 𝜖, en el cual se busca estimar a 𝛽.
Se despejar y se utiliza las propiedades explicadas en los puntos anteriores para obtener la primera
ecuación normal.
𝛽1 ∑(𝜎𝑖−1 𝑥𝑖∗ ) + 𝛽2 ∑(𝑥𝑖∗2 ) = ∑(𝑥𝑖∗ 𝑦𝑖∗ ) → 𝐸𝑠𝑡𝑎 𝑒𝑠 𝑙𝑎 𝑒𝑐𝑢𝑎𝑐𝑖ó𝑛 𝑛𝑜𝑟𝑚𝑎𝑙 𝑞𝑢𝑒 𝑏𝑢𝑠𝑐𝑎𝑚𝑜𝑠.
̂ 𝟏y 𝜷
a. Muestre que 𝜷 ̂ 𝟐 pueden ser reescritos como:
∑ 𝝈−𝟐
𝒊 𝒚𝒊 𝒙𝒊 ∑ 𝝈−𝟐 −𝟐
𝒊 𝒚𝒊 ∑ 𝝈𝒊 𝒙𝒊
− ( )( )
∑ 𝝈−𝟐 ∑ 𝝈−𝟐 ∑ 𝝈−𝟐
̂ 𝟐=
𝜷 𝒊 𝒊 𝒊
𝟐
∑ 𝝈−𝟐 𝒙𝟐 ∑ 𝝈−𝟐 𝒙
( 𝒊 −𝟐 𝒊 ) − ( 𝒊 −𝟐 𝒊 )
∑ 𝝈𝒊 ∑ 𝝈𝒊
∑ 𝝈−𝟐
𝒊 𝒚𝒊 ∑ 𝝈−𝟐
𝒊 𝒙𝒊 ̂
̂𝟏 =
𝜷 − 𝜷𝟐
∑ 𝝈−𝟐
𝒊 ∑ 𝝈−𝟐
𝒊
(∑ 𝝈−𝟐 ̂ −𝟏 ∗ ̂ −𝟏 ∗
𝒊 )𝜷𝟏 + (∑ 𝝈𝒊 𝒙𝒊 )𝜷𝟐 = ∑ 𝝈𝒊 𝒚𝒊
(∑ 𝝈−𝟐 ̂ −𝟏 ∗ −𝟏 ∗ ̂
𝒊 )𝜷𝟏 = ∑ 𝝈𝒊 𝒚𝒊 − (∑ 𝝈𝒊 𝒙𝒊 ) 𝜷𝟐
−𝟏 ∗ ̂
∑ 𝝈−𝟏 ∗
𝒊 𝒚𝒊 − (∑ 𝝈𝒊 𝒙𝒊 )𝜷𝟐
̂𝟏 =
𝜷
∑ 𝜎−2
𝑖
Sustituir los valores de 𝑦 ∗ , 𝑥 ∗ por los valores que nos muestran al inicio del problema.
∑ 𝝈−𝟏 −𝟏 −𝟏 −𝟏 ̂
𝒊 (𝝈 𝒚𝒊 ) − (∑ 𝝈𝒊 (𝝈 𝒙𝒊 ))𝜷𝟐
̂𝟏 =
𝜷
∑ 𝜎−2
𝑖
∑ 𝝈−𝟐 −𝟐 ̂
𝒊 𝒚𝒊 − (∑ 𝝈𝒊 𝒙𝒊 )𝜷𝟐
̂𝟏 =
𝜷
∑ 𝜎−2
𝑖
𝑥 𝑦 𝑥±𝑦
separar la resta de fracciones 𝑧 ± 𝑧 = 𝑧
.
∑ 𝝈−𝟐
𝒊 𝒚𝒊 (∑ 𝝈−𝟐
𝒊 𝒙𝒊 )
̂𝟏 =
𝜷 − ̂𝟐
𝜷
(∑ 𝝈−𝟐
𝒊 ) (∑ 𝜎−2
𝑖 )
̂ 𝟏 ∑(𝜎−1
𝜷 ∗ ̂ ∗𝟐 ∗ ∗
𝑖 𝑥𝑖 ) + 𝜷𝟐 ∑(𝒙𝒊 ) = ∑(𝒙𝒊 𝒚𝒊 )
̂ 𝟏 ∑(𝜎−1
𝜷 ∗ ∗ ∗ ∗𝟐 ̂
𝑖 𝑥𝑖 ) = ∑(𝒙𝒊 𝒚𝒊 ) − ∑(𝒙𝒊 )𝜷𝟐
Donde:
𝑥𝑖∗ = 𝜎 −1 𝑥𝑖
𝑦𝑖∗ = 𝜎 −1 𝑦𝑖
̂𝟐
∑(𝜎−2 𝑥𝑖 𝑦𝑖 ) − ∑(𝜎−2 𝑥2𝑖 )𝜷
̂𝟏 =
𝜷
∑(𝜎−2
𝑖 𝑥𝑖 )
∑(𝜎−2
𝑖 𝑥𝑖 𝑦𝑖 ) ∑(𝜎−2 2
𝑖 𝑥𝑖 ) ̂
̂𝟏 =
𝜷 − 2 𝜷𝟐
∑(𝜎−2
𝑖
𝑥𝑖 ) ∑(𝜎−2
𝑖 𝑥𝑖 )
̂𝟏 = 𝜷
𝜷 ̂𝟏
̂𝟐
Se despeja 𝜷
∑(𝝈−𝟐 𝟐
𝒊 𝒙𝒊 ) (∑ 𝜎−2
𝑖 𝑥𝑖 ) ∑ 𝝈−𝟐
𝒊 𝒙 𝒊 𝒚𝒊 ∑ 𝜎−2
𝑖 𝑦𝑖
̂𝟐 −
𝜷 ̂𝟐 =
𝜷 −
∑(𝝈−𝟐 𝟐
𝒊 𝒙𝒊 )
∑(𝜎−2
𝑖 ) ∑(𝝈−𝟐
𝒊 𝒙𝒊 )
∑(𝜎−2
𝑖 )
Factorización de 𝑘𝑥 ± 𝑦𝑥 − (𝑘 ± 𝑦)𝑥
∑(𝜎−2 𝑥𝑖 𝑦𝑖 ) (∑ 𝜎−2
𝑖 𝑦𝑖 )
−2 −
∑ (∑ 𝜎−2
̂ 𝟐 = (𝜎𝑖 𝑥𝑖 )
𝜷 𝑖 )
−2 2 −2
∑(𝜎 𝑥𝑖 ) (∑ 𝜎𝑖 𝑥𝑖 )
−
∑(𝜎−2
𝑖 𝑥𝑖 ) (∑ 𝜎−2
𝑖 )