Pichihua 2003 - Econometría - Teoría y Aplicaciones
Pichihua 2003 - Econometría - Teoría y Aplicaciones
Pichihua 2003 - Econometría - Teoría y Aplicaciones
MOLINA
FACULTAD DE ECONOMIA Y PLANIFICACIÓN
ECONOMETRIA:
TEORIA Y APLICACIONES
0
0 1 2 3 4 5 6 7 8
-1
-2
TASA DE CRECIMIENTO DEL PBI (%)
Profesor Principal del Departamento Académico de Economía y Planificación
Sobre el Autor:
INDICE
Prólogo ii
Introducción iii
Capítulo I: Econometría Campo y Usos
1.1 Definición y campo de la econometría 2
1.2 Etapas de la Construcción de un Modelo Econométrico 5
1.3 Usos de los Modelos Econométricos 9
1.4 Los Modelos Econométricos y sus Elementos 10
1.5 Los Modelos Econométricos y sus Problemas 12
1.6 Regresión y Causalidad 13
Capítulo 2: Modelo de Regresión Lineal Simple
2.1 Especificación 16
2.2 Estimación por Mínimos Cuadrados Ordinarios 20
2.3 Validación 32
2.4 Estimación por Máxima Verosimilitud 44
2.5 Especificaciones No Lineales del Modelo de Regresión 50
2.6 Experimentos de Monte Carlo y Bootstrap 53
2.7 Aplicaciones y Problemas 58
Capítulo 3: Modelo de Regresión Lineal General
3.1 Especificación 68
3.2 Supuestos en el Modelo de Regresión Clásico: 69
3.3 Problemas Frente a los Supuestos del Modelo de Regresión Clásico 69
3.4 Estimación por Mínimos Cuadrados Ordinarios (MCO) 71
3.5 Estimación por Máxima Verosimilitud (MV) 80
3.6 Estimación por Mínimos Cuadrados Restringidos (MCR) 86
3.7 Pruebas de Hipótesis 92
3.8 Variables Dummy 109
3.9 Aplicaciones y Problemas 115
Capítulo 4: Violación de los Supuestos del Modelo de Regresión Clásico
4.1 Revisión de los Supuestos del Modelo de Regresión Clásico 129
4.2 Sesgo de Especificación 130
4.3 No Normalidad de los Errores 137
4.4 Errores con Media Diferente de Cero 138
4.5 Errores No Esféricos 139
4.6 Heterocedasticidad 145
4.7 Autocorrelación 158
4.8 Multicolinealidad 177
4.9 Problemas de Endogeneidad en las Variables Explicativas 194
4.10Aplicaciones y Problemas 203
Capítulo 5: Modelos Lineales Multiecuacionales
5.1 Especificación 216
5.2 Tipos de Modelos Multiecuacionales 217
5.3 Modelo de Ecuaciones Recursivas (MER) 217
5.4 Modelo de Ecuaciones Aparentemente No Relacionadas (MEANR) 219
5.5 Modelo de Ecuaciones Simultáneas (MES) 223
5.6 Estimación de Modelos de Ecuaciones Simultáneas 239
5.7 Uso de los Modelos de Ecuaciones Simultáneas 257
5.8 Aplicaciones y Problemas 263
Bibliografía 271
i
Econometría: Teoría y Aplicaciones Juan Pichihua Serna
PROLOGO
Sin duda, el texto no está dirigido para aquellos que dan sus primeros pasos en esta
rama del conocimiento, es un texto de nivel intermedio, con aplicaciones interesantes y
motivadoras usando datos de nuestra realidad, este sólo hecho amerita su lectura en
primera instancia y posterior “reprocesamiento”, las lecciones aprendidas por el autor a
lo largo de su trayectoria académica y profesional son trasmitidas con lucidez y
claridad.
En esta relación teoría y realidad, por el contenido que invita a todos aquellos que se
interesan en el tema a seguir avanzando y el lenguaje preciso y adaptado a nuestras
necesidades encontramos que Juan Pichihua nos presenta una visión pertinente entre la
modelística y su tratamiento, esperemos que continúe en este camino y que este trabajo
sea la primera entrega en esta apasionante tarea de la elaboración de modelos y análisis
de datos.
ii
Econometría: Teoría y Aplicaciones Juan Pichihua Serna
INTRODUCCIÓN
Antes de los años 80, los textos de econometría eran básicamente de Métodos
Econométricos muy cargado de procedimientos estadísticos y matemáticos. A inicios de
los 80 aparecieron los primeros textos con una fuerte tendencia a la construcción de
Modelos Econométricos, con muchísimas aplicaciones empíricas. Los textos de
econometría de los 90, han tratado de encontrar un equilibrio entre los métodos y los
modelos econométricos. Sin embargo, queda aún la sensación que falta algo. En mi
opinión falta darle integralidad a la econometría con el análisis económico. En ese
sentido, el propósito del libro es mostrar al estudiante cómo dar los saltos cualitativos
necesarios que le permitan pasar de una hipótesis económica a la especificación de un
modelo econométrico, de allí a la estimación de sus parámetros y a la validación
económica, estadística y empírica del modelo, e iniciarlos en el uso de los modelos
econométricos.
iii
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 1
CAPITULO 1:
ECONOMETRIA,
CAMPO Y USOS
“la revista ... promoverá los estudios que contribuyan a la unificación de las
aproximaciones teórico-cuantitativos y empírico-cuantitativos de los problemas
económicos........ sin embargo, no debiera confundirse la econometría con
cualquier aproximación matemática de la economía, ni con la economía
estadística. ... La experiencia muestra que ... con la unificación de la estadística,
la teoría económica y las matemáticas se constituye la econometría”.
Veinte años después, Tintner (1953) dedicó todo un artículo pretendiendo poner punto
final a la discusión sobre lo que es la econometría, basándose en la referencia del qué
hacer los econometristas, concluyendo que “la econometría es el estudio de la
aplicación estadística al análisis de los fenómenos económicos”.
Todos los autores, arriba mencionados, señalan que la econometría es mucho más que
su significado literal, “medición económica”; que existe un elemento central sobre el
cual gira su trabajo, el “modelo” que está detrás de las relaciones entre variables
postuladas por la teoría económica y que permite: i) poner a prueba a las hipótesis
planteadas, ii) hacer pronóstico sobre las variables de interés y iii) hacer evaluaciones de
política económica. En ese sentido, se plantea la siguiente definición:
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 3
Algunas de las relaciones entre las variables económicas (respuestas cuantitativas) que
pueden ser realizadas por la econometría tenemos:
Por ejemplo, la teoría de la demanda dice que un individuo que tiene un presupuesto
limitado y que es maximizador de su función de utilidad, encuentra la cantidad
demandada de equilibrio, Q d , para un bien X, si conoce el precio del bien, PX , el precio
de otros bienes relacionados, PY , y su ingreso o presupuesto, I . Esto se resume en la
ecuación implícita:
§ ·
¨ ¸ (1.1)
Q Xd f ¨ P X , PY , I ¸
¨ () (r ) (r ) ¸
© ¹
§ · (1.2)
Q Xd f ¨¨ P X ¸¸
© () ¹
Q Xd a bP X (1.3)
Q Xd D E PX P (1.4)
4 Capítulo 1: Econometría, campo y usos
Teoría Teoría
económica estadística
Economía Métodos
Matemática estadísticos
Métodos
econométricos
Especificación Realidad:
Etapa I Datos
Econométrica
Modelación
Política
Estimación
Económica
Etapa II
Validación
Etapa III
Usos
Etapa I: Especificación
¿Qué variables estarán incluidas en el modelo?. Omitir una variable relevante puede
producir pérdida de eficiencia y sesgos en la estimación de los parámetros. El incluir
variables irrelevantes también traerá problemas, aunque menos graves.
¿Cómo se especificarán las variables incluidas?. Depende de qué tipo de modelo se
quiere estimar en niveles, pudiendo darse en diferencias, en variaciones
porcentuales, en ratios (proporciones o participaciones), etc.
¿Cuál será la forma funcional del modelo?. Se debe elegir entre un modelo dinámico
o estático, y entre un modelo lineal o en un modelo no lineal. En ambos casos
dependerá del carácter dinámico de las variables (con efectos transitorios o con
efectos permanentes) y del concepto de linealidad que se esté utilizando (lineal en
variables o lineal en parámetros).
QX f ( PX , PY , I ) y QY f ( PX , PY , I )
Modelo Ecuación
Lineal QX E 1 E 2 PX E 3 PY E 4 I P
Exponencial QX DPXJ PYJ I J e P
2 3 4
wQ X PX
Si usamos el concepto estándar de elasticidad precio: H x . se encuentra que
wPX Q X
el modelo lineal tiene elasticidad precio que cambia con el nivel del precio,
específicamente, será inelástico a precios “bajos” y elástico a precio “altos”. En cambio,
el modelo exponencial (no lineal) tiene una elasticidad precio constante, es decir, es
independiente del nivel del precio. Continuando el ejercicio para la elasticidad cruzada
y la elasticidad ingreso, encontraremos que estas características se mantienen, es decir:
Modelo Ecuación
Cuadrático GA E1 E 2 I E 3 I 2 P
Exponencial GA DI J 2 e P
Donde: GA = Gasto en Alimentos, I= ingreso.
Para operativizar está hipótesis se plantea un modelo donde las variables se expresan
como netos de los retornos libre de riesgos, como pueden ser los bonos del Banco
Central de Reserva o del tesoro público. El modelo se puede plantear así:
r j , t r f ,t D E rm,t r f ,t H t (1.5)
Donde:
rj,t = tasa de retorno mensual de la empresa, por ejemplo las acciones de la Telefónica.
rm,t = tasa de retorno mensual del mercado, por ejemplo de la Bolsa de Valores de Lima.
rf,t = Tasa de retorno mensual de activos libre de riesgo, por ejemplo Bonos del BCR.
Según el modelo CAPM dice que si una compañía es “más riesgosa” que el mercado en
su conjunto debe tener un coeficiente “Beta”, E , mayor que uno y viceversa.
Por ejemplo, la Teoría Keynesiana afirma que hay una relación directa entre el gasto en
bienes de consumo y el ingreso disponible. En la etapa de especificación se plantea un
modelo lineal entre las variables Consumo Privado (CPR) y el Producto Bruto Interno
(PBI), que son una expresión de la forma empírica de las variables consumo e ingreso
planteadas en la hipótesis económica.
CPRt D E * PBI t Pt
Con datos del Banco Central de Reserva del Perú para el consumo y el ingreso, y el
método de estimación de los mínimos cuadrados se obtiene los valores estimados para
D y E . D̂ =2790.6 y Ê =0.614. De modo que la línea de regresión estimada es:
CPˆ Rt Dˆ Eˆ * PBI t
o también:
35000 25000
CPR
30000
PBI
20000
25000
20000
15000
CPR
15000
10000
10000
15000 20000 25000 30000 35000
90 91 92 93 94 95 96 97 98 99 00 PBI
Por ejemplo, si se está estimando una curva de demanda, es inadmisible los modelos
estimados que muestran una relación directa entre el precio y la cantidad demandada,
también sería inadmisible con la teoría económica que la propensión marginal a
consumir sea negativa o mayor que uno en la función consumo. En estos casos
significa que hay algún problema en la especificación del modelo, o un problema en la
calidad de los datos, entre otros.
Modelo Especificación
Estático CPˆ Rt Dˆ EˆPBI = 2790.6 0.614 * PBI
t t
Dinámico CPˆ Rt ˆ ˆ
G TPBI t JˆCPRt 4 = 2633 0.528 * PBI t 0.132 * CPRt 4
'CPRt
Las propensiones marginales a consumir (PMgC= ) son:
'PBI t
El uso del modelo con fines de evaluación de política se refiere a la determinación del
efecto cuantitativo de varias alternativas de política económica. En este caso se plantea
diferentes escenarios de política. En cada escenario las variables exógenas pueden tomar
valores distintos; por ejemplo, si tenemos un modelo de determinación del tipo de
cambio como función de la cantidad de dinero en la economía, se puede plantear
diferentes escenarios de crecimiento de la cantidad de dinero, y como consecuencia de
esto se tendrá resultados diferentes para el crecimiento del tipo de cambio. El modelo
estimado permitirá simular cada escenario y cuantificar las magnitudes de impacto en
el tipo de cambio.
Una de las variables que hemos ignorado hasta ahora es el término de perturbación.
Esta variable permite transformar el modelo de una relación determinística a una
relación estocástica. La existencia del término de perturbación se justifica por tres
razones (no necesariamente mutuamente excluyentes):
b) Errores de medida. Puede haber casos en los que la variable no puede ser medida
con precisión por problemas conceptuales o por dificultades en su medición, está
imprecisión, finalmente se transmite en el término de perturbación.
c) Indeterminación humana. El término de perturbación representa la naturaleza
inherentemente aleatoria del comportamiento humano.
Finalmente, un modelo se completa con los parámetros. Los parámetros son las
constantes que caracterizan las ecuaciones de un modelo. Sin embargo debe
diferenciarse un parámetro del estimador del parámetro y de un valor estimado del
parámetro. Por ejemplo, sea el parámetro E ; un estimador del parámetro E , Ê , es la
ecuación, la fórmula o la “receta” que permite obtener un valor estimado del parámetro
E , digamos Ê X , es decir, el estimador de E se obtiene como el valor promedio de
la variable X; y un valor estimado del parámetro E es el valor particular que toma el
estimador dado los datos muestrales disponibles, digamos Ê =0.4, es decir, si el
promedio de la variable X es 0.4, Ê tomará dicho valor.
a) El horizonte de predicción,
b) La estabilidad de los parámetros,
c) La cantidad y calidad de los datos, y
d) La especificación correcta del modelo.
Como se puede observar en el gráfico 1.3, los valores estimados para el parámetro
“Beta” son bastante estables; y el intervalo de confianza disminuye rápidamente a
medida que aumenta el número de observaciones.
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 13
12 1.0
0.9
8
0.8
4
0.7
0
0.6
-4 0.5
78 80 82 84 86 88 90 92 94 96 98 92 93 94 95 96 97 98 99 00
Gráfico 1.3 Beta Estimado ± 2 S.E. Gráfico 1.4 Alfa Estimado ± 2 S.E.
CAPITULO 2:
MODELO DE
REGRESION LINEAL SIMPLE
2.1 Especificación 16
2.1.1 Función de Regresión Poblacional 16
2.1.2 Función de Regresión Muestral 17
2.1.3 Supuestos del Modelo de Regresión Lineal Clásico 18
2.2 Estimación por Mínimos Cuadrados Ordinarios 20
2.2.1 Mínimos Cuadrados Ordinarios (MCO) 20
2.2.2 Propiedades de los Estimadores de MCO 25
a) Propiedades de Ê 25
b) Propiedades de D̂ 27
c) Covarianza Dˆ , Eˆ 28
d) Estimador de la Varianza del Error, V u2 30
e) Teorema de Gauss-Markov 31
2.3 Validación 32
2.3.1 Validación Económica 32
2.3.2 Validación Estadística 32
a) Bondad de Ajuste 33
b) Prueba de Hipótesis 35
c) Intervalos de Confianza 38
2.3.3 Validación Empírica 39
a) Predicción Media 39
b) Predicción Punto 40
c) Evaluación del Pronóstico 43
2.4 Estimación por Máxima Verosimilitud 44
2.4.1 Máxima Verosimilitud (MV) 45
2.4.2 Propiedades de los Estimadores de MV 46
2.4.3 Matriz de Varianzas y Covarianzas de los Estimadores de MV 46
2.4.4 Pruebas de Bondad de Ajuste de un Modelo Estimado por MV 48
2.5 Especificaciones No Lineales del Modelo de Regresión 50
2.6 Experimentos de Monte Carlo y Bootstrap 53
2.7 Aplicaciones y Problemas 58
16 Capítulo 2: Modelo de Regresión Lineal Simple
2.1 ESPECIFICACIÓN
Sea el Modelo de Regresión Lineal Simple:
Yi D EX i u i (2.1)
Donde:
Yi : es la variable dependiente o endógena.
Xi : es la variable independiente o explicativa.
ui : es el término de perturbación.
D, E : son los parámetros del modelo.
De este modo el modelo de regresión lineal simple, también se puede expresar como:
Yi E >Yi X i @ u i (2.2)
Y FRP:
Observación
i-ésima E[Yi X i ] D EX i
(Xi ;Yi)
Yi
ui
E[Yi X i ]
X
Xi
Gráfico 2.1 Función de Regresión Poblacional - FRP
Dado que los parámetros de la función de regresión poblacional y que los valores que
toma variable aleatoria u i son desconocidos, la función de regresión poblacional, o
verdadera, no se puede observar. Lo más que se puede tener es una función de regresión
muestral – FRM, ecuación 2.4, producto de la información muestral disponible.
Y FRP:
Observación
i-ésima E[Yi X i ] D EX i
(Xi ;Yi)
Yi
FRM:
ui
û i Yˆi Dˆ EˆX i
E[Yi X i ]
Yˆi
X
Xi
Gráfico 2.2 Función de Regresión Poblacional – FRP
y Función de Regresión Muestral - FRM
18 Capítulo 2: Modelo de Regresión Lineal Simple
ui Yi E >Yi X i @
ui Yi D EX i (2.5)
uˆ i Yi Yˆi
uˆ i Yi Dˆ EˆX i (2.6)
u i uˆ i (D Dˆ ) ( E Eˆ ) X i (2.7)
Para asegurarnos que el valor esperado para la discrepancia entre ambos errores sea
cero, es necesario garantizar que los estimadores de los parámetros son insesgados.
Estos resultados se pueden obtener trabajando con una muestra representativa y
utilizando el método de estimación adecuado para lograr estimadores insesgados.
Esto implica que existe una relación estocástica lineal entre la variable dependiente (Y)
y la variable explicativa (X).
a) Distribución normal: ui a N
Esto implica que la función de densidad de probabilidad del error o término de
perturbación sigue la regla de una distribución normal.
ui2
1 2V u2
f (u i ) e
2SV u2
Econometría: Teoría y aplicaciones Juan Pichihua Serna 19
d) No autocorrelación: E (u i u i r s ) 0 , s z 0.
La no autocorrelación de errores implica que el error en una observación es
independiente del error en otra observación.
En el caso extremo del modelo de regresión clásico se supone que la variable X i es una
variable no aleatoria, por lo tanto, sus valores son exógenos al modelo, cumpliendose
también: E ( X i u i ) X i E (u i ) 0 .
Supuesto 5: No quiebre estructural. Esto implica que los parámetros del modelo son
constantes para todos las observaciones.
Corolario
Corolario 1: Si ui a N entonces Yi a N
E >Yi X i @ E >D EX i u i X i @ D EX i
C (Yi , Y j ) E[u i u j ] C (u i , u j ) 0
ui Yi D EX i (2.8)
Luego,
u i2 Yi D EX i 2 (2.9)
n n
¦ Yi D EX i
2
¦ u i2 (2.10)
i 1 i 1
n
El método de MCO consiste en minimizar la ¦ u i2 con respecto a D y E para obtener
i 1
n n
n
2 w ¦ u i2 w ¦ u i2
Min¦ u
i 1
i
i 1
0 y i 1
0 D̂ y Ê .
D, E wD wE
n
w ¦ u i2 n
i 1
2¦ Yi D EX i (2.11)
wD i 1
n
w ¦ u i2 n
i 1
2¦ Yi D EX i X i (2.12)
wE i 1
n n
¦ Yi nDˆ Eˆ ¦ X i (2.15)
i 1 i 1
n n n
¦ Yi X i Dˆ ¦ X i Eˆ ¦ X i2 (2.16)
i 1 i 1 i 1
§ n X ·§ n Y ·
n ¨ ¦ i ¸¨ ¦ i ¸ n n
© i 1 ¹© i 1 ¹
¦ Yi X i ¦ (Yi Y )( X i X ) ¦ y i xi
Ê i 1 n i 1 i 1
(2.18)
2 n n
¦ X i X
n 2
§ X · ¦x 2
n ¨¦ i ¸ i
2 ©i 1 ¹ i 1 i 1
¦ Xi
i 1 n
n n n n ¦ Xi n n
¦ xi ¦ ( X i X ) ¦ X i Xn ¦ X i i 1 n ¦ Xi ¦ Xi 0
i 1 i 1 i 1 i 1 n i 1 i 1
n n n n ¦ Yi n n
¦ yi ¦ (Yi Y ) ¦ Yi Y n ¦ Yi i 1 n ¦ Yi ¦ Yi 0
i 1 i 1 i 1 i 1 n i 1 i 1
22 Capítulo 2: Modelo de Regresión Lineal Simple
n n n ¦ X i 2
¦ xi2 ¦ ( X i X ) 2 ¦ ( X i2 2 XX i X 2 ) ¦ X i2 nX 2 ¦ X i2
i 1 i 1 i 1 n
n n 2 n ¦ Yi 2
¦ yi2 ¦ (Yi Y ) ¦ (Yi 2 2Y Yi Y 2 ) ¦ Yi 2 nY 2 ¦ Yi 2
i 1 i 1 i 1 n
n n n (¦Yi )(¦ X i )
¦ yi xi ¦ (Yi Y )(X i X ) ¦ (Yi X i YX i XYi XY ) ¦Yi X i nYX ¦Yi X i
i 1 i 1 i 1 n
De las ecuaciones 2.17 y 2.18 se puede concluir que los estimadores de MCO:
Observación
Y i-ésima
(Xi ;Yi)
Yi
FRM:
û i Yˆi Dˆ EˆX i
Yˆi Y
( X , Y ) FRM
Ê
D̂ pendiente
X
Xi X
Gráfico 2.3: Función de Regresión Muestral - FRM
n n
¦ (Yi Dˆ EˆX i ) ¦ uˆ i 0 (2.19)
i 1 i 1
Econometría: Teoría y aplicaciones Juan Pichihua Serna 23
n
¦ uˆ i
i 1
uˆ 0 (2.20)
n
n n
¦ (Yi Dˆ EˆX i )X i ¦ uˆ i X i 0 (2.21)
i 1 i 1
n n n n n
¦ uˆ i xi ¦ uˆ i ( X i X ) ¦ uˆ i X i X ¦ uˆ i ¦ uˆ i X i 0 (2.22)
i 1 i 1 i 1 i 1 i 1
Gastos en 3000
Ventas
Año Publicidad
Y X
1945 2637 1145
1946 2177 1012 2500
1947 1920 836
1948 1910 941 V
1949 1984 981 E 2000
1950 1787 974 N
T
1951 1689 766 A
1952 1866 920 S
1953 1896 964 1500
1954 1684 811
1955 1633 789
1956 1657 802 1000
1957 1569 770 400 600 800 1000 1200
1958 1390 639
1959 1387 644 Gastos Publicidad
1960 1289 564
Suma 28475 13558 Figura 2.1 Ventas vs Gastos en Publicidad
Promedio 1779,6875 847,375
24 Capítulo 2: Modelo de Regresión Lineal Simple
Año y Y Y x X X y2 x2 yx
1945 857,3125 297,6250 734984,7227 88580,6406 255157,6328
1946 397,3125 164,6250 157857,2227 27101,3906 65407,5703
1947 140,3125 -11,3750 19687,5977 129,3906 -1596,0547
1948 130,3125 93,6250 16981,3477 8765,6406 12200,5078
1949 204,3125 133,6250 41743,5977 17855,6406 27301,2578
1950 7,3125 126,6250 53,4727 16033,8906 925,9453
1951 -90,6875 -81,3750 8224,2227 6621,8906 7379,6953
1952 86,3125 72,6250 7449,8477 5274,3906 6268,4453
1953 116,3125 116,6250 13528,5977 13601,3906 13564,9453
1954 -95,6875 -36,3750 9156,0977 1323,1406 3480,6328
1955 -146,6875 -58,3750 21517,2227 3407,6406 8562,8828
1956 -122,6875 -45,3750 15052,2227 2058,8906 5566,9453
1957 -210,6875 -77,3750 44389,2227 5986,8906 16301,9453
1958 -389,6875 -208,3750 151856,3477 43420,1406 81201,1328
1959 -392,6875 -203,3750 154203,4727 41361,3906 79862,8203
1960 -490,6875 -283,3750 240774,2227 80301,3906 139048,5703
Suma 0,0000 0,0000 1637459,4375 361823,7500 720634,8750
Eˆ
¦ y i xi 720634.875
1.99167
¦ xi2 361823.75
Interpretación de resultados:
dY
x Eˆ 1.99167 . Esto significa que por cada mil dólares adicionales de gastos en
dX
publicidad (dX)la empresa obtiene como retorno un incremento en las ventas (dY)
por US$1,991.67, o lo que es lo mismo, por cada dólar de gasto en publicidad
adicional se incrementan las ventas en 1.99 dólares.
Esto significa que las ventas son inelásticas con respecto de los gastos en
publicidad, pues, por cada 1% de incremento en los gastos en publicidad, las ventas
solo aumentan en 0.94%.
'Y H Y , X .'X
a) Propiedades de Ê
n
¦ y i xi ¦ y i xi
i 1
Ê n ¦ k i yi (2.23)
¦x 2
i
¦ xi2
i 1
Donde:
xi
ki donde xi Xi X (2.24)
¦ xi2
Donde k i es una variable no aleatoria con las siguientes características:
1° ¦ ki 0
§ xi · ¦ xi 0
¦ ki ¦ ¨¨ 2
¸¸ 0
© ¦ xi ¹ ¦ xi2 ¦ xi2
1
2° ¦ k i2
¦ xi2
26 Capítulo 2: Modelo de Regresión Lineal Simple
2 2
2 § x · ¦ xi 1
¦ ki ¦ ¨¨ i 2 ¸¸
© ¦ xi ¹ ¦
xi2
2
¦ xi
2
3° ¦ k i xi ¦ ki X i 1 .
§ x · § x · ¦ xi2
¦ k i xi ¦ ki X i ¦ ¨¨ i 2 ¸¸ X i ¦ ¨¨ i 2 ¸¸ xi 1
© ¦ xi ¹ © ¦ xi ¹ ¦ xi2
Ê ¦ k i yi ¦ k i (Yi Y ) ¦ k i Yi Y ¦ k i ¦ k i Yi (2.25)
Eˆ ¦ k i (D EX i u i ) D ¦ k i E ¦ k i X i ¦ k i u i E ¦ ki ui (2.26)
Distribución de Ê :
De la ecuación 2.26: Ê E ¦ ki ui
E[ Eˆ ] E ¦ k i E[u i ] E (2.27)
Varianza de Ê , V ( Eˆ ) :
De la ecuación 2.26: Eˆ E ¦ k i u i Eˆ E ¦ ki ui
Pero,
¦ k i u i 2 ¦ k i2 ui2 ¦ ¦ k i k j u i u j , i z j (2.29)
i j
Luego,
Econometría: Teoría y aplicaciones Juan Pichihua Serna 27
ª º
V ( Eˆ ) E «¦ k i2 u i2 ¦ ¦ k i k j u i u j » ¦ k i2 E >u i2 @ ¦ ¦ k i k j E >u i u j @
¬ i j ¼ i j
§ 1 ·
V ( Eˆ ) ¦ k i2V u2 ¦ ¦ k i k j 0 V u2 ¦ k i2 V u2 ¨¨ ¸
2 ¸
(2.30)
i j © ¦ xi ¹
§ V2 ·
En resumen, Ê a N ¨¨ E , u 2 ¸¸
© ¦ xi ¹
b) Propiedades de D̂
¦ Y §¨ ¦ yx ·¸ ª1 º
Dˆ Y EX X ¦ « X .ki »Yi ¦ wiYi , (2.31)
n ¨© ¦ x 2 ¸¹ ¬n ¼
Donde:
1
wi X .ki (2.32)
n
xi
Siendo k i (ecuación 2.24).
2
¦ xi
Donde wi es una variable no aleatoria con las siguientes características:
a) ¦ wi 1
§ 1 ·
¦ wi ¦ ¨ X .k i ¸ 1 X ¦ k i 1
©n ¹
2 2
1 X ¦ Xi
b) ¦ wi2
n ¦ xi2 n ¦ xi2
2
2 §1 · n ¦ ki 1 X2
¦ wi ¦ ¨ Xk i ¸ 2
2X X 2 ¦ k i2
©n ¹ n n n ¦ xi2
c) ¦ wi X i 0.
§1 · ¦ Xi
¦ wi xi ¦ ¨ Xki ¸ X i X ¦ ki xi X X 0
©n ¹ n
d) ¦ wi xi X
¦ wi xi ¦ wi ( X i X ) ¦ wi X i X ¦ wi 0 X X
Dˆ ¦ wi (D EX i u i ) D ¦ wi E ¦ wi X i ¦ wi u i D ¦ wi u i (2.33)
28 Capítulo 2: Modelo de Regresión Lineal Simple
Distribución de D̂ :
De la ecuación 2.33: D̂ D ¦ wi u i
Varianza de D̂ , V (Dˆ ) :
De la ecuación 2.33: Dˆ D ¦ wi u i Dˆ D ¦ wi u i
E[Dˆ E >Dˆ @ ] E[Dˆ D ] E[¦ wi u i ]
2 2 2
V (D ) (2.35)
Pero,
¦ wi u i 2 2 2
¦ wi u i ¦ ¦ wi w j u i u j , i z j (2.36)
i j
Luego,
ª º
V (Dˆ ) E «¦ wi2 u i2 ¦ ¦ wi w j u i u j » ¦ wi2 E[u i2 ] ¦ ¦ wi w j E[u i u j ]
¬ i j ¼ i j
§ 1 X 2 ·¸
V (Dˆ ) 2 2
¦ wi V u ¦ ¦ wi w j 0 V u2 ¦ wi2 V u2 ¨ (2.37)
¨ 2 ¸
i j © n ¦ xi ¹
§ ª1 X 2 º·
En resumen, D̂ a N ¨D , V u2 « » ¸¸
¨ 2
«¬ n ¦ xi »¼ ¹
©
c) Covarianza Dˆ , Eˆ
Eˆ E ¦ k i u i Eˆ E ¦ ki ui
Dˆ D ¦ wi u i Dˆ D ¦ wi u i (2.39)
Econometría: Teoría y aplicaciones Juan Pichihua Serna 29
Pero,
¦ wi u i ¦ k i u i ¦ wi k i u i2 ¦ ¦ wi k j u i u j , i z j (2.41)
i i j
Luego,
ª º
C (Dˆ , Eˆ ) E «¦ wi k i u i2 ¦ ¦ wi k j u i u j » ¦ wi k i E[u i2 ] ¦ ¦ wi k j E[u i u j ]
¬i i j ¼ i i j
§ X ·
C (Dˆ , Eˆ ) ¦ wi k iV u2 ¦ ¦ wi k j (0) V u2 ¦ wi k i V u2 ¨¨ ¸
2 ¸
(2.42)
i i j i © ¦ x i ¹
Donde:
§ 1· § xi · ¦ xi X ¦ k i xi X
¦ wi k i ¦ ¨ Xk i ¸¨¨ 2
¸
¸ (2.43)
i ©n ¹© ¦ xi ¹ n¦ xi2 ¦ xi2 ¦ xi2
( Eˆ E )¦ X i u i (¦ k i u i ) ¦ X i u i ¦ k i X i ui2 ¦¦ k i X j ui u j i z j (2.49)
i i j
Luego,
E[Dˆ D ¦ u i ] ¦ wi E[u i2 ] ¦ ¦ wi E[ui u j ] V u2 (2.50)
i i j
30 Capítulo 2: Modelo de Regresión Lineal Simple
2
Vˆ u2ˆ
¦ uˆ i2 202.189,8537
(120.1754 ) 2
¦ x =361.823,75. X 847,3750
( n 2) 16 2
ª 2§ 1 X 2 · § ·º
«Vˆ u ¨¨ ¸ Vˆ u2 ¨ X ¸»
¨ ¦ x 2 ¸»
« © n ¦ xi ¸¹
2
§ Dˆ · © i ¹ ª 29563.25 33,82283º
V ¨¨ ˆ ¸¸ « » « 33,82283 0.039915 »
©E ¹ §
« Vˆ u2 ¨ X ¸
· 2§¨ 1 ·¸» ¬ ¼
¨ ¦ x2 ¸
Vˆ u¨ 2¸
«¬ © i ¹ © ¦ xi ¹»¼
e) Teorema de Gauss-Markov
Demostración:
La Varianza de Ê es mínima:
~
Supongamos que existe otro estimador lineal de E , digamos E E ¦ k i u i c , donde
~
c es una constante cualquiera distinta de cero. Si la varianza de E no es menor que la
varianza de Ê , entonces, la varianza de Ê será mínima.
~
E E ¦ kiui c
~
(E E ) 2 (¦ k i u i c) 2 ¦ k i2 u i2 ¦ ¦ k i k j u i u j 2c ¦ k i u i
i j
~
E[ E E ] 2 E[(¦ k i u i c) 2 ] ¦ k i2 E[u i2 ] ¦ ¦ k i k j E[u i u j ] 2c ¦ k i E[u i ]
i j
~ ~ V u2
V (E ) E[ E E ] 2 V u2 ¦ k i2 ¦ ¦ k i k j 0 2c ¦ k i (0)
i j ¦ xi2
~
Por lo tanto: V E V Eˆ . El estimador de E de MCO, Ê , tiene varianza mínima.
32 Capítulo 2: Modelo de Regresión Lineal Simple
La Varianza de D̂ es mínima:
D~ D ¦ wiui c
(D~ D ) 2 (¦ wi u i c) 2 ¦ wi2 u i2 ¦ ¦ wi w j u i u j 2c ¦ wi u i
i j
E[D~ D ] 2 E[¦ wi u i c] 2 2 2
¦ w E[u ] ¦ ¦ wi w j E[u i u j ] 2c ¦ wi E[u i ]
i i
i j
ª1 X2 º
V (D~ ) >
E D~ D
2
@ V u2 ¦ wi2 ¦ ¦ wi w j 0 2c ¦ wi (0) V u2 « 2 »
i j ¬ n ¦ xi ¼
Por lo tanto: V D~ V Dˆ . El estimador de D de MCO, D̂ , tiene varianza mínima.
2.3 VALIDACIÓN
Todo modelo econométrico requiere ser validado en tres niveles: validación económica,
validación estadística y validación empírica.
Otro ejemplo, puede aplicarse a la teoría de la demanda, donde un modelo no podría ser
aceptado como teóricamente válido si la demanda no tienen pendiente negativa con
respecto al precio del bien.
a) Bondad de Ajuste:
SCExp
R2 (2.56)
SCT
Donde:
SCExp : Suma de cuadrados explicada por la regresión
SCT : Suma de cuadrados totales
Yi Yˆi uˆ i (2.57)
¦ Yi Y
2 2 2 2
¦y i ¦ Yi nY (2.58)
i
Yi Y Yˆ Y uˆ
i i
¦ Yi Y ¦ >Yˆ Y uˆ @ , o también
2 2
i i
¦ > yˆ i uˆi @
2
¦ yi2 ¦ yˆ i2 ¦ uˆ i2 2¦ uˆ i yˆ i
Luego,
¦ yi2 ¦ yˆ i2 ¦ uˆ i2 (2.59)
¦ yˆ i
2
¦ Yˆi Y 2
¦ Dˆ EˆX i Dˆ EˆX 2 Eˆ 2 ¦ xi2 Eˆ ¦ xi y i (2.61)
i
De la ecuación 2.23: Eˆ
¦ xi y i
¦ xi2
SCExp SC Re s
R2 1 ; 0 d R2 d 1 (2.63)
SCT SCT
R 2 En el ejemplo 2.1
§ ¦ yx ·§ ¦ yx · § ·
rY , X rX ,Y
¦ yx
¨ ¸¨ ¸ Eˆ ¨ ¦ yx ¸ R 2 0.9362
¨ ¦ x 2 ¸¨ ¦ y 2 ¸
¦ y2 ¦ x2 ¨ ¦ y2 ¸
© ¹© ¹ © ¹
Mide el grado de asociación lineal entre las variables X e Y. 1 d r d 1 . En el ejemplo
1, un r=+0.93 significa una alta asociación lineal directa entre Y y X.
Econometría: Teoría y aplicaciones Juan Pichihua Serna 35
b) Prueba de hipótesis:
Si se sustituye Yi Wi W ; Xi Zi Z ; y ui vi vi
Yi EX i ui
Y
E >Yi X i @ EX i u i
Yi
Eˆ
¦ X i Yi
¦ Xi
2
X
0
Gráfico 2.4 La línea de regresión pasa por el origen
Note que Y y X tienen media cero, por lo tanto, la línea de regresión pasa por el origen.
Por ejemplo, si corremos un modelo de tasa de interés activa efectiva mensual que
cobra el sistema bancario a sus clientes (TIA) contra la tasa de inflación mensual (INF)
notaremos que ambas variables en los últimos años se muestran como variables
estacionarias con respecto a sus promedios; por lo tanto, podemos expresarlas en
términos de desviación con respecto a su media y correr el modelo sin intercepto:
Yi
E >Yi X i @ D u i
D E >Yi X i @
D̂ Y
^ 0
X
INFLACION t S u t .
Donde Sˆ será igual al promedio de la inflación observada, porque û =0.
2
SCExp / 1 Eˆ 2 ¦ xi2 Eˆ 2 ¦ xi2 Eˆ 2 Eˆ 2 § Eˆ ·
FEˆ ¨ ¸ t E2ˆ
¨ S ( Eˆ ) ¸
SC Re s ¦ yi2 Eˆ 2 ¦ xi2 Vˆ u2 Vˆ u2 V ( Eˆ ) © ¹
n2 n2 ¦ xi2
En ambos casos, el FÊ debe ser comparado con el F con 1 y n-2 grados de libertad.
FÊ a F1,n 2 gl
38 Capítulo 2: Modelo de Regresión Lineal Simple
Note que el estadístico t para el intercepto (variable C) es menor que 2, esto implica que
se acepta la hipótesis nula que el intercepto no es estadísticamente distinto de cero. En
cambio, el estimador de E asociado a la variable explicativa GAST_PUBLICIDAD
tiene un t=9.96, o sea mayor que 2, lo que rechaza la hipótesis nula que E 0 . En otras
palabras, los gastos en publicidad si ayudan a explicar las variaciones de las ventas. El
estadístico F=99.38 es mayor que F1,14gl 4.6 , lo que rechaza la hipótesis nula que
E 0.
Un intervalo de confianza para una variable aleatoria se define como los límites
[Tˆ1 ;Tˆ2 ] que tienen una probabilidad de 1 O de contener al verdadero parámetro T ,
donde O es el nivel de significación o probabilidad de rechazar una hipótesis verdadera.
Se interpreta como que el intervalo [Tˆ1 ;Tˆ2 ] tiene una probabilidad de 1 O * 100 de
contener al verdadero parámetro T . Si O 0.05 , estaremos hablando de un intervalo
que tiene el 95% de confianza. El t O se obtiene con n-2 grados de libertad.
2
IC ª Eˆ t O * S ( Eˆ ) d E d Eˆ t O * S ( Eˆ )º 1 O (2.67)
«¬ 2 2 »¼
ª 2 n 2 Vˆ u2ˆ º
IC « F 1O d 2
d F O2 » 1 O (2.68)
¬ 2 Vu 2
¼
ª Vˆ 2 n 2Vˆ u2 º»
« n 2 u 2
IC dVu d 1 O (2.68)
« F O2 F 12O »
¬ 2 2 ¼
El intervalo > 251.8;435.8@ tiene una probabilidad del 95% de contener al verdadero D
a) Predicción Media
Como no se conoce por dónde puede estar pasando la función de regresión verdadera, a
partir de la función de regresión muestral estimada se construye un área que tenga una
alta confianza de contener a la verdadera regresión.
Pero, los estimadores de la Función de Regresión Muestral (FRM): Yˆi Dˆ EˆX i tienen
la siguiente distribución:
§ 2 ª1 X 2 º ·¸ § V u2 · V u2 X
¨
D̂ a N ¨D ; V u « ; ¨
Ê a N ¨D ; ¸ y C (D , E ) .
2 »¸ 2 ¸
© ¬ n ¦ xi ¼ ¹ © ¦ xi ¹ ¦ xi2
u i a N 0; V u2 ; E >ui ui rs @ 0 ; Yi a N D EX i ;V u2
¿Cuál es la distribución de la Función de Regresión Muestral, Yˆi Dˆ EˆX i ?
ª1 X 2 º V u2 X i2 V u2 X i X ª 1 X 2 X i2 2 X i X º
>@
V Yˆi V u2 « 2 »
2
V u2 « »
¬ n ¦ xi ¼ ¦ xi ¦ xi2 ¬n ¦ xi2 ¼
ª 1 X i X 2 º
>@
V Yˆi 2
V «
u » S Y2ˆ (2.70)
¬« n ¦ xi2 ¼» i
ª 1 X X 2 º
Donde: S (Yˆi ) V [Yˆi ] V u « i 2 » y t O con n-2 grados de libertad.
¬« n ¦ x i ¼» 2
b) Predicción Punto
Yp D EX p u p
Yˆp Dˆ EˆX p
uˆ p Y p Yˆp (D Dˆ ) ( E Eˆ ). X p u p
ª 1 X p X 2 º
> @
V uˆ p 2
V «1
u
» S uˆ2p (2.73)
«¬ n ¦ xi2 »¼
Intervalo de confianza para el Y p :
Donde: S uˆ p . V [uˆ p ] Vu
ª 1 X X
«1 p 2
2
º
» y tO con n-2 grados de libertad.
« n ¦ xi » 2
¬ ¼
PREDICCIÓN MEDIA
PREDICCION INDIVIDUAL
2,400
2,400
LIMITE
LIMITE Y
SUPERIOR Estimad SUPERIOR
o
Y
LIMITE ESTIMADO
INFERIOR
VENTAS
VENTAS
1,800 1,800
LIMITE
INFERIOR
1,200 1,200
600 850 1,100
600 850 1,100
GASTOS EN PUBLICIDAD
GASTOS EN PUBLICIDAD
Los errores estándar para la predicción individual y predicción media han sido
calculadas para todos los valores observados para la variable X, gastos en publicidad.
La media de X y la suma de cuadrados de X son las mismas que las utilizadas en los
ejemplos anteriores. De igual modo, la varianza del error es la misma que la utilizada
anteriormente.
2
¦ uˆi
2
¦ x =361.823,75. X 847,3750 Vˆ u2ˆ (120.1754 ) 2
( n 2)
Note que el intervalo de confianza en la predicción individual es mayor que el intervalo
de confianza de la predicción media.
§1·
¨ ¸¦ Yˆt Yt
2
©m¹
U Theil (2.75)
§ 1 · ˆ2 §1·
¨ ¸¦ Yt ¨ ¸¦ Yt
2
©m¹ ©m¹
El valor del coeficiente U está comprendido entre 0 y 1, excepto en el caso de que tanto
las predicciones como los valores reales, sean todos cero, en este caso el coeficiente U
será indeterminado.
Econometría: Teoría y aplicaciones Juan Pichihua Serna 43
a) U=0 (error cero) si los valores predichos coinciden con los valores observados.
b) U=1 (100% de error), la predicción es totalmente errónea. Este caso puede ocurrir
en tres casos:
x Predicción nula para valores observadas distintas de cero.
x Predicciones no nulas para valores observados iguales a cero.
x Que las predicciones se equivoquen sistemáticamente de capturar los quiebres o
cambios de rumbo.
Otras tres medidas del error promedio del pronóstico comúnmente utilizados son:
El error cuadrático medio (ECM): mide la varianza promedio del error de pronóstico.
§1·
ECM ¨ ¸¦ Yˆt Yt
2
(2.76)
©m¹
La raíz del error cuadrático médio (RECM): mide una la desviación promedio del error.
RECM
§1· ˆ
¨ ¸¦ Yt Yt 2 (2.77)
©m¹
U M U S UC 1 (2.80)
Proporción del error explicado por el sesgo: Mide el porcentaje del error de pronóstico
que es explicado por la no captación de la media o tendencia de largo plazo.
(Yˆ Y ) 2
UM (2.81)
§1·
¨ ¸¦ (Yˆt Yt )
2
©m¹
Proporción del error explicado por la varianza: Mide el porcentaje del error de
pronóstico que se produce por no captar los cambios de tendencia (“quiebres” de corto
plazo).
44 Capítulo 2: Modelo de Regresión Lineal Simple
S Yˆ S Y
US (2.82)
§1·
¨ ¸¦ (Yˆt Yt )
2
©m¹
Proporción del error de Covarianza: Mide el porcentaje del error de pronóstico que no
es explicado por los errores de sesgo o los errores de varianza, sino producto de la
covariación y que no es explicado por ninguno de los ratios anteriores, esto implica que
es explicado por factores puramente aleatorios.
2(1 r ) S Yˆ .S Y
UC (2.83)
§1·
¨ ¸¦ (Yˆt Yt )
2
©m¹
Actual: SALES
Forecast sample: 1 16 2400
Included observations: 16
Root Mean Squared Error 112.4138 2000
Mean Absolute Error 84.96578
Mean Absolute Percentage Error 4.510589
1600
Theil Inequality Coefficient 0.031114
Bias Proportion 0.000000
Variance Proportion 0.032936 1200
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Covariance Proportion 0.967064
VENTAS (OBSERVADA) VENTAS (PREDICCION)
Según el U-Theil el modelo tiene un error promedio de 0.031, es decir, 3.1% de error
entre el valor predicho y el valor observado.
1 2
ui
1 2V u2
f (u i ) e (2.85)
2SV u2
§ 1 ·
n ¨ 2 ¸ ¦ Yi D EX i 2
f (u ) L(D , E , V u2 Yi , X i )
2SV u2 2
¨ 2V
e© u
¸
¹ (2.87)
§ 1 ·
§n·
l (D , E , V u2 ) ¨
© 2 ¹
§n·
© 2¹
2
¨ ¸
¸ log2S ¨ ¸ log V u ¨ 2 ¸¦ Yi D EX i
2
(2.88)
© 2V u ¹
wl (.) 2 ~
wD 2V~u2
¦ Y i
D~ E X i 1 0 (2.89)
wl (.) 2 ~
wE ~ 2
¦ Yi D~ E X i X i 0 (2.90)
2V
wl (.) § n · § 1 ·
¨ ¸¨ ¸¦ Yi D~ E~X i
2 0 (2.91)
wV 2 ¨ 2V~ 2 ¸ ¨ 2V~ 4 ¸
© u ¹ © u ¹
~
D~ Y EX (2.92)
46 Capítulo 2: Modelo de Regresión Lineal Simple
~ ¦ Yi Y X i X ¦ yi xi
E (2.93)
¦ X i X
2 2
¦ xi
~
V~ 2
¦ Yi D~ E X i 2 (2.94)
u
n
ª ¦ u~i2 º ~2
§ n 2 · ª ¦ ui º
> @
E V~ 2 u E« » ¨ ¸.E « »
© n ¹ «¬ n 2 »¼
§ 2 · 2 ~2
¨1 ¸V u , V u es sesgado (2.96)
«¬ n »¼ © n¹
ª w 2 l (.) º
Sea J ' >D @
E V 2 , La matriz de información es: I J E « ».
«¬ wJwJ ' »¼
Donde:
ª 2 º
« w l (.) 2 w 2 l (.) w 2 l (.) »
« wD wDwE wDwV u2 »
2 « w l (.)
2 2 »
w l (.) w l (.) w 2 l (.) (2.98)
« wEwD 2»
wJwJ ' « wE 2 wEwV u »
2
«w l (.) w 2 l (.) 2
w l (.) »
« »
¬
wV u2 wD wV u2 wE 2
w V u2 ¼
I 1 J~ ¦ J~ (2.98)
Econometría: Teoría y aplicaciones Juan Pichihua Serna 47
Luego,
w 2 l (.) n ª w 2 l (.) º n
E« » (2.99)
wD 2 V u2 «¬ wD 2 »¼ V u2
w 2 l (.) 1 ª w 2 l (.) º 1
¦ Xi E« » ¦ Xi (2.100)
wDwE V u2 «¬ wDwE »¼ V u2
w 2 l (.) 1 ª w 2 l (.) º 1
¦ ui E« » ¦ E >u i @ 0 (2.101)
wDwV u2 V u4 2
«¬ wDwV u »¼ V u4
w 2 l (.) 1 2
ª w 2 l (.) º 1 2
2
¦ Xi E« » ¦ Xi (2.102)
wE V u2 «¬ wE »¼
2
V u2
w 2 l (.) 1 ª w 2 l (.) º 1
wEwV u2 V 4 ¦ X i ui E« 2 »
V u4
¦ X E>u @ i i 0 (2.103)
u ¬ wEwV u ¼
wl (.) n 2V u2 2
ª wl (.) º n n n
¦ u i E « » (2.104)
w V u2
2
2V u4 2V u8
2
«¬ w V u2 »¼ 2V 4
u V 4
u 2V u4
ª §1 X 2 · XV u2 º
«V u2 ¨ ¸ 0 »
« ¨© n ¦ x i2 ¸
¹ ¦ xi
2
»
« »
XV u2 V u2
¦ J~ I 1 J~ « 0 » (2.106)
« ¦ xi
2 2
¦ xi »
« »
« 2V u4 »
« 0 0
n »
¬ ¼
§ 1 ·
~ §n·
l (D~, E , V~u2 ) ¨
§n·
~
¸ log2S ¨ ¸ log V~u ¨ ~ 2 ¸¦ Yi D~ EX i
© 2 ¹ © 2¹
2
¨ 2V ¸
2 (2.107)
© u¹
ª L(J~ ) º
RV 2 log« ~ R » 2>log L(J~R ) log L(J~NR )@ 2>l (J~R ) l (J~NR )@ (2.108)
¬ L(J NR ) ¼
Donde:
RV a F 2 con 1 grado de libertad (2.110)
§ 1 ·
§n·
l (J~R ) ¨
© 2 ¹
¸ log2S
§n·
¨ ¸
© 2¹
log ~
V 2
u, R ¨
¨ ~ 2
¸¦ Y D~ 2
¸ i R (2.111)
© 2V u, R ¹
§ 1 ·
§n· §n·
l (J~NR) ¨ ¸ log2S ¨ ¸ log V~u2, NR ¨ 2 ¸¦ Yi D~NR E NR Xi
© 2 ¹ © 2¹ ¨ ~ ¸
~
2 (2.112)
© 2V u, NR ¹
Seguido al comando @PARAM se debe escribir los valores iniciales de los tres
parámetros que serán estimados el intercepto, c(1), la pendiente c(2) y la varianza c(3).
En el ejemplo toman respectivamente los valores 100, 1 y 120.
Luego se define las ecuaciones para el residuo (RES), la varianza del error (VAR) y de
la función de log verosimilitud (log likelihood).
Los resultados de la estimación son:
2
¦ ui
La varianza del error estimada es: V~u2 12636.63
n
La matriz de varianzas y covarianzas de los estimadores, es decir, la inversa de la matriz
de información es:
ª V (D~ ) ~
C (D~, E ) C (D~,V~u2 ) º ª 49275.17 - 49.47468 1812.246 º
« ~ ~ ~ ~ » «- 49.47468 0.050512 1.942629»
ˆ~
¦J « C (D , E ) V (E ) C ( E ,V~u2 )» « »
«C (D~,V~ 2 ) C ( E~,V~ 2 ) V (V~ 2 ) » «¬ 1812.246 1.942629 374.9144 »¼
¬ u u u ¼
Efecto
Nombre del Elasticidad
Forma Funcional Marginal
Modelo (dY/dX)(X/Y)
(dY/dX)
X
Lineal Y E1 E 2 X E2 E2
Y
Lineal-Log o E2 E2
Y E 1 E 2 ln X
Semilogarítmica X Y
E E
Reciproca Y E 1 E 2 (1 / X ) 22 2
X XY
Cuadrática (E 2 2E 3 X ) X
Y E1 E 2 X E 3 X 2 E 2 2E 3 X
o Polinómica Y
Términos de (E 2 E 3 Z ) X
Y E 1 E 2 X E 3 XZ E 2 E3Z
Interacción Y
Log-Lineal ln Y E1 E 2 X E 2Y E2 X
E 2Y
Log-Log ln Y E 1 E 2 ln X E2
X
ª Y º
Logística ln « E1 E 2 X E 2Y (1 Y ) E 2 X (1 Y )
¬1 Y »¼
O 1 O
Y O 1 X O 1 §X· §X·
Box-Cox E1 E 2 E2¨ ¸ E2¨ ¸
O O ©Y ¹ ©Y ¹
Econometría: Teoría y aplicaciones Juan Pichihua Serna 51
Modelo: Y E1 E 2 X
Estimación: IMP t 100 0.12 PBI t
Donde:
IMP = Recaudación Tributaria (Millones de Nuevos Soles)
PBI = Producto Bruto Interno (en Millones de Nuevos Soles)
Interpretación: La pendiente 0.12 implica que por cada 1.00 Millón de Nuevos Soles de
crecimiento del PBI, la recaudación tributaria aumenta en 120.00 Mil Nuevos Soles. Si
bien el intercepto no tiene significado práctico, se puede asumir que si el PBI fuera cero,
el Gobierno tendría que pagar a las familias un total de 100.00 Millones de Nuevos
Soles.
Modelo: ln Y E 1 E 2 ln X
Estimación: ln Q 3.96 0.25 ln P
Donde:
Q = Cantidad demandada del bien (miles de TM)
P = Precio del bien (en Nuevos Soles/TM)
ln Yt ln Y0 t ln(1 r )
ln Yt E1 E 2t , Donde E 1 lnY0 y E 2 ln(1 r )
Modelo: ln Y E1 E 2 X . Donde X t.
Estimación: ln PBI 12.007 0.025t
Donde:
PBI = Producto Bruto Interno (Miles de Millones de Dólares)
t = Tendencia en años (t=1,2,3,4,5,...)
Modelo: Y E 1 E 2 ln X
Estimación: PBI t 1600.9 25000.3 ln M ts
Donde:
PBI = Producto Bruto Interno (en Millones de Dólares)
M ts = Oferta de dinero (en Millones de Dólares)
Modelo: Y E 1 E 2 (1 / X )
Estimación: wˆ t 0.2594 20.588(1 / u t )
Donde:
w = tasa de variación de los salarios (variación porcentual, %)
u = tasa de desempleo (puntos porcentuales, %), u > 0%.
Segundo, estimar los parámetros para cada una de las M muestras repetidas
Para cada una de las M muestras de Yi se estima los parámetros del modelo
Yi D EX i u i , con lo cual se obtiene M valores estimados para cada uno de los
parámetros del modelo estimado, es decir:
Muestra 1: Yˆi Dˆ 1 Eˆ1 * X i
Muestra 2: Yˆ Dˆ Eˆ * X
i 2 2 i
.................... ...........................................
Muestra 1000: Yˆi Dˆ1000 Eˆ1000 * X i
Yi 90 2.0 * X i u i
con ui a N E >u i @ 0;V (u i ) 1202
Observaciones Xi
ui a N 0 ; 120 2 Yi 90 2.0 * X i u i
Valores Generados Valores Simulados
1 1145.000 -23.82080 2356.179
2 1012.000 193.1447 2307.145
3 836.0000 295.0739 2057.074
4 941.0000 87.63353 2059.634
5 981.0000 -27.23107 2024.769
6 974.0000 174.7764 2212.776
7 766.0000 19.08756 1641.088
8 920.0000 -14.97879 1915.021
9 964.0000 91.65000 2109.650
10 811.0000 316.3728 2028.373
11 789.0000 -68.12605 1599.874
12 802.0000 -79.57788 1614.422
13 770.0000 -183.6113 1446.389
14 639.0000 -25.70109 1342.299
15 644.0000 -104.0117 1273.988
16 564.0000 -51.34722 1166.653
A partir de los valores de las X y los valores simulados para Y se puede estimar los
parámetros del modelo. El resultado de la estimación por mínimos cuadrados ordinarios
en la primera muestra es:
Yi 124.16 2.29 * X i u i
Yi 90 2.0 * X i u i
x Estimar los parámetros ALFA y BETA a partir de cada una de las 1000 muestras.
Econometría: Teoría y aplicaciones Juan Pichihua Serna 55
Distribución de ALFA
120
Series: ALFA
Sample 1 1000
100 Observations 1000
80 Mean 99.11782
Median 97.46518
Maximum 624.0527
60
Minimum -443.7235
Std. Dev. 174.1394
40 Skewness 0.066706
Kurtosis 2.993092
20
Jarque-Bera 0.743613
Probability 0.689488
0
-400 -200 0 200 400 600
Distribución de BETA
120
Series: BETA
Sample 1 1000
100 Observations 1000
80 Mean 1.989910
Median 1.994456
Maximum 2.661807
60
Minimum 1.360806
Std. Dev. 0.203657
40 Skewness -0.094569
Kurtosis 3.115176
20
Jarque-Bera 2.043279
Probability 0.360004
0
1.4 1.6 1.8 2.0 2.2 2.4 2.6
56 Capítulo 2: Modelo de Regresión Lineal Simple
Conclusiones:
Intercepto D Pendiente E
Parámetros verdaderos D =90.00 E =2.00
Estimadores (promedio) D̂ =99.11 Ê =1.99
Diferencia (%) 10% -0.5%
2. Los estimadores de mínimos cuadrados son insesgados. Bajo las hipótesis nulas
que D =90 y E =2 no hay evidencias para rechazarlas a partir de los estimadores de
los parámetros. Los estadísticos t-calculados son bastante “pequeños” que no
superan a los valores t-críticos para un nivel de significación del 5% y 14 grados de
libertad. En ambos casos para rechazar las hipótesis nulas se requieren de niveles de
significación (errores tipo I) superiores al 50% ó 0.5. Por lo tanto, se acepta la
hipótesis nula que no hay diferencia estadística entre los estimadores y los
verdaderos parámetros, es decir, los estimadores mínimos cuadrados ordinarios D̂ y
Ê son estimadores insesgados de los verdaderos parámetros D y E .
Intercepto D Pendiente E
Hipótesis Nula Ho: D =90.00 Ho: E =2.00
Estimadores (promedio) D̂ =99.11 Ê =1.99
Error Estándar sD̂ =174.13 s Ê =0.20
99.11 - 90 1.99 2
Estadístico t tDˆ 0.05 t Eˆ 0.005
174.13 0.20
t-crítico (5%) 1.761 -1.761
Nivel de significación 0.51 0.50
Intercepto D Pendiente E
Sesgo 0.06 -0.09
Kurtosis 2.99 3.11
Jarque-Bera 0.74 2.04
Nivel de significación 0.68 0.36
Econometría: Teoría y aplicaciones Juan Pichihua Serna 57
Bootstrap
1° Estime por MCO el modelo de regresión: Yˆi Eˆ1 Eˆ 2 X i y obtenga los residuos de
la regresión, uˆ Y Eˆ Eˆ X .
i i 1 2 i
Resultados esperados:
Obs 1 2 3 4 5 6 7 8
Yi 2637 2177 1920 1910 1984 1787 1689 1866
Obs 9 10 11 12 13 14 15 16
Yi 1896 1684 1633 1657 1569 1390 1387 1289
58 Capítulo 2: Modelo de Regresión Lineal Simple
APLICACIONES:
5,0
TASA DE CRECIMIENTO DEL EMPLEO
ITALIA
4,0
ALEMANIA
3,0
OCCIDENTAL
DINAMARCA
CANADA
AUSTRIA
2,0
FRANCIA HOLANDA
BELGICA
1,0 ESTADOS
UNIDOS
NORUEGA
INGLATERRA
-
1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0
TASA DE CRECIMIENTO DE LA PRODUCTIVIDAD
Econometría: Teoría y aplicaciones Juan Pichihua Serna 59
Según esto en los países de la OECD por cada punto porcentual de incremento en el PBI
el empleo crece en 0.4897 puntos porcentuales, de modo que si la PEA de dichos países
crece a un ritmo del 0.6% anual requerirán que el producto crezca a un ritmo promedio
de 2.35% anual, 0.6 = -0.5458912762 + 0.4897370336*PBI, entonces PBI = 2.35%.
PROBLEMAS:
Por otro lado, cambios en el origen, sucede cuando una variable se “desplaza”
paralelamente (aumenta o disminuye una cantidad fija). Esto provoca que el promedio
de las variables se desplacen en la misma magnitud que se desplazó cada observación.
Un caso de estos es cuando a las variables se las expresa en desviaciones con respecto a
sus medias.
Solucionario:
Eˆ1 ¦ wy ¦ axy a ¦ xy 1 ˆ
E
¦ w2 ¦ a2x2 a2 ¦ x2 a
Y
§1 ·
Dˆ 1 Y Eˆ1W Y ¨ Eˆ ¸.aX Y EˆX Dˆ
©a ¹
1 ˆ ª1 º 1
Si Eˆ1 E , entonces, la V ( Eˆ1 ) V « Eˆ » V ( Eˆ ) . O también:
2 ¬a ¼ a2
V u2 V u2 V u2 1
V ( Eˆ1 ) V ( Eˆ )
¦ w2 ¦ a2x2 a ¦x
2 2
a 2
2 ª1 W2 º ª1 a2 X 2 º ª1 X2 º
V (D 1 ) V u «
ˆ 2 »
2
V « 2
u 2 »
2
V «
u 2 »
V (Dˆ )
¬n ¦ w ¼ ¬n a ¦ x ¼ ¬n ¦ x ¼
§1 ·
Yˆ Dˆ 1 Eˆ1W Dˆ ¨ Eˆ ¸.aX Dˆ EˆX Yˆ .
©a ¹
§1 ˆ·
¨ E ¸¦ ax y
Eˆ1 ¦ yw ©a ¹ Eˆ ¦ yx SCExp
R12 R2 .
¦ y2 ¦ y2 ¦ y2 SCT
¦ wy ¦ xy
Eˆ1 2 2
Eˆ
¦w ¦x
Y
Dˆ1 Y Eˆ1W Y Eˆ a X Y EˆX aEˆ Dˆ aEˆ
V u2 V u2
V ( Eˆ1 ) 2 2
V ( Eˆ )
¦w ¦x
V (Dˆ1 )
ª1
V u2 «
X 2 º V u2
2 a
V u2 X ª
V u2 «
1
a X º
2
»
2»
«¬ n ¦ x »¼ ¦ x «¬ n
2 2 2
¦x ¦x »¼
O también:
2ª1
V (D1 ) V u «
ˆ
W2 º
V u2 «
ª
1
a X º
2
»
2»
¬« n ¦ w ¼» «¬ n
2
¦x »¼
Eˆ1 ¦ yw Eˆ ¦ xy SCExp
R12 R2 .
¦y
2
¦y
2 SCT
Cambios en la escala de Y: Z bY . Zi D 2 E 2 X i Ki vs Yi D EX i ui
¦ zx ¦ by x b ¦ xy
Eˆ2 2 2 2
bEˆ
¦x ¦x ¦x
Y
Dˆ 2 Z Eˆ2 X
bY bEˆ . X
b Y EˆX bDˆ
ª1 X2 º
De igual modo, si Dˆ 2 bDˆ , entonces, V (Dˆ 2 ) b 2V (Dˆ ) b 2V u2 « 2 »
.
¬n ¦ x ¼
Zˆ Dˆ 2 Eˆ 2 X bDˆ bEˆX
b Dˆ EˆX bYˆ .
Eˆ 2 ¦ zx ¦ b y x b¦ x ¦ yx
¦ yx Eˆ
¦ x2 ¦ x2 ¦ x2 ¦ x2 ¦ x2
Y
Dˆ 2 Z Eˆ 2 X b Y EˆX Y EˆX b Dˆ b
V u2
Si Eˆ 2 Eˆ , entonces, la V ( Eˆ 2 ) V ( Eˆ ) .
¦ x2
ª1 X 2 º
De igual modo, si Dˆ 2 Dˆ b , entonces, V (Dˆ 2 ) V (Dˆ b) V (Dˆ ) V u2 « 2»
.
«¬ n ¦ x »¼
Zˆ Dˆ 2 Eˆ2 X b Dˆ EˆX
b Dˆ EˆX Yˆ b .
Cambios en Y y X simultáneamente:
¦ zw ¦ abyx § b · ¦ xy b ˆ
Eˆ3 ¨ ¸ E.
¦z
2 2 2
¦a x © a ¹ ¦ x2 a
Para responder las otras preguntas seguir los pasos desarrollados en los otros casos.
Problema 3: Un investigador tiene una muestra de datos de corte transversal para los
salarios agregados, W, ganancias agregadas, P, y el ingreso nacional agregado Y de n
países. Donde: Y W P .
Wˆ Dˆ1 Eˆ1Y
Pˆ Dˆ 2 Eˆ2Y
Problema 4: Un investigador hipotetiza que los años de escolaridad, AESC, puede estar
relacionado al número de hermanos del individuo, HNOS, de acuerdo a la siguiente
regresión:
AESCi D EHNOSi ui
CAPITULO 3:
MODELO DE
REGRESION LINEAL GENERAL
3.1 Especificación 68
3.2 Supuestos en el Modelo de Regresión Clásico: 69
3.3 Problemas Frente a los Supuestos del Modelo de Regresión Clásico 69
3.3.1 Especificación Incorrecta del Modelo de Regresión 69
3.3.2 Errores No Normales y Errores No Esféricos 70
3.3.3 Problemas con las Variables Explicativas 70
3.3.4 Inestabilidad de Parámetros 70
3.4 Estimación por Mínimos Cuadrados Ordinarios (MCO) 71
3.4.1 Mínimos Cuadrados Ordinarios 71
3.4.2 Propiedades de los Estimadores de MCO 72
3.4.3 Estimador de la Varianza de la Regresión Vˆ 2 74
3.4.4 Bondad de Ajuste 75
a) El Coeficiente de Determinación, R 2 75
b) R 2 Ajustado 76
3.5 Estimación por Máxima Verosimilitud (MV) 80
3.5.1 Máxima Verosimilitud 80
3.5.2 Propiedades de los Estimadores de MV 82
3.5.3 Matriz de Varianzas y Covarianzas de los Estimadores de MV 83
3.5.4 Bondad de Ajuste 84
3.6 Estimación por Mínimos Cuadrados Restringidos (MCR) 86
3.6.1 Mínimos Cuadrados Restringidos 86
3.6.2 Propiedades de los Estimadores de MCR 88
3.6.3 Bondad de Ajuste, el Coeficiente de Determinación R 2 89
3.7 Pruebas de Hipótesis 92
3.7.1 Test de Wald 92
3.7.2 Test de Especificación, Test de Ratio de Verosimilitud 99
3.7.3 Test de Modelos No Anidados (Non Nested Test) 102
3.7.4 Test de Cambio Estructural (Test de Chow) 105
3.8 Variables Dummy 109
3.9 Aplicaciones y Problemas 115
68 Capítulo 3: Modelo de Regresión Lineal General
Yi E1 E 2 X 2i E 3 X 3i ....... E k X ki ui (3.1)
Si E[ui ] 0 , entonces:
wE[Yi ]
E j j 2,3,...., k (3.3)
wX j
Y XE U (3.4)
Donde:
ªY1 º ª 1 X 21 X 31 ... X k 1 º ª E1 º ª u1 º
«Y » «1 X X 32 ... X k 2 »» «E » «u »
Y « 2» ; X « 22
; E « 2» ; y U « 2»
«....» «... ... ... ... ... » « ... » «....»
« » « » « » « »
¬Yn ¼ nx1 ¬ 1 X 2n X 3n ... X kn ¼ nxk ¬ E K ¼ kx1 ¬u n ¼ nx1
ECONOMETRIA, TEORIA Y APLICACIONES Juan Pichihua Serna 69
El supuesto 1 señala que la forma funcional del modelo de regresión es la lineal, o sea:
E >Yi X @ E1 E 2 X 2i E 3 X 3i ....... E k X ki
(1) Yi E1 E 2 X 2i E 3 X 3i ui
(2) Yi J 1 J 2 X 2i J 3 X 3i J 4 X 22i J 5 X 32i J 6 X 2i X 3i vi
Los supuestos 2.1 al 2.4 implican que el vector de errores U a NID 0; V u2 I n
La violación del supuesto 2.1, que ui se distribuye como una normal, no tiene
consecuencias graves para los estimadores de los parámetros, pues, por el Teorema
Central del Límite, los estimadores, al ser promedios, tienden a distribuirse como una
normal, sea cual fuera la distribución de origen del error, ui . Mediante el test de
normalidad de Jarque-Bera probaremos si los residuos siguen una distribución normal.
Si el E >u i @ z 0 , pero constante, afectará únicamente al intercepto del modelo, pero las
propiedades de las pendientes quedarán intactas. En el caso de los estimadores de
mínimos cuadrados ordinarios las pendientes seguirán siendo MELI, aunque el
intercepto deje de serlo.
De acuerdo a los supuestos del 3.1 al 3.3 las variables explicativas, X, son variables
independientes del error e independientes entre si, pero además al tener varianza finita
significaría que son variables estacionarias. Sin embargo, si las variables X están
correlacionadas con el error, E[ X ' U ] z 0 , los mínimos cuadrados ordinarios produciría
estimadores sesgados e inconsistentes.
De igual modo, si las variables explicativas no fueran independientes entre si, sino que
alguna de ellas pudiera obtenerse como combinación lineal del resto, estaríamos frente a
un problema de multicolinealidad, que si bien no afecta la propiedad MELI de los
estimadores, si aumenta la varianza y por lo tanto hace más imprecisa la estimación de
los parámetros.
Cuando se trabaja con series de tiempo, algunas variables pueden ser variables no
estacionarias, lo que produciría pérdida en la eficiencia de los estimadores.
Sea el error
U Y XE (3.5)
Minimizando U’U:
wU ' U
2 X ' Y 2 X ' XE (3.7)
wE
wU ' U
2 X ' Y 2 X ' XEˆ 0.
wE
Donde:
ª Eˆ1 º
«ˆ »
E
E « 2»
ˆ (3.10)
« ... »
« »
«¬ Eˆk »¼
Además, si U a N , por la ecuación 3.12 se puede concluir que Ê también sigue una
distribución normal, Ê a N . Por lo tanto, la media y la varianza de Ê son:
Media de Ê , E[Eˆ ] :
E[ Eˆ ] E (3.14)
ECONOMETRIA, TEORIA Y APLICACIONES Juan Pichihua Serna 73
Varianza de Ê , V (Eˆ )
Ê a N ( E ; V u2 ( X ' X ) 1 )
Por el Teorema de Gauss – Markov, los estimadores de E de MCO, por ser lineales e
insesgados, son los Mejores Estimadores (MELI), esto es, tienen la varianza más
pequeña entre todos los estimadores lineales e insesgados de E .
(1) Eˆ * W *Y
> @
(4) E Eˆ * E
Dado que CC’ es una matriz semidefinida positiva, entonces, la varianza de Ê * será
mayor que la varianza de Ê estimada por mínimos cuadrados ordinarios:
(8) V ( Eˆ *) ! V ( Eˆ ) .
Por lo tanto, el estimador de E de MCO, Ê , tiene la varianza mínima,, entre todos los
estimadores lineales e insesgados.
Yˆ XÊ (3.20)
1
M es simétrica si M=M’. M es idempotente si M=M’M=MM’. M es semidefinida positiva si para
cualquier vector V no nulo, se cumple que V ' MV t 0 .
ECONOMETRIA, TEORIA Y APLICACIONES Juan Pichihua Serna 75
En este caso el valor esperado del producto de matrices es el esperado de la traza debido
a que U’MU es un escalar:
E[Uˆ 'Uˆ ] E[tr (UU ' M )] tr ( E[UU ' ]M ) V u2 .tr ( M ) V u2 .tr[ I n X ( X ' X ) 1 X ' ]
E[Uˆ 'Uˆ ] V u2 .tr ( I n ) V u2 .tr[( X ' X ) 1 X ' X ] nV u2 V u2 tr[ I k ] V u2 (n k ) (3.24)
ª Uˆ ' Uˆ º
E« » V u2 (3.25)
¬n k ¼
a) El Coeficiente de Determinación R 2
y su estimador:
Yi Eˆ1 Eˆ2 X 2i Eˆ3 X 3i ....... Eˆk X ki ó Y XÊ .
Por lo tanto, el valor observado es la suma del valor estimado y del residuo
Y XEˆ Uˆ (3.27)
Y 'Y ( XEˆ Uˆ )' ( XEˆ Uˆ ) Eˆ ' X ' XEˆ Uˆ 'Uˆ 2 Eˆ ' X 'Uˆ Eˆ ' X ' XEˆ Uˆ 'Uˆ (3.28)
Donde:
SCT : Suma de cuadrados totales
SCExp : Suma de cuadrados explicada
SC Re s : Suma de cuadrados residuales
SCExp SC Re s
1 (3.31)
SCT SCT
SCExp SC Re s
R2 1 (3.32)
SCT SCT
b) R 2 ajustado
Una característica del R 2 es que aumenta a medida que se incorpora más variables
explicativas, es decir, la proporción explicada aumenta con el número de regresores o
lo que es lo mismo, la proporción no explicada, disminuye cuando aumenta el número
de regresores. Para corregir este problema surge el R 2 ajustado, R 2 , en el que se
incorpora los cambios en los grados de libertad cuando se incorpora variables
explicativas en el modelo.
SC Re s
§ SC Re s ·§ n 1 · § SCT SCExp ·§ n 1 ·
R2 1 n k 1 ¨ ¸¨ ¸ 1 ¨ ¸¨ ¸ (3.34)
SCT © SCT ¹© n k ¹ © SCT ¹© n k ¹
n 1
O también:
ECONOMETRIA, TEORIA Y APLICACIONES Juan Pichihua Serna 77
§ n 1 ·
R2
1 1 R2 ¨
©nk ¹
¸ (3.35)
R2; R 2
1
R2
R2
K
0 K* # Regresores
Descomponiendo el numerador:
§ PRECIOt ·
log(CANTIDADt ) E 1 E 2 log¨¨ ¸¸ E 3 log( INGRESOt ) u t
© IPCt ¹
wCANTIDAD
w log(CANTIDAD ) CANTIDAD =-2.70
Elasticidad precio de la demanda: ex, Px
w log( PRECIO) wPRECIO
PRECIO
wCANTIDAD
w log(CANTIDAD ) CANTIDAD = 0.51
Elasticidad Ingreso de la demanda: K x
w log( INGRESO) wINGRESO
INGRESO
Luego, la demanda del bien X es elástica con respecto al precio, o sea, el bien X tiene
muchos sustitutos. También, la demanda del bien X es inelástica al ingreso y positivo,
lo que implica que el bien X es un bien normal necesario.
El R 2 = 0.9737 y el R 2 =0.9713, los cuales son bastante “altos”, esto es cercano a uno,
lo que implica que la regresión explica el 97.37% de la variación total y que el 97.13%
de la varianza total no es explicado por la varianza del error, sino por la varianza de la
regresión.
U a NID(0 ; V u2 I n )
1§ u2 ·
¨ i2 ¸
1 2 ¨© V u ¸
¹
f (u i ) e (3.36)
2SV u2
1§ u2 ·
¨ i2 ¸
n n 1 2 ¨© V u ¸
¹
f (u ) f (u1 ). f (u 2 )........ f (u n ) f (u i ) e
i 1 i 1 2SV u2
n n
§ 1 · 2V1 2 ¦ ui2 § 1 · V1 2 U 'U
f (u ) ¨ ¸ e u ¨ ¸ e 2 u (3.37)
¨ 2SV 2 ¸ ¨ 2SV 2 ¸
© u ¹ © u ¹
n 1
Y XE 'Y XE
2 2 2V u2
L(Y ; X ; E ; V ) u (2SV ) e u
2
(3.38)
n n 1
l (Y ; X ; E ; V u2 ) log2S log V u2
Y ' Y E ' X ' XE 2 E ' X ' Y (3.39)
2 2 2V u2
wl (.) n ~
~ 2 (2 X ' XE 2 X ' Y ) 0 (3.40)
wE 2V u
wl (.) n n ~ ~ ~
wV u2 2V u 2V u
~ 2 ~ 4 Y ' Y E ' X ' XE 2 E ' X ' Y 0 (3.41)
~
De la ecuación 3.42 obtenemos el estimador de E por máxima verosimilitud, E :
~
E X ' X 1 X ' Y (3.43)
~
Por lo tanto, el estimador de E por máxima verosimilitud, E , es idéntica al estimador
de E por mínimos cuadrados ordinarios:
~
E Eˆ (3.44)
~ ~ ~ ~ ~ ~ ~
V~ 2
Y ' Y E ' X ' XE 2 E ' X ' Y (Y XE )' (Y XE ) U 'U ¦ u~i2
u
n n n n
~ ~ ~ ~
(Y XE )' (Y XE ) U 'U
V~u2 (3.45)
n n
~ ~
Nótese, que si E Eˆ , entonces, u~ Y XE Y XEˆ uˆ , o también ¦ u~i2 2
¦ uˆi .
~
Sustituyendo E y V~u2 en las ecuaciones 3.38 y 3.39 se obtendrá el valor máximo de la
función de verosimilitud, L(.) , o lo que es lo mismo la función log verosimilitud., l (.) .
l Eˆ ; V~u2 n n
1 ~ ~
log2S log V~u2 ~ 2 (Y XE )' (Y XE )
2 2 2V u
82 Capítulo 3: Modelo de Regresión Lineal General
~
x E es un estimador insesgado de E
Si X es exógena en el modeloY XE U y E >U @ 0 entonces:
~
E X ' X 1 X ' Y [ X ' X X ' ]( XE U )
1
E ( X ' X ) 1 X 'U (3.47)
~
Hallando el valor esperado de E , se tiene:
~
EE>@ E X ' X 1 X ' E >U @ E (3.48)
~
Por lo tanto, el estimador de máxima verosimilitud, E , es un estimador insesgado de
E:
ª w 2 l (.) º
Sea J ' >E V 2
u @ , la matriz de información es: I J E « ».
¬ wJwJ ' ¼
Donde:
ª w 2 l (.) w 2 l (.) º
2
w l (.) « wEwE ' wEwV u2 »
« 2 » (3.54)
wJwJ ' «w l (.) 2 w 2 l (.) »
«¬ wV u wE ' 2
w V u2 »¼
I 1 J~ ¦ J~ (3.55)
Luego,
2V u2 ª º
wl (.) n
U ' U E « wl (.) »
n
n n
(3.58)
wV 2 2
u
2V 4
u 2V u8
¬ u
«w V 2 2 »
¼
2V u4 V u4 2V u4
ªX ' X 2 0 º
ª w 2 l (.) º « Vu »
I J E « » (3.59)
« 0 n 2»
¬ wJwJ ' ¼ «¬ 2V u »¼
ªV u2 X ' X 1 0 º ~
ªV ( E ) 0 º
¦ J~ I 1 J~ « 2V u4 »» « » (3.60)
« 0 ¬ 0 V (V~u2 )¼
¬« n ¼»
ª L(J~ ) º
RV 2 log« ~ R » 2>log L(J~R ) log L(J~NR )@ 2>l (J~R ) l (J~NR )@ (3.61)
¬ L(J NR ) ¼
Donde:
RV a F 2 con k-1 grados de libertad (3.62)
Donde la función log verosimilitud (log likelihood) del modelo no restringido se obtiene
de:
§n· § 1 · ~ ~ ~
l (J~NR ) ¨ ¸ log(2SV~u ) ¨¨ ~ 2 ¸¸¦ (Yi E1 E 2 X 2i ...... E k X ki )
2 2
(3.63)
© 2 ¹ © 2V u ¹
§n· §n· § 1 ·
l (J~R ) ¨ ¸ log(2S ) ¨ ¸ log(V~u , R ) ¨¨ ~ 2
2 ¸¦ (Yi E~1 ) 2 (3.64)
¸
© 2 ¹ ©2¹ © 2V u , R ¹
Seguido al comando @PARAM se debe escribir los valores iniciales de los tres
parámetros que serán estimados el intercepto, c(1), las pendientes c(2) y c(3) y la
varianza c(4).
Luego se define las ecuaciones para el residuo (RES), la varianza del error (VAR) y de
la función de log verosimilitud (log likelihood).
ECONOMETRIA, TEORÍA Y APLICACIONES Juan Pichihua Serna 85
Yi E1 E 2 X 2i E 3 X 3i E 4 X 4i ui . Sujeto a: 2 E3 E 2 1 y E2 2E4
Donde:
Y XE U sujeto a: RE r (3.65)
Donde:
R = matriz de q x k, donde q es el número de restricciones lineales y k el número total
de parámetros del modelo.
E = vector de k x 1.
r = vector de q x 1.
ECONOMETRIA, TEORÍA Y APLICACIONES Juan Pichihua Serna 87
wU R 'U R
2 X ' Y 2 X ' XEˆ R 2 R' O 0 (3.68)
wE
wU R 'U R
r REˆ R 0 (3.69)
wO
2
Dado que el valor de O no es restringido, se puede especificar como 2O para facilitar los cálculos.
88 Capítulo 3: Modelo de Regresión Lineal General
x Valor esperado de Ê R
E[ Eˆ R ] E (3.76)
x Varianza de Ê R
Eˆ R C AEˆ (3.77)
Dado que A es una matriz semi definida positiva se puede demostrar que si se cumple la
restricción RE r , entonces, V [ Eˆ R ] d V [ Eˆ ] . Esto es la información RE r permite
ganar q grados de libertad y hacer más precisa la estimación de parámetros.
x Distribución de Ê R
2 Uˆ R 'Uˆ R ¦ uˆ i2,R
R 1 1 (3.79)
Y ' Y nY 2 ¦ y i2
Uˆ R 'Uˆ R ¦ uˆ i2,R
nk q nk q § n 1 ·
R2 1 1 1 (1 R 2 )¨¨ ¸¸ (3.80)
Y ' Y nY 2 ¦ yi2 ©nk q¹
n 1 n 1
Suponga que los datos que se presentan a continuación corresponden a datos recogidos
de 27 productores de maíz amarillo duro donde:
obs Q L K obs Q L K
1 657.2900 162.3100 279.9900 14 1165.630 240.2700 1078.790
2 935.9300 214.4300 542.5000 15 1917.550 536.7300 2109.340
3 1110.650 186.4400 721.5100 16 9849.170 1564.830 13989.55
4 1200.890 245.8300 1167.680 17 1088.270 214.6200 884.2400
5 1052.680 211.4000 811.7700 18 8095.630 1083.100 9119.700
6 3406.020 690.6100 4558.020 19 3175.390 521.7400 5686.990
7 2427.890 452.7900 3069.910 20 1653.380 304.8500 1701.060
8 4257.460 714.2000 5585.010 21 5159.310 835.6900 5206.360
9 1625.190 320.5400 1618.750 22 3378.400 284.0000 3288.720
10 1272.050 253.1700 1562.080 23 592.8500 150.7700 357.3200
11 1004.450 236.4400 662.0400 24 1601.980 259.9100 2031.930
12 598.8700 140.7300 875.3700 25 2065.850 497.6000 2492.980
13 853.1000 145.0400 1696.980 26 2293.870 275.2000 1711.740
27 745.6700 137.0000 768.5900
ó también
log§¨ Q ·¸
© K¹
E1 E 2 log L K ui
Ê a N ( E ; V u2 ( X ' X ) 1 )
Ê R a N ( E ; V u2 A( X ' X ) 1 )
Ê = Ê R
Por lo tanto, el test de Wald para la hipótesis nula H 0 : RE r queda expresado como:
El primer caso, se obtiene de dividir la ecuación 3.83 por q y despejar Vˆ u2 , esto es:
SC Re s R SC Re s NR ¦ uˆ i2,R ¦ uˆ i2, NR
q q
WF a Fq ,nk gl (3.85)
SC Re s NR ¦ uˆ i2, NR
nk nk
94 Capítulo 3: Modelo de Regresión Lineal General
Finalmente, se puede dividir la ecuación 3.86 por SCT y expresarlo en términos de los
R 2 del modelo restringido y del modelo no restringido, es decir:
2
R NR RR2
q
WF 2
a Fq ,nk gl (3.87)
1 R NR
nk
a) Utilizando el estadístico t.
Se acepta Ho si:
H0 : E j 0 Donde: para el j-ésimo parámetro
FÊ d F1 ; n k gl
Ha : E j z 0 j
V ( Eˆ j ) Vˆ u2 .b jj Vˆ u2 [ R X ' X 1 R' ]
Se rechaza Ho si:
Siendo: R >0 0 1 0 0@ . Con valor 1 en FEˆ ! F(1 ; n k ) gl
j
el j-ésimo parámetro.
El modelo no restringido, NR, incluye las k variables del modelo original, osea:
Modelo NR: Yi E 1 E 2 X 2i E j X ji E k X ki u i
Criterio de
Hipótesis Estadístico de Prueba
Decisión
FÊ vs F(1 ; n k ) gl
j
2
( R NR RR2 ) / 1 Se acepta Ho si:
H0 : E j 0 FÊ 2
j
(1 R NR )/n k FEˆ d F(1 ; n k ) gl
Ha : E j z 0 j
Se rechaza Ho si:
FEˆ ! F(1 ; n k ) gl
j
E2 0
ª0 1 0 0º
°E 0 «0 0 1 0»
° Donde: R « »
H0 : ® 3 « »
° « »
°¯Ek 0 ¬0 0 0 1¼
2
Se acepta Ho si:
H0 : E 2 E3 ... Ek 0 ( R NR RR2 ) / k 1 FÊ d Fk 1 ; n k gl
FÊ 's
Ha : al menos un E j z 0 2
(1 R NR )/n k j
Se rechaza Ho si:
FÊ ! Fk 1 ; n k gl
j
ECONOMETRIA, TEORÍA Y APLICACIONES Juan Pichihua Serna 97
Si las q-j pendientes son cero (porque H0 : Ej1 Ej2 ... Eq 0), la matriz R de la hipótesis
conjunta RE 0 tiene q-j restricciones a los parámetros y la siguiente forma:
E j 1 0 ª0 0 1 0 0 0 º
°E «0 0 0 1 0 0 »
° j 2 0 Donde R « »
H0 : ® « »
° « »
°¯ Eq 0 ¬0 0 0 0 1 0 ¼
2E E2 1 ª0 1 2 0 º ª1 º
H0 : ® 3 ; por lo tanto: R «0 1 0 2 » ; y r «0 »
¯E 2 2E 4 0 ¬ ¼ ¬ ¼
Cuando la hipótesis incluye una sola combinación lineal, también se puede encontrar su
expresión en la forma de un estadístico t o un estadístico F. A continuación se presentan
algunas aplicaciones.
Sea Lˆ (Tˆ1 Tˆ2 ) el valor máximo de la función verosimilitud del modelo no restringido y
~ ~
L (T 1 T 20 ) el valor máximo de la función verosimilitud del modelo restringido, bajo la
~
hipótesis nula. Si O L / Lˆ es el ratio de verosimilitud, el estadístico LR = -2lnO tiene
una distribución asintótica tipo F k22 . Por lo tanto, se rechazará la hipótesis nula T 2 T 20
si LR > F k22 para un nivel de significación D=0.05.
~ ~
L(T Re stringida ) L( E R , V~u2, R )
O (3.88)
L(Tˆ no restringida) L( Eˆ , Vˆ 2 )
u
2
3
Si se utiliza los estimadores de máxima verosimilitud para Ê y Vˆ u en L(.) se obtiene:
ª 1 º
Lˆ (2SVˆ 2 ) n / 2 exp « 2
(Y XE )' (Y XE )» (Vˆ 2 ) n / 2 (2S ) n / 2 e n / 2
¬ 2Vˆ ¼
2 (Y XE )' (Y XE )
Pues el estimador de la varianza de máxima verosimilitud es: Vˆ
n
n / 2
§ 2Se ·
Entonces Lˆ (Uˆ 'Uˆ ) n / 2 ¨ (Uˆ 'Uˆ ) n / 2 .C
2 n / 2 n / 2
(Vˆ ) .( 2Se) ¸
© n ¹
100 Capítulo 3: Modelo de Regresión Lineal General
n
ln L(TˆR ) ln C ln(Uˆ R 'Uˆ R ) (3.90)
2
n
L(TˆNR ) L( Eˆ NR , Vˆ u2, NR ) constante * (Uˆ NR
'
Uˆ NR ) 2
, en logaritmos se tiene:
n
ln L(TˆNR ) ln C ln(Uˆ NR
'
Uˆ NR ) (3.91)
2
n n
LR 2 ln O 2[ln C ln(Uˆ NR
'
Uˆ NR ) ln C ln(Uˆ R 'Uˆ R )]
2 2
§ Uˆ 'Uˆ ·
LR n[ln(Uˆ R 'Uˆ R ) ln(Uˆ NR
'
Uˆ NR )] n * ln¨¨ ' R R ¸ (3.92)
ˆ ˆ ¸
© U NRU NR ¹
Note que para el cálculo del ratio de verosimilitud basta conocer el número de
observaciones y las sumas de cuadrados de los residuos del modelo no restringido y del
modelo restringido. Además puede utilizarse directamente los residuos de MCO y de
MCR para el cómputo del ratio de verosimilitud.
El valor del LR obtenido debe ser comparado con un chi-cuadrado con q grados de
libertad, que es el número de restricciones que tiene el modelo.
E 2 E3 E 4 E5 U
Modelo A: Q dp APpol Pres Povi Y e , y
E2 E3 E5 U
Modelo B: Q pd APpol Pres Y e .
Los datos se encuentran en las aplicaciones al final del presente capítulo. Los resultados
del modelo A fueron:
ECONOMETRIA, TEORÍA Y APLICACIONES Juan Pichihua Serna 101
Respuestas:
El ratio de verosimilitud se puede hallar también, y con los mismos resultados, como:
LR 2[ln L( Eˆ , Vˆ u2 ) ln L( Eˆ R , Vˆ u2, R )] 2(14.16927 11.87244) 4.59366
Como los modelos involucrados son los mismos, el valor calculado del ratio de
verosimilitud, LR, y el F de Wald calculado son los mismos, de modo que los resultados
también serán los mismos. Es decir, según el test LR = 4.5966 se rechaza la hipótesis
nula que E 4 0 , luego, el precio del ovino sí es una variable relevante en el modelo,
por lo tanto, evidencia haber omitido la variable relevante. De igual modo, el F de Wald
es 4.1366, acepta la hipótesis nula E 4 0 , luego que la variable precio de ovino es
irrelevante.
ECONOMETRIA, TEORÍA Y APLICACIONES Juan Pichihua Serna 103
Suponga que se tiene dos modelos alternativos entre los que se debe elegir, el “mejor”,
sobre bases estadísticas. Es decir, sea:
Modelo 1: H o : Y XE U (3.93)
Modelo 2: H a : Y ZJ V (3.94)
Davidson & MacKinnon (1981)4 proponen el llamado J-test que consiste en correr
modelos “agregados” que permitan aproximar una respuesta al problema de las
hipótesis en cuestión.
Para probar que el modelo 1 es mejor al modelo 2 se debe seguir los siguientes pasos:
Para probar que el modelo 2 es mejor al modelo 1 se debe seguir los siguientes pasos:
4
Davidson & MacKinnon (1981), “several Tests for Model Specification in the Presence of
Alternative Hypotheses”, Econometrica, 49, 1981, pp. 781-793
104 Capítulo 3: Modelo de Regresión Lineal General
Utilizando los datos del consumo privado y el PBI para el período 1990:2 - 2000:3, se
plantea dos modelos no anidados:
Para probar que el modelo 1 es mejor al modelo 2 se debe seguir los siguientes pasos:
Como podemos ver, se rechaza la hipótesis nula, por lo tanto, el modelo 1 no es mejor
que el modelo 2.
Para probar que el modelo 2 es mejor al modelo 1 se debe seguir los siguientes pasos:
Como podemos ver, se acepta la hipótesis nula, lo que implica que el modelo 1 no
contribuye a explicar a el modelo el modelo 2, por lo tanto, el modelo 2 es
definitivamente mejor que el modelo 1.
El test de cambio estructural es una prueba para probar si los parámetros cambian al
interior de la muestra. Para ello Chow propone un test que se deriva del test de Wald.
El caso más simple de cambio estructural proviene de los “outliers”, es decir, cuando
existen alguna(s) observaciones que caen fuera del rango frecuente. Este caso puede ser
tratado como que el intercepto, debido a algún factor, se desplazó solo en esa
observación. Por ejemplo, el fenómeno del niño o shock especial puede provocar el
desplazamiento hacia arriba o hacia debajo de la línea de regresión afectando el
intercepto únicamente. La solución puede ser omitir dicha observación “outlier” o
agregar una variable dummy (variable ficticia) en el modelo tal que toma valor 1 si
ocurre el evento y cero en otros casos. El coeficiente asociado a dicha dummy muestra
el efecto que tuvo el “outlier” en la variable dependiente, por lo tanto, el modelo no
pierde su característica regular.
106 Capítulo 3: Modelo de Regresión Lineal General
El test de Chow que interesa revisar en esta sección están relacionadas a la última fuente
de inestabilidad de los parámetros, los otros temas serán abordados en la sección de
variables dummies. Entonces:
Pasos:
1° Estimar por MCO la ecuación 3.98 con N observaciones y computar la suma de
cuadrados de los residuos ( SC Re s N ).
2° Estimar por MCO la ecuación 3.98 en cada una de las submuestras, con N1
observaciones del Grupo 1 y con N 2 del Grupo 2 y computar las sumas de cuadrados de
los residuos SC Re s N 1 y SC Re s N 2 .
Grupo 1: t 1,2,3,...., N1
Yt E 11 E 21 X 2t E 31 X 3t E k1 X kt u t (3.100)
Grupo 2: t N 1 1, N 1 2,...., N
Yt E 12 E 22 X 2t E 32 X 3t E k2 X kt u t (3.101)
3° Probar si los parámetros del modelo (pendientes e intercepto) han permanecido
invariables al interior de la muestra, es decir, si existe diferencia significativa en las
pendientes y el intercepto en la primera submuestra, en la segunda submuestra y en toda
la muestra.
Tomando los datos anuales del consumo privado y PBI para el Perú, identificar si hay
evidencias de inestabilidad en los parámetros. La información proviene del INEI y está
en soles constantes de 1979.
100
-100
-200
70 72 74 76 78 80 82 84 86 88 90 92 94 96 98
CPR_R Residuals
108 Capítulo 3: Modelo de Regresión Lineal General
Nótese en el gráfico, hay dos puntos donde el error es bastante mayor al resto de
observaciones 1979 y 1987, lo que hace presumir que puede ser explicado por un
cambio estructural o un cambio en los parámetros.
H 0 : E 11 E 12 E 13 E 21 E 22 E 23 E 31 E 32 E 33
Test de Chow:
SC Re s N SC Re s N1 SC Re s N 2 SC Re s N3
(m 1)k
FCh
SC Re s N1 SC Re s N 2 SC Re s N 3
N 3k
x Primero, para aislar el efecto de un evento aleatorio, por ejemplo el fenómeno del
niño, un terremoto, un “golpe de Estado”, que provocan un comportamiento
“estraño” de la variable dependiente en alguna o algunas observaciones de la
muestra. A estas observaciones se les denomina “outliers”. En este caso la muestra
se separa entre la muestra “principal” y las observaciones donde se presenta el
evento aleatorio, donde cada outlier es tomada como un caso diferente. Por
ejemplo, durante el período muestral puede haber ocurrido más de un “terremoto”,
entonces, para cada terremoto se creará una variable dummy especial.
x Finalmente, las variables dummy permiten capturar los eventos aleatorios que
pueden haber ocurrido en un momento pero con consecuencias por un período de
tiempo mayor. En este caso dicho evento produce “cambios estructurales” en la
muestra que se reflejan en la inestabilidad en los parámetros del modelo. Las
variables dummies permiten separar cada sub período “antes” y “después” del
cambio estructural (o cambios estructurales), tal como se estudió en el Test de
Chow.
En general cuando se analiza los residuos de una regresión se encuentra que en algunas
observaciones los valores residuales son “exagerados” con respecto al resto de
observaciones. Si se está en los casos primero y tercero se tendrá pocos errores “fuera
de rango” tal como se observa en el siguiente gráfico. Si se esta en el segundo caso, los
errores fuera de rango serán más repetidos. En ese sentido, no será tan simple para el
modelista saber en que caso se encuentra, para ello será necesario descartar primero si
los errores “extraños” son producidos por un cambio estructural vía el Test de Chow.
1.2
0.8
0.4
0.0
-0.4
-0.8
78 79 80 81 82 83 84 85 86 87
Residuos
110 Capítulo 3: Modelo de Regresión Lineal General
En todos los casos, las variables dummies actúan como variables adicionales en el
modelo por lo que no es raro que mejore el “ajuste” del modelo con respecto a aquel
que no incluye las variables dummies. De igual modo, permiten reducir o eliminar la
inestabilidad de los parámetros que es producido por un evento aleatorio o un atributo
de parte de la muestra, y finalmente, permiten poner “bajo control” el comportamiento
de los residuos en un rango deseable.
El test de Chow arriba mencionado es un test general que permite descartar solamente
si hubo un cambio estructural, en el intercepto, en las pendientes o en ambos, pero no
señala dónde ocurrieron específicamente dicho cambios. En este caso, las variables
dummies permiten completar la tarea del test.
A: Cambio en el B: Cambio en la
Intercepto pendiente
Y Y
E [Yi ] J E 2 X 2 i E [Yi ] J E 2 X 2 i
J
E2
J
E [Yi ] E 1 E 2 X 2i
'E 1 E [Yi ] E 1 E 2 X 2i
E1 E1
X2 X2
C: Cambio en el intercepto y en la
pendiente
E[Yi ] J 1 J 2 X 2 i
Y
J2
J2 E2
'E 1
E [Yi ] E 1 E 2 X 2i
E1
X2
Yi E 1 E 2 X 2 i E 3 X 3i u i (3.102)
Sea Di la variable dummy que permite diferenciar el evento aleatorio (por ejemplo el
fenómeno del niño en 1997) o la característica del individuo (por ejemplo sexo) tal que:
Por ejemplo, supongamos que se observa únicamente un residuo “fuera de rango” (un
“outlier”) que es producido por un evento que ha ocurrido una sola vez (el fenómeno
del niño en 1997). Para capturar el efecto del fenómeno del niño bastará con crear una
variable dummy que identifique dicho evento, de la siguiente manera:
Yi E 1 E 2 X 2i E 3 X 3i E 4 Di u i (3.103)
Donde, E 4 refleja la magnitud del impacto del “fenómeno del niño de 1997” en el
modelo. El signo de E 4 indicará el sentido del impacto, positivo o negativo.
Yi E 1 E 2 X 2i E 3 X 3i E 4 Di X 3i u i (3.104)
Donde, E 4 refleja la magnitud del impacto adicional del “fenómeno del niño de 1997”
en la pendiente de la variable X3. El signo de E 4 indicará el sentido del impacto,
positivo o negativo.
112 Capítulo 3: Modelo de Regresión Lineal General
Yi E 1 E 2 X 2i E 3 X 3i E 4 Di E 5 Di X 3i u i (3.105)
Donde, E 4 refleja la magnitud del impacto adicional del “fenómeno del niño de 1997”
en el intercepto del modelo y E 5 mide el cambio en la pendiente de la variable X3. El
signo de E 4 y E 5 indicará el sentido del impacto, positivo o negativo, en el intercepto
y en la pendiente.
Donde SEX
1 Si es hom bre
® y bajo el supuesto que E >ui @ 0 y E ui2 > @ V u2
¯0 Si es mujer
Note que mientras el salario y los años de educación son variables numéricas es sexo es
una variable categórica, por lo tanto, no cuantificable. Para resolver este problema se
incorpora una variable dummy (SEX) que toma los siguientes valores:
ln WAGE i E 1 E 2 EDUC i
J
E3
E1
Educ
ECONOMETRIA, TEORÍA Y APLICACIONES Juan Pichihua Serna 113
Por lo tanto, una persona sin educación EDUC = 0 y de sexo mujer, SEX = 0, tendrá un
salario esperado base de:
Luego, una persona sin educación EDUC = 0 y de sexo hombre, SEX = 1, tendrá un
salario esperado base de:
Donde, E 3 refleja la magnitud del impacto del “sexo” en el salario. El signo esperado
para E 3 es que sea positivo si efectivamente los hombres tienen mayores salarios que
las mujeres.
1 Si t 1979 1998
D79 _ 98 ®
¯0 En cualquier otro año
“Quiebre” en el intercepto:
Ct E1 J 1 E 2Yt ut
“Quiebre” en la pendiente:
Ct E1 J 1 E 2 J 2 Yt ut
Una evaluación rigurosa del cambio estructural significará verificar las tres pruebas una
por una de esta manera se identificará la fuente de inestabilidad de los parámetros
sugerido por el Test de Chow.
ECONOMETRIA, TEORÍA Y APLICACIONES Juan Pichihua Serna 115
APLICACIONES:
Se pide estimar una función de demanda para la carne de pollo. Para facilitar la
obtención de las elasticidades de la demanda, directa, cruzadas e ingreso se plantea una
función exponencial, que puede ser reducida a una forma lineal en logarítmos, o doble
logarítmica.
d
QPOL log A E 2 log PPOL E 3 log PRES E 4 log POVI E 5 ING u i
116 Capítulo 3: Modelo de Regresión Lineal General
X'X 1 x2 x3 x4 x5
1 30.00000 58.23527 62.08404 57.09870 179.0071
x2 58.23527 121.2368 120.0400 111.5938 347.3371
x3 62.08404 120.0400 131.8561 117.1553 370.6107
x4 57.09870 111.5938 117.1553 114.4538 340.6055
x5 179.0071 347.3371 370.6107 340.6055 1071.099
X ' X 1 1 x2 x3 x4 x5
1 14.72771 -0.271564 -0.690030 -0.447744 -1.992164
x2 -0.271564 0.124202 0.013141 -0.013856 0.004968
x3 -0.690030 0.013141 0.314659 0.052958 -0.014656
x4 -0.447744 -0.013856 0.052958 0.184154 0.002438
x5 -1.992164 0.004968 -0.014656 0.002438 0.336558
V ( Eˆ ) Ê1 Ê 2 Ê 3 Ê 4 Ê5
Ê1 0.402346 -0.007419 -0.018851 -0.012232 -0.054424
Ê 2 -0.007419 0.003393 0.000359 -0.000379 0.000136
Ê 3 -0.018851 0.000359 0.008596 0.001447 -0.000400
Ê 4 -0.012232 -0.000379 0.001447 0.005031 6.66E-05
Ê5 -0.054424 0.000136 -0.000400 6.66E-05 0.009194
ECONOMETRIA, TEORÍA Y APLICACIONES Juan Pichihua Serna 117
E2 E3 E4
Al igual que antes se utilizará la especificación: d
QPOL APPOL PRES POVI ING E 5 eui
Siendo su especificación doble logarítmica:
d
QPOL log A E 2 log PPOL E3 log PRES E 4 log POVI E 5 ING ui
Sujeto a: E 2 E 3 E 4 E 5 0 , o también RE E 2 E3 E 4 E5 0
X ' X 1 1 x2 x3 x4 x5
1 14.72771 -0.271564 -0.690030 -0.447744 -1.992164
x2 -0.271564 0.124202 0.013141 -0.013856 0.004968
x3 -0.690030 0.013141 0.314659 0.052958 -0.014656
x4 -0.447744 -0.013856 0.052958 0.184154 0.002438
x5 -1.992164 0.004968 -0.014656 0.002438 0.336558
Ê1 Ê 2 Ê 3 Ê 4 Ê5
R 0.000000 1.000000 1.000000 1.000000 1.000000
Siendo: Eˆ R > 1
@
Eˆ X ' X 1 R' R X ' X 1 R' r REˆ
MCO Ê MCR Ê R
Ê1 1.015285 Ê1, R -0.540579
Ê 2 -0.965367 Ê 2, R -0.906611
Ê 3 -0.250483 Ê 3, R -0.083026
Ê 4 -0.144261 Ê 4, R -0.041027
Ê5 0.880037 Ê5, R 1.030664
RÊ -0.480074 RÊ R 0.00000
118 Capítulo 3: Modelo de Regresión Lineal General
REˆ Eˆ2 Eˆ3 Eˆ4 Eˆ5 -0.965367 - 0.250483 -0.144261 0.880037 -0.480074
V ( Eˆ R ) Ê1 Ê 2 Ê 3 Ê 4 Ê 5
Ê1 0.128575 0.005025 0.017234 0.009849 -0.032107
Ê 2 0.005025 0.003766 -0.001099 -0.001440 -0.001227
Ê 3 0.017234 -0.001099 0.006490 -0.000894 -0.004496
Ê 4 0.009849 -0.001440 -0.000894 0.004708 -0.002374
Ê5 -0.032107 -0.001227 -0.004496 -0.002374 0.008097
Luego:
A X ' X 1 1 x2 x3 x4 x5
1 3.703841 0.144744 0.496465 0.283705 -0.924914
x2 0.144744 0.108481 -0.031666 -0.041479 -0.035336
x3 0.496465 -0.031666 0.186957 -0.025767 -0.129523
x4 0.283705 -0.041479 -0.025767 0.135621 -0.068376
x5 -0.924914 -0.035336 -0.129523 -0.068376 0.233235
R2
§ 30 1 ·
1 1 R2 * ¨ ¸
© 30 4 ¹
0.909050
ECONOMETRIA, TEORÍA Y APLICACIONES Juan Pichihua Serna 119
Se utilizará los resultados del modelo de demanda de carne de pollo vistos en la sección
anterior.
E 2 E3 E 4 E5
Modelo no restringido: Q dp APpol Pres Povi Y
Respuestas:
a) Significancia individual.
5
En Eviews se puede hallar el valor del t-“critico” como: @qtdist(0.025,#gl). Con 0.025 en cada
cola. Alternativamente se puede hallar el nivel de significación necesario para rechazar la
hipótesis nula de un valor de t-calculado utilizando @tdist(X,#gl).
120 Capítulo 3: Modelo de Regresión Lineal General
Utilizando cualquiera de las dos columnas podemos observar que el t-calculado para el
intercepto “C” y la pendiente de la variable LOG(POVI) son inferiores al t-“critico” ,
por lo tanto, en esos casos no se podría rechazar la hipótesis nula. El aceptar las
hipótesis nulas significaría que el modelo no debiera incluir intercepto y podría estar
incluyendo una variable irrelevante, el precio del ovino. Sin embargo este test lo
retomaremos luego.
Las pendiente asociadas al precio del pollo, al precio de la carne de res y al ingreso
tienen t-calculados bastante mayores que el t-crítico de 2.06, por lo tanto, tendríamos
que rechazar la hipótesis nula. Esto equivale a decir que las variables señaladas son
relevantes individualmente para explicar las variaciones del consumo de pollo.
b) Significancia conjunta.
Este test investiga si ninguna variable es útil para explicar significativamente las
variaciones del consumo de pollo, luego, la hipótesis nula es: H 0 : E 2 E 3 ... E k 0 . En
los resultados presentados, puede notar en la parte inferior derecha, los valores de el F-
“calculado” y la probabilidad para rechazar la hipótesis nula.
0.9383 / 5 1
El F-calculado se obtiene de: FEˆ ' s 95.041
1 0.9383 / 30 5
De las tablas estadísticas se encuentra que el F-crítico para un 5% de nivel de
significación y con 4 y 25 grados de libertad es: 2.7596. Como se puede observar el F-
calculado es “bastante” mayor que el F crítico, por lo tanto, se debe rechazar la hipótesis
nula que ninguna pendiente contribuye a explicar las variaciones del consumo de pollo.
6
En Eviews se puede hallar el valor del F-“critico” como: @qfdist(0.95,gl numerador, gl
denominador). Se usa 0.95 en vez de 0.05 por diferencia con respecto al área total.
Alternativamente se puede hallar el nivel de significación necesario para rechazar la hipótesis
nula de un valor de F-calculado utilizando @fdist(X, gl numerador, gl denominador).
ECONOMETRIA, TEORÍA Y APLICACIONES Juan Pichihua Serna 121
X ' X 1 1 x2 x3 x4 x5 Ê
1 14.72771 -0.271564 -0.690030 -0.447744 -1.992164 Ê1 1.015285
Wald Test:
Equation: EQ_LQPOL_MCO
Null Hypothesis: C(2)+C(3)+C(4)+C(5)=0
F-statistic 8.037938 Probability 0.008940
Chi-square 8.037938 Probability 0.004581
Si se busca en las tablas extadísticas el valor crítico para el chi-cuadrado con 1 grado de
libertad y un nivel de significación del 5% es F 12gl 3.84 , el F-crítico con 1 y 25 grados
de libertad es 4.24. Los resultados del test de Wald muestran que en ambos casos, W y
WF calculados son superiores al valor crítico de chi-cuadrado y F, lo que lleva a
rechazar la hipótesis nula. Por lo tanto, no hay evidencias para admitir que se cumple
con la condición de homogeneidad.
V ( Eˆ ) Ê1 Ê 2 Ê 3 Ê 4 Ê 5
Ê1 0.402346 -0.007419 -0.018851 -0.012232 -0.054424
Ê 2 -0.007419 0.003393 0.000359 -0.000379 0.000136
Ê 3 -0.018851 0.000359 0.008596 0.001447 -0.000400
Ê 4 -0.012232 -0.000379 0.001447 0.005031 6.66E-05
Ê 5 -0.054424 0.000136 -0.000400 6.66E-05 0.009194
V ( Eˆ 2 Eˆ 3 Eˆ 4 Eˆ 5 ) V ( Eˆ 2 ) V ( Eˆ 3 ) V ( Eˆ 4 ) V ( Eˆ 5 ) 2 * C ( Eˆ 2 , Eˆ 3 ) 2 * C ( Eˆ 2 , Eˆ 4 )
2 * C ( Eˆ 2 , Eˆ 5 ) 2 * C ( Eˆ 3 , Eˆ 4 ) 2 * C ( Eˆ 3 , Eˆ 5 ) 2 * C ( Eˆ 3 , Eˆ 5 )
122 Capítulo 3: Modelo de Regresión Lineal General
V ( Eˆ 2 Eˆ 3 Eˆ 4 Eˆ 5 ) =0.003393+0.008596+0.005031+0.009194+2*0.000359-
2*0.000379+2*0.000136+2*0.001447-2*0.0004+2*0.0000666=0.0287
Luego: S ( Eˆ 2 Eˆ 3 Eˆ 4 Eˆ 5 ) V ( Eˆ 2 Eˆ 3 Eˆ 4 Eˆ 5 ) = 0.1693
El t-calculado será:
Eˆ 2 Eˆ 3 Eˆ 4 Eˆ 5 0.480074
t Eˆ ˆ ˆ ˆ 2.83
2 E3 E 4 E5
S ( Eˆ 2 Eˆ 3 Eˆ 4 Eˆ 5 ) 0.1693
E 2 E3 E 4 E 2 E3 E 4
Modelo restringido: Q pd APpol Pres Povi Y
2
( R NR RR2 ) / q (0.9383 0.918459) / 1
FEˆ 's 2
8.03
(1 R NR )/n k (1 0.9383) / 30 5
Nota de advertencia:
PROBLEMAS:
Yt D 1 D 2 * X 2t D 3 * X 3 P t
Yt X 2t E 1 E 2 * X 2t E 3 * X 3 P t
a. ¿Son iguales los valores estimados por MCO para D1 y E1?. ¿Porqué?
b. ¿Son iguales los valores estimados por MCO para D3 y E3?. ¿Porqué?
c. ¿Cuál es la relación entre D2 y E2?. ¿Porqué?
d. ¿Es posible comparar los R2 de ambos modelos?. ¿Por qué sí o por qué no?.
Algunos analistas han sugerido que la reforma agraria del año 1969 ha creado un hito en
la historia y ha provocado cambios estructurales en los parámetros, y por lo tanto no
debiera utilizarse los resultados de la función de producción estimada.
Uno de los asistentes del investigador, para demostrar que no ha habido “cambio
estructural”, sugiere dividir la muestra en 2 grupos: antes y después del 69. Los
resultados fueron:
Problema 4: Dos investigadores estiman la función consumo para el Perú utilizando los
mismos datos, pero especificando modelos distintos. El investigador 1 presentó los
siguientes resultados:
Las cifras entre paréntesis son los errores estándar de los estimadores.
a. ¿Cuál de los dos investigadores plantea el modelo correcto?. Haga las pruebas de
hipótesis necesarias. Dato: en el primer modelo se utilizó 24 observaciones, en el
segundo 25.
b. ¿Cuál es la propensión marginal a consumir de corto y largo plazo en los dos
modelos?.
c. En el primer modelo hay diferencias significativas entre las propensiones marginales
a consumir de corto y largo plazo?.
Donde:
W = salario, se mide en soles mensuales
E1 = 1 si no tiene estudios y 0 en otro caso.
E2 = 1 si tiene primaria y 0 en otro caso.
E3 = 1 si tiene secundaria y 0 en otro caso.
E4 = 1 si tiene educación superior y 0 en otro caso.
Sexo = 1 si es hombre y 0 en otro caso.
a) Considerando la ecuación (1) construya una tabla de salarios esperados según nivel
de educación y sexo, es decir, el casillero que está en la primera fila y primera
columna, del cuadro adjunto, indica el salario esperado de una mujer sin estudios. El
casillero ubicado en la segunda fila y tercera columna indica el salario esperado de
un hombre con educación secundaria, etc.
b) Considerando la ecuación (2) construya una tabla de salarios esperados según nivel
de educación y sexo. En este caso se presume que el sexo y la educación tienen un
efecto de interacción que hace que además de la diferencia propias del sexo y de la
educación, la combinación de ambas tienen un efecto significativo.
a) ¿Cuál sería el modelo propuesto por usted?. Defina claramente cada una de las
variables del modelo.
b) ¿Qué interpretación tienen cada uno de los parámetros del modelo?
c) Utilizando el modelo propuesto cómo probaría la hipótesis nula que “el programa A
no tiene ningún efecto sobre los salarios?.
a
ª x º
Problema 7: Supongamos que P[ X d x] ³ f ( x)dx«¬1 x »¼ . Para X t 0 .
a) ¿Cuál es la función de densidad de probabilidad de X?
b) ¿Cuál es el estimador de máxima verosimilitud de a?
c) ¿Cuál es la varianza asintótica del estimador de a por MV?
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 127
CAPITULO 4:
Donde:
ªY1 º ª 1 X 21 X 31 ... X k 1 º ª E1 º ª u1 º
«Y » «1 X X 32 ... X k 2 »» «E » «u »
Y « 2» ; X « 22
; E « 2» ; y u « 2»
«....» «... ... ... ... ... » « ... » «....»
« » « » « » « »
¬Yn ¼ Nx1 ¬ 1 X 2n X 3n ... X kn ¼ NxK ¬ E K ¼ Kx1 ¬u n ¼ Nx1
Los supuestos del modelo de regresión clásico pueden resumirse en el siguiente cuadro:
4.2.1 Naturaleza
Y XE u (4.2)
Y XE ZJ H (4.3)
Queda claro, sin embargo, que el modelo verdadero no se conoce, pero es posible
plantear hipótesis sobre él. Entonces, bajo el supuesto de que la hipótesis sobre la
especificación del modelo es correcta se puede tener una clasificación de los siguientes
cuatro casos que se describen a continuación:
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 131
4.2.2 Consecuencias
Luego:
Eˆ ( X ' X ) 1 X ' Y (4.6)
Eˆ ( X ' X ) 1 X ' ( XE ZJ H )
Eˆ E ( X ' X ) 1 X ' ZJ ( X ' X ) 1 X ' H
Media de Ê :
Varianza de Ê :
Esto porque la ecuación (4.4) también puede ser expresada de la siguiente manera:
ªE º
Y XE ZJ H >X Z @« » H WT H
¬J ¼
ªE º
Donde: W >X Z@ y T « »
¬J ¼
1
ªX ' X X 'Zº ªX ' X X 'Zº
Donde: W 'W «Z' X y (W 'W ) 1
¬ Z ' Z »¼ «Z' X
¬ Z ' Z »¼
V 2 ( X ' X ) 1 d V 2 ( X ' X ) 1 X ' Z ( Z ' Z ) 1 Z ' X 1
Para el caso del Sesgo de Especificación Ramsey sugiere probar las hipótesis:
H0 :J 0
H1 : J z 0
Un caso de especificación incorrecta es suponer una expresión aditiva del error en vez
de suponer una expresión multiplicativa, esto es:
(1) Yi E 1 E 2 X 2 i E 3 X 3i u i
(2) Yi E 1 X 2Ei X 3Ei u i .
2 3
Sin embargo, Ramsey propone una expresión más sencilla, plantear contrastar el
modelo lineal versus un modelo polinómico, tal como se puede observar en el siguiente
ejemplo.
(1) Yi E 1 E 2 X 2 i E 3 X 3i u i
(2) Yi J 1 J 2 X 2i J 3 X 3i J 4 X 22i J 5 X 32i J 6 X 2i X 3i H i
(3) u i J 4 X 22i J 5 X 32i J 6 X 2i X 3i H i
Luego Z [Yˆ 2 Yˆ 3 Yˆ 4 ]
De igual manera, para identificar “el grado” del polinomio es necesario que se vaya
incorporando uno a uno los términos polinómicos desde el grado más bajo, esto porque
basta mostrar evidencias de no linealidad y no el grado de la no linealidad. En el
ejemplo significaría correr primero un modelo no restringido con un Yˆi al cuadrado, si
se acepta la hipótesis nula el test acaba. Si se rechaza la hipótesis nula debe continuarse
con dos términos polinómicos uno al cuadrado y otro al cubo, etc., hasta rechazar la
hipótesis nula. De no encontrarse evidencias de no linealidad se debe admitir que el
modelo no restringido es “empíricamente correcto” aun cuando teóricamente puede no
serlo.
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 135
Los resultados de la estimación por mínimos cuadrados ordinarios del modelo son:
Test Equation:
Dependent Variable: QPAN
Method: Least Squares
Included observations: 35
Variable Coefficient Std. Error t-Statistic Prob.
C 11.82070 8.332936 1.418551 0.1675
ING -0.312782 0.344289 -0.908489 0.3717
TFAM -5.012236 5.542563 -0.904317 0.3738
PPAN 4.376851 4.982440 0.878455 0.3874
PCARNE -6.743556 7.873263 -0.856514 0.3993
FITTED^2 3.322101 4.565181 0.727704 0.4731
FITTED^3 -0.340564 0.649423 -0.524410 0.6043
FITTED^4 0.012034 0.033368 0.360633 0.7212
El conocer a priori la distribución de los errores del modelo de regresión puede tener
dos implicancias. En primer lugar, mejora la eficiencia de la estimación de parámetros,
la estimación por máxima verosimilitud se basa en este supuesto; y en segundo lugar, tal
vez el más importante, facilita la inferencia estadística.
Si bien el supuesto del modelo de regresión clásico se basa en que los errores provienen
de una función de densidad norma, u a N , la violación de este supuesto no tiene
consecuencias graves sobre las propiedades de los estimadores de los parámetros, pues,
de conformidad con el Teorema Central del Límite, los estimadores, al ser promedios,
tienden a distribuirse como una normal, sea cual fuera la distribución de origen del
error, ui .
ª skw 2 (kurt 3) 2 º 2
JB (n k ) « » ~ F 2 gl
¬ 6 24 ¼
3
Si JB < 6 se acepta la Ho.
skewness skw
¦ uˆ / n o 0
V~
2 3/ 2
4
Kurtosis kurt
¦ uˆ o 3
V~
2 2
138 Capitulo 4: Violación de los Supuestos del Modelo de Regresión Clásico
Jarque-Bera 0.210135
2 Probability 0.900264
0
-1.0 -0.5 0.0 0.5 1.0
El Jarque-Bera 0.21< 5.99 (valor crítico), por lo tanto se acepta la hipótesis que los
errores siguen una distribución normal. Note que la kurtosis tiende a 3 y el skewness
tiende a cero.
Yi E 1 E 2 X 2i E 3 X 3i ..... E k X ki u i .
Siendo su estimador
Yi Eˆ1 Eˆ 2 X 2i Eˆ 3 X 3i ..... Eˆ k X ki uˆ i .
Una de las propiedades de los mínimos cuadrados ordinarios es que ¦ uˆ i 0 , por lo
tanto, uˆ 0.
E (Yi X ) E 1 E 2 X 2i E 3 X 3i ..... E k X ki
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 139
E (Yi X ) ( E 1 T ) E 2 X 2i E 3 X 3i ..... E k X ki
E (Yi X ) D E 2 X 2i E 3 X 3i ..... E k X ki
1
La simetría es una de las condiciones para asegurar que el proceso autorregresivo sea
estacionario.
140 Capitulo 4: Violación de los Supuestos del Modelo de Regresión Clásico
ª V (u12 ) C (u1 , u 2 ) C (u 1 , u n ) º ªV 12 0 0º
« » « 2 »
«C (u1 , u 2 ) V (u 2 ) C (u 2 , u n ) » «0 V 2 0»
V (u ) E (uu ' ) 6
« » « »
« » « »
¬«C (u1 , u n ) C (u 2 , u n ) V (u n ) »¼ ¬« 0 0 V n2 »¼
Demostración:
Y XE u (4.13)
2
Esto significa que ante errores no esféricos no se cumple el Teorema de Gauss Markov.
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 141
V( Eˆ ) V u2 ( X ' X ) 1 (4.18)
4.5.1 Naturaleza
3
La varianza mínima será proporcionada por el estimador de mínimos cuadrados
generalizados.
142 Capitulo 4: Violación de los Supuestos del Modelo de Regresión Clásico
y XE v donde : v a N (T ; 6) (4.22)
Nótese que la V(v) incluye la varianza del verdadero término de perturbación u, V(u),
pero, además, una matriz de varianza de ZJ no nula que la hace no esférica4. Por lo que
la varianza de v, V(v), será muy sensible al patrón que la forma la variable Z. Por
ejemplo:
yt E 1 E 2 x t E 3 y t 1 H t (4.24)
yt E 1 E 2 x t E 3y t 2 Q t , (4.25)
Donde Q t E 3 ( y t 1 y t 2 ) H t (4.26)
Q t 1 E 3 ( y t 2 y t 3 ) H t 1 , (4.27)
4
El supuesto de independencia del error u con la variable explicativa Z no se ha violado,
E (Z ' u) 0.
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 143
Donde X es una variable no estocástica de rango completo, U(X), es decir, donde todas
las variables explicativas son independientes entre si, e independiente del error
E ( X ' u ) 0 . Asimismo, supongamos que la matriz 6 es una matriz simétrica, definida
positiva, de rango completo e invertible, por lo tanto, no singular.
Supongamos que existe una matriz P simétrica, no nula, que permite transformar la
matriz de varianzas y covarianzas de los erroes no escalares, 6, en una matriz de
varianzas y covarianzas que satisface los supuestos del modelo de regresión clásico. Es
decir, P6P' V u2 I n , por lo tanto:
Luego, si existe la matriz P se puede pre-multiplicar la ecuación (4.29) por P para tener
la ecuación generalizada:
PY PXE Pu (4.31)
Donde: Y * PY , X * PX , y u * Pu .
Media de Ê MCG
Tomando la esperanza matemática a la ecuación (4.37) se demuestra que, Ê MCG es un
estimador insesgado de E .
Varianza de Ê MCG
V ( Eˆ MCG ) E[( Eˆ MCG E )( Eˆ MCG E )' ] ( X * ' X * ) 1 X * 'V (u * ) X * ( X * ' X * ) 1 (4.39)
V ( Eˆ ) V ( Eˆ MCG ) ( X ' X ) 1 X ' P 1 [ I PX ( X ' P' PX ) 1 X ' P ' ]( P 1 )' X ( X ' X ) 1 (4.44)
z' A z
Dado que A es una matriz semi definida positiva, en una ecuación cuadrática, la
expresión completa también es semi definida positiva. Es decir:
Por lo tanto, la varianza del estimador de E por MCO será mayor que la varianza del
estimador de E por MCG, en consecuencia, el estimador de E por MCG es el
estimador más eficiente.
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 145
4.6 HETEROCEDASTICIDAD
En el análisis de regresión clásico se supone que la varianza del error, y por ende de la
variable endógena, permanece constante a lo largo de toda la muestra, esto hace que la
matriz de varianzas y covarianzas del error sea escalar:
V (u i ) V u V (u ) E (uu ' ) V u I n . Sin embargo, es probable que la dispersión de los
2 2
Y
Y Y
x
x
x x Varianza x x Varianza x Varianza
x decreciente x x constante x x creciente
x x x x x x
x x x
x x x x x x
x xx
x x x x x x x x x
x x
x x x x x x x x x
x x x x x x x
x x x x x x x
x x x x xx x x x x xx x x
x x x x x x x x
x x x
x x x
Z Z Z
Si bien los rendimientos promedios aumentan con el tamaño del predio, la dispersión
de los rendimientos no permanece constante. Se puede observar empíricamente que
exite mucha dispersión en el rendimiento de los pequeños agricultores, es decir, unos
muchos tienen rendimientos considerablemente “altos”, y otro tanto tienen rendimientos
“bajos”, que hacen que el promedio sea “bajo”. A nivel de medianos y grandes
agricultores (muy pocos en el país) el rendimiento es mayor y la dispersión es menor,
probablemente por que la tecnología es más estandarizada y la “habilidad de gestión” se
puede desarrollar a plenitud.
146 Capítulo 4: Violación a los Supuestos del Modelo de Regresión Clásico
ªV 12 0 0º
« 2 »
V (u i ) V i2 ; i V (u ) E (uu ' ) 6 « 0 V2 0»
(4.46)
« »
« »
¬« 0 0 V n2 ¼»
O también:
ªV 12 0 0º ª:12 0 0 º
« 2 » « »
« 0 V2 0» 2« 0 : 22 0 »
6 V V 2: (4.47)
« » « »
« » « »
«¬ 0 0 V n2 »¼ «¬ 0 0 : n2 »¼
Al final de esta sección se hará una breve presentación de cada uno de estos modelo.
Se puede tener dos tipos de causas, puras e impuras. Las causas puras ocurren cuando la
heterocedasticidad es producto de factores puramente aleatorios que genera que la
varianza cambie de observación en observación, es decir, la heterocedasticidad es
producto de la volatilidad imprevista de las series, por ejemplo:
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 147
Suponga ahora, que por alguna razón se omitió como variable explicativa al PBI (GDP)
y se estimó el modelo el modelo restringido:
(2) Mi = b0 + b2PRi + ui
En este caso queda claro que la omisión de la variable GDP lleva a que los errores
tenga la forma:
(3) ui = ei + b1GDPi
• Dado que los precios relativos PR (costo de oportunidad) difícilmente servirán como
una buena variable proxi de la variable GDP (variable de escala), entonces ui debe
incorporar el efecto de la variable omitida.
• El efecto de la variable omitida será aumentar la varianza de ui en especial para los
países más grandes, pues sus valores estarán asociados a los valores del GDP.
• Por lo tanto, la omisión de la variable GDP ha generado que ui sea heterocedástica.
V(ui) = V(ei) + b21V(GDPi).
148 Capítulo 4: Violación a los Supuestos del Modelo de Regresión Clásico
X 'u
Si X y u son asintóticamente independientes, es decir, el p lim( ) 0 , Ê es un
n
estimador consistente de E .
1
ªX'X º X 'u
p lim( Eˆ ) E p lim « p lim( ) E (4.49)
¬ n »¼ n
La varianza de Ê de MCO:
V ( Eˆ ) >
E ( Eˆ E )( Eˆ E )' @ ( X ' X ) 1 X ' E (uu ' ) X ( X ' X ) 1 (4.50)
o también:
Donde:
V ( Eˆ *) V ( Eˆ ) (4.54)
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 149
V ( Eˆ )C H ! V ( Eˆ ) S H . (4.58)
Estadístico t Estadístico F
Eˆ j
t Eˆ
j s Eˆ
j
s Eˆ V 2 b jj §¨ t ·¸
2
j FEˆ
j © Eˆ j ¹
Donde:
b jj es el elemento j-ésimo de la diagonal de la matriz
( X ' X ) 1 . Lo correcto sería incluir el elemento de la
diagonal de la matriz ( X ' X ) 1 X ' :X ( X ' X ) 1 .
1.0
0.5
0.0
-0.5
-1.0
-1.5
-2.0
50 100 150 200 250 300 350 400
Residuals
0.8
0.4
0.0
-0.4
-0.8
78 79 80 81 82 83 84 85 86 87
Residuals
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 151
0.1
0.0
-0.1
-0.2
-0.3
78 79 80 81 82 83 84 85 86 87
'IBL
û û
2 2
x x
x
x x x xx
xx x x x x
x x
x x x xx x xx x x x
x xx x x x x xx x x x
x x xx xx x xx x x x x x
x x xx x xx xx x x
x x x xx xx x xx x x xx xx x xx x xx x
0 x x xx x xx x x x
x 0 x x xx x xx x x
Z Z
El Test parte del supuesto que en la muestra existen dos grupos muy diferenciados de
observaciones (por ejemplo debido al sexo, raza, escala de planta, niveles de ingreso,
etc.) en los que en cada grupo se observa dispersión de los errores lo suficientemente
diferentes que pudiera derivan en varianzas diferentes.
152 Capítulo 4: Violación a los Supuestos del Modelo de Regresión Clásico
Procedimiento:
Paso 1: Ordenar las observaciones tomando como referencia la variable que se sospecha
es fuente de la heterocedasticidad, de menor a mayor.
Paso 3: Estimar por mínimos cuadrados ordinarios dos líneas de regresión, uno para
cada sub-muestra y obtener los residuos de cada modelo de regresión.
c) Test de White
(1) Yi E 1 E 2 X 2 i E 3 X 3i u i
Procedimiento:
Paso 1: Estimar por mínimos cuadrados ordinarios la ecuación (1) y obtener los
residuos.
(3) u i Yi Eˆ1 Eˆ 2 X 2i Eˆ 3 X 3i
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 153
El problema del test de White es que puede tener problemas de colinealidad y de grados
de libertad si el modelo correcto incluye muchas variables explicativas. El problema de
multicolinealidad se puede dar entre los términos lineales y o entre los términos
cuadráticos, pero para los fines de heterocedasticidad se pueden ignorar.
1
ªV 12 0 0º ª p12 0 0º
« » « »
0 V 22 0» «0 p 22 0» 1
6 V 2 ( P' P) 1 « pi (4.59)
« » « » Vi
« » « »
¬« 0 0 V n2 ¼» ¬« 0 0 p n2 ¼»
Donde P es la matriz que permite transformar la matriz no esférica en una esférica con
varianza igual a 1. Por lo tanto, el modelo de regresión generalizado será:
Pi Yi Pi E 1 E 2 Pi X 2i E 3 Pi X 3i E k Pi X ki Pi u i (4.60)
Yi 1 X 2i X 3i X ki ui
E1 E2 E3 Ek
Vi Vi Vi Vi Vi Vi
Donde el error modelo generalizado (u*) satisface los supuestos del análisis de
regresión clásico, por lo que, los estimadores de mínimos cuadrados ordinarios son
MELI, de igual modo la varianza estimada será insesgada. Por lo tanto, las pruebas de
hipótesis y las conclusiones que de ella se derivan serán válidas.
§u · Var u i V i2
Var (u i* ) Var ¨¨ i ¸¸ 2
1 V2 (4.61)
©Vi ¹ V i V i2
(1) Yi E 1 E 2 X 2 i E 3 X 3i u i .
(2) uˆ i Yi Eˆ1 Eˆ 2 X 2i Eˆ 3 X 3i
Vˆ i2 uˆ i2
(Engle, 1982)5, luego de analizar las cotizaciones de los activos financieros negociados
en la Bolsa de Valores encuentra períodos con una alta volatilidad de los precios y otros
períodos donde las cotizaciones permanecen relativamente constantes. Sobre la base de
estos hallazgos plantea que si los agentes económicos maximizan una función de
utilidad intertemporal bajo un esquema de expectativas racionales, es posible encontrar
una explicación a la persistencia de la volatilidad por varios períodos. En ese sentido, la
varianza del período t se forma a partir de toda la información existente sobre la
volatilidad de las cotizaciones, por ejemplo:
Sea le modelo de regresión general:
Yt E 1 E 2 X 2t E 3 X 3t E k X kt u t (4.62)
V t2 V (u t u t 1 , u , t 2 , , u t p ) (4.64)
V t2 E (u t2 :) (4.66)
V t2 Et 1 (u t2 ) (4.67)
5
Engle, Robert F. (1982) “Autoregressive Conditional Heteroskedasticity with Estimates of the
Variance of U.K. Inflation,” Econometrica, 50, 987–1008.
156 Capítulo 4: Violación a los Supuestos del Modelo de Regresión Clásico
Paso 1: Estimar por MCO la ecuación (4.62) y computar los residuos estimados.
Paso 2: Estimar por MCO la regresión auxiliar ARCH(p) utilizando uˆ t2 contra sus p
rezagos y compute su R2.
Paso 1: Estimar por MCO el modelo de regresión (4.62) y computar los residuos
estimados al cuadrado ut2 .
Paso 2: Estimar la varianza ARCH(p) mediante la regresión auxiliar (4.68). Utilice los
valores predichos por la regresión auxiliar uˆ para construir Vt2 . 2
t
Paso 3: Estimar por Mínimos Cuadrados Ponderados la ecuación (4.62), es decir, la
ecuación (4.60), utililizando como ponderador Pt 1
V̂ t
Los coeficientes estimados en el paso 3, son consistentes y eficientes, las varianzas
estimadas son consistentes si la hipótesis es correcta. Un problema crítico ocurre cuando
se tiene valores negativos en los pronósticos del paso 2.
6
Bollerslev, Tim (1986). “Generalized Autoregressive Conditional Heteroskedasticity,” Journal
of Econometrics 31, 307–327.
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 157
Esta especificación sugiere que los agentes forman sus expectativas sobre la varianza
del error como un promedio ponderado de un término de largo plazo( D 0 ) y las
varianzas recientes V t2 j y las volatilidades recientes u t2k .
Yt X t' E JV t2 u t (4.70)
Donde Dt 1 si u t ! 0()
Dt 0 en otro caso
u t 1 §u ·
log V t2 D 0 E 1 log(V t21 ) D 1 J ¨¨ t 1 ¸¸ H t (4.73)
V t 1 © V t 1 ¹
Si J z 0 la influencia es asimétrica.
7
Engle, Robert F., David M. Lilien, and Russell P. Robins (1987) “Estimating Time Varying Risk
Premia in the Term Structure: The ARCH-M Model,” Econometrica 55, 391–407.
8
Zakoian, J.M. (1990) “Threshold Heteroskedastic Models,” manuscript, CREST, INSEE, Paris.
9
Nelson, Daniel B. (1991) “Conditional Heteroskedasticity in Asset Returns: A New Approach,”
Econometrica, 59, 347–370.
158 Capítulo 4: Violación a los Supuestos del Modelo de Regresión Clásico
4.7 AUTOCORRELACIÓN
La autocorrelación o la correlación serial, en el contexto de series de tiempo, significa
que el error de un período de tiempo t depende de manera sistemática del error de otro
período distinto, en sentido, viola el supuesto de no correlación no contemporánea de
los errores, esto es, cuando en el modelo de regresión Y XE u no se cumple el
supuesto E[u t u t r s ] 0 ; s z 0 . Por lo tanto, se dice que los errores no se comportan
como un ruido blanco (white noise).
Una serie de tiempo u1 , u 2 , u 3 , , u t es llamada ruido blanco si u t a iid (0, V 2 ,0) , esto
es:
En el modelo de regresión clásico, se supuso que los errores son variables aleatorias
independientes e idénticamente distribuidas, u t a NID(0, V 2 ,0) , por lo tanto, se supuso
que el error era un ruido blanco gaussiano.
E (u t u t r s ) C (u t u t r s )
Uj (4.74)
E (u t2 ) V (u t )
0 0
-2
-2
-4
-4 -6
700 710 720 730 740 750 760 770 780 790 800 700 710 720 730 740 750 760 770 780 790 800
residuos residuos
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 159
En general las variables económicas tienen un carácter dinámico por lo que cualquier
variable presenta algún grado de autocorrelación de errores, por ejemplo, si el PBI de la
economía en el presente período se contrae, es muy probable que la contracción
continuará en el siguiente en los siguientes períodos, de igual modo, si en el presente
período se inicia un proceso de expansión es probable que dicha expansión continuará.
La explicación de dicho fenómeno no tiene nada que ver con otras variables, sino
solamente porque los errores están correlacionados.
ª Jo J1 J n 1 º ª 1 U1 U n 1 º
«J J0 J n 2 »» « U 1 U n 2 »»
V (u ) E (uu ' ) 6 « 1 J0« 1 (4.75)
« » « »
« » « »
¬J n 1 J n 2 J0 ¼ ¬ U n 1 U n 2 1 ¼
Donde:
Jj C (u t , u t j )
Uj (4.76)
J0 V (u t )
El valor o forma de cada uno de los elementos U j está supeditado al tipo de proceso
autorregresivo (AR) que se observa en el modelo.
Por ejemplo, si los errores ut siguen un proceso autorregresivo de primer orden, AR(1),
su distribución tendrá las siguiente características:
ut Uu t 1 H t , U 1 (4.77)
u t U Lu t H t (1 UL)u t He
Por lo tanto:
§f · f
E (u t ) E ¨¨ ¦ U s H t s ¸¸ ¦ U s E (H t s ) 0 (4.79)
©s 0 ¹ s 0
2
§f · §f · f
V (u t ) V ¨¨ ¦ U s H t s ¸¸ E ¨¨ ¦ U s H t s ¸¸ ¦ U 2 s E (H t2 s ) V 2 ¦ U 2 s (4.80)
©s 0 ¹ ©s 0 ¹ s 0 s 0
Para calcular las covarianzas entre ut y ut 1 se multiplicará la ecuación (4.77) por ut-1,
esto es:
u t u t 1 U u t21 H t u t 1
V2
Porque, E (u t21 ) V (u t 1 ) V (u t ) V u2 (por 4.81) y E(H t ut 1 ) 0 (porque ut-1
1 U 2
es solo función de H t 1 , H t 2 , H t 3 , y no estará correlacionado con H t .
U 2V 2
E (u t u t 2 ) UE (u t u t 1 ) E (H t u t 2 ) UE (u t , u t 1 ) (4.84)
1 U2
UE (u t , u t 1 ) U [ UV 2 /(1 U 2 )]
U (u t u t 2 ) U2 (4.85)
V (u t ) V 2 /(1 U 2 )
ª Jo J1 J n 1 º ª 1 U1 U n 1 º
«J « 1 »
J0 J n 2 »» V2 « U 1 U n2 »
E (uu ' ) 6 «
1
V (u ) V 2 : (4.86)
« » 1 U2 « »
« » « n 1 »
¬J n 1 J n 2 J0 ¼ ¬« U U n2 1 ¼»
162 Capítulo 4: Violación a los Supuestos del Modelo de Regresión Clásico
Luego,
ª 1 U1 U n 1 º
« »
1 « U1 1 U n2 »
: (4.87)
1 U2 « »
« n 1 »
¬« U U n2 1 ¼»
Existen dos tipos de causas puras e impuras. Esta distinción es en el mejor de los casos
arbitraria. Se entiene como causas puras de la autocorrelación cuando son producidas
por la naturaleza dinámica de las variables económicas, en cambio se entiende como
causas impuras a aquellas debidas a la impericia del modelista, esto es, haber omitido
variables, haber especificado incorrectamente el modelo, etc.
(1) Yt E 1 E 2 X 2t E 3 X 3t H t
Sin embargo, por alguna razón se omite o elimina la variable X3, estimándose el
modelo:
(2) Yt E 1 E 2 X 2t u t
Pero, es muy probable que X 3t esté correlacionada sus valores en el pasado, es decir,
E[ X 3t X 3t s ] z 0 .
u t u t 1 ( E 3 X 3t H t )( E 3 X 3t 1 H t 1 ) E 32 X 3t X 3t 1 E 3 X 3t H t 1 E 3 X 3t 1H t H t H t 1
E[u t u t 1 ] E 32 X 3t X 3t 1
En consecuencia, E[u t u t 1 ] z 0 ; s z 0 .
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 163
(1) Yt E 1 E 2 X t E 3 X t2 H t
Sin embargo, por alguna razón se omite o elimina la variable X2t, estimándose el
modelo:
(2) Yt E1 E 2 X t ut
Pero, es muy probable que X t2 esté correlacionada sus valores en el pasado, es decir,
E[ X t2 X t2s ] z 0 .
E[u t u t 1 ] E 32 X t2 X t21
En consecuencia, E[u t u t 1 ] z 0 ; s z 0 .
(1) Yt E1 E 2 X t ut
Pero, que por alguna razón las variables X e Y se miden con error, por ejemplo, porque
las variables no están claramente definidas o porque sus datos no existen y se utiliza un
“proxi”, dados por:
(2) Yt Yt* u ty ; X t X t* u tx ; u ty a Rb(0, V u2y ,0) ; u tx a Rb(0, V u2x ,0)
ut Yt E 1 E 2 X t (Yt* u ty ) E 1 E 2 ( X t* u tx )
Si E (u ty ) E (u tys ) E (u tx ) E (u txs ) 0; E[u ty u ty1 ] E[u ty utys ] E[u tx u tx1 ] E[u tx u tx s ] 0 , la
covarianza de errores es:
E[ Eˆ ] E ( X ' X ) 1 E[ X ' u ] E .
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 165
1
§ X'X · ª X 'u º
p lim Eˆ E p lim¨ ¸ p lim « » E
© n ¹ ¬ n ¼
Pero, además, dado que : es una matriz simétrica, semidefinida positiva, y no nula,
X ' :X no converge a X ' X , luego, V ( Eˆ ) es inconsistente, es decir:
1 1
§ X'X · § X ' :X · § X'X ·
2
nV p lim¨ ¸ . p lim¨ ¸. p lim¨ ¸ z V 2 ( X ' X ) 1 .
© n ¹ © n ¹ © n ¹
(2) u t Uu t 1 H t d t 2
n
2
(3) H t a Rb(0, V 2 ,0) ¦ uˆ t
t 1
Paso 1: Estimar por MCO la ecuación (1) y calcular los residuos ut .
Paso 2: Calcular el estadístico d de Durbin-Watson
Paso 3: Obtener los valores críticos del estadístico d de Durbin-Watson, que si bien no
tiene distribución conocida, en muestras grandes (n > 200) su converge a una
distribución t. Pero, para muestras pequeñas no está precisada. Sin embargo, se ha
calculado como valores críticos, el límite más bajo y el límite más alto (dL y dU) para n
y k-1 grados de libertad. Donde k-1 es el número de pendientes del modelo (lo cual
implica que tiene intercepto).
Paso 4: Criterios de decisión
n n n n
§ ·
¦ uˆ t uˆ t 1
2
2 ¦ uˆ t2 2 ¦ uˆ t uˆ t 1 ¨ ¦ uˆ t uˆ t 1 ¸
d t 2
n
# t 1
n
t 1
# 2¨ 1 t 2n ¸ # 2 (1 U )
2 2 ¨ 2 ¸
¦ uˆ t ¦ uˆ t ¨ ¦ uˆ t ¸
t 1 t 1 © t 1 ¹
d
0 dL dU 4-dU 4-dL 4
2
168 Capítulo 4: Violación a los Supuestos del Modelo de Regresión Clásico
Paso 1: Estimar por MCO la ecuación (1) y calcular los residuos ut .
r12 ¦ uˆ t uˆ t 1
Q n(n 2) a F 12g.l. donde r1 2
n 1 ¦ uˆ t
ª r12 r22 º 2 ¦ uˆ t uˆ t 1 ; r ¦ uˆ t uˆ t 2
Q n(n 2) « » a F 2 g.l. donde r1 2 2 2
¬n 1 n 2¼ ¦ uˆ t ¦ uˆ t
ª r2 r2 r2 º ¦ uˆ t uˆ t 3
Q n ( n 2 ) « 1 2 3 » a F 32 g.l. donde r3 2
¬n 1 n 2 n 3¼ ¦ uˆ t
c) Test de Breusch-Godfrey
El test de Breusch & Godfrey es una aplicación del test del Multiplicador de Lagrange
(LM test) para el caso de autocorrelación de errores. Se utiliza para modelos estáticos o
dinámicos y para procesos autorregresivos de primer orden o de orden superior.
(2) u t U1u t 1 U 2 u t 2 U 3 u t 3 U p u t p H t
Paso 1: Estimar por MCO la ecuación (1) y calcular los residuos ut .
Paso 2: Estimar la regresión auxiliar de ut contra todas las variables explicativas y los p
rezagos de los residuos y obtener el R2 de la regresión auxiliar, es decir:
2
uˆ t E 1 E 2 X 2t E k X kt U1uˆ t 1 U 2 uˆ t 2 U 3uˆ t 3 U p uˆ t p H t R AUX .
LM 1 (n 1) R12 a F n 1 g.l.
LM 2 (n 2) R22 a F n 2 g.l.
LM 3 (n 3) R32 a F n 3 g.l.
d) Test h de Durbin
El test h de Durbin es un test para modelos dinámicos que incluyen una variable
endógena rezagada como variable explicativa y cuando el proceso autorregresivo es de
primer orden AR(1). En estos casos, el estadístico d de Durbin-Watson está sesgado a 2
por lo que induce a aceptar la hipótesis nula de no autocorrelación de errores cuando en
verdad si puede tener.
Una debilidad del test h de Durbin es que si1 nV ( EˆYt 1 ) se tendrá soluciones
imaginarias, por lo tanto, será necesario recurrir al test de Breusch-Godfrey (LM test)
mediante la estimación de la regresión auxiliar visto en el acápite c). En general cuando
se está probando la hipótesis nula H 0 : U 0 , el h crítico para un nivel de significación
del 0.05 (5%) será h* = 1.645.
ª 1 U1 U n 1 º
« »
V 2 « U1 1 U n2 »
V (u ) E (uu ' ) 6 V 2:
1 U 2 « »
« n 1 »
«¬ U U n2 1 »¼
Entonces:
Eˆ ( X ' : 1 X ) 1 X ' : 1Y ; y V ( Eˆ ) V 2 ( X ' : 1 X ) 1
Por lo tanto:
ª 1 U 0 0 0 0 0 º
« U 1 U 2 U 0 0 0 0 »»
«
« U 1 U 2 U 0 0 0 »
: 1 « » P' P
« »
« 0 0 0 0 U 1 U 2 U»
« »
«¬ 0 0 0 0 0 U 1 »¼
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 171
Donde
ª 1 U 2 0 0 00 0 0º
« »
« U 1 0 00 0 0»
« 0 U 1 00 0 0»
P « »
« »
« 0 0 0 0 U 1 0 »»
«
«¬ 0 0 0 0 0 U 1 »¼
ª 1 U 2 Y1 º ª 1 U 2 X1 º ª 1 U 2 u1 º ªH 1 º
« » « » « » «H »
« Y2 UY1 » « X 2 UX 1 » « u 2 Uu1 » « 2»
Y* PY « Y UY » ; X * PX « X UX » ; u * Pu « u Uu » «H 3 » H
« 3 2
» « 3 2
» « 3 2
» « »
« » « » « » «»
«Y UY » « X UX » «u Uu » «¬H n »¼
¬ n n 1 ¼ ¬ n n 1 ¼ ¬ n n 1 ¼
O también:
(6) Yt * E 1* E 2 X 2*t H t
172 Capítulo 4: Violación a los Supuestos del Modelo de Regresión Clásico
Para el caso del modelo estático simple con AR(1), los pasos son los siguientes:
Para el caso del modelo estático con AR(p), los pasos son los siguientes:
Yt Uˆ 1Yt 1 Uˆ p Yt p E 1 (1 Uˆ 1 Uˆ p ) E 2 ( X 2t Uˆ 1 X 2t 1 Uˆ p X 2t p )
u t Uˆu t 1 Uˆu t p
Para el caso del modelo dinámico con AR(1), los pasos son los siguientes:
Yt E 1 (1 U ) E 2 X 2t E 2 UX 2t 1 ( E 3 U )Yt 1 E 3 UYt 2 H t
Como H t satisface los supuestos del modelo de regresión clásico los estimadores de D
por MCO serán insesgados, el estimador insesgado y consistente de U se obtiene de:
Uˆ Ê 3 / Eˆ 2 .
Paso 3: Utilizando el estimador de U obtenido en el Paso 2 estimar los E ' s por MCO a
partir de la ecuación de diferencias generalizadas (EDG):
Este método se utiliza únicamente para modelos estáticos y cualquier orden de proceso
autorregresivo. Por ejemplo para el caso de un AR(1), los pasos son los siguientes:
es:
ˆ ˆ ˆ ˆ
Paso 7: Volver a calcular los residuos: uˆˆ t Yt Eˆ1 Eˆ 2 X 2t Eˆ k X kt y repetir los
pasos 5 y 6 hasta lograr la convergencia de los estimadores de U y E a un valor estable,
esto es, si la diferencia entre los estimadores de dos iteraciones consecutivas es menor a
un límite de tolerancia, digamos 0.001.
ˆ
Uˆ Uˆˆ 0.001 y Eˆ Eˆ 0.001
Dado que la estimación por mínimos cuadrados ordinarios para un modelo dinámico
(que incluyen una o más variables endógenas rezagadas) son sesgados e inconsistentes,
la técnica de estimación por “Variables Instrumentales” produce estimadores
consistentes y eficientes. Donde las variables que sirven de instrumentos para la
variable endógena rezagada tienen las siguientes características:
(1) Los “instrumentos” Z son variables que están muy correlacionadas con la variable
§ Z' X ·
Yt-1. p lim¨ ¸ 6 zx z 0 . Donde X incluye a la variable endógena rezagada.
© N ¹
§ Z 'u ·
(2) Los “instrumentos” Z son variables independientes del error ut. p lim¨ ¸ 0.
© N ¹
Por lo tanto, si para cada variable endógena explicativa se reemplazan por sus
instrumentos los estimadores de “variables instrumentales” serán consistentes y
eficientes:
~ 1
E (Z ' X ) Z 'Y
Etapa 1:
(a) Estimar por Variables instrumentales el modelo dinámico inicial y obtener los
residuos u~t .
~
§ E1 ·
~ ¨~ ¸ ~ ~ ~
E ¨ E2 ¸ y u~t Yt E 1 E 2 X 2t E 3Yt 1
¨¨ ~ ¸¸
© E3 ¹
9
Hatanaka, M. (1974): “An efficient Two-Step Estimator for The Dynamic Adjustment Model
with Autoregressive Errors”, Journal of Econometrics, 2, 199-220.
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 175
n
¦ u~t u~t 1
2
t 3
Û n
¦ u~t
2
t 3
Etapa 2:
Ht Yt UYt 1 E 1 (1 U ) E 2 ( X 2t UX 2t 1 )
Como H t satisface los supuestos del modelo de regresión clásico, se puede utilizar la
función de densidad de una normal.
H t2
1
V2
f (H t ) e
2SV 2
n 1 n 1 1 n
l ( U , E1 , E 2 , V 2 ) log 2S logV 2 2 ¦ >Yt UYt 1 E1 (1 U ) E 2 ( X 2t UX 2t 1 )@
2 2 2V t 2
176 Capítulo 4: Violación a los Supuestos del Modelo de Regresión Clásico
Yˆt Eˆ1 Eˆ 2 X 2t Eˆ k X kt Uˆ 1u t 1 Uˆ 2 u t 2 Uˆ 3u t 3 Uˆ p u t p
En todos los casos deberá utilizarse los residuos de los modelos que permitieron estimar
los coeficientes U del proceso autorregresivo.
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 177
4.8 MULTICOLINEALIDAD
La colinealidad (o la multicolinealidad ) se presenta cuando alguna(s) variable(s)
explicativa(s) no mantiene(n) independencia con respecto al otra(s) variable(s)
explicativa(s) presente(s) en la ecuación, esto es, cuando las variables explicativas no
son “linealmente independientes”.
Con frecuencia los modelos econométricos incluyen distintas expresiones de una misma
variable explicativa sin que esto lleve a problemas de multicolinealidad, obsérvese por
ejemplo las variables X2 y X3 en el siguiente modelo.
1
(2) log Yi E 0 ¦ E j log x j ¦ ¦ J ij log xi * log x j
2 i j
O1 X 1i O 2 X 2i O3 X 3i O k X ki 0 i
Ante el caso de colinealidad perfecta, la detección será inmediata pues la matriz X’X
será singular, X ' X 0 , luego, la matriz inversa ( X ' X ) 1 quedará indeterminada y por
lo tanto, no se podrá estimar los parámetros E .
O1 X 1i O 2 X 2i O3 X 3i O k X ki vi 0 i
Ante el caso de colinealidad imperfecta, la detección será más difícil pues la matriz X’X
no será singular, pero puede ser cercana a singular, X ' X z 0 pero X ' X 0 , luego,
la matriz inverza ( X ' X ) 1 existirá pero con elementos exageradamente altos e
inestables, por lo tanto, se podrá estimar los parámetros E , pero sus resultados serán
muy inestables y poco significativos por la explosión de las varianzas y covarianzas, tal
como se puede observar en el siguiente cuadro.
Nótese que a medida que aumenta la correlación entre las variables explicativas, el
determinante de X’X tiende a cero y su inversa (que representa la matriz de varianzas y
covarianzas de Ê ) crece muy aceleradamente.
178
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 179
a) Colinealidad perfecta
(3) Yi E 1 E 2 X 2i E 3 X 3i E 4 X 4i u i
(4) X 2i aX 3i bX 4i
Dado que la variable X2 presenta una combinación lineal exacta con las variables X3 y
X4, la correlación simple entre la variable X2 y la combinación lineal aX3+bX4 será uno.
Si se reemplaza la ecuación (4) en la regresión (3) se tendrá:
(6) X [1 X 2i X 3i X 4i ] [1 aX 3i bX 4i X 3i X 4i ]
ª n a6X 3i b6X 4i 6X 3i 6X 4i º
«a6X b6X 6(aX 3i bX 4i ) 2 6(aX 3i bX 4i ) X 3i 6(aX 3i bX 4i ) X 4i »»
(7) X ' X « 3i 4i
« 6X 3i 6(aX 3i bX 4i ) X 3i 6X 32i 6X 3i X 4i »
« 2 »
¬ 6X 4i 6(aX 3i bX 4i ) X 4i 6X 3i X 4i 6X 4i ¼
ª n a6X 3 b6X 4 6X 3 6X 4 º
«a6X b6X a6(aX bX ) X b6(aX bX ) X 6(aX bX ) X 6(aX bX ) X »
X' X « 3 4 3 4
2
3 3 4 4 3
2
4 3 3 4 4»
« 6X 3 a6X 3 b6X 3 X 4 6X 3 6X 3 X 4 »
« 2 2 »
¬ 6X 4 a6X 3 X 4 b6X 4 6X 3 X 4 6X 4 ¼
Note que la segunda columna (fila) de la matriz X’X es una combinación lineal de la
tercera y cuarta columnas (filas), por lo tanto, si al menos una columna (o fila) de la
matriz X’X no es linealmente independiente, entonces: X ' X 0 . Por lo tanto, tanto la
matriz inversa ( X ' X ) 1 queda indeterminado. Como consecuencia tanto el estimador de
MCO de E como la matriz de varianzas y covarianzas de Ê quedan indeterminados.
180 Capítulo 4: Violación a los Supuestos del Modelo de Regresión Clásico
(8) Yi E 1 E 2 X 2 i E 3 X 3i E 4 ( X 4 i / X 2 i ) u i
Se plantea un modelo de determinación de la tasa de interés (r) como función del déficit
fiscal (D), además, se está interesado en separar los efectos de los ingresos fiscales (I) y
de los gastos fiscales (G) en la tasa de interés, por lo que se define la función:
rt f ( I t , Gt , Dt ) .
(10) rt E 1 E 2 I t E 3Gt E 4 Dt u t
(11) Dt I t Gt
180
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 181
Suponga que se quiere estimar las ventas (Y) como función de los Gastos en Publicidad
(X), pero diferenciando el efecto que tiene la estacionalidad trimestral (T1, T2, T3, T4)
en las ventas.
(11) Yt E 1 E 2 X t E 3T 1t E 4T 2 t E 5T 3t E 6T 4 t u t
Por lo tanto, se presenta colinealidad perfecta entre los trimestres y el intercepto porque:
(12) T 1t T 2 t T 3t T 4 t 1
Suponga que se quiere estimar los salarios (Y) como función de los años de escolaridad
(X) y el sexo de la persona (H=1 si es hombre, 0 en otro caso y M=1 si es mujer y 0 en
otro caso).
(13) Yi E1 E 2 X i E 3 H i E 4 M i ui
Por lo tanto, se presenta colinealidad perfecta entre los sexos y el intercepto porque:
(14) H i M i 1
b) Colinealidad imperfecta
(15) Yi E 1 E 2 X 2 i E 3 X 3i E 4 X 4 i u i
(16) X 2i aX 3i bX 4i ei
En este caso es muy probable que el coeficiente 0.05 sea estadísticamente no distinto de
cero, mientras el resto de estimadores mantiene su nivel de significación.
182
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 183
Utilizando datos del PBI anual para la economía peruana se ha construido la matriz de
correlaciones simples contra distintos niveles de rezagos. Los resultados son los mismos
con respecto a los hallazgos de la economía norteamericana.
rt E 1 E 2 I t E 3 Gt u t
log Qt 0.322 0.854 log PA,t 0.577 log PB ,t ; R2 0.89 Donde: rPA , PB 0.97
( s .e ) ( 0.089 ) (1.226 ) (1.012 )
Ejemplo: Sea el modelo de determinación del nivel salarial. En este caso a pesar que
no existir una relación teórica entre sexo, logros educativos y raza, en la práctica a nivel
muestral suele presentarse una alta asociación lineal entre dichas variables.
184 Capítulo 4: Violación a los Supuestos del Modelo de Regresión Clásico
Donde:
SALARIO: Salario en soles mensuales del individuo i-ésimo.
AÑEXP: número de años de experiencia del individuo i-ésimo.
SEX: sexo del individuo i-ésimo, 1=mujer, 0=hombre.
EDUC: grado de educación del individuo i-ésimo. 1 = educación superior; 0 = en otro
caso.
RAZA: raza del individuo í-ésimo. 1 = raza blanca, 0 = otra raza.
184
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 185
3. Dado que las variables explicativas están muy correlacionadas entre si, las
covarianzas entre los estimadores de MCO de E , C ( Eˆ j , Eˆ k ) , tiene a ser muy alta.
Esto dificulta separar el efecto en la variable dependiente que es atribuible a cada
variable explicativa. Por ejemplo, en el modelo: Yi E 1 E 2 X 1i E 3 X 2i u i , los
estimadores de MCO de E y sus errores estándar están muy influidos por la
correlación entre variables explicativas, r23.
Eˆ 2
¦ x 2 y ¦ x32 ¦ x3 y ¦ x 2 x3 s ¦ uˆ i2 /(n 3)
Eˆ
¦ x 22 ¦ x32 (1 r232 ) 2
¦ x 22 (1 r232 )
Eˆ 3
¦ x3 y ¦ x 22 ¦ x 2 y ¦ x 2 x3 s ¦ uˆ i2 /(n 3)
Eˆ
¦ x 22 ¦ x32 (1 r232 ) 3
¦ x32 (1 r232 )
4. Las altas covarianzas entre estimadores de MCO, produce una alta inestabilidad en
los valores estimados, es decir, pequeños cambios muestrales (inclusión o exclusión
de una variable explicativa, o adición o sustracción de unas pocas observaciones)
producen grandes cambios en los estimadores de E asociado a las variables
colineales, pero, no afectará los coeficientes estimados de las variables no
colineales. Es a raíz de esta situación se dice que la multicolinealidad es más un
problema muestral que poblacional, luego, dos variables pueden tener un alto grado
de correlación a nivel muestral, aunque a nivel poblacional no estén correlacionadas.
Por lo tanto, la multicolinealidad siempre va a existir, el problema es el grado. Si es
muy severa puede desencadenar todo lo visto arriba, en otro caso, es posible vivir
con él.
Suponga que se quiere estimar los gastos en transporte (GT) de un grupo de 100
trabajadores, para ello se divide el año entre el número de días trabajados por el
trabajador (W), el número de días de descanso médico (M) y el número de días no
trabajados por otras razones (O). El promedio de días trabajados es 242.7, el de
descanso médico es 2.1 y el de otros días no trabajados es de 120.2. Las cifras entre
paréntesis son los errores estándar.
GT t 9.6 2.10Wt 0.45 Ot R2 0.72
( 8.3) (1.98 ) (1.77 )
t 1.15 t 1.06 t 0.25
Hallazgos:
R2 k 0.72 2
F (2,97) 124.7
(1 R 2 ) (n k 1) (1 0.72) 97
La varianza “grande” para cada uno de los estimadores, trae como consecuencia
estadísticos t “bajos” de significancia individual para cada uno de los estimadores.
Pero, si está acompañado de un R 2 “alto” entonces llevará a una prueba F “alta” que
implica que las variables explicativas son significativa tomadas en conjunto. Esta
contradicción solo ocurre cuando se está ante un problema severo de
multicolinealidad. Además, el R 2 ajustado se va a afectar si se quita la variable
colineal.
186
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 187
X 2i a1 a 2 X 3i a3 X 4i a k X ki u 2i
X 3i a1 a 2 X 2i a3 X 4i a k X ki u 3i
1
FIV j . Donde el R 2j es el R2 de la regresión auxiliar para la j-ésima
1 R 2j
variable explicativa.
188 Capítulo 4: Violación a los Supuestos del Modelo de Regresión Clásico
1. Ignorar el problema.
Es frecuente admitir estos casos, cuando el modelo ha sido construido sólo con fines
de pronóstico, pues, es de esperar que el patrón de la colinealidad se mantendrá para
el período de pronóstico.
188
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 189
(6) Yt E 1 E 2 X 2 t E 3 X 3t J 1t u t .
Algunas veces se puede recurrir a un marco teórico que permite imponer restricciones a
los parámetros, que en condiciones irrectrictas pueden desencadenar en problemas de
multicolinealidad severa. Por ejemplo, a las funciones de producción se les puede
imponer la restricción de rendimientos constantes a escala, o las funciones de demanda
se le puede imponer la condición de homogeneidad. De igual modo, puede existir
estudios previos sobre los mismos parámetros de interés, que pueden ser tomados como
restricción al proceso de estimación del modelo.
Por ejemplo, supongamos una función de producción translog con dos insumos
variables:
(log Li ) 2 (log K i ) 2
log Qi E 0 E 1 log Li E 2 log K i E 3 E4 E 5 log Li * log K i u i
2 2
En algunos casos se hace preciso utilizar una mezcla de casos, es decir, utilizar primeras
diferencias, utilizar deflactores e imponer restricciones a los parámetros, como por
ejemplo al caso de la función de producción en modelos de crecimiento endógeno.
Qt AK tE 2 H tE 3 e ut
E2
Qt ªK º
A« t » e ut
Ht ¬ Ht ¼
190
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 191
Hipótesis: En 1966 el Papa Paulo VI tomó la decisión de permitir que los católicos
coman carne en Viernes Santo, esto habría desplazado la función de demanda por
pescado.
Los datos:
Ft = la cantidad de pescados consumidos (en libras) en el año t.
PFt = el índice de precios de pescado en el año t.
PBt = el índice de precios de carne de res en el año t.
Ydt = ingreso real disponible en el año t (en miles de millones de dólares)
CATt = el número de católicos en los Estados Unidos en el año t (decenas de miles).
D66t = Variable dummy igual a 1 para el año 1966 (decision papal) 0 en otros años.
Evaluación de resultados:
x Ninguno de los coeficientes son estadísticamente significativos (estadísticos t bajos).
x El R2 es 0.73 y el R2 ajustado es 0.666 los cuales son bastantes “altos” para estos
datos.
x Los valores estimados para E 1 , E 2 , y E 4 tienen signo incorrecto.
192 Capítulo 4: Violación a los Supuestos del Modelo de Regresión Clásico
x Tiene alguna sospecha?. Los problemas probables son variables omitidas, variables
irrelevantes o multicolinealidad.
x Chequee la matriz de correlaciones. Note que el ingreso per cápita disponible (Yd) y
el número de católicos (CAT), ambos miden el poder de compra. Además, es
probable que los precios de pescado (PF) y de carne de res (PB) se muevan en el
mismo sentido, porque son precios de equilibrio de dos bienes sustitutos, por
ejemplo, cuando se incrementa la demanda de pescado, el precio del pescado sube.
Al subir el precio del pescado la demanda de carne de res se expande aumentando
también el precio de la carne de res.
Qué hacer:
La multicolinealidad más probable es entre el número de católicos y el ingreso, ambos
representan el poder de compra, la correlación simple entre ambos es r=0.94, por lo que
podría eliminarse alguna de ellas, digamos el número de católicos (CAT).
Dependent Variable: F No
Method: Least Squares Significativos
Sample: 1946 1970
Included observations: 25
Variable Coefficient Std. Error t-Statistic Prob.
C 7.961108 7.773354 1.024154 0.3180
PF 0.027993 0.028533 0.981075 0.3383
PB 0.004692 0.019336 0.242675 0.8107
LOG(YD) 0.360363 1.154974 0.312010 0.7583
D66 -0.124462 0.257573 -0.483211 0.6342
R-squared 0.722869 Mean dependent var 13.448
Adjusted R-squared 0.667443 S.D. dependent var 0.533948
S.E. of regression 0.307916 Akaike info criterion 0.658876
Sum squared resid 1.896243 Schwarz criterion 0.902651
Log likelihood -3.235944 F-statistic 13.04200
Durbin-Watson stat 2.236966 Prob(F-statistic) 0.000022
192
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 193
Dependent Variable: F
Method: Least Squares
Sample: 1946 1970
Included observations: 25
Variable Coefficient Std. Error t-Statistic Prob.
C -5.168676 4.83273 -1.069515 0.297
PF/PB -1.930897 1.430728 -1.349591 0.1915
LOG(YD) 2.711743 0.656781 4.128838 0.0005
D66 0.005197 0.28008 0.018554 0.9854
R-squared 0.639721 Mean dependent var 13.448
Adjusted R-squared 0.588252 S.D. dependent var 0.533948
S.E. of regression 0.342621 Akaike info criterion 0.841263
Sum squared resid 2.465174 Schwarz criterion 1.036284
Log likelihood -6.515793 F-statistic 12.42938
Durbin-Watson stat 1.59775 Prob(F-statistic) 0.000069
Prueba de hipótesis:
En los casos 1 al 3, también se podría utilizar los estimadores de VI, pues ambos MCO
y VI producirán estimadores consistentes, sin embargo, el estimador de MCO tendrá la
menor varianza, es decir, el estimador Ê MCO será eficiente, V ( Eˆ MCO ) d V ( Eˆ VI ) .
Hay muchas razones por las cuales los regresores y el término de perturbación estarán
correlacionados, al menos asintóticamente. Se puede destacar cuatro razones:
a) Simultaneidad
Cuando el modelo incluye una variable endógena como variable explicativa (modelo de
ecuaciones simultáneas, se observa consecuentemente correlación de errores entre
ecuaciones distintas.
Demanda: qt E 1 pt u1t p
Oferta: qt E 2 p t u 2t
O
Donde:
ª E[u12 ] E[u1u 2 ]º ª V 12 V 12 º
E[uu ' ] « 2 » « 2 »
¬ E[u1u 2 ] E[u 2 ] ¼ ¬V 21 V 2 ¼
P*
Siendo p y q las variables endógenas del
modelo, es decir, se determinan D
simultáneamente al encontrar el equilibrio
entre la oferta y la demanda. q
q*
ª 1 º
E 1 pt u1t E 2 pt u 2t pt « » (u1t u 2t )
¬ E1 E 2 ¼
ª 1 º ª E2 º ª E1 º
qt E2 « » (u1t u 2t ) u 2t qt « »u1t « »u 2t
¬ E1 E 2 ¼ ¬ E1 E 2 ¼ ¬ E1 E 2 ¼
10
Se dice que un modelo está en su forma estructural si refleja la hipótesis económica. Se dice
que el modelo está en su forma reducida si refleja la solución (equilibrio) del modelo.
196 Capítulo 4: Violación a los Supuestos del Modelo de Regresión Lineal General
ª 1 1 ºª E u Eu º
¦« u1t u 2t » « 2 1t 1 2t »
Eˆ
¦ pt qt ¬ E1 E 2 E1 E 2 ¼ ¬ E1 E 2 E1 E 2 ¼
¦ pt2 ªu u º
2
¦ « 1t 2t »
¬ E1 E 2 ¼
ª1 0 º
E[uu ' ] «0 1 »
¬ ¼
Entonces, se puede observar que beta estimado por mínimos cuadrados ordinarios no es
igual ni a la pendiente de la demanda ni a la pendiente de la oferta. Además, este sesgo
no se elimina por más que aumente el tamaño de la muestra.
E 2 E1 E 2 E1
E[ Eˆ ] z0 y Lim E[ Eˆ ] z0
2 n of 2
Por lo tanto, el estimador de beta de MCO será sesgado e inconsistente con respecto a
cualquiera de las pendientes (oferta y demanda). Para ello basta que el modelo sea de
ecuaciones simultáneas. El problema se complica aún más si se supone que la
covarianza contemporánea de errores de ecuaciones distintas es diferente de cero,
E[u1i u 2i ] V 12 z 0 .
b) Errores de medida
Sea E[Yi X i* ] xi* ' E la relación condicional esperada entre Y y X*. Por lo tanto, el
modelo lineal se puede expresar como:
yi Exi* H i
Entonces,
yi E ( xi vi ) H i
yi Exi u i . Donde: u i Evi H i
UV u2
E[Yt 1u t ] z0
1 E2U
Si bien no existe un test directo que permite decidir, cuál método es mejor (MCO vs
VI) antes de hacer la regresión, el estimador de VI debe realizarse sobre la base de:
Y = XE + u (4.46)
Cada una de las variables incluidas en la matriz Z deben estar correlacionadas con su
par en la matriz X, ser estacionaria y ser asintóticamente independiente de error, es
decir:
§1 ·
plim¨ Z cu ¸ = 0 (4.47)
©T ¹
§1 ·
Donde plim¨ Z cX ¸ = : z 0 , es una matriz no singular de constantes.
©T ¹
Sea Ê VI el estimador de variables instrumentales de E .
Ê VI = (Z cX )-1 Z cY (4.48)
Ê VI = E + (Z cX )-1 Z cu
Supongamos que la matriz X está compuesta de dos tipos de variables X1 y X2, que se
puede representar como:
X = {X1 ¦ X2}
En la práctica se tiene que trabajar con muestras finitas y con errores que no son
observables, luego, no se sabe si una variable está efectivamente correlacionada
asintóticamente con el error, por lo tanto, la elección previa entre la estimación por
mínimos cuadrados ordinarios y por variables instrumentales es incierta. Sin embargo,
con posterioridad, el test de Wu-Hausman trata de probar si entre los estimadores de
MCO y de VI existe una diferencia estadísticamente significativa.
§1 ·
El argumento es que si plim¨ X cu ¸ = 0 , tanto los estimadores de MCO y de VI serán
©T ¹
consistentes, pero, el estimador de VI será ineficiente con respecto al de MCO. Por lo
tanto, se puede plantear las siguientes hipótesis:
§1 ·
H0: plim¨ X cu ¸ = 0 ó también H 0 : E ( X ' u ) 0 (4.88)
©T ¹
§1 ·
Ha: plim¨ X cu ¸ z 0 ó también H 1 : E ( X ' u ) z 0
©T ¹
11
Hausman, J.A. (1978), “Specification Test in Econometrics,” Econometrica, 46, 1251-1271.
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 201
Para probar que V (qˆ) V ( Eˆ MCO ) V ( EˆVI ) será necesario demostrar que C( Eˆ MCO , qˆ ) 0 ,
por lo que se creará un nuevo estimador:
Se sospecha que la variable X4t puede estar asintóticamente correlacionada con el error
ut. Supongamos que se han identificado dos instrumentos, W1 y W2, para la variable X4t,
es decir, están muy correlacionadas con X4, pero no con el error.
Paso 1:
Estimar por MCO la “ecuación instrumental”, para la variable potencialmente
“endógena” (X4) contra todas la variables “instrumentales” y obtenga los residuos:
X 4t D1 D 2 X 2t D 3 X 3t D 4W1t D 5W2t H t (4.96)
Hˆt X 4t Dˆ 1 Dˆ 2 X 2t Dˆ 3 X 3t Dˆ 4W1t Dˆ 5W2t , para todo t=1,...,T. (4.97)
Paso 2:
Estimar por MCO el modelo de regresión original:
12
Davidson, Russel & James G. MacKinnon (1989) “Testing for Consistency using Artificial
Regression”, Econometric Theory, Vol. 5, 363-384.
202 Capítulo 4: Violación a los Supuestos del Modelo de Regresión Lineal General
Yt E 1 E 2 X 2 t E 3 X 3t E 4 X 4 t u t (4.98)
Paso 3:
Estime por MCO el modelo aumentado y pruebe la hipótesis nula para la variable
adicional:
Yt E 1 E 2 X 2t E 3 X 3t E 4 X 4t JHˆt vt (4.99)
( SC Re s SC Re s A ) / 1 Si F ! F(10.05
, n -(k 1)) g.l. se
H0 :J 0 F: F a F(10.05
, n - k -1) g.l.
SC Re s A /(n k 1) re-chaza la hipótesis
H1 : J z 0 Ratio de verosimilutud: nula.
RV 2[l ( E , V 2 ) l A ( E , J , V 2 )] ~ F 12gl
Si RV ! F 12gl se
rechaza la hipótesis
nula.
APLICACIONES:
Respuestas:
a) Gráficas
PPOL vs. QPOL ING vs. QPOL
20 800
15 600
P I 400
P 10
N
O G
L
5 200
0 0
0 50 100 150 0 50 100 150
QPOL QPOL
14
15
12
P 10
P
R O 10
E 8 V
S I
6
5
4
2 0
0 50 100 150 0 50 100 150
QPOL QPOL
204 Capítulo 4: Violación a los Supuestos del Modelo de Regresión Lineal General
Los valores críticos del estadístico Durbin-Watson para k’=1 y n=30 son para un nivel
de significación del 5% son: dL=1.352 y dU=1.489. El estadístico DW calculado es
d=1.226. Por lo tanto cae en la zona de aceptación de la hipótesis nula de
autocorrelación positiva de primer orden.
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Variable Coefficient Std. Error t-Statistic Prob.
C 6.933067 9.662092 0.717553 0.4792
PPOL -0.897484 1.109810 -0.808682 0.4258
RESID(-1) 0.437755 0.188372 2.323882 0.0279
R-squared 0.166678 Mean dependent var 2.78E-15
Adjusted R-squared 0.104950 S.D. dependent var 23.42591
S.E. of regression 22.16257 Akaike info criterion 9.129326
Sum squared resid 13261.84 Schwarz criterion 9.269446
Log likelihood -133.9399 F-statistic 2.700214
Durbin-Watson stat 1.869275 Prob(F-statistic) 0.085305
Econometría: Teoría y Aplicaciones 205
Los valores críticos del estadístico Durbin-Watson para k’=4 y n=30 son para un nivel
de significación del 5% son: dL=1.143 y dU=1.739. El DW calculado es d=1.88, cae
dentro del rango dU=1.729 y 4-dU=2.261, por lo tanto, cae en la zona de aceptación de
la hipótesis nula de no autocorrelación de primer orden. El test de Breusch y Godfrey lo
confirma.
Test Equation:
Included observations: 30
Variable Coefficient Std. Error t-Statistic Prob.
C 34.36769 12.11679 2.836370 0.0085
PPOL -5.577449 0.782899 -7.124099 0.0000
ING 0.133068 0.024204 5.497843 0.0000
R-squared 0.751076 Mean dependent var 44.62747
Durbin-Watson stat 1.903631 Prob(F-statistic) 0.000000
206 Capítulo 4: Violación a los Supuestos del Modelo de Regresión Lineal General
Por lo tanto: Las variables precio de ovino y de res son variables redundantes.
En el capítulo 3, en el ejemplo 3.9 (página 107) se presenta los datos del Consumo y el
PBI para la economía peruana.
Respuestas:
a) Estime la función consumo: CPRt = D + EPBIt + ut
Los valores críticos del estadístico Durbin-Watson para k’=1 y n=50 son para un nivel
de significación del 5% son: dL=1.503 y dU=1.585. El DW calculado es d=0.467. Por lo
tanto cae en la zona de aceptación de la hipótesis nula de autocorrelación positiva
AR(1). Esto se verifica con el test de Breusch y Godfrey.
(3) Yt E 1 (1 U ) E 2 X t UX t 1 UYt 1 H t
Método de Hendry
(3) Yt E1 E 2 X t E 3 X t 1 E 4Yt 1 H t
Caso 3: Heterocedasticidad
Respuestas:
a) Estime por MCO la curva de Engel: SHALIMt = D + ELINGPCt + ut
b) Test de homocedasticidad.
Método Gráfico:
0.6
Nótese que las familias de más
0.4 bajos ingresos tienen una mayor
dispersión en el fracción gastada de
alimentos.
0.2
RES
-0.4
8 9 10 11 12 13
LINGPC
210 Capítulo 4: Violación a los Supuestos del Modelo de Regresión Lineal General
Test de White:
Los resultados indican que se rechaza la hipótesis nula, por lo tanto, hay evidencia de
heterocedasticidad en los residuos.
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Sample: 1 621
Included observations: 621
Variable Coefficient Std. Error t-Statistic Prob.
C 0.510960 0.079790 6.403843 0.0000
LINGPC -0.098130 0.016122 -6.086905 0.0000
LINGPC^2 0.004720 0.000812 5.812502 0.0000
R-squared 0.123886 Mean dependent var 0.004208
Adjusted R-squared 0.121051 S.D. dependent var 0.010649
S.E. of regression 0.009984 Akaike info criterion -6.370934
Sum squared resid 0.061597 Schwarz criterion -6.349526
Log likelihood 1981.175 F-statistic 43.69394
Durbin-Watson stat 1.967374 Prob(F-statistic) 0.000000
c) Corrección de la heterocedasticidad.
1° A partir del modelo inicial obtener los residuos uˆi SHALIM Dˆ EˆLINGPC .
2° Estimar el modelo : log (uˆi2 ) Ȗˆ1 Ȗˆ2 LINGPCi Ȗˆ2 LINGPCi2
3° Obtener la varianza estimada: Vˆ i2 uˆi2 exp(Ȗˆ1 Ȗˆ2 LINGPCi Ȗˆ2 LINGPCi2 )
Obtenga Pi 1/ Vˆ i2 1 / Vˆ i
Test Equation:
Dependent Variable: STD_RESID^2
Method: Least Squares
Date: 09/18/02 Time: 01:20
Sample: 1 621
Included observations: 621
Variable Coefficient Std. Error t-Statistic Prob.
C -0.041452 0.041130 -1.007827 0.3139
LINGPC 0.009290 0.008310 1.117888 0.2640
LINGPC^2 -0.000483 0.000419 -1.153364 0.2492
R-squared 0.003481 Mean dependent var 0.003008
Adjusted R-squared 0.000256 S.D. dependent var 0.005147
S.E. of regression 0.005146 Akaike info criterion -7.696242
Sum squared resid 0.016368 Schwarz criterion -7.674835
Log likelihood 2392.683 F-statistic 1.079438
Durbin-Watson stat 1.952903 Prob(F-statistic) 0.340426
PROBLEMAS:
(1) X t E 1 E 2 X t 1 u t
(2) u t Uu t 1 H t
(3) H t a N (0, V 2 X i )
Hi D 0 D 1 ln Wi D 2 K i D 3 M i u i
Donde:
Suponga que se cree que los residuos son heterocedásticos, donde Var (u i ) T ( I i ) 2 ,
donde T es desconocido e I es el ingreso. ¿Cómo obtendría los estimadores MELI de
los coeficientes del modelo?.
CAPITULO 5:
MODELOS LINEALES
MULTIECUACIONALES
o también
ª J 11 J 12 J 1m º ª Y1t º ª E 11 E 12 E 1k º ª X 1t º ª u1t º ª0 º
«J »« » « »« » « » «0 »
« 21 J 22 J 2 m » «Y2t » « E 21 E 22 E 2 k » « X 2t » « u 2t » « »
« »« » « »« » « » «0 »
« »« » « »« » « » « »
¬J m
1 J m 2 J mm ¼ ¬Ymt ¼ ¬ E m1 E m 2 E mk ¼ ¬ X kt ¼ ¬u mt ¼
0¼
¬,
* Y E X u 0
* Y EX u 0 (5.2)
ª V 11 V 12 V 1m º ª V 12 V 12 V 1m º
«V « »
« 21 V 22 V 2 m »» «V 21 V 2
2
V 2m »
6 (5.3)
« » « »
« » « »
¬V m1 V m 2 V mm ¼ ¬«V m1 V m 2 V m2 ¼»
ª V 12 I n V 12 I n V 1m I n º
« »
«V 21 I n V 22 I n V 2m I n »
) 6
In (5.4)
« »
« »
«¬V m1 I n V m2 I n V m2 I n »¼
Econometría, Teoría y Aplicaciones Juan Pichihua Serna 217
En este modelo, se está suponiendo que los errores dentro de cada ecuación están bien
comportados, es decir, no se evidencia problemas de autocorrelación de errores entre
observaciones distintas ni de heterocedasticidad para todas las observaciones dentro de
cada ecuación. Por ello, en la m-ésima ecuación los errores se comportarán como ruido
blanco.
u m a RB(0, V m2 I n ) donde E (u mt u m (t r s ) ) 0 s z 0
En todos los casos, la lista de variables predeterminadas (X) presentes en las ecuaciones
deberán ser distintas, para evitar problemas de identificación de cada una de ellas.
Para simplificar supongamos un modelo recursivo con tres ecuaciones dado por:
ªV 11 0 0 º
«
6 « 0 V 22 0 »»
«¬ 0 0 V 33 »¼
Esto implica los estimadores de los parámetros del modelo estructural por MCO
(ecuación por ecuación) serán insesgados y eficientes, es decir, MELI.
Paso 1: Estimar por MCO cada una de las ecuaciones del modelo y obtener los residuos
û it .
Paso 2: Probar la hipótesis siguiente:
De aceptarse la hipótesis nula, las ecuaciones del modelo podrán ser estimados por
MCO, siendo los estimadores MELI, en caso contrario, los estimadores de MCO serán
sesgados e inconsistentes. En este último caso, será preciso utilizar algunos métodos
alternativos, tales como el de Variables Instrumentales o el de Mínimos Cuadrados
Generalizados.
ª 1 0º ªV 12 0 º
Dado que * « » , si E (u1t u 2t ) 0 , entonces 6 « 2»
, por lo tanto, el
¬ J 1 1¼ ¬ 0 V2 ¼
modelo de oferta y demanda funciona como un modelo de ecuaciones recursivas, en ese
sentido, los estimadores de MCO de la oferta y la demanda serán insesgados y eficientes
(MELI).
De aceptarse la hipótesis nula ambas ecuaciones podrán ser estimadas por MCO, en
caso contrario, la función de demanda deberá ser estimada por Variables Instrumentales
y la función de oferta por MCO.
Q x Px
J2 Qx J 2 .I 1 .Px1 log Q x log J 2 1 * log I 1 * log Px
I
Q y Py
J3 Qy J 2 .I 1 .Py1 log Q y log J 3 1 * log I 1 * log Py
I
Q z Pz
J2 Qz J 2 .I 1 .Pz1 log Q z log J 4 1 * log I 1 * log Pz
I
220 Capítulo 5: Modelos Lineales Multiecuacionales
y1t X 1t E 1 u1t
y 2t X 2t E 2 u 2t
y 3t X 3t E 3 u 3t
ª1 0 0º ª y1t º ª X 1t 0 0 º ª E 1 º ª u1t º
«0 0 0 » « y » « 0 X 0 »» «« E 2 »» ««u 2t »»
« » « 2t » « 2t
¬«0
0 1¼» ¬« y 3t ¼»
¬« 0
0
X 3t ¼» ¬« E 3 ¼» ¬«u 3t ¼»
, ,
* y X E u
*Y EX u 0
ª1 0 0º
* «0 1 0 »
« »
«¬0 0 1»¼
ªV 12 V 12 V 13 º
« 2 »
) 6
In «V 12 V 2 V 23 »
I n
«V 13 V 23 V 32 »
¬ ¼
Econometría, Teoría y Aplicaciones Juan Pichihua Serna 221
Paso 1: Estimar por MCO cada una de las ecuaciones del modelo y obtener los residuos
û it .
Paso 2: Probar la hipótesis siguiente:
En caso de aceptarse la hipótesis nula, implicará que los estimadores de MCO serán
MELI, pero en caso contrario, implicará que no se deberá utilizar MCO para estimar los
parámetros por ser sesgados e inconsistentes. Los estimadores eficientes los proporciona
los Mínimos Cuadrados Generalizados para modelos multiecuacionales (SUR).
Regresando al modelo de demanda con tres ecuaciones, el test de Breusch y Pagan será:
H 0 : V 12 V 13 V 23 0 versus H 1 : al menos unV ij z 0
O n(r122 r132 r232 ) a F 32g .l .
O también:
V ( Eˆ SUR ) ( X ' (6 1
I n ) X ) 1
(5.10)
222 Capítulo 5: Modelos Lineales Multiecuacionales
Dado que 6 es una matriz no conocida, Zellner propone utilizar los residuos de la
estimación por Mínimos Cuadrados Ordinarios para obtener un estimador factible de
6.
Donde:
ªVˆ 12 Vˆ 12 Vˆ 13 º ªVˆ 11 Vˆ 12 Vˆ 13 º
« » « 12 »
6ˆ 2
«Vˆ 12 Vˆ 2 Vˆ 23 » y 6ˆ 1 «Vˆ Vˆ 22 Vˆ 23 »
«Vˆ 13 Vˆ 23 Vˆ 32 » «Vˆ 13 Vˆ 23 Vˆ 33 »
¬ ¼ ¬ ¼
¦ uˆ i uˆ j
Vˆ ij
(n k i )(n k j )
uˆ it y it X it Ê i
Existe dos casos cuando los estimadores de mínimos cuadrados ordinarios produce
estimadores insesgados y eficientes (MELI) en el caso de modelos de ecuaciones
aparentemente no relacionadas, los casos son:
Eˆ SUR 1
( X ' X ) X 'Y (5.13)
Econometría, Teoría y Aplicaciones Juan Pichihua Serna 223
Por lo tanto:
ª Eˆ1SUR º ª ( X 1 ' X 1 ) 1 X 1 ' Y1 º ª Eˆ1MCO º
« ˆ SUR » « 1 » « ˆ MCO »
E « ( X 2 ' X 2 ) X 2 ' Y2 » «E 2 »
E SUR « 2 »
ˆ Eˆ MCO (5.14)
« » « » « »
« SUR » « » « MCO »
«¬ Eˆ m »¼ «¬ Eˆ m »¼
1
«¬( X m ' X m ) X m ' Ym »¼
En el caso que las variables explicativas sean idénticas en todas las ecuaciones, la
demostración también sigue un proceso parecido.
~
ªX1 0 0º ªX 0 0º
«0 « ~ »
« X 1 0 »» «0 X 0» ~ ~
Sea X I m
X , entonces: X ' I m
X ' .
« » « »
« » « ~»
¬0 0 X1¼ «¬ 0 0 X »¼
Luego:
Eˆ SUR [ X ' (6 1
I n ) X ] 1 ( X ' (6 1
I n )Y )
~ ~ ~
Eˆ SUR [( I m
X ' )(6 1
I n )( I m
X )]1 ( I m
X ' )(6 1
I n )Y
~ ~ ~ ~ ~ ~
Eˆ SUR [6 1
X ' X ] 1 (6 1
X ' )Y [6
( X ' X ) 1 ](6 1
X ' )Y
~ ~ ~
Eˆ SUR [ I m
( X ' X ) 1 X ' ]Y
~ ~ 1 ~
Eˆ SUR [( I m
X ' )( I m
X )] ( I m
X ' )Y
X' X X'
Nuevamente:
Eˆ SUR ( X ' X ) 1 X ' Y Eˆ MCO (5.15)
Por lo tanto, en ambos casos será suficiente los MCO para estimar los parámetros del
modelo.
ª V 12 V 12 V 1m º
« 2 »
6 «V 21 V 2 V 2m »
« »
« »
«¬V m1 V m 2 V m2 »¼
Donde:
y it = es la variable endógena de la ecuación i-ésima
Y1t , Y2t , Y3t , , Ymt = llamadas “variables endógenas explicativas”, es un conjunto de
otras variables endógenas presentes en la ecuación que operan como variables
explicativas en la ecuación i-ésima (no incluye la variable y it i-ésima) .
X 2t ,......., X kt = es el conjunto de variables predeterminadas presentes en la ecuación i-
ésima.
u it = es el término de perturbación estocástico con: u it a Rb(0, V i2 )
yi Yi J i X i E i 2 u i (5.17)
O también así:
yi Z iG i ui (5.18)
y1 J 12 y2 J 13 y3 E1 x1 H1
y2 J 21 y1 J 23 y3 E 2 x2 H 2
y3 J 31 y1 J 32 y2 E 3 x3 H 3
Reordenando se tiene:
y1 J 12 y 2 J 13 y3 E1 x1 H 1 0
J 21 y1 y 2 J 23 y3 E 2 x2 H 2 0
J 31 y1 J 32 y 2 y3 E 3 x3 H 3 0
Donde:
ª y1 º ª x1 0 0º ª 1 J 12 J 13 º ª E1 0 0º
Y «« y 2 »» ; X «0 0 »» ; * «J » «0 0 »» ; y
« x2 « 21 1 J 23 » ; E « E2
«¬ y 3 »¼ «¬ 0 0 x3 »¼ «¬J 31 J 32 1 »¼ «¬ 0 0 E 3 »¼
ªV 11 I n V 12 I n V 13 I n º
E (HH ' ) ) 6
In «V I V 22 I n V 23 I n »» .
« 21 n
«¬V 31 I n V 32 I n V 33 I n »¼
1
A diferencia de los modelos uni-ecuacionales, donde las variables se dividían entre variables
dependientes y variables independientes, en el contexto del modelo de ecuaciones simultáneas
se divide en variables endógenas y predeterminadas.
226 Capítulo 5: Modelos Lineales Multiecuacionales
Las variables predeterminadas, pueden ser variables cuyos valores se obtienen fuera del
modelo (llamadas variables exógenas) o variables cuyos valores corresponden a
períodos pretéritos, y pueden estar compuestas por variables endógenas o variables
exógenas rezagadas. Las variables “exógenas” son variables no estocásticas, y por lo
tanto, no están correlacionadas con ningún término de error del modelo. De igual modo,
si bien las variables endógenas rezagadas le dan un carácter dinámico al modelo, se
supondrá, en todos los casos, que mantienen independencia estocástica con respecto al
término de perturbación.
Finalmente, para que una ecuación pueda ser diferenciada de otra ecuación, es preciso
señalar que la lista de variables predeterminadas presentes en cada ecuación sea distinta
en al menos una variable. Esto lo veremos con mayor detalle en la sección “el problema
de la identificación”.
* Y EX u 0 (5.19)
Donde:
ª J 11 J 12 J 1m º ª Y1t º ª E 11 E 12 E 1k º ª X 1t º ª u1t º ª0 º
«J »« » « »« » « » «0 »
« 21 J 22 J 2 m » «Y2t » « E 21 E 22 E 2 k » « X 2t » « u 2t » « »
« »« » « »« » « » «0 »
« »« » « »« » « » « »
¬ J m1 J m 2 J mm ¼ ¬Ymt ¼ ¬ E m1 E m 2 E mk ¼ ¬ X kt ¼ ¬u mt ¼ 0¼
¬,
* Y E X u 0
La forma reducida se obtiene de encontrar la solución para las variables endógenas (Y)
como función únicamente de las variables predeterminadas (X).
Y * 1 EX * 1u (5.20)
O también:
ª Y1t º ª S 11 S 12 S 1k º ª X 1t º ª v1t º
«Y » «S »« » « »
« 2t » « 21 S 22 S 2 k » « X 2t » « v 2t »
«» « »« » « »
« » « »« » « »
¬Y
mt ¼ ¬ S m1 S m 2 S mk ¼ ¬ X kt ¼ ¬v mt ¼
Y 3 X u
Y 3X v (5.21)
Donde: 3 * 1 E ; v * 1u
J 12 pt E 1 pt 1 u1t J 22 pt E 2 I t u 2t
E1 E2 u u1t
(3) pt pt 1 I t 2t pt S 11 pt 1 S 12 I t v1t
J 12 J 22 J 12 J 22 J 12 J 22
ª E1 E2 u u1t º
qt J 22 « pt 1 I t 2t » E 2 I t u 2t
¬ J 12 J 22 J 12 J 22 J 12 J 22 ¼
E 1J 22 E 2J 12 J u J 22 u1t
(4) qt pt 1 I t 12 2t qt S 21 pt 1 S 22 I t v 2t
J 12 J 22 J 12 J 22 J 12 J 22
Donde:
E1 E2 u 2t u1t
S 11 ; S 12 ; v1t
J 12 J 22 J 12 J 22 J 12 J 22
228 Capítulo 5: Modelos Lineales Multiecuacionales
E 1J 22 E 2J 12 J 12 u 2t J 22 u1t
S 21 ; S 22 ; v 2t
J 12 J 22 J 12 J 22 J 12 J 22
yi Yi J i X i E i 2 u i Z iG i ui (5.22)
El estimador de MCO:
E2 u u
(3) pt I t 2t 1t
J 12 J 22 J 12 J 22
E 2J 12 J u J 22 u1t
(4) qt I t 12 2t
J 12 J 22 J 12 J 22
(5) Jˆ12
¦ pt qt
2
¦ pt
Dado que V(pt)>0 (positivo), se puede demostrar que E ( pt u1t ) Cov( pt u1t ) z 0 , luego,
Jˆ12 de MCO será un estimador sesgado de J 12 .
V 12
(9) E ( pt u1t ) 0
J 12 J 22
Luego:
V 12
J 12 J 22
(10) E (Jˆ12 ) J 12 2
z J 12 E (Jˆ12 ) J 12
Vp
Con lo que se demuestra que Jˆ12 de MCO será un estimador sesgado de J 12 , más aún
si V 12 0 , Jˆ12 de MCO subestimará el verdadero valor de J 12 , E (Jˆ12 ) J 12 .
V 12 V 12 V 12 V 12
(11) E ( pt u1t ) Lim E ( pt u1t ) z0
J 12 J 22 n of J 12 J 22
Donde V 12 puede ser positivo o negativo, y siendo la probabilidad cero para que
V 12 V 12 (o de 1 en infinito).
2
V 12 V 1
J 12 J 22
(12) Lim E (Jˆ12 ) J 12 2
z J 12 ,
n of Vp
Con lo que se demuestra que Jˆ12 de MCO será un estimador inconsistente de J 12 . Pero
además, dependiendo del signo de la diferencia entre V 12 V 12 , Jˆ12 de MCO sobre
estimará o subestimará el verdadero valor de J 12 .
(1) Ct D EYt u t
(2) Yt Ct I t
Donde: C = consumo,
Y = ingreso disponible,
I = inversión.
D E u
(3) C t I t t C t 3 0 3 1 I t vt
1 E 1 E 1 E
D E u
(4) Yt I t t Yt 3 0 3 1 I t vt
1 E 1 E 1 E
D 1
Donde: 3 0 ; 31
1 E 1 E
(5) Eˆ
¦ ct y t
2
¦ yt
(6) Eˆ
¦ ( Ey t u t u ) yt E
¦ ( yt ut yt u )
2 2
¦ yt ¦ yt
Econometría, Teoría y Aplicaciones Juan Pichihua Serna 231
(7) E ( Eˆ ) E
¦ E ( yt ut ) u ¦ E ( yt ) E
Cov( y t u t )
2 2
¦ E ( yt ) ¦ E ( yt ) V ( yt )
ª§ E u u · º EE (it u t ) E (u t2 ) u E (u t )
(8) E ( y t u1t ) E «¨¨ it t ¸u t »
¬© 1 E 1 E ¸¹ ¼ 1 E 1 E
V2
E ( y t u1t ) ! 0 ()
1 E
Luego:
V 12
1 E
(9) E ( Eˆ ) E !E
V y2
O también:
(11) p lim Eˆ z E
Una ecuación estructural estará identificada sólo cuando existan suficientes variables
predeterminadas del sistema no incluidas en aquella ecuación, de modo que es posible
distinguirla de todas las otras ecuaciones del sistema.
* Y EX u 0 (5.24)
Donde:
ª J 11 J 12 J 1m º ª Y1t º ª E 11 E 12 E 1k º ª X 1t º ª u1t º ª0 º
«J »« » « »« » « » «0 »
« 21 J 22 J 2 m » «Y2t » « E 21 E 22 E 2 k » « X 2t » « u 2t » « »
« »« » « »« » « » «0 »
« »« » « »« » « » « »
¬ J m1 J m 2 J mm ¼ ¬Ymt ¼ ¬ E m1 E m 2 E mk ¼ ¬ X kt ¼ ¬u mt ¼ 0¼
¬,
* Y E X u 0
Y 3X v (5.25)
Donde: 3 * 1 E ; v * 1u ; y
ª Y1t º ª S 11 S 12 S 1k º ª X 1t º ª v1t º
«Y » «S »« » « »
« 2t » « 21 S 22 S 2 k » « X 2t » « v 2t »
«» « »« » « »
« » « »« » « »
¬Y
mt ¼
S m1 S m 2 S mk ¼ ¬ X kt ¼ ¬v mt ¼
¬
Y 3 X u
a) Condición de Orden
Una condición necesaria (pero no suficiente) para que la ecuación i-ésima sea
identificada es que el número de variables predeterminadas ausentes en dicha ecuación,
k i** , sea mayor o igual al número de variables endógenas presentes menos uno, mi* 1 .
De otro modo, también se puede señalar que una ecuación estará identificada si el
número de variables predeterminadas del sistema (modelo) es mayor o igual al número
de pendientes de dicha ecuación.
Ejemplo 5.6: Supongamos el siguiente modelo de oferta y demanda que cuenta con 2
variables endógenas (qt y pt) y una variable predeterminada It .
pt Sˆ1 I t vˆ1 E2 E 2J 12
. Donde: Sˆ1 y Sˆ 2
qt Sˆ 2 I t vˆ2 J 12 J 22 J 12 J 22
Con Jˆ12 la curva de oferta queda claramente identificada, sin embargo, los parámetros
de la curva de demanda no pueden ser obtenidos a partir de los parámetros de la forma
reducida. Esto se explica porque el modelo tiene tres parámetros por estimar en la forma
estructural (“incógnitas”: J 12 , J 22 , y E 2 ), pero, cuenta solamente con dos parámetros en
la forma reducida (“ecuaciones”: S 1 y S 2 ).
E1 E2 E 1J 22 E 2J 12
Donde: Sˆ11 ; Sˆ12 ; Sˆ 21 ; y Sˆ 22 .
J 12 J 22 J 12 J 22 J 12 J 22 J 12 J 22
Econometría, Teoría y Aplicaciones Juan Pichihua Serna 235
Note que en este caso el modelo tiene cuatro parámetros por estimar en la forma
estructural (“incógnitas”: J 12 , J 22 , E 1 y E 2 ), y cuenta con cuatro parámetros en la forma
reducida (“ecuaciones”: S 11 , S 12 , S 21 y S 22 ). Por lo tanto, es posible la existencia de
solución única para los parámetros estructurales.
Sˆ 22 Sˆ 21 ˆ ª Sˆ Sˆ º ª Sˆ Sˆ º
Jˆ12 ; Jˆ 22 ; E1 Sˆ 11 « 21 22 » ; y Eˆ 2 Sˆ 12 « 22 21 »
Sˆ12 Sˆ11 ¬ Sˆ11 Sˆ 12 ¼ ¬ Sˆ 12 Sˆ11 ¼
E1 E2 E3
Donde: Sˆ11 ; Sˆ12 ; Sˆ13 ;
J 12 J 22 J 12 J 22 J 12 J 22
E 1J 22 E 2J 12 E 3J 22
Sˆ 21 ; Sˆ 22 ; y Sˆ 23 .
J 12 J 22 J 12 J 22 J 12 J 22
Note que en este caso el modelo tiene cinco parámetros por estimar en la forma
estructural (“incógnitas”: J 12 , J 22 , E 1 , E 2 y E 3 ), y cuenta con seis parámetros en la
forma reducida (“ecuaciones”: S 11 , S 12 , S 13 , S 21 , S 22 y S 23 ). Por lo tanto, la sobre
identificación hace que exista más de una solución para la pendiente de la curva de
demanda Jˆ 22 , y con ello todos los demás parámetros también quedan
sobreidentificados.
Sˆ 21 Sˆ 23
¿ Jˆ 22 ó Jˆ 22 ?,
Sˆ11 Sˆ13
ª Sˆ Sˆ º ª Sˆ Sˆ º
¿ Eˆ1 Sˆ 11 « 21 22 » ó Eˆ 2 Sˆ 11 « 23 22 » ?, etc.
¬ Sˆ11 Sˆ 12 ¼ ¬ Sˆ13 Sˆ12 ¼
Ejemplo 5.9: Supongamos el siguiente modelo con tres ecuaciones simultáneas, que
cuenta con tres variables endóques y1, y2, y3, y dos variables predeterminadas x1 y x2.
236 Capítulo 5: Modelos Lineales Multiecuacionales
b) Condición de Rango
Ejemplo 5.10: Si se reordena las variables del modelo trabajado en el ejemplo anterior,
se tiene:
y1 J 12 y 2 J 13 y3 E1 x1 u1 0
0 y1 y 2 J 23 y3 0 x1 E 2 x2 u 2 0
J 31 y1 0 y 2 y3 0 x1 0 x2 u3 0
Econometría, Teoría y Aplicaciones Juan Pichihua Serna 237
ª y1 º ª 1 J 12 J 13 º ªE1 0º
ª x1 º « 0 1 J » ; y E «0
Donde: Y «y » ; X
« 2» «x » ; * « 23 » « E 2 »»
«¬ y 3 »¼ ¬ 2¼ «¬J 31 0 1 »¼ «¬ 0 0 »¼
ªY º
Reordenando también se puede expresar como: >* E @« » u 0 AZ u 0
¬X ¼
Donde: Z ' > y1 y 2 y 3 x1 x 2 @ y
y1 y2 y3 x1 x2
-1 J 12 J 13 E1 0 (1)
A = 0 -1 J 23 0 E2 (2)
J 31 0 -1 0 0 (3)
ªE 2 º ª 1 E1 º ªJ 12 E1 0 º
A1 « 0 » U ( A1 ) 1 ; A2 «J » U ( A2 ) 2 , y A3 « 1 0 E » U ( A3 ) 2
¬ ¼ ¬ 31 0 ¼ ¬ 2¼
Note que la ecuación (1) está subidentificada porque U ( A1 ) 2 . La ecuación (2) está
exactamente identificada porque U ( A2 ) 2 y la condición de orden así lo señala.
Finalmente, la ecuación (3) está sobreidentificada porque U ( A3 ) 2 y la condición de
orden así lo señala. Note también que la matriz A2 solo existe una submatriz no singular
que confirma que la ecuación (2) está exactamente identificada, en cambio en la matriz
A3 existe hasta tres posibles submatrices no singulares, lo que confirma la
sobreidentificación de la ecuación (3).
J 12 E1 J 12 0 E1 0
A31 z 0 , A32 z 0, A33 z0
1 0 1 E2 0 E2
Ejemplo 5.11: Supongamos ahora un modelo de cinco ecuaciones, dos de las cuales son
identidades (1) y (3) y las tres restantes son ecuaciones de comportamiento. Evalue la
situación de identificación de las tres ecuaciones de comportamiento: ecuaciones (2)
“función consumo”, (4) “función inversión” y (5) “demanda por dinero”. Las
identidades, al tener parámetros conocidos (1 ó –1) siempre están identificados, por lo
que no requieren evaluación adicional.
En el modelo las cinco variables endógenas son: PBI (Y), Consumo (C), Ingreso
disponible (YD), Inversión (I), y tasa de interés (r). Las seis variables
predeterminadas del modelo son todas la demás variables, esto es: Gasto del gobierno
(G), exportaciones netas (NX = exportaciones – importaciones), Consumo rezagado
(Ct-1), impuestos (T), tasa de interés rezagada (rt-1), cantidad de dinero (M).
238 Capítulo 5: Modelos Lineales Multiecuacionales
Yt It rt Gt NXt Tt rt-1 Mt
-1 1 0 1 1 0 0 0 (1)
1 0 0 0 0 -1 0 0 (3)
A2 = E -1 0 0 0 0 E5 0 (4)
4
E7 0 -1 0 0 0 0 E8 (5)
Como se puede verificar, todas las matrices tienen rango 4, o sea, se puede extraer más
de una submatriz no singular de cada una de ellas. Luego, las ecuaciones (2), (4) y (5)
están sobre identificadas.
predeterminadas son: ingreso rezagado (Yt-1), gasto del gobierno (G). Recuerde que
'Yt Yt Yt 1 .
Ct It Yt 1 Yt-1 Gt
-1 0 E1 E0 0 0 (1)
A= 0 -1 E3 E2 E3 0 (2)
1 1 -1 0 0 -1 (3)
ª 1 E 3 0º ª 1 0º
A1 «1 ; A2
¬ 0 1»¼ « 1 1»
¬ ¼
Por otro lado, los métodos de estimación con información completa (IC, Full
Information-FI) estiman los parámetros de todas las ecuaciones simultáneamente (por
ejemplo mínimos cuadrados en tres etapas-MC3E y máxima verosimilitud con
información completa-MVIC), y proporcionan estimadores eficientes, sin embargo, si
la ecuación de interés tiene problemas de sesgo de especificación (como ejemplo debido
a variables omitidas) los estimadores los estimadores de IC tienden a ser inconsistentes,
mientras los estimadores de IL conservan la consistencia.
Donde:
y it = es la variable endógena de la ecuación i-ésima
Yi * >Y1t Y2t Ymt @ = son las mi* “variables endógenas explicativas” presentes en
la ecuación i-ésima, en la que obviamente no se incluye la variable y it i-ésima .
X i* >1 X 2t X kt @ = son las ki* variables predeterminadas (exógenas y
rezagadas) presentes en la ecuación i-ésima.
u it = es el término de perturbación de la ecuación i-ésima, siendo u it a Rb(0, V i2 ) .
yi Yi*J i X i* E i 2 u i (5.27)
yi Z i*G i u i (5.28)
Donde: Z *
i >Y i
*
X *
i @ ; y G ' >J
i i Ei @
Yi * XS i vi (5.29)
Donde: X [X *
i X ] **
i
La forma reducida para las m variables endógenas del modelo también se expresa en
función de las k variables predeterminadas presentes (X*) y ausentes (X**), es decir:
Y 3X v (5.30)
Donde: Y ' [ y i Yi *
Yi ] ; 3
**
* E ; y v
1
* u
1
Econometría, Teoría y Aplicaciones Juan Pichihua Serna 241
El método de MCI se debe utilizar únicamente cuando las ecuaciones de interés están
exactamente identificadas y consiste de dos pasos:
Y ˆ X vˆ
3 (5.31)
ˆ
3 ( X ' X ) 1 X ' Y (5.32)
ˆ
Donde: 3 * 1 E
Demostración:
yi Yi*J i X i* E i 2 u i (5.33)
ªJ º
yi >Yi
*
@
X i* « i » u i (5.34)
¬E i ¼
yi Z i*G i u i (5.35)
Dado que las variables predeterminadas son independientes del error, E[ X ' u i ] 0 , el
estimador consistente de Mínimos Cuadrados Indirectos, como un estimador de
variables instrumentales, es:
~
Gi ( X ' Z i ) 1 X ' y i (5.37)
~
~ ªJ i º
Donde G i « E~ »
¬ i¼
242 Capítulo 5: Modelos Lineales Multiecuacionales
Dado que todas las ecuaciones del modelo están exactamente identificadas no habrá
ningún problema para obtenerse la inversa de X’Zi, pues ambas matrices, X’ y Zi, deben
ser conformables. Esto implica que el número de variables endógenas explicativas
incluidas en la ecuación i-ésima, Zi, es reemplazada por la misma cantidad de
instrumentos (variables predeterminadas ausentes en dicha ecuación, Xi**). Esto es
posible porque si todas las ecuaciones del modelo están exactamente identificadas
tendrán tantas variable endógenas como variables predeterminadas, m = k.
ˆ
3 ( X ' X ) 1 X '[ y i Yi* Yi** ] (5.38)
y i Yi*J i X i* E i 2 u i (5.39)
ª1º
>
y Yi Yi .««J i »»
i
* **
@ > X
X@.ª« E0 º» u
*
i
**
i
i
i (5.40)
Y «¬ 0 »¼ X
¬ ¼
ª1º
ªE i º
( X ' X ) 1 X ' Y ««J i »» « 0 » ( X ' X ) X ' ui
1
(5.41)
¬ ¼
ˆ
3 «¬ 0 »¼
~
Por lo tanto, si E[ X ' u i ] 0 el estimador consistente de J~i y E i se obtiene de despejar
algebraicamente la siguiente relación:
ª1º ~
ªE i º
3 ««J~i »»
ˆ « » (5.42)
«¬ 0 »¼ ¬0¼
Dado que todas las ecuaciones del modelo están exactamente identificados la solución
~
para los J~ ' s y E ' s serán únicas, esto se puede lograr, porque el número de parámetros
contenidos en la matriz de parámetros de la forma reducida, 3̂ , es igual a mk que será
igual al número de parámetros J ' s y E ' s que se desean estimar en el modelo
estructural.
Econometría, Teoría y Aplicaciones Juan Pichihua Serna 243
E 20 E 10 E 11 E 22
Donde: Sˆ10 ; Sˆ11 ; Sˆ12 ;
J 12 J 22 J 12 J 22 J 12 J 22
E 20J 12 E 10J 22 E 11J 22 E 22J 12
Sˆ 20 ; Sˆ 21 ;y Sˆ 22 .
J 12 J 22 J 12 J 22 J 12 J 22
obs Q P I PCH(t-1)
1970 98.48500 100.3230 87.40000 98.00000
1971 99.18700 104.2640 97.60000 99.10000
1972 102.1630 103.4350 96.70000 91.10000
1973 101.5040 104.5060 98.20000 98.10000
1974 104.2400 98.00100 99.80000 110.8000
1975 103.2430 99.45600 100.5000 108.2000
1976 103.9930 101.0660 103.2000 105.6000
1977 99.90000 104.7630 107.8000 109.8000
1978 100.3500 96.44600 96.60000 108.7000
1979 102.8200 91.22800 88.90000 100.6000
1980 95.43500 93.08500 75.10000 81.00000
1981 92.42400 98.80100 76.90000 68.60000
1982 94.53500 102.9080 84.60000 70.90000
1983 98.75700 98.75600 90.60000 81.40000
1984 105.7970 95.11900 103.1000 102.3000
1985 100.2250 98.45100 105.1000 105.0000
1986 103.5220 86.49800 96.40000 110.5000
1987 99.92900 104.0160 104.4000 92.50000
1988 105.2230 105.7690 110.7000 89.30000
1989 106.2320 113.4900 127.1000 93.00000
244 Capítulo 5: Modelos Lineales Multiecuacionales
Los resultados de la estimación por MCO a las ecuaciones de la forma reducida son:
ª Sˆ º ª Sˆ º
Eˆ10 Sˆ 20 Sˆ 10 « 22 » 36.10 ; Eˆ 20 Sˆ 20 Sˆ 10 « 21 » 104.30
¬ Sˆ12 ¼ ¬ Sˆ 11 ¼
ª Sˆ Sˆ º ªSˆ Sˆ º
Eˆ11 Sˆ 11 « 21 22 » 0.2361 ; Eˆ 22 Sˆ12 « 22 21 » 0.3519 .
¬ Sˆ 11 Sˆ12 ¼ ¬ Sˆ12 Sˆ11 ¼
Etapa I:
Estimar por mínimos cuadrados ordinarios las ecuaciones de la forma reducida para
cada una de las variables endógenas que aparecen como variables explicativas en la
ecuación estructural i-ésima. En general se debe correr cada variable endógena
explicativa contra todas las variables predeterminadas del modelo.
Yi * XS i v i (5.44)
Obtener el valor estimado de cada ecuación reducida
Yˆi XSˆ i
*
(5.45)
Dado que las variables predeterminadas son independientes del error de la forma
reducida, E[ X ' vi ] 0 , los estimadores de MCO de las ecuaciones “reducidas” son
insesgados.
246 Capítulo 5: Modelos Lineales Multiecuacionales
Etapa II:
Sustituya los valores estimados para las variables endógenas explicativas, obtenidos en
la etapa I, en la i-ésima ecuación estructural. Luego, estimar los parámetros de la
ecuación estructural resultante utilizando los Minimos Cuadrados Ordinarios.
yi Yˆi *J i X i* E i u i (5.46)
ªJ º
yi >Yˆi
*
@
X i* « i » u i (5.47)
¬E i ¼
yi Zˆ i*G i u i (5.48)
ªJ º
yi >Y i
*
@
X i* « i » u i (5.51)
¬E i ¼
yi Z i*G i u i (5.52)
p limGˆi G i (5.58)
( yi Yi Jˆi X i Eˆ i )' ( yi Yi Jˆ i X i Eˆ i )
* * * *
2
Donde: Vˆ i
n mi* k i*
b.2) Ejemplos
Etapa I: Estimar por MCO las ecuaciones de la forma reducida y obtener sus valores
estimados.
(4' ) : yˆ1 ˆ x 3
3 ˆ x 3 ˆ x 3 ˆ x
11 1 12 2 13 3 14 4
(5' ) : yˆ 2 ˆ ˆ ˆ ˆ
3 21 x1 3 22 x 2 3 23 x3 3 24 x 4
(6' ) : yˆ 3 ˆ x 3
3 ˆ x 3 ˆ x 3 ˆ x
31 1 32 2 33 3 34 4
Ejemplo 5.16: Función Consumo (CP: consumo privado, YD: ingreso disponible).
Considérese la función consumo del ejemplo 5.10
CPt E 1 E 2YDt E 3 CPt 1 u t
Supóngase que el gasto de gobierno (G), las exportaciones netas (NX), los impuestos
(T), el consumo privado rezagado CP(-1), y la tasa de interés rezagada R(-1) son
variables instrumentales.
Econometría, Teoría y Aplicaciones Juan Pichihua Serna 249
Dependent Variable: CP
Method: Least Squares
Variable Coefficient Std. Error t-Statistic Prob.
C -38.10541 29.77949 -1.279586 0.2112
YD 0.516486 0.116196 4.444959 0.0001
CP(-1) 0.461118 0.123244 3.741502 0.0008
R-squared 0.997921 Mean dependent var 2445.21
Adjusted R-squared 0.997772 S.D. dependent var 642.2594
S.E. of regression 30.31356 Akaike info criterion 9.752833
Sum squared resid 25729.53 Schwarz criterion 9.891606
Log likelihood -148.1689 F-statistic 6719.462
Durbin-Watson stat 0.892667 Prob(F-statistic) 0.00000
Dependent Variable: YD
Method: Least Squares (Etapa I: MCO a la forma reducida de YD)
Variable Coefficient Std. Error t-Statistic Prob.
C 511.6131 86.24515 5.93208 0.00000
G -0.547546 0.200853 -2.726098 0.0115
NX -0.629537 0.164692 -3.822515 0.0008
T -0.343178 0.186925 -1.835909 0.0783
CP(-1) 1.237214 0.057829 21.39424 0.00000
R(-1) -2.033507 4.088716 -0.497346 0.6233
R-squared 0.997903 Mean dependent var 2689.429
Adjusted R-squared 0.997483 S.D. dependent var 674.9012
S.E. of regression 33.85685 Akaike info criterion 10.05414
Sum squared resid 28657.15 Schwarz criterion 10.33169
Log likelihood -149.8392 F-statistic 2379.178
Durbin-Watson stat 2.094307 Prob(F-statistic) 0.000000
Dependent Variable: CP
Method: Least Squares (Etapa II: MC2E a la forma structural)
Variable Coefficient Std. Error t-Statistic Prob.
C -24.73014 34.90233 -0.708553 0.4845
YDFIT 0.441638 0.153839 2.870773 0.0077
CP(-1) 0.540309 0.163 3.314782 0.0025
R-squared 0.997075 Mean dependent var 2445.210
Adjusted R-squared 0.996866 S.D. dependent var 642.2594
S.E. of regression 35.95622 Akaike info criterion 10.09425
Sum squared resid 36199.78 Schwarz criterion 10.23302
Log likelihood -153.4608 F-statistic 4771.906
Durbin-Watson stat 1.485932 Prob(F-statistic) 0.000000
250 Capítulo 5: Modelos Lineales Multiecuacionales
* Y EX u 0 (5.60)
ªY º
>* E @.« » u 0 (5.61)
¬X ¼
GZ u 0 (5.61)
y2 Z 2*G 2 u 2
........................
ym Z m* G m u m
2
Zellner, A., H. Theil (1962), “Three Stage Least Squares: Simultaneous Estimation of
Simultaneous Equations”, Econometrica, 30: 54-78.
Econometría, Teoría y Aplicaciones Juan Pichihua Serna 251
Reordenando se tiene:
ª X ' y1 º ª X ' Z 1* 0 0 º ª G 1 º ª X ' u1 º
«X'y » « »« » « »
« 2» « 0 X ' Z 2* 0 » «G 2 » « X ' u 2 »
« » « »« » « »
« » « »« » « »
¬ X ' ym ¼ «¬ 0 0 X ' Z m* »¼ ¬G m ¼ ¬ X ' u m ¼
ª Z 1* 0 0º ª Y1 º
« » «Y »
«0 Z 2* 0» « 2 » , entonces:
Si: Z* y Y
« » « »
« » « »
«¬ 0 0 Z m* »¼ ¬Ym ¼
Procedimiento de MC3E
Etapa I: Estimar por MCO las ecuaciones de la forma reducida, al igual que la Etapa I
de MC2E.
Y 3X v (5.69)
ˆ
3 ( X ' X ) X 'Y
1
(5.70)
252 Capítulo 5: Modelos Lineales Multiecuacionales
Etapa II: Estimar los parámetros estructurales de MC2E y obtener los residuos para
cada una de las ecuaciones estructurales.
Gˆi ,MC 2 E [ Z i ' X ( X ' X ) X ' Z i ] Z i ' X ( X ' X ) X ' yi
* 1 * 1 * 1
(5.71)
uˆ i y i Z i Gˆi , MC 2 E (5.72)
Etapa III: estimar G por SUR, utilizando la matriz 6ˆ estimada a partir de los residuos
de la Etapa II.
ª Vˆ 12 Vˆ 12 Vˆ 1m º
« »
«Vˆ 12 Vˆ 22 Vˆ 2 m »
6ˆ
« »
« »
¬«Vˆ 1m Vˆ 2 m Vˆ m2 ¼»
Donde:
( y i Z i Gˆi )' ( yi Z i Gˆi )
Vˆ ij
W
m
¦ (mi 1)k i
i 1
W n (en muestras pequeñas), y
m
W n (en muestras grandes).
Ejemplo 5.17: Considérese el modelo macroeconómico del ejemplo 5.11, pero ahora
con todas sus ecuaciones.
(1) CPt E 0 E 1YDt E 2 CPt 1 H 1t
(2) I t E 3 E 4Yt E 5 rt 1 H 2t
(3) rt E 6 E 7 Yt E 8 M t H 3t
(4) Yt C t I t Gt NX t
(5) YDt Yt Tt (1 0.23)Yt
Donde las cinco variables endógenas del modelo son: PBI (Y), Consumo Privado
(CP), Ingreso disponible (YD), Inversión (I), y tasa de interés (r) y las seis variables
predeterminadas son: Gasto del gobierno (G), exportaciones netas (NX, exportaciones
– importaciones), Consumo Privado rezagado (Ct-1), impuestos (T), tasa de interés
rezagada (rt-1), cantidad de dinero (M), cuyos datos son:
obs CP G I NX Y T R M
1963.0 1341.9 NA NA NA NA NA 3.6 NA
1964.0 1417.2 549.1 371.8 2.5 2340.6 778.4 4.0 160.3
1965.0 1497.0 566.9 413.0 -6.4 2470.5 817.0 4.4 167.9
1966.0 1573.8 622.4 438.0 -18.0 2616.2 881.9 5.6 172.0
1967.0 1622.4 667.9 418.6 -23.7 2685.2 873.8 5.1 183.3
1968.0 1707.5 686.8 440.1 -37.5 2796.9 910.1 5.9 197.4
1969.0 1771.2 682.0 461.3 -41.5 2873.0 925.6 7.8 203.9
1970.0 1813.5 665.8 429.7 -35.1 2873.9 848.6 7.7 214.4
1971.0 1873.7 652.4 475.7 -45.9 2955.9 856.0 5.1 228.3
1972.0 1978.4 653.0 532.2 -56.5 3107.1 920.9 4.7 249.2
1973.0 2066.7 644.2 591.7 -34.0 3268.6 934.5 8.2 262.8
1974.0 2053.8 655.4 543.0 -4.1 3248.1 931.1 9.8 274.3
1975.0 2097.5 663.5 437.6 23.1 3221.7 866.3 6.3 287.5
1976.0 2207.3 659.2 520.6 -6.3 3380.8 939.9 5.3 306.3
1977.0 2296.6 664.1 600.4 -27.8 3533.3 1020.7 5.6 331.1
1978.0 2391.8 677.0 664.6 -29.9 3703.5 1065.1 8.0 358.2
1979.0 2448.4 689.3 669.7 -10.6 3796.8 1086.7 10.9 382.5
1980.0 2447.1 704.2 594.4 30.6 3776.3 1042.7 12.3 408.5
1981.0 2476.9 713.2 631.1 21.9 3843.1 1047.3 14.8 436.3
1982.0 2503.7 723.6 540.5 -7.5 3760.3 939.9 11.9 474.3
1983.0 2619.4 743.8 599.5 -56.1 3906.6 1013.0 8.9 521.0
1984.0 2746.1 766.9 757.5 -122.0 4148.5 1068.4 10.2 552.1
1985.0 2865.8 813.4 745.9 -145.3 4279.8 1117.7 8.0 619.9
1986.0 2969.1 855.4 735.1 -155.1 4404.5 1142.6 6.4 724.5
1987.0 3052.2 881.5 749.3 -143.1 4539.9 1250.4 6.9 750.1
1988.0 3162.4 886.8 773.4 -104.0 4718.6 1314.3 7.7 787.4
1989.0 3223.3 904.4 784.0 -73.7 4838.0 1373.1 8.8 794.7
1990.0 3272.6 932.6 746.8 -54.7 4897.3 1372.8 8.0 826.4
1991.0 3259.4 944.0 683.8 -19.6 4867.6 1329.1 5.9 897.7
1992.0 3349.5 936.9 725.3 -32.4 4979.3 1331.2 3.8 1024.8
1993.0 3458.7 929.8 819.9 -73.9 5134.5 1430.4 3.3 1128.4
1994.0 3578.5 922.5 955.5 -114.2 5342.3 1506.9 4.9 1147.6
254 Capítulo 5: Modelos Lineales Multiecuacionales
De las ecuaciones estimadas se obtiene sus valores predichos, esto es YDFIT y YFIT.
CP I R
CP 837.2916 134.8238 -29.99993
I 134.8238 1961.331 9.246927
R -29.99993 9.246927 3.535883
y2 Z 2*G 2 u 2
........................
ym Z m* G m u m
n n
Esto también puede simplificarse si: log (* 1 )' 6* 1 log 6 n log * , luego:
2 2
nm n n
log L(*, E , 6) log 2S log 6 n log * ¦ (Y ZG )'(6 1
I n )(Y ZG )
2 2 2
(5.79)
Para estimar los parámetros *, E , y 6 se debe maximizar la función logL(.) con
respecto de los parámetros *, E , y 6 .
256 Capítulo 5: Modelos Lineales Multiecuacionales
Si bien los estimadores de MVIC posee todas las propiedades asintóticas deseables para
los estimadores máximo verosímiles, puede ser computacionalmente costoso, en
especial cuando el modelo incluye una gran cantidad de ecuaciones, pues contiene no
linealidades que pueden no ser convergentes a un valor óptimo.
Hausman (1983)3 demostró que el estimador de MVIC es también un estimador de
variables instrumentales, si la matriz asintótica de varianzas y covarianzas para el
estimador del error de MVIC, 6 , se deriva como estimador de variables instrumentales.
En ese sentido, si los errores están normalmente distribuidas, MVIC tiene la misma
matriz asintótica de 6 que el de Máxima Verosimilitud. Por lo tanto, el estimador de
MVIC se obtiene de la ecuación:
Ejemplo 5.18: Considerese el modelo y los datos del ejercicio 5.17 y estime por MVIC.
3
Hausman. (1983), “Specification and Estimation of Simultaneous Equation Models”, en Z.
Grilliches & M. Intriligator editors, Hand Book of Econometrics, Amsterdam, North Holland.
Econometría, Teoría y Aplicaciones Juan Pichihua Serna 257
Yt ˆX
0 (5.84)
t
O también:
ª Y1 º ª mˆ 11 mˆ 12 mˆ 1k º ª X 1 º
«Y » « mˆ mˆ 22 mˆ 2 k »» «« X 2 »»
« 2» « 21 .
« » « »«»
« » « »« »
¬Ym ¼ ¬mˆ m1 mˆ m 2 mˆ mk ¼ ¬ X K ¼
wYt / wX jt mˆ j (5.85)
ª wY1t / wX jt º ª mˆ 1 j º
« wY / wX » «mˆ »
« 2t jt » « 2j»
« » «»
« » « »
«¬wYmt / wX jt »¼ «¬ mˆ mj »¼
Esto implica que cada una de las columnas de la matriz de multiplicadores de impacto
deben entenderse como el impacto marginal de cada una de las variables
predeterminadas, esto es, la primera columna de la matriz M mide el impacto de la
variable predeterminada X1 sobre cada una de las variables endógenas del modelo. La
segunda columna mide el impacto de la variable X2 sobre todas las Yi y así
sucesivamente.
(1) CP=-21.51285628+0.4207240841*YD+0.5626550704*CP(-1)
(2) I=35.22431494+0.1637016587*Y-5.707140711*R(-1)
(3) R=-6.984448386+0.005994103125*Y-0.01689489502*M
(4) Y=CP+I+G+NX
(5) YD=0.77*Y
ª0.56 0 0 0 0º ª 21.5 0 0 0º
« 0 0 5.7 0 0»» « 35.22 0 0 0»»
« «
B « 0 0 0 0 0» ; C « 6.98 0.017 0 0»
« » « »
« 0 0 0 0 0» « 0 0 1 1»
«¬ 0 0 0 0 0»¼ «¬ 0 0 0 0»¼
Econometría, Teoría y Aplicaciones Juan Pichihua Serna 259
O también:
ª 'Y1t º ª mˆ 1 j 'X jt º
« 'Y » «mˆ 'X »
« 2t » « 2j jt »
« » « »
« » « »
¬ 'Ymt ¼ «¬ mˆ mj 'X jt »¼
Si quisiera medirse el impacto de dos variables predeterminadas (por ejemplo X1 y X2)
sobre las variables endógenas se debe sumar los efectos marginales de cada variable,
esto es:
'Yt mˆ i1 'X 1t mˆ i 2 'X 2t (5.87)
« » « »
« » « »
¬ 'Ymt ¼ ¬mˆ m1 'X 1t mˆ m 2 'X 2t ¼
Para medir el impacto de cambios en todas las variables se debe sumar los “impactos
marginales” de todas las variables predeterminadas sobre las variables endógenas, esto
es:
'Yt mˆ i1 'X 1t mˆ i 2 'X 2t mˆ ik 'X kt (5.88)
« » « »
« » « »
¬ 'Ymt ¼ ¬mˆ m1 'X 1t mˆ m 2 'X 2t mˆ mk 'X kt ¼
Ejemplo 5.20: ¿Cuál es el impacto de un aumento por única vez (en 1995) de 100
unidades del gasto público (esto equivale al 11% de incremento con respecto al último
dato, 1994)?.
ª 'CPt º ª 5.7 *100 º ª570º
« 'I » «0.99 *100» « 99 »
« t » « » « »
'Yt « 'Rt » «0.04 *100» « 4 »
« » « » « »
« 'Yt » « 7.7 *100 » «770»
«¬'YDt »¼ «¬5.93 *100 »¼ «¬593»¼
5.7.3 Pronóstico:
Yt h ˆX
0 (5.89)
t h
ª Y1,t h º ª mˆ 11 mˆ 12 mˆ 1k º ª X 1,t h º
«Y » « mˆ « »
« 2 ,t h » « 21 mˆ 22 mˆ 2 k »» « X 2,t h »
.
« » « »« »
« » « »« »
¬Ym ,t h ¼ ¬mˆ m1 mˆ m 2 mˆ mk ¼ ¬ X k ,t h ¼
En los casos de modelos dinámicos, esto es modelos que incluyen variables endógenas
rezagadas como variables explicativas, deben garantizar soluciones convergentes hacia
un único equilibrio (condición de estacionariedad).
Yt FˆYt 1 Hˆ X t (5.90)
( I m Fˆ L)Yt Hˆ X t (5.91)
Yt ( I m Fˆ L) Hˆ X t
1
(5.92)
Yt 0̂ 1 X t (5.93)
Donde: Mˆ 1 ( I m FˆL) Hˆ
1
( I m FˆL) Hˆ Hˆ FˆHˆ L Fˆ Hˆ L Fˆ Hˆ L
1 2 2 3 3
(5.94)
De modo que el pronóstico de las variables Y en el período t+h se obtiene de los valores
de las X en el período t si el cambio en X es por única vez, o de los valores de las X para
los períodos t+1, t+2,...,t+h, si el cambio en X es permanente. Si el cambio por única
vez se tiene:
262 Capítulo 5: Modelos Lineales Multiecuacionales
Efecto en t+2: Yt 2 Fˆ Hˆ X t
2
...........................................
h
Efecto en t+h: Yt h Fˆ Hˆ X t
Efecto acumulado desde t hasta t+h:
h
Yt h Hˆ X t FˆHˆ X t Fˆ Hˆ X t F Hˆ X t Fˆ Hˆ X t .
2 3
(5.96)
obs CP I R Y YD
1994 3578.500 955.5000 4.930000 5342.300 3835.400
1995 3778.716 909.9745 5.911533 5515.441 4246.889
1996 3970.957 944.5901 6.577565 5761.116 4436.059
1997 4157.250 980.2683 7.184315 6002.282 4621.758
1998 4338.537 1015.446 7.726810 6238.327 4803.512
1999 4515.704 1050.332 8.210290 6470.351 4982.170
2000 4689.554 1085.051 8.639009 6699.290 5158.453
Econometría, Teoría y Aplicaciones Juan Pichihua Serna 263
APLICACIONES:
A partir de los datos de Bernt & Wood (1975)11 en su estudio de la demanda de energía para el
sector manufacturero de los Estados Unidos utiliza una función de costos tipo translog, que
puede expresarse como:
1
(1) ln C E 0 ¦ E j ln Pj ¦ ¦ J ij ln Pi * ln Pj
2 i j
w ln C
(2) sj E j ¦ J ij ln Pi
w ln Pj i
Desarrollando para M insumos se obtiene un modelo para cada participación en el costo de cada
factor de producción:
(3) s1 E1 J 11 ln P1 J 12 ln P2 J 13 ln P3 J 1m ln Pm
s2 E 2 J 12 ln P1 J 22 ln P2 J 31 ln P3 J 2m ln Pm
.............. ......................... ......................... .................................
sm E m J 1m ln P1 J 2 m ln P2 J 3m ln P3 J mm ln Pm
(4) ¦sj ¦E j E1 E 2 E m 1
(5) ¦ J ij 1 (suma vertical)
i
(6) ¦ J ij 1 (suma horizontal)
j
Por ejemplo para el caso de cuatro factores de producción, capital K, trabajo L, energía E y
materiales diversos M, se tiene el siguiente sistema de ecuaciones:
sK E K J KK ln PK J KL ln PL J KE ln PE J KM ln PM
sL E L J LK ln PK J LL ln PL J LE ln PE J LM ln PM
sE E E J EK ln PK J EL ln PL J EE ln PE J EM ln PM
sM E M J MK ln PK J ML ln PL J ME ln PE J MM ln PM
Simetría:
J LK J KL , J LE J EL , J LM J ML , J KE J EK , J KM J MK , y J EM J ME .
11
Berndt, E. Y D. Wood. 1975. “Tecnology, Prices, and the Derived Demand for Energy”,
Review of Economics and Statistics, Vol. 57, pag. 376-384.
264 Capítulo 5: Modelos Lineales Multiecuacionales
J KK J KL J KE J KM 1
J LK J LL J LE J LM 1
J EK J EL J EE J EM 1 , y
J MK J ML J ME J MM 1
J KK J LK J EK J MK 1
J KL J LL J EL J ML 1
J KE J LE J EE J ME 1 , y
J KM J LM J EM J MM 1
Puede demostrarse que la última restricción horizontal es redundante con respecto a la última
restricción de la suma vertical por la condición de simetría.
§P · §P · §P ·
sL E L J KL ln¨¨ K ¸¸ J LL ln¨¨ L ¸¸ J LE ln¨¨ E ¸¸
© PM ¹ © PM ¹ © PM ¹
§P · §P · §P ·
sE E E J KE ln¨¨ K ¸¸ J LE ln¨¨ L ¸¸ J EE ln¨¨ E ¸¸
© PM ¹ © PM ¹ © PM ¹
EM 1 EK EL EE
J KM 1 J KK J KL J KE
J LM 1 J LK J LL J LE
J EM 1 J EK J EL J EE
J MK J KM
J ML J LM
J ME J EM
J MM 1 J MK J ML J ME
Econometría, Teoría y Aplicaciones Juan Pichihua Serna 265
System: SUR
Estimation Method: Seemingly Unrelated Regression
Sample: 1947 1971
Total system (balanced) observations 75
Coefficient Std. Error t-Statistic Prob.
C(1) 0.056824 0.001307 43.46980 0.0000
C(11) 0.029870 0.005750 5.194678 0.0000
C(12) 2.21E-05 0.003675 0.006007 0.9952
C(13) -0.008203 0.004061 -2.020117 0.0474
C(2) 0.253546 0.001987 127.5844 0.0000
C(22) 0.074877 0.006394 11.71137 0.0000
C(23) -0.003212 0.002748 -1.168778 0.2467
C(3) 0.043833 0.001049 41.78917 0.0000
C(33) 0.029383 0.007406 3.967588 0.0002
Determinant residual covariance 2.43E-16
266 Capítulo 5: Modelos Lineales Multiecuacionales
SK=C(1)+C(11)*LOG(PK/PM)+C(12)*LOG(PL/PM)+C(13)*LOG(PE/PM)
SL=C(2)+C(12)*LOG(PK/PM)+C(22)*LOG(PL/PM)+C(23)*LOG(PE/PM)
SE=C(3)+C(13)*LOG(PK/PM)+C(23)*LOG(PL/PM)+C(33)*LOG(PE/PM)
Ecuación Ê j Jˆ jK Jˆ jL Jˆ jE Jˆ jM
SK 0.056824 0.02987 0.0000221 -0.008203 0.9783109
SL 0.253546 0.0000221 0.074877 -0.003212 0.9283129
SE 0.043833 -0.008203 -0.003212 0.029383 0.982032
SM 0.645797 0.9783109 0.9283129 0.982032 -1.8886558
Por ejemplo:
Eˆ M 1 Eˆ K Eˆ L Eˆ E
EˆM 1 0.056824 0.253546 0.043833 0.645797
PROBLEMAS:
Para simplificar suponga que las variables endógenas (y) y exógenas (x) se miden en
desviación respecto de su media.
a) Explique porqué el sistema de ecuaciones simultáneas no puede ser estimado usando
mínimos cuadrados ordinarios ecuación por ecuación.
b) Utilice la condición de orden para evaluar si cada ecuación está identificada.
c) Resuelva el sistema de ecuaciones y encuentre la forma reducida del modelo.
Econometría, Teoría y Aplicaciones Juan Pichihua Serna 267
d) Estime los parámetros de la forma estructural del modelo a partir de los parámetros
de la forma reducida (Estimador de Mínimos Cuadrados indirectos).
La matriz de correlaciones entre los residuos de MCO para las tres ecuaciones es:
P̂1 P̂ 2 P̂ 3
P̂1 1.000 -0.608 -0.489
P̂ 2 -0.608 1.000 -0.120
P̂ 3 -0.489 -0.120 1.000
a) ¿Cuál es la hipótesis nula que permite evaluar si MCO es adecuado para este
modelo?.
b) ¿Cuál es el estadístico de prueba para probar la hipótesis nula?.
c) A partir de los datos de la matriz de correlaciones de los residuos, haga el test de
covarianza nulas. ¿Se acepta o se rechaza la hipótesis nula?. Dato: F 32gl 7.81 .
Ct D1 D 2Yt H 1t
It E1 E 2 Rt E 3Yt H 2t
Yt C t I t Gt
a) Cuáles de las variables son endógenos y cuáles son exógenas en este sistema?.
268 Capítulo 5: Modelos Lineales Multiecuacionales
Y1 E 10 E 12Y2 J 11 X 1 J 12 X 2 H 1
Y2 E 20 E 23Y3 J 22 X 2 H 2
Y3 E 30 E 32Y1 H 3
Problema 8: Suponga que el mercado de computadoras puede ser representado por las
siguientes ecuaciones:
a) Qué significa que una ecuación está “identificada” en el contexto del modelo de
ecuaciones simultáneas.
b) Discuta la identificabilidad de cada una de las ecuaciones del modelo.
c) Suponiendo que limT o f T 1 ¦ Yt 2 es diferente de cero, pero finito (Y es una
variable estacionaria), derive el sesgo del estimador de MCO del parámetro E1 .
d) Si la covarianza V 12 =0, esperaría que el sesgo del estimador de MCO sea positivo
o negativo (con respecto a la pregunta c).
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 271
Bibliografía
Davidson, R. & J.G. Mackinnon (1981). “Several Tests for Model Specification in the
Presence of Alternative Hipótheses”, Econometrica, 49, 781-793.
Dorfman, Jeffrey H & Christopher S. McIntosh (1998), Putting the “econ” into
econometrics, Draft for presentation to the 1998 AAEA Meeting in Salt Lake
City.
Dougherty, C.R.S.(2000). Introduction to Econometrics, class notes, London School of
Economics, http://econ.lse.ac.uk/ie.
Eichenbaum, Martin (1996), “Some comments on the rol of econometrics in economics
theory”, Economic Perspectives, Fedral Reserve Bank of Chicago, pp. 22-31.
Engle, R. F. (1984). “Wald, Likelihood Ratio, and Lagrange Multiplier Tests in
Econometrics”, in Handbook of Econometrics, Vol.2., Z. Griliches & M.D.
Intriligator Editores, North Holland Publishing Company.
Frish, Ragnar (1933), “Editorial”, Econometrica, Vol. 1, 1933, pp. 1-4.
Gujarati, Damodar N.(1997), Econometría, Tercera Edición, Mc Graw Hill, Bogotá-
Colombia.
Greene, William H., Econometric Analysis fourth edition, (2000). Upper Saddle River,
New Jersey: Prentice-Hall.
Griliches, Z. y M.D. Intriligator Editores (1983), Handbook of Econometrics, North
Holland Publishing Company. Amsterdam, North Holland.
Gujarati, Damodar N., (1997). Econometría, Tercera Edición, Mc Graw Hill, Bogotá-
Colombia.
Hansen, Bruce E. (2002). Econometrics, University of Wisconsin, Revisión: Enero 2002,
www.ssc.wisc.edu/~bhansen.
Hausman, Jerry A. (1978), "Specification Tests in Econometrics," Econometrica 46, pags.
1251-1271.
Hausman, Jerry A. (1983), “Specification and Estimation of Simultaneous Equation
Models”, en Z. Grilliches & M. Intriligator editors, Hand Book of Econometrics,
Amsterdam, North Holland.
Intriligator, Michael D (1983), Economic and Econometric Models, en Handbook of
Econometrics, Volumen I, Editado por Z. Griliches y M.D. Intriligator, North-
Holland Publishing Company.
Intriligator, Michael D., Ronald G. Bodkin, and Cheng Hsiao (1996) Econometric
Models,Techniques, and Applications. Prentice Hall, New Jersey.
Johnston, J. (1984), Econometrics Methods, 3th edition, Mc Graw Hill, New York.
272 Bibliografía
Johnston, J. (1984), Econometrics Methods, 3th edition, Mc Graw Hill, New York.
Johnston, Jack, & John DiNardo, (1997). Econometric Methods, fourth edition, New
York,McGraw-Hill.
Judge, G.G., W.E. Griffiths, R.C. Hill, H. Lütkepohl, and T.C. Lee, (1988). Introduction to
the Theory and Practice of Econometric s, 2nd edition, John Wiley and Sons,
New York.
Kennedy, Peter, (1998). A Guide to Econometrics, 4th ed., The MIT Press. Cambridge,
Massachusetts.
Leamer, Edward E. (1983), “Let’s Take the Con Out of Econometrics, The American
Economic Review, Vol. 73 N° 1, pp. 31-43.
LeSage, James P. (1999). An Introduction to Econometrics, Department of Economics,
University of Toledo. Ohio.
Maddala, G. S. (1985), Econometría, Mc Graw-Hill, Madrid.
Maddala, G.S. (1996), Introducción a la econometría, Prentice Hall Hispanoamericana,
S.A., 2da edición, México.
Novales, Alfonso. 1996. Econometría, Segunda edición. McGraw-Hill/Interamericana,
Madrid.
Pindyck, Robert S., and Daniel L. Rubinfeld, (1998) Econometría Modelos y Pronósticos,
Cuarta edición, Irwin McGraw-Hill, Boston,.
Quantitative Micro Software (1998), Eviews 3: User’s Guide, 2nd Edition.
Ramanathan, Ramu, (1995). Introductory Econometrics With Applications, 4th ed., The
Dryden Press. New York.
Ruud, P.A., (1999). Introduction to Classic Econometric Theory, Oxford University Press.
Studenmund, A. H., (2000). Using Econometrics: A Practical Guide, Addison-Wesley,
4th edition, Massachusetts.
Tintner, Gerhard (1953), “The definition of econometrics”, Econometrica, V 21, 1953,
pp.31-40.
Verbeek, Marno, (2001). A Guide to Modern Econometrics, John Wiley and Sons, New
York.
Wooldridge, Jeffrey M., (2000). Introductory Econometrics: A Modern Approach, South-
Western College Publishing. Cincinnati, Ohio.
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 273
Apéndice
Tablas Estadísticas
274 Apéndice: Tablas Estadísticas
g.l.
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 275
gl1 =1
gl2 =1
276 Apéndice: Tablas Estadísticas
g.l.
Econometría: Teoría y Aplicaciones Juan Pichihua Serna 277