Letp8 13

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 8

ESTADISTICA II

Lic. en Economía, F.C.E. de la U.N.C.


TRABAJO PRACTICO No 8
ESTIMACIÓN Y SELECCIÓN DE MODELOS

2013

1. Se dispone de 150 observaciones de un proceso {Zt : t ∈ Z}. Con estos datos


se obtuvieron los primeros diez valores de las funciones muestrales de autocor-
relación y de autocorrelación parcial que se muestran en la siguiente tabla.
k 1 2 3 4 5
ρ (k)
 0.8040 0.3676 −0.1135 −0.4647 −0.5830
 (k)
π 0.8040 −0.7885 −0.0607 −0.0034 0.0479

k 6 7 8 9 10
ρ (k)
 −0.4678 −0.1914 0.1183 0.3291 0.3674
 (k)
π 0.0118 0.0906 −0.0163 −0.0860 −0.0494
Además se obtuvo z = 4.9805, γ0 = 8.4594

(a) Use el criterio de las dos desviaciones estándares para decidir cuáles de los
valores de la tabla anterior son significativamente distintos de cero.
(b) A partir de los resultados del inciso (a) determine el modelo teórico más
simple que podría ajustarse a los datos. Exprese su ecuación general .
(c) Obtenga las estimaciones por mínimos cuadrados de los coeficientes del
modelo propuesto en (b). Para ello encuentre el sistema de ecuaciones que
permite calcular las estimaciones de mínimos cuadrados de los coeficientes
del modelo. Resuelva el sistema planteado y utilice los valores de la tabla
anterior para encontrar las estimaciones.
(d) Obtenga un estimador para la varianza del Ruido Blanco, σ 2A . Para esto,
suponga que el proceso {Zt : t ∈ Z} es estacionario.y a partir de la
ecuación del modelo propuesta en (b), mutiplique por Zt − µ y tome es-
peranza.

1
ESTADISTICA II L.  E , F.C.E.   U.N.C. 2

2. Se dispone de 100 observaciones de un proceso {Zt : t ∈ Z}. Con estos datos


se obtienen las siguientes estimaciones:

z = 9.8844, γ0 = 2.5321


ρ1 = 0.7418, 
 ρ2 = 0.5761

(a) Suponga que el proceso generador es un AR(1).


i. Estime σ 2A y φ1
ii. Obtenga un intervalo aproximado del 95% de confianza para φ1 .
iii. Con las estimaciones obtenidas en el inciso (i) calcule los valores de los
criterios de identificación, Criterio de Información de Akaike (AIC),
Criterio de Información de Akaike Corregido (AICC) y Criterio de
Información Bayesiana de Akaike (BIC).
(b) Suponga que el proceso generador es un AR(2).
i. Estime σ 2A , φ1 y φ2 .
ii. Obtenga un intervalo aproximado del 95% de confianza para φ1 y φ2 ..
iii. Con las estimaciones obtenidas en el inciso (i) calcule los valores de los
criterios de identificación, Criterio de Información de Akaike (AIC),
Criterio de Información de Akaike Corregido (AICC) y Criterio de
Información Bayesiana de Akaike (BIC).
(c) En base a lo obtenido en los incisos (a)iii y (b)iii, indique cuál sería el
modelo elegido por cada uno de los criterios de identificación.
(d) Los datos se encuentran en el archivo TP8ej2.txt. Utilice el software
ITSM2000 para realizar las actividades propuestas en los incisos (a) y
(b).

3. Con 200 observaciones de un proceso {Zt : t ∈ Z} se decidió estimarlo con


un modelo ARMA(2,1). La ecuación obtenida para este modelo estimado está
dada por la siguiente expresión,

Zt − 25 + 0.3 (Zt−1 − 25) − 0.4 (Zt−2 − 25) = Ut + 0.25 Ut−1 (1)

Para verificar la bondad del ajuste de este modelo estimado a los datos se hizo
t = Zt − Zt . Se calcularon las funciones muestrales
un análisis de los residuos U
de autocorrelación y de autocorrelación parcial de los residuos U t , siendo sus
primeros diez valores los que se muestran en la siguiente tabla:
ESTADISTICA II L.  E , F.C.E.   U.N.C. 3

k 1 2 3 4 5
ρU (k)
 0.6439 0.4216 0.2697 0.1824 0.1266
U (k)
π 0.6439 0.0121 −0.0107 0.0167 0.0064
k 6 7 8 9 10
ρU (k)
 0.0947 0.1064 0.1322 0.1087 0.0866
U (k)
π 0.0121 0.0634 0.0599 −0.0305 0.0017

(a) En base a los valores de la tabla anterior justifique porqué el modelo dado
en la ecuación (1) no es el modelo adecuado para los datos observados.
(b) Teniendo en cuenta lo afirmado en (a) determine los órdenes p y q de un
modelo ARMA(p,q) más apropiado para los datos observados.
(c) Determine la ecuación estimada para el modelo propuesto en el inciso
anterior.

4. Sea {Zt : t ∈ Z} un proceso que responde a la ecuación

Zt = φ1 Zt−1 + φ2 .Zt−2 + φ3 .Zt−3 + At

donde {At : t ∈ Z} es un proceso de Ruido Blanco con varianza σ 2A . Con este


proceso se generaron 200 datos con los que se calcularon las funciones mues-
trales de autocorrelación y de autocorrelación parcial cuyos primeros valores se
muestran en la siguiente tabla:
k 1 2 3 4 5
ρ (k)
 0.500 0.000 0.300 0.600 0.300
 (k)
π 0.500 −0.300 0.700 −0.001 0.001

(a) Plantee el sistema de ecuaciones que permite determinar los estimadores


de mínimos cuadrados de φ1 , φ2 y φ3 .
(b) Utilice los valores de la tabla anterior para encontrar las estimaciones de
mínimos cuadrados de φ1 , φ2 y φ3 .
(c) Determine una estimación para σ 2A , sabiendo que γ 0 = var (Zt ) = 1.7.
(d) Obtenga intervalos aproximados del 95% de confianza para φ1 , φ2 y φ3 .
(e) Con las estimaciones obtenidas en los incisos anteriores calcule los val-
ores de los criterios de identificación, Criterio de Información de Akaike
(AIC), Criterio de Información de Akaike Corregido (AICC) y Criterio de
Información Bayesiana de Akaike (BIC).
ESTADISTICA II L.  E , F.C.E.   U.N.C. 4

5. En el archivo "Coparticipacion.txt" se encuentran los 77 datos correspondientes


a la recaudación en concepto de coparticipación del municipio de San Rafael
durante el período Enero 2001-Mayo 2007. Son 77 datos mensuales medidos en
pesos.

(a) Represente gráficamente estos datos y los valores de las funciones mues-
trales de autocorrelación y de autocorrelación parcial. En base a estos
gráficos analice si este proceso puede considerarse estacionario.
(b) Analice si resulta conveniente aplicar la transformación de Box-Cox.
(c) De ser necesario, diferencie adecuadamente estos datos de modo de obtener
un comportamiento estacionario.
(d) Muestre en una tabla los posibles modelos que podrían ajustarse a estos
datos. Para cada uno de los modelos propuestos determine la estimación
de los coeficientes
 (c) e indique
 en
 cada caso si el coeficiente es significativo,
   
 
c 
es decir si     > 1 donde s C  es la estimación del desvío
 1.96 · s C  
del estimador del coeficiente c.
Además determine, para cada modelo, la estimación de la varianza de los
residuos y los criterios de identificación.
(e) Teniendo en cuenta sólo la información de la tabla del inciso (d), determine,
cuáles son los modelos entre los que puede estar el que mejor se ajusta a
los datos observados.
(f) Realice un análisis de los residuos correspondientes a los modelos competi-
dores. Especifique las hipótesis que se contrastan.
(g) Elija, justificando su respuesta, un modelo para ajustar a estos datos.
(h) A partir de los datos suministrados por el software ITSM2000, indique
el intervalo de predicción para los datos estacionarios correspondiente a
k = 1.
(i) Teniendo en cuenta el intervalo obtenido en el inciso anterior, determine
un intervalo de predicción para la recaudación correspondiente a Abril de
2007.
ESTADISTICA II L.  E , F.C.E.   U.N.C. 5

EJERCICIO PROPUESTO.

1. En el archivo "Ajo.txt" se encuentran los datos correspondientes a las hectáreas


cultivadas con ajo en la provincia de Mendoza. Estos datos corresponden a la
Dirección de Estadística e Investigaciones Económicas y son datos anuales desde
el año 1941 al 2007.

(a) Represente gráficamente estos datos y los valores de las funciones mues-
trales de autocorrelación y de autocorrelación parcial. Repita los pasos
realizados en el trabajo práctico anterior de modo de obtener un compor-
tamiento estacionario.
(b) Muestre en una tabla los posibles modelos que podrían ajustarse a estos
datos. Para cada uno de los modelos propuestos determine la estimación
de los coeficientes
 (c) e indique
 en
 cada caso si el coeficiente es significativo,
 
 
c 
es decir si     > 1.
 1.96 · s C  
Además determine, para cada modelo, la estimación de la varianza de los
residuos y los criterios de identificación.
(c) Teniendo en cuenta sólo la información de la tabla del inciso (b), determine,
cuáles son los modelos entre los que puede estar el que mejor se ajusta a
los datos observados.
(d) Realice un análisis de los residuos correspondientes a los modelos competi-
dores. Especifique las hipótesis que se contrastan.
(e) Elija, justificando su respuesta, un modelo para ajustar a estos datos.
(f) A partir de los datos suministrados por el software ITSM2000, indique
el intervalo de predicción para los datos estacionarios correspondiente a
k = 1.
(g) Teniendo en cuenta el intervalo obtenido en el inciso anterior, determine
un intervalo de predicción para las hectáreas cultivadas correspondientes
al año 2008.
ESTADISTICA II L.  E , F.C.E.   U.N.C. 6

APÉNDICE.

INTERVALOS DE CONFIANZA DEL 95% PARA ρK .

. Bartlett(1946) demostró que si {Wt : t ∈ Z} un proceso estacionario gaussiano


entonces para T suficientemente grande

ρk ˜ N (ρk , var (
 ρk )) cuando T → ∞
−→

1
ρk ) ∼
donde si el proceso es tal que ρk = 0 para k > m entonces var ( = (1 + 2 ρ21 + ... + 2 ρ2m )
T
para k > m.
1
ρk ) ∼
Como caso particular, si el proceso es un ruido blanco, entonces var ( = .
T
Luego, para k ≥ 1
1
ρk ˜ N ρk ,
 cuando T → ∞
−→ T
donde ρk = 0 para k ≥ 1. Un intervalo del 95% de confianza para ρk está dado por
1 1
ρk − 1.96
 ρ + 1.96
, . Este intervalo se aproxima a lo que se denomina
T k T
1 1
intervalo de "dos desviaciones", es decir, ρk − 2
 ρ +2
, . Entonces,
T k T

1 1 1 1
0∈ ρk − 2
 ρ +2
, ⇐⇒ 
ρk ∈ −2 ,2
T k T T T

Este último intervalo es el que se grafica en el ITSM por linea de puntos.


ESTADISTICA II L.  E , F.C.E.   U.N.C. 7

ESTIMACIÓN DE PROCESOS AUTORREGRESIVOS.

. Sea {Wt : t ∈ Z} un proceso autorregresivo de orden (p),

(Wt − µ) − φ1 (Wt−1 − µ) − φ2 (Wt−2 − µ) − · · · − φp (Wt−p − µ) = At . (2)



Si multiplicamos (2) por Wt − µ = ψ i At−i ,(usando la estacionariedad asumida
i=0
en el proceso) y tomamos esperanza obtenemos

γ 0 − φ1 γ 1 − φ2 γ 2 − · · · − φp γ p = σ 2A .

De donde, reemplazando cada autocovarianza teórica y cada coeficiente por su corre-


spondiente estimación, se obtiene como estimación para la varianza σ 2A , por el método
de los momentos, a
2A = 
σ 1 γ1 − φ
γ0 − φ 2  p γp
γ2 − · · · − φ
Para determinar intervalos de confianza para los coeficientes del proceso Wt , nece-
sitamos determinar la distribución de los estimadores Φ  1, Φ
 2, . . . , Φ
 p de dichos coe-
ficientes. Se puede demostrar que bajo la suposición de que las variables aleatorias
{At : t ∈ Z} son independientes e idénticamente distribuídas, no necesariamente nor-
males, con media 0 y varianza σ 2A y momentos de cuarto orden finitos, el vector
√   √   √  ‘
T Φ  1 − φ1 , T Φ  2 − φ2 , . . . , T Φ p − φp tiene asintóticamente una dis-
tribución normal multivariada (p-variada) con vector de media igual al vector nulo y
matriz de varianza-covarianza σ 2A Γ−1 , donde Γ está dada por
 
γ0 γ1 γ 2 · · · γ p−1
 γ γ0 γ 1 · · · γ p−2 
 1 
 γ γ γ · · · γ 
Γ= 2 1 0 p−3 
 .. .. .. .. 
 . . . . 
γ p−1 γ p−2 γ p−3 · · · γ 0

Para obtener una estimación de la matriz varianza-covarianza se sustituye σ 2A por


su estimación σ  se obtiene reemplazando en la matriz Γ las autocovarianzas
2A y Γ
teóricas por sus estimaciones 
γ k : k = 0, 1, ..., p − 1.
ESTADISTICA II L.  E , F.C.E.   U.N.C. 8

CRITERIOS DE INFORMACIÓN.

. Si T representa el tamaño muestral, σ 2M V la estimación de máxima verosimilitud


de σ 2 y k el número de parámetros estimados para calcular predicciones a un
paso (en general k = p+ q + 1), los distintos criterios de información se expresan
como sigue.

Criterio de Información de Akaike (AIC)

σ 2M V ) + 2 k
AIC(k) = T ln(

Criterio de Información de Akaike Corregido (AICC)


T
σ 2M V ) + 2 k
AICC(k) = T ln(
T −k−1

Criterio de Información Bayesiana de Akaike (BIC)

σ 2M V ) + k ln(T )
BIC(k) = T ln(

También podría gustarte