Cap 3
Cap 3
Cap 3
El ejemplo inicial referido a la riqueza obtenida en el juego referido a las sucesivas tiradas
de una moneda es un ejemplo de un camino aleatorio.
Este último resultado tiene un rol muy importante en la detección de series no estacionarias.
La función de autocorrelación decae muy poco si s es pequeño pero decae más si s es
grande; en definitiva la función de autocorrelación decae muy lentamente a partir de la
unidad. Este comportamiento de la función de autocorrelación coadyuva a identificar un
random walk.
Analizaremos ahora la media condicional del proceso. Esta medida es importante para
efectuar proyecciones y quiere detectar cuál es el valor medio del proceso a partir de la
información contenida en el presente, es decir consiste en: E (y t+1 / yt ). Por propiedades de
la esperanza condicional resulta: E (y t+1 / yt ) = E (yt / yt )+ E ( ε t / yt ) = yt . El significado
de la última relación es que la mejor proyección del valor actual es el valor actual de modo
que el proceso no aporta ninguna información adicional. Como el valor actual es una
constante más un agregado de ruido se puede notar que no es posible predecir el proceso y
que por otra parte el “ruido” se ha incorporado en el camino aleatorio de manera
permanente ya que representa la parte sustancial del valor presente.
30
20
10
-10
50 100 150 200 250 300 350 400 450 500
La serie muestra una tendencia general a crecer lo que se hace más notorio a partir de las
últimas observaciones.
Ejercicios.
1. Construya un random walk con 500 observaciones donde las perturbaciones del modelo
son ruido blanco normal con varianza 1.
2. Utilice las mismas perturbaciones del modelo anterior y elabore un proceso estacionario
considerando las primeras diferencias del random walk. Grafique las observaciones.
Nota: Las primeras diferencias se pueden generar en el Eviews utilizando el comando Genr
y generando por ejemplo, la serie z, es decir completándola con datos y luego utilizando
otra vez ese comando y escribiendo m=z-z(-1) y modificando sample 2 500. La serie
diferenciada se halla en m. También una vez que se generó z se puede escribir
m=d(z,1).Este último procedimiento es más general.
Ejercicios.
1. Construya un random walk con 500 observaciones donde las perturbaciones del modelo
son ruido blanco normal con varianza 1.
2. Utilice las mismas perturbaciones del modelo anterior y elabore un proceso estacionario
considerando las primeras diferencias del random walk. Grafique las observaciones.
Nota: Las primeras diferencias se pueden generar en el Eviews utilizando el comando Genr
y generando por ejemplo, la serie z, es decir completándola con datos y luego utilizando
otra vez ese comando y escribiendo m=z-z(-1) y modificando sample 2 500. La serie
diferenciada se halla en m. También una vez que se generó z se puede escribir
m=d(z,1).Este último procedimiento es más general.
Una tendencia determinística aparece cuando las series se apartan de sus valores medios,
creciendo o decreciendo según una ley o relación funcional determinística de tipo
polinómico que depende del tiempo. Por ejemplo si yt = c1 + c2 t donde c1 y c2 son
constantes y t representa el tiempo, la tendencia determinística es lineal, si
yt = c1 + c2 t + c2t 2 la tendencia es cuadrática, etc.
Los pasos son los siguientes 1) generar alea=nrnd. 2) generar y=2+0.50* @trend +alea. La
expresión @trend, que representa a t, es un comando del Eviews que devuelve una serie
ordenada 0,1,2,3,etc.
Y
60
50
40
30
20
10
0
10 20 30 40 50 60 70 80 90 100
La línea recta está representada por 2+0.50* @trend, las discrepancias con respecto a la
recta corresponden al término aleatorio. La tendencia domina al término aleatorio y se
observa que la serie no es estacionaria ya que, por ejemplo, la media depende del tiempo.
En cambio, si a la serie yt se le quita la tendencia determinística el modelo se convierte en
ruido blanco.
Prob(F-statistic) 0.000000
El gráfico presenta una tendencia aleatoria superpuesta y dominada por una tendencia
determinística ya que esta prevalece en todo el recorrido de la serie. El correlograma
muestra un proceso random walk.
Y
200
160
120
80
40
-40
10 20 30 40 50 60 70 80 90 100
Si uno se hallara en presencia de datos cuyo gráfico y correlograma son los que se muestran
podría efectuar la estimación en dos etapas: en la primera podría estimar mediante una
regresión los parámetros de la tendencia determinística y eliminar a esta de la serie y en la
segunda, efectuando el correlograma de los datos a los cuales se les quitó la tendencia
determinística, podría identificar el camino aleatorio.
Prob(F-statistic) 0.000000
W
4
-1
-2
-3
-4
10 20 30 40 50 60 70 80 90 100
Para comprobar si este es el modelo que ha generado los datos se efectuó la primera
diferencia de la serie, es decir se generó z=w-w(-1).
Daremos ahora los pasos necesarios para reconstruir el pgd. Sabemos que z es la primera
diferencia de w y es ruido blanco, así que podemos escribir: z t = ∆ w t = w t - w t-1 = ε t .
El énfasis que debe ponerse en este ejemplo debe recaer en mostrar las diferencias
existentes entre una tendencia determinística y una tendencia estocástica y en comprobar el
tratamiento particular que cada una de ellas merece. A la tendencia determinística se la
puede eliminar quitándole los resultados de una regresión tal como se mostrara en el
ejemplo, a la tendencia estocástica mediante diferenciación.
Ejercicios.
Construya 100 observaciones del modelo cuyo pgd es y t = 1 + y t-1 + ε t donde ε t ~ N ( 0;
s e2 = 9 ). Identifique el modelo y conviértalo en estacionario. A partir de los resultados
reconstruya el pgd.
Supongamos que los coeficientes b i cumplen con las condiciones de invertibilidad y que la
ecuación ( 1 – a1 L - a2 L2 -…..- ap Lp ) posee una sola raíz unitaria. Como esta ecuación se
puede escribir como el producto de sus raíces, si denotamos a ellas mediante λ i , se tiene:
1 – a1 L - a2 L2 -…..- ap Lp = (1 - λ 1L ) (1 - λ 2 L2 ) …….(1 - λ p Lp) .
Si la ecuación posee una sola raíz unitaria podemos suponer por ejemplo que λ 1= 1 y
entonces se podría escribir a yt como:
(1- 0,60 L ) ∆ y t = ε t - 0,50 ε t-1 . O bien: (1- 0,60 L ) (y t - y t-1) = ε t - 0,50 ε t-1 . Si se
efectúan las operaciones del primer miembro y se expresa la ecuación en términos de ∆ y t
queda: ∆ y t = 0,60 ∆ y t-1 + ε t - 0,50 ε t-1 . Si se reemplaza ∆ y t por y t - y t-1 y ∆ y t-1 por y
t-1 - y t--2 se obtiene finalmente: y t = 1,60 y t-1 + 0,60 y t-2 + ε t - 0,50 ε t-1 .
La forma final del proceso semeja la de un ARMA (2,1) donde el coeficiente del término
y t-1 es (1 + a1 ).
2.4E+17
2.0E+17
1.6E+17
1.2E+17
8.0E+16
4.0E+16
0.0E+00
5 10 15 20 25 30 35 40 45 50 55 60
Por ejemplo la variación porcentual entre 2,10 y 2,20 es 100* ( 0,10 / 2,10 ) = 4,545% en
tanto que 100*(ln 2,20 –ln 2,10 ) = 4,652.
El enfoque tradicional de las series de tiempo, iniciado a fines del siglo XIX y comienzos
del siglo XX, consideraba que estas estaban integradas por componentes: la componente
cíclica, la de tendencia, la estacional y la irregular. Consistía en un análisis estructural de la
serie.
La componente cíclica es un movimiento de largo plazo de las series económicas y
financieras y corresponde a los movimientos o fluctuaciones de naturaleza ondulatoria que
periódicamente ocurren en el mundo de los negocios. Por ejemplo, la gran depresión de los
años 30 fue seguida de un auge en los 40 y en la posguerra, la crisis de 2008 fue otro
movimiento hacia abajo y posiblemente en 2010 se inicie la recuperación de las economías.
La tendencia es otro movimiento de largo plazo, las series suben o bajan o se mantienen
estacionarias y a ellas nos hemos referido con anterioridad. Algunos autores engloban estas
dos componentes en una sola y la denominan tendencia-ciclo.
Las otras dos componentes son de corto plazo. La estacionalidad se refiere a los
movimientos que ocurren en las series dentro del año producto de las estaciones; la
cantidad de turistas es diferente en julio o en enero que en abril o septiembre, también es
bastante estacional la venta de cerveza o de bebidas gaseosas, etc.
La componente irregular engloba tanto a fenómenos no habituales como por ejemplo una
huelga o el número de feriados en un mes o trimestre y a movimientos aleatorios.
Estas componentes suelen combinarse en forma aditiva cuando el analista considera que
son independientes o en forma multiplicativa cuando considera que no lo son, es decir el
movimiento de una componente influye sobre el movimiento de la otra. Por ejemplo, la
tendencia puede influir sobre la estacionalidad, esta sobre la irregular, etc.
Estos casos son de estacionalidad estable. Pero puede suceder que por diversos factores los
períodos en los que se producen picos y caídas no se mantengan estables en el curso de los
años y este tipo de estacionalidad es más difícil de detectar.
Pero además de los métodos gráficos existen procedimientos analíticos para detectar la
estacionalidad. El más importante es el ideado por el Departamento de Comercio de los
Estados Unidos ( Bureau of Census ) que desde 1930 aproximadamente está
perfeccionando estos métodos. Actualmente está vigente la versión X 12 ARIMA y este
procedimiento es usado por las oficinas estadísticas de casi todo el mundo.
Está basado en promedios móviles y filtros que someten a las series a continuas
“depuraciones” de manera que como resultado se obtienen las componentes, los
denominados factores de estacionalidad y las series desestacionalizadas. El Eviews ha
incorporado este método.
Los investigadores que emplean modelos de series cronológicas como los que nos ocupan
también han propuesto métodos basados en los modelos ARIMA para captar la
estacionalidad. Esta se detecta mediante el correlograma; tanto las funciones de
autocorrelación como las de autocorrelación parcial de las series estacionales presentan
comportamientos particulares: cada cuatro períodos en las series trimestrales y cada doce
períodos en las series mensuales. Es posible reconocer para estos períodos estacionales,
modelos similares a los ya considerados: AR, MA, ARMA, ARIMA, etc. Pero estos son
modelos referidos exclusivamente a la estacionalidad y a la par de ellos, junto a ellos,
acompañándolos, interactúan los patrones no estacionales de las series que hemos
considerados anteriormente. En síntesis, en las series estacionales se requiere una
estimación conjunta: una para los patrones estacionales y otra para los movimientos no
estacionales y esto complica la identificación práctica del modelo.
Se puede presentar un problema adicional referido al número de datos: en una serie con 60
datos mensuales analizar el comportamiento estacional requiere observar el
comportamiento del correlograma en los períodos 12, 24, 36, 48 y 60, solo se cuenta con
cinco medidas para determinar la naturaleza del modelo estacional y este número es
presumiblemente, bastante exiguo.
Los modelos estacionales de series cronológicas propuestos también son aditivos o
multiplicativos, ( aunque por lo general estos últimos son los más utilizados),así por
ejemplo para series trimestrales:
Estacionalidad aditiva.
Estacionalidad multiplicativa.
Modelo MA estacional ( 1 - a1 L ) yt = ( 1 - b1 L ) (1 - b4 L4 ) ε t .
Modelo AR estacional ( 1 - a1 L ) (1 - a4 L4 ) yt = ( 1 - b1 L ) ε t .
Si las series estacionales presentan raíces unitarias o son no estacionarias y por lo tanto,
necesitan ser diferenciadas, conviene diferenciarlas en el período estacional, es decir hacer
yt - y t - 4 en el caso de las series trimestrales y y t - y t - 12 en el caso de las series mensuales.
Esto se puede explicar por el hecho de que los cambios de las series en los períodos
estacionales, por ejemplo enero contra enero, febrero contra febrero, etc., serán menores a
causa de la estacionalidad, que los cambios de enero contra febrero, marzo contra abril, etc.
y puesto que tendrán menor varianza serán estimados con mayor precisión. Además, puede
observarse que: (1 – L4 ) = ( 1- L ) (1 + L) (1 – i) (1 + i) es decir (1 – L 4 ) contiene a (1 –L),
esto significa que cuando se efectúa la diferencia yt - y t - 4 en cierta forma se está efectuando
también la diferencia yt - y t - 1 . Otro tanto ocurre con (1 – L 12 ) que también contiene a (1 –
L).
A modo de ejemplo se analizará el PBI a precios básicos, base 1993 = 100 desde el I
trimestre de 1985 hasta el IV trimestre de 2005. Los datos, trascriptos por columna son los
que se consignan en el cuadro siguiente.
El gráfico de los mismos muestra que la serie es no estacionaria, tiene tendencia y presenta
estacionalidad: en el segundo y el tercer trimestre el pbi por lo general crece, muchas veces
lo hace también en el cuarto, en tanto que en el primer trimestre decrece.
La estacionalidad es bastante marcada y los picos y caídas dentro del año se repiten durante
todo el período considerado. Pareciera, merced a la observación del gráfico, que la
estacionalidad es estable, pero como se refiriera anteriormente más allá de la simple
observación se requieren pruebas analíticas para aceptar o rechazar las hipótesis
estadísticas.
PBI
280,000
260,000
240,000
220,000
200,000
180,000
160,000
140,000
86 88 90 92 94 96 98 00 02 04
PBI1
20
15
10
-5
-10
-15
86 88 90 92 94 96 98 00 02 04
Los residuos de esta regresión se muestran en el gráfico siguiente. Se puede apreciar que
son ruido blanco y que solo presenta un pico significativo en el lag 8.
En definitiva el modelo estimado fue: z t = - 0,183 z t-1 + 0,798 z t-4 + ε t + 0,360 ε t -1 donde
z es la variación porcentual del PBI.
Como se había señalado anteriormente el Census posee una serie de filtros basados en
promedios móviles que procuran estimar las componentes de una serie: la tendencia-ciclo,
la estacional y la irregular. A partir de estimaciones iniciales estos filtros son usados
repetidamente y mejoran continuamente esas estimaciones en sucesivas etapas del
programa. Debido a la extensión y la complejidad de este procedimiento solo se
consignarán los resultados más importantes. Bibliografía adicional se puede hallar en la
página web del Bureau of Census o bien se puede recurrir al texto The econometric análisis
of time series,E. Ghysels y D. R. Osborn, Cambridge 2001.
Las variaciones porcentuales del pbi fueron procesadas mediante el programa Census X 12
Arima en su versión aditiva. Este programa contiene pruebas estadísticas en las que emplea
tests “F-Snedecor” y no paramétricos (Krhuskal-Wallis), tendientes a determinar por una
parte, la existencia de estacionalidad y por otra, si esta es estable. En ambos casos la
respuesta fue afirmativa, lo que confirmó las presunciones que se tenían y que fueron
originadas en la observación del gráfico de la serie. Entre otras “salidas” el Census
suministra, la serie desestacionalizada, los “términos estacionales” y la tendencia ciclo. La
serie desestacionalizada se obtiene deduciendo de la serie original los “términos
estacionales”, si el modelo hubiera sido multiplicativo la serie desestacionalizada se obtiene
multiplicando la serie original por el factor estacional.
Se comprueba que se eliminó en buena parte el pico estacional en el cuarto rezago pero
aún persiste bastante alto en los lags 8 y 12. Para eliminar el pico estacional del lag 8 se
incorporó en el modelo el término MA (8).
Prob(F-statistic) 0.000010
El correlograma de los residuos que se expone a continuación muestra que son ruido blanco. En
particular el test Q y el de Bartlett muestran que los residuos no son significativamente distintos de
cero.
Los desarrollos que hemos presentado pretenden ilustrar cómo operan los dos
procedimientos analizados. El método basado en los modelos Box-Jenkins efectúa una
estimación conjunta del modelo estacional y del modelo ARMA referido a la parte de la
serie que no es estacional, el Census se aplica para desestacionalizar la serie y el modelo de
series cronológicas se obtiene a partir de la serie desestacionalizada. Mediante el
correlograma habrá que discernir cuál es la perfomance de cada uno y, por otra parte, la
elección de algún método debe estar basada en el problema concreto que se deba resolver,
por ejemplo el Census constituye una buena elección si uno desea solamente obtener
factores estacionales o series desestacionalizadas, si uno requiere estimaciones conjuntas y
más estilizadas pareciera que los métodos de series cronológicas son más satisfactorios
pero, en última instancia lo más efectivo parece desarrollar ambos procedimientos y
comparar los resultados.
En el caso que nos ocupa el segundo procedimiento que incluye 76 observaciones presenta
valores más bajos de los criterios de Akaike y de Schwarz que el primero, que incluye a 75
observaciones. Sin embargo, si bien esta comparación no sería estrictamente válida porque
ambos modelos no poseen igual número de observaciones, como ellas son prácticamente
iguales y el modelo que posee más observaciones tiene residuos más bajos, se puede
concluir que las pruebas estadísticas hacen preferible al modelo que emplea el Census.
Ejercicio. Utilice los datos del pbi, utilizando una transformación distinta a las variaciones
porcentuales, para efectuar una estimación de la serie y proyecciones. Aplique el método
Census y el de series de tiempo. Compare los resultados y halle el valor del pbi para el
primer trimestre del 2005 si se prevé (con respecto al cuarto trimestre de 2004): a) un
aumento del 2% en la serie desestacionalizada y b) una caída de 0,7% en la serie con
estacionalidad.