Apostila Eviews PDF
Apostila Eviews PDF
Apostila Eviews PDF
APOSTILA
Junho 2003
* EViews e Econometric Views são marcas registradas da empresa americana Quantitative Micro
Software (QMS). Copyright Rogério Silva de Mattos.
2
ÍNDICE
Apresentação ...............................................................................................................3
1. Primeiros Passos ......................................................................................................5
1.1 Entrando no Eviews............................................................................................5
1.2 Arquivo de Trabalho...........................................................................................5
1.3 Entrando Dados ..................................................................................................7
1.4 Entrando Dados Pelo Teclado .............................................................................7
1.5 Salvando o Arquivo de Trabalho.........................................................................7
1.6 Verificando os Dados..........................................................................................7
1.7 Importando Dados ..............................................................................................8
1.8 Exportando Dados ..............................................................................................9
EXERCÍCIOS........................................................................................................ 10
2. Manipulação e Visualização de Dados .................................................................... 11
2.1 Criando Novas Séries........................................................................................ 11
2.3 Gráficos no EViews.......................................................................................... 12
EXERCÍCIOS........................................................................................................ 14
Anexo 2.1: Operadores Utilizáveis em Fórmulas..................................................... 15
3. Análise de Regressão Múltipla ................................................................................ 16
3.1 Introdução ........................................................................................................ 16
3.2 Regressão Múltipla ........................................................................................... 16
3.4 Relembrando Inferência Estatística ................................................................... 17
3.5 Voltando à Regressão Múltipla ......................................................................... 18
3.6 Qualidade do Ajustamento de Modelos ............................................................. 19
3.6 Algumas Definições Adicionais ........................................................................ 20
4. Regressão Múltipla no EViews............................................................................... 21
4.1 Dados de Receita Total versus Preço e Propaganda ........................................... 21
4.2 Rodando uma Regressão................................................................................... 21
4.3 Visualizando o Comportamento do Modelo ....................................................... 23
EXERCÍCIOS........................................................................................................ 24
5. Diagnóstico de Modelos ......................................................................................... 25
5.1 Pressupostos Básicos do Modelo de Regressão Múltipla .................................... 25
5.2 Propriedades dos MQO..................................................................................... 25
5.3 Autocorrelação Serial (ACS)............................................................................. 25
5.4 Heterocedasticidade .......................................................................................... 27
5.5 Não–Normalidade dos Erros ............................................................................. 28
EXERCÍCIOS........................................................................................................ 29
6. Modelos Especiais .................................................................................................. 31
6.1 Variáveis Dummy............................................................................................. 31
6.2 Variáveis independentes binárias (Dummy)....................................................... 31
6.3 Variáveis dummy dependentes.......................................................................... 34
6.4 Modelos Não–Lineares..................................................................................... 37
EXERCÍCIOS........................................................................................................ 38
Bibliografia ............................................................................................................ 42
3
Apresentação
O software comercial EViews é uma versão para Windows de várias ferramentas para
análise estatística de dados de séries temporais. Essas ferramentas foram desenvolvidas
originalmente na década de 70 como um software para computadores grandes e que se
denominava Time Series Processor (TSP). Em 1981, foi disponibilizado pela primeira
vez a versão para computadores pessoais denominada MicroTSP. O sucessor imediato
deste último é o EViews, desenvolvido para ambientes gráficos tipo Windows.
O objeto de dados básico no EViews é a série temporal. Cada série tem um nome e você
pode realizar operações sobre todas as observações apenas mencionando o nome da
série. O EViews oferece recursos visuais convenientes para entrar séries de tempo pelo
teclado ou importando de arquivos em disco, criar novas séries a partir de outras já
existentes, mostrar e imprimir séries e realizar análise estatística da relação entre as
séries.
Você pode usar o EViews através do mouse, acessando os diversos menus e caixas de
diálogos. Os resultados aparecem em janelas e podem ser manipulados com as técnicas
padrões do Windows. Alternativamente, existe a poderosa linguagem de comandos do
EViews, que permite entrar e editar comandos na janela de comandos, bem como criar
comandos específicos para implementar um projeto completo de pesquisa.
Como essa lista de recursos é muito vasta, alguns itens envolvendo conhecimentos
avançados de inferência estatística, neste curso vamos nos centrar em alguns itens
relevantes que irão nos capacitar a construir modelos empíricos de regressão múltipla
usando o EViews. Basicamente, estudaremos os recursos referentes aos itens 1, 2, 3, 4,
11, 13, 14, 16 e 17. Mesmo nos restringindo a esses itens, vamos aprender uma ampla
gama de procedimentos que nos permitirão aplicar as técnicas de modelos de regressão
a problemas reais de nosso interesse.
Aviso
1. Primeiros Passos
Iniciar\Programas\Econometric Views\EViews
Será aberta uma grande janela, dividida em 2 partes. A primeira parte corresponde à
linha de menu, com as opções:
Através dessas várias opções e suas respectivas sub–opções é que iremos realizar todas
as operações com o EViews.
A segunda parte é uma grande faixa branca, logo abaixo da linha de menu, denominada
Janela de Comandos. Ela permite uma forma alternativa de operar o EViews, através da
digitação de comandos.
Para iniciantes, como é o nosso caso, a primeira forma é a mais adequada e será através
dela que iremos trabalhar aqui. A segunda forma, via Janela de Comandos, é mais
flexível, mas é mais adequada para quando tivermos mais experiência com o uso do
EViews.
File\New\Workfile.
A seguir, temos de entrar as informações nos dois campos em branco: Start Date (data
inicial) e End Date (data final). Para cada tipo de opção, temos procedimentos
apropriados para entrar as datas, conforme os exemplos a seguir:
Nota: Você pode digitar um ponto “.” ao invés de dois pontos “:” numa data, por
exemplo: 1956.1, 1990.11.
Uma vez informada a data inicial e a final, podemos clicar ‘OK’. O EViews cria, então,
o Arquivo de Trabalho. A primeira coisa que acontece é o surgimento de uma janela
com informações do Arquivo de Trabalho recém criado. Para abreviar, chamaremos
essa janela de JAT.
View,Procs,Save,Show,Fetch,Store,Delete,Genr,Sample
Em breve, estaremos aprendendo a usar essas opções. Na próxima parte JAT, aparece a
informação sobre os dados a serem usados:
Nós podemos alterar esses dois intervalos quando quisermos. O intervalo disponível em
geral mudamos quando queremos aumentar a base de dados (por exemplo, quando
termina um mês e queremos inserir nova observação). O Intervalo em Uso nós
mudamos quando queremos usar só uma parte da amostra (sample) de dados. Por
enquanto não vamos mexer nesses intervalos.
Também aparece a informação sobre a equação em uso no momento. Como ainda não
estimamos uma equação (nem entramos os dados ainda!) o EViews nos informa que não
há qualquer equação (Default Equation: None).
Na ultima parte da JAT, aparecem dois objetos: C e RESID. O objeto C é usado pelo
EViews para guardar resultados, e também como nome reservado para a constante dos
7
modelos de regressão. O objeto RESIDS é usado para guardar os resíduos de uma
equação de regressão.
Y 10 12 15 17 19 18 21 19 20 23 20 25
X 1 2 3 4 5 6 7 8 9 10 11 12
Com a JAT aberta, digitamos a sequência: Quick\Empty Group (Edit Series). Aparecerá
uma planilha vazia. Na primeira coluna, de cor cinza, aparece a data das linhas. Na
segunda coluna em branco, vamos entrar os dados para a variável Y. Digite na primeira
célula (em cinza) desta coluna o nome da variável: Y. Aperte a tecla ↓. Imediatamente,
as células em branco da coluna receberão a denominação ‘NA’ (de Not Avaylable, isto
é, não disponível). Digite o valor 10 na primeira célula e tecle ↓. Repita este
procedimento para entrar os demais dados para Y. Quando terminar, repita todos os
procedimentos para entrar os dados para X. Após entrar o último dado para X, pode
fechar a janela. (clicando no botão ‘×’ do canto superior da janela).
Você vai notar que agora aparecem mais dois objetos na JAT: as duas séries Y e X que
você acabou de entrar.
Usaremos, como exemplo, o arquivo EX01.XLS. Abra este arquivo no Excel. Dentro do
Excel, selecione Edit\Copy para copiar os dados para a área de transferência. Em
seguida, inicie o EViews e crie um novo Arquivo de Trabalho anual (File\New), ou
carregue um Arquivo de Trabalho já existente (File\Open). Certifique–se de que o
Intervalo em Uso (Sample) esteja definido para incluir as mesmas observações que você
copiou do Excel.
Na JAT recém aberta, selecione Quick\Empty Group e uma janela contendo uma
planilha de grupo aparecerá. A planilha abre no modo Editar, de forma que não há
necessidade de clicar o botão Edit +/–. Você tem de rolar a planilha uma linha para
baixo de forma a criar espaço para os nomes das séries. Clique na seta para cima da
barra de rolagem. Então, coloque o cursos na célula superior esquerda que está logo à
direita da palavra ‘obs’. Então, cole os dados (selecione Edit\Paste do menu principal) e
pronto.
O primeiro passo é criar o arquivo de onde vamos importar. Normalmente fazemos isso
salvando os dados em formato texto ou em formato de planilha no software (que não o
EViews) onde estivermos trabalhando. O segundo passo é criar um arquivo de trabalho
apropriado: se os dados forem mensais, criar um arquivo de trabalho de tipo Monthly;
se forem trimestrais de tipo Quarterly e assim por diante.
Usaremos o arquivo EX01.TXT como exemplo. Este arquivo foi criado no Bloco de
Notas do Windows. Para ver o conteúdo dele, inicie o Bloco de Notas e abra o arquivo.
Você verá que ele contem três colunas de dados, correspondentes a três séries Y, X e Z.
Agora, vá para o Eviews e crie um arquivo de trabalho do tipo mensal, começando em
2000:1 e terminando em 2000:12. Execute a seguinte sequência:
File\Import\Read Text-Lotus-Excel
Abrirá uma janela chamada Open. Vá para o campo List Files of Type que fica no canto
inferior esquerdo da janela e selecione a opção Text-ASCII. Agora, procure o arquivo
pelos diretórios do seu microcomputador. Quando o achar, de um clique sobre ele. Você
verá que o nome do arquivo será automaticamente escrito no campo File Name, que fica
no canto superior esquerdo. Agora, dê ‘OK’,
Abrirá uma segunda janela chamada ASCII Data Import\Export. Em Order of Data,
selecione a opçao By Observation – series in columns. No grande campo em branco que
aparece logo embaixo, digite a relação de variáveis que aparecem na primeira linha do
9
arquivo, isto é, digite (com pelo menos um espaço em branco de separação): Y X Z. Dê
‘OK’.
Você verá na JAT que apareceram três novos objetos, denominados, X, Y e Z. Use o
comando Show para verificar se os dados foram importados corretamente.
Há duas opções de arquivo tipo planilha para se importar no EViews: Excel (extensão
.XLS) e Lotus 123 (extensão .WK1). A presente versão do EViews funciona com alguns
problemas na importação do Excel diretamente. Usaremos a importação de planilha tipo
Lotus 123. Isso não vai nos impedir de usar o Excel, pois sempre poderemos salvar
nossos dados numa planilha Excel em um formato de planilha Lotus 123.
File\Import\Read Text-Lotus-Excel
Abrirá uma janela chamada Open. Vá para o campo List Files of Type que fica no canto
inferior esquerdo da janela e selecione a opção Lotus wks-wk3. Agora, procure o
arquivo pelos diretórios do seu microcomputador. Quando o achar, de um clique do
botão esquerdo do mouse sobre ele. Você verá que o nome do arquivo será
automaticamente escrito no campo File Name, que fica no canto superior esquerdo.
Agora, dê ‘OK’,
Você verá na Janela de Arquivo que apareceram três novos objetos, denominados, X, Y
e Z. Use o comando Show para verificar se os dados foram importados corretamente.
EXERCÍCIOS
1.1 Crie um novo arquivo de trabalho com periodicidade anual, para um total de 12 anos
começando em 1990, e experimente entrar manualmente os dados que estão no arquivo
EX01.TXT. Quando terminar, cheque se os dados foram copiados corretamente. Salve o
arquivo como EX01.WF1.
1.2 Abra no Excel o arquivo VOTE.XLS e observe os dados que estão dentro dele.
Conte quantas observações existem para as variáveis. Selecione a região que contém os
dados, inclusive a linha de título das variáveis, e copie para a área de transferência.
Entre no EViews e crie um novo arquivo de trabalho não datado com o mesmo número
de observações. Abra uma Janela de Grupo nova e copie para dentro dela os dados da
área de transferência (não esqueça de andar uma linha para cima na Janela de Grupo).
Depois feche essa janela. O que aconteceu na JAT? Salve o arquivo como VOTE.WF1.
1.3 O arquivo tipo texto PROFITS.DAT contém dados trimestrais de 1959.1 a 1999.3
para três variáveis (YEAR,QTR e PROFITS). Verifique isso usando o Bloco de Notas.
Crie um arquivo de trabalho apropriado no EViews e importe os dados desse arquivo.
Depois salve o arquivo com o nome de PROFITS.WF1.
Além dos recursos de importar e exportar dados, você tem ampla flexibilidade para
manipular dados dentro do EViews. A forma básica de fazer isso é operar sobre as
séries de dados. Você pode criar novas séries a partir das já existentes no arquivo de
trabalho usando fórmulas.
Exemplo 2.1: Você pode usar vários tipos de equações para criar novas séries, como
segue:
R=Y
Z = X2 + X3 - X4
W = X2*X3/X4
YQ = Y^2
LNY = LOG(Y) (logaritmo neperiano de Y)
SENY = SIN(Y) (seno de Y)
COS2X3 = COS(2*X3) (cosseno de 2 vezes X3)
RQX2 = SQRT(X2) (raiz quadrada de X2)
Há muita flexibilidade no EViews para se editar equações para criar novas séries. No
Anexo 2.1, veja a relação de operadores utilizáveis nas fórmulas.
Para criar um grupo de séries, selecione Quick\Empty Group (Edit Series). O EViews
abre a JG sem nome (UNTITLED). Esta janela tem a aparecência de uma planilha, com
várias linhas e colunas. Clique sobre a célula acinzentada do lado da palavra ‘obs’.
Digite X. Você verá que os dados da série X vão aparecer na coluna respectiva. Clique
12
agora na célula ao lado do nome da série ‘X’. Digite Z. Os dados para Z agora também
aparecem. Você simplesmente colocou as séries X e Z dentro do Grupo.
Salve o grupo usando a opção Name e usando o nome GROUP1. Você verá que o
objeto GROUP1 agora aparece na JAT. Para criar uma nova série, vá para a célula ao
lado do nome da série ‘Z’. Digite 4*X–2*Z. Você verá que um novo conjunto de
valores (uma série) vai aparecer. Digite agora sobre a célula contendo a expressão
4*X – 2*Z, a letra ‘V’. Uma nova série terá sido criado na JG. Mais, note que essa série
V também aparece como um novo objeto na JAT.
A JG serve a vários propósitos. Além de permitir juntar e criar séries numa planilha, ela
permite exportar o grupo como um arquivo Excel. Podemos fechar a JG e depois abri–la
a qualquer momento usando a opção Show, ou clicando sobre o objeto GROUP1 na
JAT.
Note que também podemos alterar os valores das séries disponíveis na JAT através da
JG. Basta clicar sobre um grupo que contenha a série que se quer alterar. Aí nos
movemos dentro da JG até as células cujos valores queremos alterar e alteramos.
Automaticamente, a série na JAT também fica alterada. Logo, a JG não é uma planilha
separada da JAT, ela permite atualizar os dados da JAT.
O EViews permite fazer gráficos de uma ou mais séries, com o máximo permitido de 6
séries em único gráfico. Há recursos para se mostrar vários gráficos na mesma janela
(Multiple Graphs). Há ampla facilidade de edição (por títulos, legendas, textos, sobras,
etc.) nos gráficos para sua posterior exportação para uso em documentos criados em
outros softwares, tipo MS–Word.
Com relação à galeria disponível no EViews, os seguintes tipos de gráficos das séries
podem ser feitos:
Stacked Line Gráfico de linha, sendo que cada linha é a soma das outras
linhas desenhadas anteriormente. Ou seja, a diferença
vertical entre duas linhas é o valor da série;
Stacked Bar Gráfico de barras, sendo que cada barra é a soma dos
valores das outras séries e cada série é mostrada como
uma pedaço da barra;
13
Mixed Bar and Line A primeira série é mostrada como um gráfico de barras e
as demais como gráficos de linhas;
50
40
30
20
10
0
00:01 00:03 00:05 00:07 00:09 00:11
X Z
Repita todo o procedimento para desenhar esse gráfico, menos o último passo (digitar
‘OK’). Isto é, você vai parar na janela Graph. Observe nessa janela que, além de poder
selecionar Graph Type, há um botão Show Options. Clique nesse botão. Aparecerá uma
ampla janela com várias opções de configuração do gráfico. Por enquanto, apenas
selecione a opção Normalized.
-1
-2
00:01 00:03 00:05 00:07 00:09 00:11
X Z
14
EXERCÍCIOS
2.1 Abra no Excel o arquivo EX02.XLS. Você vai ver 4 séries mensais: Y, X2, X3 e
X4, definidas no período 2000.01–2001.12. Abra um novo arquivo de trabalho no
EViews e copie para dentro dele os dados do arquivo EX02.XLS. Depois, salve o
arquivo de trabalho como EX02.WF1. Realize os seguintes procedimentos:
a) Faça um gráfico de linha das séries Y, X2, X3 e X4 sem nenhuma opção especial.
b) Usando as mesmas séries de a), faça os outros tipos de gráfico disponíveis (faça cada
gráfico numa janela separada para você comparar depois);
c) Repita o exercício a) usando a opção normalized;
2.3 Escolha um dos gráficos que você criou no exercício 2.2. Se tiver fechado a janela
dele, recrie–o. Agora exporte–o para dentro do MS–Word. Faça o seguinte: Na janela d
15
Gráfico, vá no menu superior e selecione Edit\Copy. Abra o MS–Word e selecione
Novo Documento. Cole o gráfico aí dentro. Veja como ficou.
2.4 Explore os outros recursos de gráfico do EViews. Tente mexer nas opções. Explore
também os botões da Janela de Gráfico, tipo Name, Add Text, Add Shade e Zoom. Veja
o que acontece.
Aritméticos
+ Soma
– Subtração
* Multiplicação
/ Divisão
^ Potenciação
Nota: como de praxe, a ordem de prioridade é potenciação, multiplicação e divisão,
soma e subtração. Para alterar esta ordem de prioridade usa–se parênteses.
Comparativos
> Maior do que; X>Y gera o valor 1 quando verdade e 0 quando falso;
< Menor do que; X<Y gera o valor 1 quando verdade e 0 quando falso;
= Igual a; X=Y gera o valor 1 quando verdade e 0 quando falso;
<> Diferente de;X<>Y gera o valor 1 quando verdade e 0 quando falso;
<= Menor ou igual; X<=Y gera o valor 1 quando verdade e 0 quando falso;
>= Maior ou igual; X>=Y gera o valor 1 quando verdade e 0 quando falso;
Lógicos
AND E lógico; X AND Y vale 1 se ambos X e Y são não–nulos;
OR OU lógico; X OR Y vale 1 se X ou Y é não nulo;
Diversos
D(X) Primeira diferença de X, i.e., X–X(–1);
D(X,n) N–ésima diferença de X,i.e., X–X(–n);
LOG(X) Logaritmo neperiano de X;
DLOG(X) Diferença do logaritmo natural de X; LOG(X)–LOG(X(–1));
DLOG( X,n) N–ésima diferença do logaritmo natural de X; LOG(X)–LOG(X(–n));
EXP(X) Função exponencial
ABS(X) Valor absoluto
SQR(X) Raiz quadrada
SIN(X) Seno
COS(X) Cosseno
RND Número aleatório gerado segundo a distribuição Uniforme(0,1);
NRND Número aleatório gerado segundo a distribuição Normal(0,1);
NA Código de dado faltando ou não–disponível
16
3.1 Introdução
Seja R = receita total de vendas, P = preço médio e A = gastos com propaganda.
Yt = β 1 + β 2 X 2 t + K + β k X kt + ε t
Yt = βˆ1 + βˆ 2 X 2 t + K + βˆ k X ki + εˆ t
r
Y = {Y1 , Y2 , K, Y N }
r
Amostras ou Séries de Dados X 2 = { X 21 , X 22 ,K , X 2 N }
r
X 3 = { X 31 , X 32 ,K , X 3 N }
Yˆ = βˆ1 + βˆ 2 X t + K + βˆ k X ki
βˆ1 → β 1 βˆ 2 → β 2 ... βˆ k → β k
População
Amostra
r
Seja X = { X 1 , K, X N } uma amostra extraída aleatoriamente (representativamente) da
população. Então:
∑X
t =1
t → µ
X =
N
Média Média
Amostral Populacional
A) Não Enviesamento
B) Eficiência (Precisão)
|–––––––––––––––––––––|––––––––––––––––––––|
XI X XS
P( X I ≤ µ ≤ X S ) = 1 − α → Nível de Confiança
18
3.4.3 Testes de Hipóteses
Enunciado do Teste H0 : µ = 3
H1 : µ ≠ 3
Estatística de Teste X −3
tX =
S/ N
Nível de Significância α
Regra de Decisão (t crítico) Se − t C ≤ t X ≤ t C : Aceito H0.
Do contrário: Rejeito H0.
Obs: tC = t (α / 2; N − 1) é tabulado.
∠= (X´X) −1 X´Y
βˆ1 1 X 21 X 31 L X k1 Y1
ˆ 1 X
β X 32 L X k2 Y
βˆ = 2 X = Y =
22 2
( k×1) M ( N ×k ) M M M O M ( N ×1) M
βˆ k 1 X 2 N X 3N L X kN Y N
A) Não Enviesados
B) Eficientes
C) Consistentes
Logo: EMQO podem ser muito confiáveis ! Por isso, vamos preferí– lo. O EViews
chama EMQO de LS (Least Squares).
19
|–––––––––––––––––––––|––––––––––––––––––––|
β̂ jI β̂ j β̂ jS
P( βˆ jI ≤ β j ≤ βˆ jS ) = 1 − α → Nível de Confiança
Estatística de Teste βˆ j
t βˆ =
j
S βˆ
j
Nível de Significância α
Regra de Decisão (t crítico) Se − t C ≤ t ≤ t C : Aceito H0.
β̂ j
R =
Variação Explicada de Y
2
=
∑ (Yˆ t − Y )2
Variação Total de Y ∑ (Y t − Y )2
3.6.2 Teste F
Enunciado do Teste H 0 : R 2 = 0 H 0 : β2 = β3 = K = βk = 0
⇔
H 1 : R 2 > 0 H 1 : pelo menosum dos βs = 0
Estatística de Teste
F=
∑ (Yˆ − Y ) /(k − 1)
i
2
∑εˆ /( N − k )
t
2
Nível de Significância α
Regra de Decisão (t crítico) Se F > FC : Aceito H0.
Do contrário: Rejeito H0.
Obs: FC = Fα (k − 1, N − k ) é tabulado.
∑ εˆ
t =1
2
t Soma dos quadrados dos resíduos;
N
S 2 = ∑ εˆt2 ( N − k ) Variância da regressão;
t =1
S = S2 Desvio–padrão da regressão.
21
RCPA
Esta sequência informa ao EViews que R é a variável dependente, C é para incluir uma
constante na regressão, P e A são as variáveis independentes. Logo abaixo, onde
aparece Estimation Settings (Configuração da Estimação), selecione a opção LS (que
significa EMQO para o EViews, lembra?). Por default, o EViews preenche o campo
Sample com a data inicial e final (isto pode ser alterado por você). Então, digite ‘OK’.
LS // Dependent Variable is R
Date: 10/01/02 Time: 16:29
Sample: 1/01/2001 12/24/2001
Included observations: 52
Use a opção Name para salvar essa equação no arquivo de trabalho com o nome EQ1.
22
View,Procs,Objects,Name,Freeze,Estimate,Forecast,Stats,Resids
A opção Resid é bastante útil para verificarmos visualmente se o modelo ficou bem
ajustado. De um clique sobre ela. Você verá uma nova tela aparecer dentro da Janela de
Equação apresentando um gráfico. Este gráfico está dividido em duas partes:
2a. Parte: Linha azul. A linha azul representa os resíduos ( εˆt = Yt − Yˆt ), isto
é, a diferença entre a série observada e a ajustada. Quanto mais
“nervosa” aparentar essa linha, melhor, significa que a parte não
explicada pelo modelo é puramente aleatória.
EXERCÍCIOS
4.1. Abra o arquivo de trabalho PROPAG.WF1. Usando R como variável dependente,
estime as seguintes equações, salvando cada uma delas no arquivo de trabalho:
4.2. Abra o arquivo de trabalho PROFITS.WF1. Crie agora uma série de tendência
usando o comando Genr e a função @trend(). Dê o nome T a esta série. Observe os
novos números da Tela de Resultados e verifique se o modelo parece estar bom. Tente
Observe também o gráfico das séries observada e ajustada e o gráfico dos resíduos.
Tente usar também a série T^2 e observe os mesmos resultados. Avalie se o modelo
melhorou ou não. Salve o arquivo PROFITS.WF1 quando terminar.
5. Diagnóstico de Modelos
Um modelo de boa qualidade é um modelo confiável. Para tanto, é necessário que certas
condições sejam satisfeitas. O Diagnóstico de Modelos é a atividade voltada para
verificar se essas condições são válidas para o problema de modelagem que você está
trabalhando.
Como falamos antes, os EMQO são eficientes e consistentes se certas condições forem
satisfeitas. É isso que torna esse método de estimação um método confiável na prática.
Essas condições tomam a forma pressupostos básicos para o modelo verdadeiro ou
populacional.
Pressupostos Básicos
1) O modelo verdadeiro é linear (nas variáveis e nos parâmetros);
2) As variáveis explicativas são independentes do erro aleatório ε e não não
perfeitamente correlacionadas entre si;
3) Pressupostos do erro erro aleatório ε:
a) média nula e variância constante σ 2 ;
b) ε i é não correlacionado com ε j , para i ≠ j .
c) ε i segue uma distribuição normal de probabilidade;
SE ENTÃO
Pressupostos EMQO é o método mais
Básicos são ========> confiável para se estimar
modelos de regressão.
Válidos
5.3.1 Consequências
– EMQO continuam não enviesados, mas não são mais eficientes (i.e., há outro
estimador que é eficiente);
– A variância residual S 2 fica enviesada, enviesando também os desvios padrões dos
estimadores . S bˆ , K, S bˆ e consequentemente as estatísticas t respectivas e a estatística
1 k
de teste F.
2) Incluir uma ou mais defasagens da dependente: muitas vezes o que gera a ACS é
alguma forma de inércia no comportamento da variável dependente. Assim incluir
defasagens da mesma resolve em muitos casos;
5.4 Heterocedasticidade
É um caso de violação da hipótese 3.a). Os erros tem média nula mas a variância não é
mais constante: Var (ε i ) = σ i2 . Heterocedasticidade acontece com frequência em dados
tipo seção–cruzada (não são séries temporais). Entretanto, em tempos recentes o
problema da heterocedasticidade vem aparecendo muito também em séries econômicas
e de negócios, fruto da instabilidade crescente dos sistemas econômicos reais.
– EMQO continuam não enviesados, mas não são mais eficientes (i.e., há outro
estimador que é eficiente);
– A variância residual S 2 fica enviesada, enviesando também os desvios padrões dos
estimadores . S bˆ , K, S bˆ e consequentemente as estatísticas t respectivas e a estatística
1 k
de teste F.
1) Gráficos: podem ser útil exploratoriamente. O diagrama de dispersão dos resíduos εˆi2
contra cada uma das variáveis explicativas pode sugerir que a variância de ε anda junto
com uma ou mais delas.
Yi = a + b2 X + b3 Z + u i
u i2 = α 1 + α 2 X i + α 3 Z i + α 4 X i2 + α 5 Z i2 + α 6 XZ + vi
e testa a hipótese nula de que todos os coeficientes α 2 ,K ,α 6 são iguais a zero. Se ela é
aceita, não há heterocedasticidade. Caso contrário há. O resultado do teste é uma
28
Para usar o teste de White no EViews, peça, após estimar uma equação, a opção
View\Residuals Tests\White heteroskedasticicy. O Eviews oferece duas opções: sem os
termos cruzados tipo XZ na equação acima (no cross terms) e com os termos cruzados
(cross terms). Essa opção é importante porque quando o modelo tem muitas variáveis
explicativas o uso dos termos cruzados aumenta o número de graus de liberdade
perdidos na regressão teste.
A hipótese 3c) não é essencial para as boas propriedades dos EMQO. Quando ela é
verdadeira, os EMQO são os mais confiáveis (eficientes) dentre todos os estimadores
dos parâmetros de um modelo de regressão. Além disso, quando a amostra é grande, a
lei dos grandes números funciona a favor dos EMQO porque a distribuição destes fica
bem aproximada por uma distribuição normal.
Esta correção é importante no caso de amostras pequenas. Portanto, uma primeira forma
de corrigir o problema é aumentar o tamanho da amostra substancialmente. Quando não
for possível e você tiver de se contentar com amostra pequenas, vários procedimentos
existem, a maioria baseados no uso de alguma forma de transformação da variável
dependente. Por exemplo, no caso de uma variável dependente que só assume valores
positivos, a transformação logarítmica tende a induzir normalidade dos erros em muitos
casos (ver mais em modelos não lineares na próximo seção). Outras transformações
existem, como a classe de transformações de Box–Cox (não serão vistas aqui).
EXERCÍCIOS
5.1 Abra o arquivo CNPEACE.XLS. Este arquivo contém séries anuais de consumo
(CO) e renda (Y) para a economia americana entre 1929 e 1970. Crie um arquivo de
trabalho no EViews para ler esses dados, e depois que os importar, salve o arquivo com
o nome CNPEACE.WF1. Então, estime uma equação, com constante, de CO em função
de Y. Então:
a) Observe a estatística de Durbin–Watson. O que ela sugere?
b) Observe o gráfico dos resíduos (com as série atual e ajustada). O que você percebe de
errado?
c) Oberve o correlograma e as estatísticas Q de Ljung–Box. O que você percebe de
errado?
Salve a equação.
5.3 Crie um arquivo de trabalho não datado com 38 observações. Importe os dados do
arquivo USFOOD.XLS. Esses dados consistem de despesas com alimentação (Y), renda
(X) e numero de moradores por domicílio (N), em uma amostra aleatório de 38
domicílios numa região metropolitana de uma grande cidade americana. Estime usando
EMQO um modelo com Y como dependente, uma constante, e X e N como
explicativas. Salve a equação e, então:
a) Faça o gráfico dos resíduos versus a renda e versus o número de moradores. Esses
gráficos sugerem a existência de heterocedasticidade?
b) Gere a série YF = Y – RESIDS. Faça o gráfico dos resíduos versus YF. Novamente,
esse gráfico sugere a existência de heterocedasticidade?
c) Aplique um teste de White para verificar estatisticamente se há heterocedasticidade.
Use primeiro a opção no cross terms e depois a opção cross terms. O que o teste está
indicando nos dois casos?
d) Agora, estime o modelo usando o estimador de desvios–padrão de White. Salve a
equação. Compare os resultados com o da estimação por MQO feita anteriormente.
e) Você acha que o estimador de White subestima ou sobre–estima a confiabilidade dos
EMQO?
5.5 Abra o arquivo CNPEACE.WF1, e clique sobre a equação que você salvou no
exercício 5.1, acima.
a) Para a série de consumo (CO), faça o histograma e verifique o teste de normalidade
de Jarque Bera.
b) Para a série de renda (Y), faça o histograma e verifique o teste de normalidade de
Jarque Bera.
c) Na JAT, clique sobre a equação que você salvou no exercício 1), acima. Para a série
de resíduos, faça o histograma e verifique o teste de normalidade de Jarque Bera.
Você detectou alguma situação problemática?
31
6. Modelos Especiais
1 período de guerra
Dt =
0 período de paz
1 i - ésimo indivíduo é negro
DRi =
0 i - ésimo indivíduo é de outra raça
O último exemplo refere–se às chamadas variáveis dummy sazonais, usadas para captar
padrões sazonais no comportamento da variável dependente.
Ct = β 1 + α 1 Dt + β 2 Yt + ε t
Ct = β 1 + β 2 Yt + α 2 ( Dt Yt ) + ε t
Ct = β 1 + α 1 Dt + β 2Yt + α 2 Dt + ε t
Usar variáveis dummy no Eviews é muito fácil. Elas podem ser entradas pelo teclado,
através da JG, usando–se a opção Quick\Empty Group (Edit series), porém esse
dispositivo só é útil quando temos poucos dados. Para grandes números de observações,
elas podem ser definidas por fórmula usando a opção Genr da JAT ou dentro da JG (ver
seção 2 desta apostila). No primeiro caso, é preciso cuidar para as definições dos
intervalos em uso (sample). Vejamos três exemplos.
Exemplo 6.1: Abra o arquivo EX01.WF1. Queremos gerar uma variável dummy D1 que
vale 0 nos meses do 1º semestre e vale 1 nos meses do 2º semestre. Seguiremos dois
estátios.
Uma vez criada uma variável dummy, ela pode ser usada numa equação a ser estimada
via EMQO ou qualquer outro método disponível no EViews.
Yi = Pi + ε i
Pi = E (Yi | X i ) = β 1 + β 2 X i
Exemplo 6.4:
1 comprar um carro da marca A
Yi =
0 comprar um carro de outra marca
X t = Idade do t–ésimo indivíduo
Pˆi = βˆ1 + βˆ 2 X
Limitações do MLP:
35
– a probabilidade estimada pode ser negativa ou maior que 1 (100%) para
determinados indivíduos (o que é logicamente impossível !);
– o modelo embute heterocedasticidade;
Para contornar o problema de P̂i poder ficar fora do intervalo [0,1] (ou [0%,100%]),
usa–se um modelo não–linear, como segue:
Yi = Pi + ε i
Pi = F ( β 1 + β 2 X )
eβ +β X
1 2
Logística Pi =
1 + eβ +β 1 2X
1
β1 +β 2 X 1 − z
Normal–padrão acumulada Pi = ∫ e 2
dz
−∞
2π
eβ +β X
1 2
dP i
β2 β +β X 2
= i efeito marginal da idade sobre a probabilidade de um
(1 + e 1
) dX i
2 i
Os modelos de escolha discreta também podem ser usados com várias variáveis
explicativas, inclusive outras variáveis dummy.
Os dados que você acabou de importar se referem a escolhas (Y) de indivíduos entre ir
de ônibus (Y=0) ou de carro (Y=1) para o trabalho. A variável independente (X) é a
diferença de tempo entre ir de ônibus (TO) ou de carro (TA), para cada indivíduo.
Para o modelo MLP, simplesmente estime uma equação como aprendido anteriormente.
Nomeie a equação estimada como EQMLP.
Para o modelo probit, proceda da mesma forma. Nomeie a equação estimada como
EQPROBIT.
Note que a Tela de Resultados (STAT) nos dois últimos casos, modelos logit e probit, é
um pouco diferente da tela correspondente no caso do método LS. Abaixo,
reproduzimos essa tela para o modelo probit.
37
Note que o cabeçalho e a tabela relativa a equação estimada são semelhantes ao caso
LS. Mas várias outras estatísticas não estão disponíveis aqui. Abaixo da equação
estimada, o EViews informa o valor máximo da log verossimilhança (log likelihood), o
número de observaçãoes de Y que são 1 (Obs with Dep=1) e 0 (Obs with Dep=0),
respectivamente, e mostra outra tabela com as médias da constante e das variáveis
independentes, considerando três situações: com todas as observações (Mean all), com
as observações para as quais Y=1 (Mean D=1) e com as observações para as quais Y=0
(Mean D=0).
Há uma ampla literatura sobre modelos de regressão não lineares. Por exemplo, o
modelo de consumo agregado com termo de interação que vimos antes é um exemplo de
modelo não linear. Os modelos logit e probit também. Veremos aqui, além desses,
apenas dois tipos de modelos não lineares que são muito usados na prática: o modelo
log– log (às vezes chamado também de modelo log–linear) e o modelo log– lin.
ln Ct = β 1´ + β 2´ ln Yt + ε ´t
38
Este modelo têm basicamente duas utilidades. A primeira é que, em pequenas amostras,
a distribuição de probabilidade para a variável dependente e o termo aleatório ε ´t fica
melhor aproximada por uma variável normalmente distribuída. Perceba que C só
assume valores positivos, ao passo que lnC pode assumir valore positivos ou negativos.
Variação Percentual de C
β ´2 =
Variação Percentual de Y
Este caso também tem a vantagem de permitir uma melhor aproximação da distribuição
da variável dependente pela distribuição normal, o que é útil sobretudo em pequenas
amostras. O coeficiente da renda Y, neste caso, é dado por:
Variação Percentual de C
β ´´2 =
Variação Absoluta de Y
EXERCÍCIOS
6.1 Abra o arquivo CNPEACE.WF1. Repare que há na JAT uma equação que você
estimou anteriormente, usando CO em função de uma constante e de Y. Realize os
seguintes procedimentos:
a) Abra essa equação e observe novamente os resultados, inclusive o gráfico dos
resíduos e da série ajustada;
b) Defina uma variável dummy (chame–a de DG) que assume o valor 1 nos anos da 2ª
Guerra Mundial (1941–1945) e 0 nos demais anos.
c) Em uma nova janela, estime outra equação adicionando DG ao rol de variáveis
independentes. Analise os resultados, inclusive o gráfico dos resíduos e da série
ajustada. Salve essa equação (com nome diferente do usado na primeira), e compare
com a primeira;
39
d) Em uma nova janela, estime outra equação adicionando também um termo de
interação DG*Y ao rol de variáveis independentes. Analise os resultados, inclusive o
gráfico dos resíduos e da série ajustada. Salve essa equação (com nome diferente do
usado na primeira), e compare com as anteriores;
Salve o arquivo CNPEACE.WF1.
6.2 No Excel, abra o arquivo METRICS.XLS, que contem, para 50 economistas, dados
de: salários anuais em dólares (SALARY), sexo (variável dummy SEX = 1 para
masculino, 0 para feminino), um índice de performance no trabalho (GPA) e um
indicador de formação especializada em econometria (variável dummy METRICS = 1
para especializado, 0 para não especializado), e tempo de experiência (TEXP). Crie no
EViews um arquivo de trabalho não datado para 50 observações, e importe os dados.
Salve o arquivo com o nome de METRICS.WF1. Realize os seguintes procedimentos:
a) Estime uma equação por MQO considerando SALARY como dependente, uma
constante, e as demais variáveis como independentes. Analise os resultados,
inclusive o gráfico dos resíduos e da série ajustada. Salve essa equação;
b) Estime nova equação em nova janela, incluindo dois termos de interação:
SEX*TEXP e METRICS*TEXP. Salve a equação. Verifique se o modelo melhorou
(use alguns testes de diagnóstico, sobretudo para heterocedasticidade);
c) Com base na última equação, responda:
– qual a equação empírica para determinação do salário dos homens?
– qual a equação empírica para determinação dos salários das mulheres?
– qual a equação empírica para determinação dos salários dos homens sem
especialização em econometria?
– qual a equação empírica para determinação dos salários das mulheres com
especialização em econometria?
Analise os resultados, inclusive o gráfico dos resíduos e da série ajustada. Salve essa
equação (com nome diferente do usado na primeira), e compare com a primeira;
6.4 (Adaptado do exercício 9.9 de Hill, Griffits e Judge (1999)) O arquivo VOTE.XLS
contém dados reais sobre o resultado da votação, por estado, da eleição presidencial de
1976 nos Estados Unidos, disputada por Jimmy Carter (democrata) e Gerald Ford
(Republicano). As variáveis nesse arquivo são:
DEM = número de votos recebidos pelo candidato democrata;
REP = número de votos recebido pelo candidato republicano;
INC = renda média em 1975;
SCHOO = número mediano de anos de escolaridade completados por pessoas
com 18 anos de idade ou mais;
URBAN = porcentagem da população que vive em área urbana;
REGION = 1 para nordeste,; 2 para sudeste; 3 para centro–oeste e centro–sul; 4
para regiões do oeste e das montanhas;
a) Crie um arquivo de trabalho apropriado no EViews com nome de VOTE.WF1 e
importe os dados. Defina uma variável dependente Y que tome o valor 1 se o voto
popular foi a favor do candidato democrata e 0 se a favor do candidato republicano.
b) Estime um modelo probit para o resultado da votação, utilizando as variáveis
explicativas INC, SCHOO e REGION. Discuta o modelo ajustado.
c) Calcule o efeito sobre a probabilidade de o estado votar no candidato democrata, em
face de um aumento de 1.000 dólares na renda média para o caso dos Estados da
Louisiana, Oklahoma e Califórnia. (Use o Excel).
7 Previsão
Lembre–se que você achou o intercepto 21,3 e o coeficiente 0,79 (de X) usando uma
amostra de N dados para Y e X. Vejamos, então, alguns conceitos.
Refere–se ao uso da equação empírica para prever Y dado um valor de X que não estava
na amostra que você usou para achar a equação empírica.
O subscrito “o” indica que o valor de X é out of sample (fora da amostra), logo é um
valor de X diferente de Xi , para i = 1,...,N.
|–––––––––––––––––––––|––––––––––––––––––––|
Yˆ0 I Yˆo ŶoS
Note que a figura acima representa genericamente a previsão intervalar fora da amostra.
Logo, ela também pode representar previsão intervalar futura. Basta substituirmos o
subscrito o por t + l .
2. Você tem que se assegurar de que a equação default da JAT seja a equação que
você quer usar para prever (basta estar dentro de uma janela de equação).
Para incluir novos valores das variáveis explicativas no EViews você tem de usar a
opção de expandir o Intervalo Disponível (Range).
Os valores fora da amostra para as variáveis explicativas são incluídos nas próprias
séries. Para isso, depois de expandir o Range como acima, proceda da seguinte forma:
1. Clique duas vezes na JAT sobre a opção Sample, que corresponde ao Intervalo em
Uso.
43
2. Defina–o como igual ao novo Range.
3. Entre os novos dados pelo teclado (use Show, listando todas as variáveis
explicativas, e a opção Edit +/–).
Agora, você pode usar diferentes equações para fazer as previsões. A partir da JAT,
estime uma nova equação ou clique duas vezes sobre uma equação que você salvou
anteriormente. Isso faz com que a equação default da JAT se torne, automaticamente,
aquela cuja Janela de Equação está aberta diante de você (para checar qual é a equação
default a qualquer momento, verfique no canto superior direito da JAT, onde está
escrito default equation).
Exercícios
7.1 Abra o arquivo PROPAG.WF1. Note que os dados amostrais se referem ao ano de
2001 (se encerram na última semana do ano). No período compreendido pelas quatro
primeiras semanas de 2002, considere os seguintes cenários alternativos para a política
de preço e gastos de propaganda a ser adotada pela cadeia de lanchonetes:
Cenário 1
Usando a equação que você estimou no capítulo 4 (EQ1), faça previsões condicionais
das receitas de vendas para ambos esses cenários. Para tanto, siga os seguintes passos.
Qual dos dois cenários se mostra mais interessante para incrementar as receitas de
vendas? Considere os impactos dos custos com propaganda em sua resposta.
Nota: lembre–se que você pode salvar os resultados numéricos numa planilha em
formato Excel, o que irá lhe permitir usar os dados previstos em relatórios.
7.2 Repita os itens a) e b) do exercício 6.3 usando agora apenas o EViews (isto é, sem
usar o Excel).
46
CONSTRUÇÃO DE MODELOS
R: Infelizmente, não
Fase de Preparação
2. Dados
indicadores para as variáveis (p. ex.: INPC para Inflação, Consumo de energia elétrica
para Nível de Atividade, etc.)
→ Estatísticas descritivas
4. MODELOS TENTATIVOS
→ Estimar o modelo (com todas as variáveis na 1a vez)
47
→ Checar coeficientes (sinal e magnitude)
6. MODELO FINAL
→ Repetir o ciclo acima até encontrar um modelo, com:
7. ALTERNATIVAS
→ Se o modelo não ficar satisfatório, tente procedimentos alternativos, como:
Método 1: faça previsões com o modelo e procure “sentir” se não está havendo
algum tipo de exagero nos números gerados. Se estiver, reconduza a análise.
Caso contrário, pode começar a usar o modelo.
“Nem sempre o modelo que ficou melhor estimado é o que irá gerar as melhores
previsões”
Bibliografia
Hill, C., Griffiths, W. e Judge, G. (1999). Econometria. São Paulo: Ed. Saraiva.