Slides - Dados em Painel

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 23

30/03/2021

Dados em Painel
Aula 01
Prof. Diego Carneiro | dr.carn@gmail.com
https://sites.google.com/view/drcarn/

Definição

Dados organizados na forma de Painel


combinam duas dimensões:
espacial e temporal.

1
30/03/2021

Fonte: MAIA, A. G. Análise de Dados em Painel. Universidade Estadual de Campinas

Introdução aos Dados em Painel


Ex.: (Dados em Painel) Expectativa de Vida nos 27 Estados Brasileiros de 2001
a 2010;
• Cada estado possui a informação em 10 períodos diferentes;
• Em cada ano tem-se 27 observações;
• A base completa possui 270 observações.

2
30/03/2021

Introdução aos Dados em Painel


Ex.: (Dados Empilhados) Informações do empregados da Construção Civil de
2016 a 2020;
• Cada ano é realizado uma amostragem da população de trabalhadores da Construção;
• Em cada amostragem trabalhadores diferentes são entrevistados;
• Não é possível acompanhar um trabalhador ao longo do tempo (logitudinalidade)

Introdução aos Dados em Painel


Vantagens do uso de dados em painel:
• Melhores propriedades estatísticas: dados mais informativos, maior
variabilidade, menos colinearidade entre variáveis, mais graus de liberdade e
mais eficiência;
• Mais adequados para examinar a dinâmica da mudança;
• Permitem levar em consideração a heterogeneidade das unidades crossection,
assim como choques comuns em cada período.

3
30/03/2021

Fonte: MAIA, A. G. Análise de Dados em Painel. Universidade Estadual de Campinas

Introdução aos Dados em Painel


Atrito em Dados em Painel
• Consiste no “desaparecimento” de unidades crossection ao longo do tempo;
• Se o fenômeno é de natureza não aleatória, os resultados da estimação
podem ser afetados;

Ex.: Evasão escolar de alunos com baixo desempenho.

4
30/03/2021

Dados em Painel
Aula 02
Prof. Diego Carneiro | dr.carn@gmail.com
https://sites.google.com/view/drcarn/

Modelos Empilhados (Pooled)


• Consiste no uso de amostras aleatórias repetidas em intervalos regulares.
• Ex.: Pesquisa Nacional por Amostra de Domicílios – PNAD
• Permite elevar o tamanho da amostra, gerando estimadores MQO mais
eficientes. Note que:
𝜎2 𝜎2
𝑉𝑎𝑟 𝛽𝑀𝑄𝑂 = = 𝑛 2
𝑆𝑄𝑇 𝑖=1 𝑦𝑖 − 𝑦
Obs.: se a relação entre X e Y for constante no tempo. ≥0

5
30/03/2021

Fonte: MAIA, A. G. Análise de Dados em Painel. Universidade Estadual de Campinas

Modelos Empilhados (Pooled)


Definindo a Forma Funcional
• Modelo Irrestrito – IR (com mudança temporal dos parâmetros):
𝐾 𝑇−1 𝐾×(𝑇−1)
𝑌𝑖𝑡 = 𝛼 + 𝛽𝑖 𝑋𝑗𝑖𝑡 + 𝛿𝑡 𝑡 + 𝜃𝑗 (𝑡 × 𝑋𝑖𝑡 ) + 𝜀𝑖𝑡
𝑗=1 𝑡=1 𝑗=1

• Modelo Restrito - R (sem mudança temporal dos parâmetros):


𝐾
𝑌𝑖𝑡 = 𝛼 + 𝛽𝑖 𝑋𝑗𝑖𝑡 + 𝜀𝑖𝑡
𝑗=1

6
30/03/2021

Modelos Empilhados (Pooled)


Definindo a Forma Funcional
• Teste de Chow:
Número de parâmetros excluídos

(𝑆𝑄𝑅𝑅 − 𝑆𝑄𝑅𝐼𝑅 )/[ 𝐾 + 1 × 𝑇 − 1 ]


∼𝐹 𝐾+1 × 𝑇−1 ,(𝑛−𝐾−1)
𝑆𝑄𝑅𝐼𝑅 /(𝑛 − 𝐾 − 1)

Hipótese nula (H0): 𝛿𝑡 = 𝜃𝑗 = 0 para todo t e j; → Intercepto e parâmetros constantes.


Hipótese alternativa (H1): pelo menos um 𝛿𝑡 ≠ 0 𝑜𝑢 𝜃𝑗 ≠ 0.

Modelos Empilhados (Pooled)


Definindo a Forma Funcional
• E se H0 for rejeitada?
• Repete o teste considerando modelo restrito 𝑌𝑖𝑡 = 𝛼 + 𝐾
𝑗=1 𝛽𝑖 𝑋𝑗𝑖𝑡 + 𝑇−1
𝑡=1 𝛿𝑡 𝑡 + 𝜀𝑖𝑡
• A nova hipótese nula será: 𝜃𝑗 = 0 para todo t e j;
• H0 rejeitada → Intercepto variável e parâmetros constantes;
• H0 não rejeitadas → Intercepto e parâmetros variáveis.

7
30/03/2021

Modelos Empilhados (Pooled)


Caso mais simples:

H0: Y = 𝛼 + 𝛽𝑋 + 𝜀
Teste de Chow H0: 𝑌 = 𝛼 + 𝛽𝑋 + 𝛿𝑡 + 𝜀
H1: 𝑌 = 𝛼 + 𝛽𝑋 + 𝛿𝑡 + 𝜃(𝑡 × 𝑋) + 𝜀
H1: 𝑌 = 𝛼 + 𝛽𝑋 + 𝛿𝑡 + 𝜃(𝑡 × 𝑋) + 𝜀

Modelos Empilhados (Pooled)


Exemplo:
• Objetivo: Estimar a taxa de retorno da educação.
• Dados: PNAD 2001 a 2006 (Dados empilhados)
• Variáveis:
• Var. dependente: log do salário real por hora;
• esc: escolaridade, em anos de estudo;
• exp: experiência, em anos;
• branca: dummy, 1 se o trabalhador se declarou branco, 0 c.c.;

SULIANO, Daniel Cirilo; SIQUEIRA, Marcelo Lettieri. Retornos da educação no Brasil em âmbito regional
considerando um ambiente de menor desigualdade. Economia Aplicada, v. 16, n. 1, p. 137-165, 2012.

8
30/03/2021

Dados em Painel
Aula 03
Prof. Diego Carneiro | dr.carn@gmail.com
https://sites.google.com/view/drcarn/

Diferenças em Diferenças
• Método muito utilizado na avaliação de políticas;
• Experimento Natural: quando um evento exógeno (política) afeta o
comportamento de algumas unidades crossection (tratados) e outras não
(controles);
• Requer informações de pelo menos dois períodos: antes e depois da política.
• Obs.: Não requer logitudinalidade (grupos diferentes em cada coorte).

9
30/03/2021

Diferenças em Diferenças
Intuição: A distância entre tratados e controles, após a política, se alterou com
relação a antes da política?

Efeito da Política

Antes Depois

Diferenças em Diferenças
Seja a seguinte equação, onde 𝑌 é um indicador de resultado;

𝑌 = 𝛼 + 𝛽1 𝑇 + 𝛽2 𝐷 + 𝛿𝑇 × 𝐷 + 𝜀
Em que:
0: 𝑎𝑛𝑡𝑒𝑠 𝑑𝑎 𝑝𝑜𝑙í𝑡𝑖𝑐𝑎 0: 𝑔𝑟𝑢𝑝𝑜 𝑑𝑒 𝑐𝑜𝑛𝑡𝑟𝑜𝑙𝑒
𝑇= ; 𝐷= .
1: 𝑎𝑝ó𝑠 𝑎 𝑝𝑜𝑙í𝑡𝑖𝑐𝑎 1: 𝑔𝑟𝑢𝑝𝑜 𝑑𝑒 𝑡𝑟𝑎𝑡𝑎𝑚𝑒𝑛𝑡𝑜

10
30/03/2021

Diferenças em Diferenças
• Tratados Antes: 𝑌 = 𝛼 + 𝛽1 0 + 𝛽2 1 + 𝛿0 × 1 + 𝜀 = 𝛼 + 𝛽2 + 𝜀
• Controles Antes: 𝑌 = 𝛼 + 𝛽1 0 + 𝛽2 0 + 𝛿0 × 0 + 𝜀 = 𝛼 + 𝜀
Diferença Antes: 𝛼 + 𝛽2 + 𝜀 − 𝛼 + 𝜀 = 𝛽2
• Tratados Depois: 𝑌 = 𝛼 + 𝛽1 1 + 𝛽2 1 + 𝛿1 × 1 + 𝜀 = 𝛼 + 𝛽1 + 𝛽2 + 𝛿 + 𝜀
• Controles Depois: 𝑌 = 𝛼 + 𝛽1 1 + 𝛽2 0 + 𝛿1 × 0 + 𝜀 = 𝛼 + 𝛽1 + 𝜀
Diferença Depois: 𝛼 + 𝛽1 + 𝛽2 + 𝛿 + 𝜀 − 𝛼 + 𝛽1 + 𝜀 = 𝛽2 + 𝛿

DIFERENÇA DAS DIFERENÇAS: 𝛽2 + 𝛿 − 𝛽2 = 𝛿

Diferenças em Diferenças
• O estimador de diferenças em diferenças, 𝛿, fornece o Efeito Médio do
Tratamento (EMT);
• Podem ser incluídas covariadas na equação, permitindo controlar diferenças
sistemáticas entre as populações, nos dois períodos;

11
30/03/2021

Diferenças em Diferenças
Exemplo:
• Objetivo: Avaliar efeito de uma política educacional.
• Dados: SAEB 2007 e 2009
• Grupo de Tratamento: Municípios Cearenses
• Grupo de Controle: Municípios Baianos.

PETTERINI, Francis Carlo; IRFFI, Guilherme Diniz. Evaluating the impact of a change in the ICMS tax law in the state of Ceará in municipal
education and health indicators. EconomiA, v. 14, n. 3-4, p. 171-184, 2013.

Dados em Painel
Aula 04
Prof. Diego Carneiro | dr.carn@gmail.com
https://sites.google.com/view/drcarn/

12
30/03/2021

Modelo de efeitos não observados


Seja o Modelo Básico de Efeitos não Observados (MENO):
Heterogeneidade
𝑌𝑖𝑡 = 𝑋𝑖𝑡 𝛽 + 𝑣𝑖𝑡 , com vit = 𝑐𝑖 + 𝑢𝑖𝑡 individual não observada
e fixa no tempo.

Quando observa-se as mesmas unidades em vários períodos de tempo, 𝑐𝑖 captura características


individuais imutaveis no tempo, como, por exemplo:
• Habilidades cognitivas, motivação, educação familiar precoce, etc.
• Qualidade e estrutura gerencial, para o caso de empresas.

Modelo de efeitos não observados


• A natureza de 𝑐𝑖 pode trazer problemas a estimação:
Modelo em diferenças
Parâmetro a Variável omitida: Efeitos MQO com dummies (LSDV)
ser estimado 𝐶𝑜𝑣 𝑋, 𝑐 ≠ 0 Fixos
Whithin Transformation
𝒄𝒊
Auto correlação
do termo de erro: MQG
Variável Aleatória Efeitos
𝐶𝑜𝑣 𝑋, 𝑐 = 0 Aleatórios
𝐸 𝑐 =0 Max. Verossimilhança
𝑉𝑎𝑟 𝑐 = 𝜎𝑐2

13
30/03/2021

Dados em Painel
Aula 05
Prof. Diego Carneiro | dr.carn@gmail.com
https://sites.google.com/view/drcarn/

Modelo de Efeitos Fixos


Seja o Modelo Básico de Efeitos não Observados (MENO):

𝑌𝑖𝑡 = 𝑋𝑖𝑡 𝛽 + 𝑣𝑖𝑡 , com vit = 𝑐𝑖 + 𝑢𝑖𝑡

Onde 𝑐𝑖 é uma variável não observada, com 𝐶𝑜𝑣 𝑋, 𝑐 ≠ 0 e 𝐸 𝑢 𝑋 = 0.


• A estimação desconsiderando a presença de 𝑐𝑖 produz estimadores
enviesados, uma vez que 𝐸(𝑣|𝑋) ≠ 0;

14
30/03/2021

Modelo de Efeitos Fixos


Modelo em Diferenças:
Note que: 𝑌𝑖𝑡 = 𝑋𝑖𝑡 𝛽 + 𝑐𝑖 + 𝑢𝑖𝑡
Tomando a Primeira Diferença, o modelo pode ser reescrito como:
∆𝑌𝑖𝑡 = 𝑌𝑖𝑡 − 𝑌𝑖𝑡−1
= 𝑋𝑖𝑡 𝛽 + 𝑐𝑖 + 𝑢𝑖𝑡 − 𝑋𝑖𝑡−1 𝛽 + 𝑐𝑖 + 𝑢𝑖𝑡−1
= 𝑋𝑖𝑡 − 𝑋𝑖𝑡−1 𝛽 + 𝑢𝑖𝑡 − 𝑢𝑖𝑡−1
⇒ ∆𝑌𝑖𝑡 = ∆𝑋𝑖𝑡 𝛽 + ∆𝑢𝑖𝑡 → 𝐸 𝑢 𝑋 = 0 ⇒ 𝐸 ∆𝑢 ∆𝑋 = 0
𝜷𝑴𝑸𝑶 não será enviesado!

Modelo de Efeitos Fixos


Mínimos Quadrados Ordinários com Dummies (LSDV):
Intuição: Tirar 𝑐𝑖 do erro, expressando-o por meio de dummies individuais;
Equivale a calcular um
𝑌𝑖𝑡 = 𝑋𝑖𝑡 𝛽 + 𝐷𝑖 𝛼 + 𝑢𝑖𝑡 intercepto para cada
unidade.
Em que 𝐷𝑖 é um conjunto de I variáveis dummies que assumem valor 1 para cada
unidade i e 0 para os demais I-1 indivíduos.
• Hipótese: a heterogeneidade individual pode ser capturada por mudanças no
intercepto. → 𝐸 𝑢 𝑋, 𝐷 = 0 ⇒ 𝜷𝑴𝑸𝑶 não será enviesado!

15
30/03/2021

Modelo de Efeitos Fixos


Within Transformation
Seja: 𝑌𝑖𝑡 = 𝑋𝑖𝑡 𝛽 + 𝑐𝑖 + 𝑢𝑖𝑡
Pode-se calcular a média temporal dessa equação como:

𝑌𝑖 = 𝑋𝑖 𝛽 + 𝑐𝑖 + 𝑢𝑖

𝑇 𝑦 𝑇 𝑥 𝑇 𝑢
𝑡=1 𝑖𝑡 𝑡=1 𝑖𝑡 𝑡=1 𝑖𝑡
Em que 𝑌𝑖 = ; 𝑋𝑖 = e 𝑢𝑖 = .
𝑇 𝑇 𝑇

Modelo de Efeitos Fixos


Within Transformation
Logo, tomando a diferença das duas equações:

𝑌𝑖𝑡 − 𝑌𝑖 = 𝑋𝑖𝑡 − 𝑋𝑖 𝛽 + 𝑐𝑖 − 𝑐𝑖 + 𝑢𝑖𝑡 − 𝑢𝑖

A equação transformada então será dada por:


𝐸 𝑢𝑖𝑡 𝑋𝑖𝑡 = 𝐸 𝑢𝑖𝑡 − 𝑢𝑖 𝑋𝑖𝑡
= 𝐸 𝑢𝑖𝑡 𝑋𝑖𝑡 -𝐸 𝑢𝑖 𝑋𝑖𝑡 = 0
𝑌𝑖𝑡 = 𝑋𝑖𝑡 𝛽 + 𝑢𝑖𝑡 ⇒ 𝜷𝑴𝑸𝑶 não será enviesado!

16
30/03/2021

Modelo de Efeitos Fixos


Pooled Data
Para nível mais agregado
Quando utilizar cada modelo? (regra de bolso)
Modelo em Whithin
Característica (comparado ao Pooled) LSDV
Diferenças Transformation
Perde-se a coorte do primeiro período Sim Não Não
Exige hipótese mais forte Não Sim Não
Pode induzir autocorrelação do termo de erro Sim Não Não
Perde-se N graus de liberdade Sim Sim Sim
Não permite covariadas constantes no tempo Sim Sim Sim

N pequeno N grande
T grande T pequeno
Erros fortemente Erros esféricos: 𝛀 = 𝝈𝟐 𝑰
auto correlacionados Possível Endogeneidade

Dados em Painel
Aula 06
Prof. Diego Carneiro | dr.carn@gmail.com
https://sites.google.com/view/drcarn/

17
30/03/2021

Modelo de Efeitos Aleatórios


Seja o Modelo Básico de Efeitos não Observados (MENO):

𝑌𝑖𝑡 = 𝑋𝑖𝑡 𝛽 + 𝑣𝑖𝑡 , com vit = 𝑐𝑖 + 𝑢𝑖𝑡

Onde 𝑐𝑖 é uma variável aleatória, com:


𝐸 𝑐|𝑋 = 𝐸 𝑐 = 0;
𝑉𝑎𝑟 𝑐 = 𝜎𝑐2 e
E 𝑢 𝑋, 𝑐 = 0

Modelo de Efeitos Aleatórios


Logo:
𝐸 vit = 𝐸 𝑐𝑖 + 𝑢𝑖𝑡 = 0

𝑉𝑎𝑟 vit = 𝑉𝑎𝑟 𝑐𝑖 + 𝑢𝑖𝑡 = 𝜎𝑢2 + 𝜎𝑐2

𝐶𝑜𝑣 vit , vi𝑠 = 𝐸 𝑣𝑖𝑡 𝑣𝑖𝑠 = 𝐸 𝑐𝑖 + 𝑢𝑖𝑡 𝑐𝑖 + 𝑢𝑖𝑠 = 𝐸 𝑐𝑖2 = 𝜎𝑐2


≠𝟎
⇒ Erros auto
correlacionados!

18
30/03/2021

Modelo de Efeitos Aleatórios


Solução: Realizar a seguinte transformação (MQG):

𝑌𝑖𝑡∗ = 𝑋𝑖𝑡
∗ ∗
𝛽 + 𝑣𝑖𝑡

∗ 𝜎𝑢2
Onde 𝑧𝑖𝑡 = 𝑧𝑖𝑡 − 𝜃𝑖 𝑧𝑖 ,com 𝑧 = 𝑌, 𝑋, 𝑣 e 𝜃𝑖 = 1 − .
𝑇𝜎𝑐2 +𝜎𝑢2

• Essa transformação faz com que 𝑣𝑖𝑡∗ respeite as hipóteses de MQO.


• Problema: 𝜎𝑐2 e 𝜎𝑢2 são desconhecidos.

Modelo de Efeitos Aleatórios


Calculando o estimador de Efeitos Aleatórios na prática (MQG Factível):
• Passo 1: Obtenha 𝑣𝑖𝑡 , a partir dos resíduos do modelo básico, estimado por
MQO, desconsiderando a presença de 𝑐𝑖 ;

• Passo 2: Calcule 𝜎𝑣2 , 𝜎𝑐2 e 𝜎𝑢2 :

19
30/03/2021

Modelo de Efeitos Aleatórios


• Passo 3: Calcule o estimador de 𝜃𝑖 :
𝜎𝑢2
𝜃𝑖 = 1 −
𝑇𝜎𝑐2 + 𝜎𝑢2

• Passo 4: Realiza a transformação 𝜃𝑖 , e estima MQG:


𝑌𝑖𝑡∗ = 𝑋𝑖𝑡
∗ ∗
𝛽 + 𝑣𝑖𝑡

Com 𝑧𝑖𝑡 = 𝑧𝑖𝑡 − 𝜃𝑖 𝑧𝑖 , 𝑧 = 𝑌, 𝑋, 𝑣.

Dados em Painel
Aula 07
Prof. Diego Carneiro | dr.carn@gmail.com
https://sites.google.com/view/drcarn/

20
30/03/2021

Selecionando o melhor modelo


MQO ou Efeitos Fixos? (Teste de Chow)
• Modelo Restrito: Yit = 𝛼 + 𝑋𝑖𝑡 𝛽 + 𝑢𝑖𝑡 (Intercepto único – MQO/Pooled)
• Modelo Irrestrito: 𝑌𝑖𝑡 = 𝑋𝑖𝑡 𝛽 + 𝐷𝑖 𝛼 + 𝑢𝑖𝑡 (Intercepto variável - LSDV)

• Estatística:

• Hipótese nula: 𝑑𝑖 = 0 ∀ 𝑖 ∈ 1, 𝐼 ⇒ Modelo MQO/Pooled é mais


adequado que o de efeitos fixos.

Selecionando o melhor modelo


MQO ou Efeitos Aleatórios? (Teste de Breush-Pagan, 1980)
• Hipótese nula: 𝜎𝑐2 = 0 ⇒ Modelo MQO/Pooled é mais adequado que o de
efeitos aleatórios.
• Estatística (Chi-2):

Onde 𝑒𝑖𝑡 é o obtido a partir resíduo da regressão de MQO.

21
30/03/2021

Selecionando o melhor modelo


Efeitos Fixos (EF) ou Efeitos Aleatórios (EA)? (Teste de Hausman, 1978)
• Intuição: se houver auto correlação do termo de erro EA e EF são consistentes,
mas EF é ineficiente. Caso contrário, EF será consistente, mas EA não.
• Assim, se houver auto correlação, os estimadores dos dois modelos não deveriam
diferir em média, apesar dos de EF possuírem maior variância;
• O teste de Hausman então compara os estimadores das duas regressões, se forem
iguais, há presença de autocorrelação e EA deve ser preferido. Caso contrário, EF
deve ser utilizado.

Selecionando o melhor modelo


Efeitos Fixos (EF) ou Efeitos Aleatórios (EA)? (Teste de Hausman, 1978)
• Hipótese nula: presença de auto correlação → EA mais eficiente.
• Hipótese alternativa: ausência de auto correlação → EA inconsistente.

• Estatística (chi-2):

22
30/03/2021

Selecionando o melhor modelo


Resumindo...
H0: MQO MQO é o mais adequado!
Teste de Chow
H1: EF

H0: MQO
Breush-Pagan
H0: EA → EA é o mais adequado!
H1: EA Hausman
H1: EF → EF é o mais adequado!

23

Você também pode gostar