Sumario Livro INTRODUÇÃO A ECONOMETRIA
Sumario Livro INTRODUÇÃO A ECONOMETRIA
Sumario Livro INTRODUÇÃO A ECONOMETRIA
Captulo 1
A Natureza da Econometria e dos Dados Econmicos 1.1 1.2 1.3 1.4 O que Econometria? Passos na Anlise Econmica Emprica A Estrutura dos Dados Econmicos A Causalidade e a Noo de Ceteris Paribus na Anlise Economtrica
1 1 2 5 12
PARTE 1 ANLISE DE REGRESSO COM DADOS DE CORTE TRANSVERSAL Captulo 2 O Modelo de Regresso Simples 2.1 2.2 2.3 2.4 2.5 2.6 Captulo 3 Definio do Modelo de Regresso Simples Derivao das Estimativas de Mnimos Quadrados Ordinrios Mecnica do Mtodo MQO Unidades de Medida e Forma Funcional Valores Esperados e Varincias dos Estimadores de MQO Regresso atravs da Origem
Anlise de Regresso Mltipla: Estimao 3.1 3.2 3.3 3.4 3.5 Funcionabilidade da Regresso Mltipla Mecnica e Interpretao dos Mnimos Quadrados Ordinrios O Valor Esperado dos Estimadores de MQO A Varincia dos Estimadores de MQO Eficincia de MQO: O Teorema de Gauss-Markov
Captulo 4
Anlise de Regresso Mltipla: Inferncia 4.1 4.2 4.3 4.4 4.5 4.6 Distribuies Amostrais dos Estimadores de MQO Testes de Hipteses sobre um nico Parmetro Populacional: O Teste t Intervalos de Confiana Testes de Hipteses sobre uma Combinao Linear dos Parmetros Testes de Restries Lineares Mltiplas: O Teste F Descrio dos Resultados da Regresso
xv
xvi
Captulo 5
Anlise de Regresso Mltipla: MQO Assimpttico 5.1 5.2 5.3 Consistncia Normalidade Assimpttica e Inferncia de Amostras Grandes Eficincia Assimpttica de MQO
158 158 163 169 174 174 179 189 195 195 199 201 203 204 207 207 209 216 221 230 243 243 244 251 256 266 272 272 278 285 292
Captulo 6
Anlise de Regresso Mltipla: Problemas Adicionais 6.1 6.2 6.3 6.4 Efeitos da Dimenso dos Dados nas Estatsticas MQO Um pouco mais sobre a Forma Funcional Um pouco mais sobre o Grau de Ajuste e a Seleo de Regressores Previso e Anlise de Resduos Intervalos de Confiana de Previses Anlise de Resduos Previso de y quando a Varivel Dependente log(y) Resumo Problemas
Captulo 7
Anlise de Regresso Mltipla com Informaes Qualitativas: Variveis Binrias (ou Dummy) 7.1 7.2 7.3 7.4 7.5 7.6 A Descrio das Informaes Qualitativas Uma nica Varivel Dummy Independente O Uso de Variveis Dummy para Categorias Mltiplas Interaes Envolvendo Variveis Dummy Uma Varivel Dependente Binria: O Modelo de Probabilidade Linear Um Pouco mais sobre Anlise e Avaliao de Polticas e
Captulo 8
Heteroscedasticidade 8.1 8.2 8.3 8.4 8.5 Conseqncias da Heteroscedasticidade para o Mtodo MQO Inferncia Robusta em Relao Heteroscedasticidade aps e Estimao MQO O Teste da Existncia de Heteroscedasticidade Estimao de Mnimos Quadrados Ponderados O Modelo de Probabilidade Linear Revisitado
Captulo 9
Problemas Adicionais de Especificao e de Dados 9.1 9.2 9.3 9.4 M Especificao da Forma Funcional Utilizando Variveis Proxy para Variveis Explicativas No-Observadas Propriedades do Mtodo MQO quando h Erros de Medida Ausncia de Dados, Amostras No-Aleatrias e Observaes Extremas
PARTE 2 ANLISE DE REGRESSO COM DADOS DE SRIES TEMPORAIS Captulo 10 O Bsico da Anlise de Regresso com Dados de Sries Temporais 10.1 A Natureza dos Dados das Sries Temporais
Wooldridge
Sumrio
xvii
Exemplos de Modelos de Regresso de Sries Temporais Propriedades de Amostra Finita do MQO sob as Hipteses Clssicas Forma Funcional, Variveis Dummy e Nmeros-ndices Tendncia e Sazonalidade
307 311 320 327 340 340 345 352 360 363
Captulo 11 Questes Adicionais quanto ao Uso do MQO com Dados de Sries Temporais 11.1 11.2 11.3 11.4 11.5 Sries Temporais Estacionrias e Fracamente Dependentes Propriedades Assimptticas do MQO O Uso de Sries Temporais Altamente Persistentes na Anlise de Regresso Modelos Dinamicamente Completos e a Ausncia de Correlao Serial A Hiptese de Homoscedasticidade para Modelos de Sries Temporais
Captulo 12 Correlao Serial e Heteroscedasticidade em Regresses de Sries Temporais 12.1 12.2 12.3 12.4 12.5 12.6 As Propriedades do MQO com Erros Serialmente Correlacionados O Teste da Correlao Serial A Correo da Correlao Serial com Regressores Estritamente Exgenos Diferenciao e Correlao Serial Inferncia Robusta em Relao Correlao Serial aps o MQO Heteroscedasticidade em Regresses de Sries Temporais
PARTE 3 TPICOS AVANADOS Captulo 13 O Agrupamento de Cortes Transversais ao Longo do Tempo. Mtodos Simples de Dados de Painel O Agrupamento Independente de Cortes Transversais ao Longo do Tempo Anlise de Decises Governamentais com Agrupamentos Anlise de Dados de Painel de dois Perodos Anlise de Decises Governamentais com Dados de Painel de dois Perodos 13.5 A Diferenciao com mais de dois Perodos de Tempo Captulo 14 Mtodos Avanados de Dados de Painel 13.1 13.2 13.3 13.4
401
14.1 Estimao de Efeitos Fixos 433 14.2 Modelos de Efeitos Aleatrios 441 14.3 A Aplicao de Mtodos de Dados de Painel a outras Estruturas de Dados 445 Captulo 15 Estimao de Variveis Instrumentais e Mnimos Quadrados de dois Estgios 15.1 15.2 15.3 15.4 15.5 Motivao: Variveis Omitidas em um Modelo de Regresso Simples Estimao de VI do Modelo de Regresso Mltipla Mnimos Quadrados de dois Estgios Solues de VI de Problemas de Erros nas Variveis O Teste de Endogeneidade e o Teste de Restries 453 454 464 468 473
xviii
Sobreidentificadoras 15.6 O MQ2E com Heteroscedasticidade 15.7 A Aplicao do MQ2E a Equaes de Sries Temporais 15.8 A Aplicao do MQ2E em Cortes Transversais Agrupados e em Dados de Painel Captulo 16 Modelos de Equaes Simultneas 16.1 16.2 16.3 16.4 16.5 16.6 A Natureza dos Modelos de Equaes Simultneas Vis de Simultaneidade no MQO A Identificao e a Estimao de uma Equao Estrutural Sistemas com mais de duas Equaes Modelos de Equaes Simultneas com Sries Temporais Modelos de Equaes Simultneas com Dados de Painel
475 478 479 481 491 491 496 498 505 506 510 517 518 529 537 542 549 559 560 567 572 574 581 602 602 604 605 609 613 629 637 645 667
Captulo 17 Modelos com Variveis Dependentes Limitadas e Correes da Seleo Amostral 17.1 17.2 17.3 17.4 17.5 Modelos Logit e Probit de Resposta Binria O Modelo Tobit para Resposta de Soluo de Canto O Modelo de Regresso de Poisson Modelos de Regresso Censurada e Truncada Correes da Seleo Amostral
Captulo 18 Tpicos Avanados sobre Sries Temporais 18.1 18.2 18.3 18.4 18.5 Modelos de Defasagem Distribuda Infinita O Teste de Razes Unitrias Regresso Espria Co-Integrao e Modelos de Correo de Erro Previso
Captulo 19 A Montagem de um Projeto na Prtica 19.1 19.2 19.3 19.4 19.5 A Formulao de uma Pergunta A Reviso da Literatura A Compilao dos Dados A Anlise Economtrica A Redao de um Ensaio Emprico
1
A Natureza da Econometria e dos Dados Econmicos
Captulo 1 examina o escopo da econometria e prope questes gerais que resultam da aplicao dos mtodos economtricos. A Seo 1.3 examina os tipos de dados usados em negcios, economia e outras cincias sociais. A Seo 1.4 faz uma discusso intuitiva das dificuldades associadas com a inferncia da causalidade nas cincias sociais.
mentos da economia. (Dados no-experimentais so, s vezes, chamados de dados observacionais para enfatizar o fato de que o pesquisador um coletor passivo de dados.) Dados experimentais so freqentemente coletados em ambientes de laboratrio nas cincias naturais, mas so muito mais difceis de serem obtidos nas cincias sociais. Embora seja possvel realizar alguns experimentos sociais, geralmente impossvel conduzir os tipos de experimentos controlados necessrios para avaliar questes econmicas, seja porque eles so proibitivamente dispendiosos ou moralmente repugnantes. Na Seo 1.4, apresentaremos alguns exemplos especficos das diferenas entre dados experimentais e no-experimentais. Naturalmente, os econometristas, sempre que possvel, valem-se dos estatsticos matemticos. O mtodo de anlise da regresso mltipla o esteio de ambos os campos, mas seu foco e sua interpretao podem diferir de forma marcante. Alm disso, os economistas criaram novas tcnicas para lidar com as complexidades dos dados econmicos e para testar as previses das teorias econmicas.
Wooldridge
Captulo 1
Em um artigo inspirador, o prmio Nobel Gary Becker postulou um arcabouo da maximizao da utilidade para descrever a participao de um indivduo no crime. Certos crimes tm recompensas econmicas evidentes, mas muitos comportamentos criminosos tm custos. O custo de oportunidade do crime impede o criminoso de participar de outras atividades, como um emprego legal. Alm disso, h custos associados com a possibilidade de ser capturado, e, se condenado, h os custos associados com o cumprimento de pena. Da perspectiva de Becker, a deciso de empreender a atividade ilegal uma deciso de alocao de recursos com os benefcios e custos das atividades concorrentes sendo considerados. Sob hipteses gerais podemos derivar uma equao que descreve a quantidade de tempo gasto na atividade criminosa como uma funo de vrios fatores. Podemos representar tal funo como y = f (x1, x2, x3, x4, x5, x6, x7), em que y = horas gastas em atividades criminosas, x1 = salrio por hora ocupada em atividade criminosa, x2 = salrio-hora em emprego legal, x3 = renda de outras atividades que no o crime ou um emprego legal, x4 = probabilidade de ser capturado, x5 = probabilidade de ser condenado se capturado, x6 = sentena esperada se condenado, e x7 = idade. Outros fatores geralmente afetam a deciso de uma pessoa de participar de atividades criminosas, mas a lista acima representa o que poderia resultar de uma anlise econmica formal. Como comum na teoria econmica, no fomos especficos sobre a funo f ( ) em (1.1). Essa funo depende de uma funo utilidade subjacente, raramente conhecida. Entretanto, podemos usar a teoria econmica ou a introspeco para prever o efeito que cada varivel teria sobre as atividades criminosas. Essa a base para uma anlise economtrica das atividades criminosas individuais. (1.1)
A modelagem econmica formal , s vezes, o ponto de partida da anlise emprica, porm mais comum usar a teoria econmica de modo menos formal, ou mesmo contar inteiramente com a intuio. Voc pode concordar quanto aos determinantes do comportamento criminoso que aparecem na equao (1.1) serem razoavelmente baseados no senso comum; poderamos chegar a tal equao diretamente, sem partir da maximizao da utilidade. Essa viso tem algum mrito, embora haja casos em que derivaes formais geram idias que a intuio pode ignorar. Vejamos o exemplo de uma equao que foi derivada por meio de um raciocnio um tanto informal.
Considere o problema proposto no incio da Seo 1.1. Um economista especializado em trabalho gostaria de examinar os efeitos do treinamento sobre a produtividade do trabalhador. Nesse caso, h pouca necessidade de teoria econmica formal. Um entendimento econmico bsico suficiente para perceber que fatores tais como educao, experincia e treinamento influenciam a produtividade do trabalhador. Os economistas tambm esto bem cientes de que os trabalhadores so pagos de acordo com sua produtividade. Esse raciocnio simples leva a um modelo tal que salrioh = f(educ, exper, treina), (1.2)
em que salrioh o salrio-hora, educ representa os anos de educao formal, exper refere-se aos anos de experincia no mercado de trabalho e treina corresponde a semanas ocupadas em treinamento. Novamente, outros fatores geralmente influenciam a taxa de salrio, mas (1.2) captura a essncia do problema.
Aps especificarmos um modelo econmico, precisamos voltar ao que chamamos de modelo economtrico. Visto que trabalharemos com modelos economtricos ao longo deste texto, importante saber como eles se relacionam com os modelos econmicos. Considere a equao (1.1) como exemplo. A forma da funo f( ) deve ser especificada antes de podermos empreender uma anlise economtrica. Uma segunda questo concernente a (1.1) como lidar com variveis que no podem ser razoavelmente observadas. Por exemplo, considere o salrio que uma pessoa pode receber na atividade criminosa. Em princpio, tal quantidade bem-definida, mas poderia ser difcil, se no impossvel, observar o salrio para um determinado indivduo. Mesmo variveis como a probabilidade de ser preso no podem ser obtidas de modo realista para um determinado indivduo, mas pelo menos podemos observar estatsticas de deteno relevantes e derivar uma varivel que se aproxime da probabilidade de priso. Muitos outros fatores que no podemos listar, nem mesmo observar, afetam o comportamento criminoso, mas devemos de algum modo consider-los. As ambigidades inerentes ao modelo econmico do crime so resolvidas ao se especificar um modelo economtrico particular, tal como: crime = 0 + 1salriom + 2 outrenda + 3 freqpris + 4 freqcond + 5 sentmed + 6 idade + u,
(1.3)
em que crime alguma medida de freqncia da atividade criminosa, salriom o salrio que poderia ser ganho em um emprego legal, outrenda a renda de outras fontes (ativos, herana etc.), freqpris a freqncia de prises por infraes anteriores (para aproximar a probabilidade de deteno), freqcond a freqncia de condenaes e sentmed a durao mdia da sentena aps as condenaes. A escolha dessas variveis determinada pela teoria econmica e por consideraes sobre os dados. O termo u contm fatores no observados, tais como o salrio da atividade criminosa, o carter moral, a formao da famlia e erros na mensurao de coisas como a atividade criminosa e a probabilidade de de teno. Podemos adicionar variveis de formao da famlia ao modelo, tais como o nmero de irmos, a educao dos pais, e assim por diante, mas nunca poderemos eliminar u inteiramente. De fato, lidar com esse termo de erro ou termo de disturbncia , talvez, o componente mais importante de qualquer anlise economtrica.
Wooldridge
Captulo 1
As constantes 0, 1, ..., 6 so os parmetros do modelo economtrico e descrevem as direes e as influncias da relao entre crime e os fatores usados para determinar crime no modelo. Um modelo economtrico completo para o Exemplo 1.2 poderia ser salrio = 0 + 1edu + 2 exper + 3 treina + u, (1.4)
em que o termo u contm fatores tais como aptido inata, qualidade da educao, formao da famlia e uma mirade de outros fatores que podem influenciar o salrio de uma pessoa. Se estivermos especialmente interessados nos efeitos do treinamento de trabalho, ento 3 o parmetro de interesse. Na maioria dos casos, a anlise economtrica comea pela especificao de um modelo economtrico, sem considerao de detalhes da criao do modelo. Geralmente seguimos essa abordagem, pois, em grande parte, a derivao cuidadosa de algo como o modelo econmico do crime toma muito tempo e pode nos levar para algumas reas especializadas e freqentemente difceis da teoria econmica. O raciocnio econmico desempenhar um papel importante em nossos exemplos, e incorporaremos toda teoria econmica subjacente na especificao do modelo economtrico. No modelo econmico do exemplo do crime, comearamos com um modelo economtrico tal como (1.3) e usaramos o raciocnio econmico e o senso comum como guias para escolher as variveis. Embora essa abordagem perca algumas das profuses da anlise econmica, ela comum e efetivamente aplicada por pesquisadores cautelosos. Visto que um modelo economtrico tal como (1.3) ou (1.4) tenha sido especificado, vrias hipteses de interesse podem ser formuladas em termos dos parmetros desconhecidos. Por exemplo, na equao (1.3), poderamos levantar a hiptese de que salriom, o salrio que poderia ser ganho no emprego legal, no tem efeito sobre o comportamento criminoso. No contexto desse modelo economtrico especfico, a hiptese equivalente a 1 = 0. Uma anlise emprica, por definio, requer dados. Aps os dados sobre as variveis relevantes terem sido coletados, os mtodos economtricos so usados para estimar os parmetros do modelo economtrico e para, formalmente, testar as hipteses de interesse. Em alguns casos, o modelo economtrico usado para fazer previses com a finalidade de testar de uma teoria a estudo do impacto de uma poltica. Como a coleta de dados muito importante em trabalhos empricos, a Seo 1.3 descrever os tipos de dados com os quais, provavelmente, nos defrontaremos.
lise pura de dados de corte transversal, ignoraramos, na coleta de dados, quaisquer diferenas de tempo no importantes. Se o conjunto de famlias fosse pesquisado durante diferentes semanas do mesmo ano, ainda veramos isso como um conjunto de dados de corte transversal. Uma importante caracterstica dos dados de corte transversal que no podemos, freqentemente, assumir que eles foram obtidos por amostragem aleatria da populao subjacente. Por exemplo, se obtemos informaes sobre salrios, educao, experincia e outras caractersticas ao extrair aleatoriamente 500 pessoas de uma populao de trabalhadores, teremos uma amostra aleatria da populao de todas as pessoas que trabalham. A amostragem aleatria, matria aprendida nos cursos introdutrios de estatstica, simplifica a anlise de dados de corte transversal. Uma reviso sobre amostragem aleatria aparece no Apndice C disponvel em www.thomsonlearning.com.br, na pgina deste livro. Algumas vezes, a amostragem aleatria no apropriada como uma hiptese para analisar dados de corte transversal. Por exemplo, suponha que estejamos interessados em estudar fatores que influenciam na acumulao de riqueza das famlias. Podemos estudar uma amostra aleatria de famlias, mas algumas talvez se recusem a relatar suas riquezas. Se, por exemplo, for menos provvel que famlias mais ricas revelem sua riqueza, a amostra resultante sobre a riqueza no uma amostra aleatria extrada da populao de todas as famlias. Este um exemplo de um problema de seleo amostral, um tpico avanado que discutiremos no Captulo 17. Outra violao da amostragem aleatria ocorre quando construmos uma amostra a partir de unidades grandes relacionadas populao, em especial a unidades geogrficas. O problema provvel em tais casos que a populao no suficientemente grande para se supor, de maneira razovel, que as observaes so extraes independentes. Por exemplo, se queremos explicar novas atividades de negcios entre estados, como funo de taxas de salrios, preos de energia, alquotas de impostos, servios prestados, qualidade da fora de trabalho e outras caractersticas estaduais, improvvel que as atividades de negcios em um Estado prximo a outro sejam independentes. Isso revela que os mtodos economtricos que discutimos funcionam, de fato, em tais situaes, mas algumas vezes necessitam ser refinados. Na maioria dos casos, ignoraremos as complexidades que surgem ao analisar tais situaes e trataremos esses problemas dentro do arcabouo da amostragem aleatria, mesmo quando no for tecnicamente correto faz-lo. Os dados de corte transversal so amplamente usados em economia e em outras cincias sociais. Em economia, a anlise de dados de corte transversal est intimamente alinhada com campos da microeconomia aplicada, tais como economia do trabalho, finanas pblicas estaduais e locais, organizao industrial, economia urbana, demografia e economia da sade. Dados sobre indivduos, famlias, empresas e cidades em um determinado ponto do tempo so importantes para testar hipteses microeconmicas e avaliar polticas governamentais. Para a anlise economtrica, os dados de corte transversal usados podem ser representados e armazenados em computadores. A Tabela 1.1 contm, de forma abreviada, um conjunto de dados de corte transversal para o ano de 1976, de 526 trabalhadores. (Esse um subconjunto dos dados do arquivo WAGE1.RAW*.) As variveis incluem salrioh (salrio por hora), educ (anos de educao formal), exper (anos de experincia no mercado de trabalho), feminino (indicador de gnero) e casado (estado civil). Estas duas ltimas variveis so binrias (zero-um) por natureza, e servem para indicar caractersticas qualitativas dos indivduos. (A pessoa do sexo feminino ou no; a pessoa casada ou no.) Falaremos mais sobre variveis binrias no Captulo 7 e seguintes.
* NRT:
Todos os arquivos mencionados no texto tm a designao *.RAW, mas no banco de dados os arquivos so planilhas em Excel (.XLS), e os arquivos de trabalho de programas economtricos (como *.WF1, do Eviews). Portanto, a designao *.RAW genrica e d um significado de *.matriaprima para aplicaes e exerccios.
Wooldridge
Captulo 1
Tabela 1.1 Conjunto de Dados de Corte Transversal sobre Salrios e outras Caractersticas Individuais
educ 11 12 11 8 12 . . . 16 14
exper 2 22 2 44 7 . . . 5 5
feminino 1 1 0 0 0 . . . 0 1
casado 0 1 0 1 1 . . . 1 0
A varivel nobsi na Tabela 1.1 o nmero da observao atribudo a cada indivduo na amostra. Diferentemente das outras variveis, ela no uma caracterstica do indivduo. Todos os programas economtricos e estatsticos atribuem a cada unidade um nmero de observao. A intuio deveria dizer-lhe que, para dados como os da Tabela 1.1, no importa qual pessoa classificada como observao um, qual pessoa designada pela observao dois, e assim por diante. O fato de que a ordenao dos dados no importa para a anlise economtrica uma caracterstica fundamental dos conjuntos de dados de corte transversal obtidos a partir da amostragem aleatria. s vezes, variveis diferentes correspondem a diferentes perodos nos conjuntos de dados de corte transversal. Por exemplo, a fim de determinar os efeitos de polticas governamentais sobre o crescimento econmico de longo prazo, os economistas tm estudado a relao entre crescimento do PIB per capita real ao longo de certo perodo (digamos, 1960 a 1985) e variveis determinadas, em parte, pela poltica governamental em 1960 (consumo do governo como percentagem do PIB e taxas de ensino mdio de adultos). Tais conjuntos de dados poderiam ser representados como na Tabela 1.2, a qual constitui parte do conjunto de dados usados no estudo de De Long e Summers (1991) sobre as taxas de crescimento entre pases. A varivel cpibpcr representa o crescimento mdio do PIB per capita real ao longo do perodo 1960 a 1985. O fato de que consgov60 (consumo do governo como percentagem do PIB) e second60 (percentagem da populao adulta com ensino mdio) correspondem ao ano de 1960, enquanto cpibpcr o crescimento mdio ao longo do perodo 1960 a 1985, no leva a quaisquer problemas especiais ao tratar essas informaes como um conjunto de dados de corte transversal. As observaes esto ordenadas alfabeticamente por pas, mas essa ordenao no afeta em nada qualquer anlise subseqente.
Tabela 1.2 Conjunto de Dados sobre Taxas de Crescimento Econmico e Caractersticas de Pases
nobsp 1 2 3 4 . . . 61
consgov60 9 16 13 18 . . . 17
second60 32 50 69 12 . . . 6
Wooldridge
Captulo 1
Muitas sries de tempo econmicas, sejam semanais, mensais ou trimestrais, exibem um forte padro sazonal, o qual pode ser um importante fator na anlise de sries de tempo. Por exemplo, dados mensais sobre o incio da construo de moradias se diferenciam entre os meses simplesmente devido a mudanas das condies climticas. Aprenderemos como trabalhar com sries de tempo no Captulo 10. A Tabela 1.3 contm um conjunto de dados de sries de tempo, obtido de um artigo de CastilloFreeman e Freeman (1992), sobre os efeitos do salrio mnimo em Porto Rico. O ano mais antigo no conjunto de dados a primeira observao, e o ano mais recente disponvel a ltima observao. Quando os mtodos economtricos so utilizados para analisar dados de sries de tempo, os dados devem ser armazenados em ordem cronolgica.
Tabela 1.3 Salrio Mnimo, Desemprego e Dados Relacionados para Porto Rico
nobsa 1 2 3 . . . 37 38
A varivel minmed se refere ao salrio mnimo mdio no ano, cobmed a taxa de cobertura mdia (o percentual de trabalhadores cobertos pela lei de salrio mnimo), desemp a taxa de desemprego e pnb o produto nacional bruto. Usaremos esses dados mais adiante em uma anlise de sries de tempo do efeito do salrio mnimo sobre o emprego.
10
imppro 42 36 38 . . . 41 16 20 15 . . . 16
qtdorm 3 3 4 . . . 4 2 4 3 . . . 2
As observaes 1 a 250 correspondem s residncias vendidas em 1993, e as observaes 251 a 520 correspondem s 270 residncias vendidas em 1995. Embora a ordem na qual armazenamos os dados no se revele crucial, no se esquea de que o ano de cada observao , geralmente, muito importante. Essa a razo de introduzirmos ano como uma varivel separada. A anlise de um corte transversal agrupado muito parecida com a de um corte transversal padro, exceto pelo fato de que precisamos, freqentemente, considerar diferenas peridicas das variveis ao longo do tempo. De fato, alm de aumentar o tamanho da amostra, a caracterstica de uma anlise de corte transversal agrupada , freqentemente, ver como uma relao fundamental mudou ao longo do tempo.
Wooldridge
Captulo 1
11
A caracterstica essencial dos dados de painel que os distingue dos dados de corte transversal agrupado o fato de que as mesmas unidades do corte transversal (indivduos, empresas ou municpios nos exemplos anteriores) so acompanhadas ao longo de um determinado perodo. Os dados na Tabela 1.4 no so considerados um conjunto de dados de painel porque as residncias vendidas so provavelmente diferentes em 1993 e 1995; se houver quaisquer repeties, o nmero provavelmente bem pequeno para ser significante. Em contraste, a Tabela 1.5 contm um conjunto de dados de painel de dois anos sobre o crime e as estatsticas relacionadas para 150 cidades nos Estados Unidos. H vrias caractersticas interessantes na Tabela 1.5. Primeiro, a cada cidade foi dado um nmero de 1 a 150. Qual cidade decidimos chamar de cidade 1, cidade 2, e assim por diante, irrelevante. Assim como em um corte transversal puro, a ordenao no corte transversal de um conjunto de dados de painel no importante. Poderamos usar o nome da cidade em lugar de um nmero, mas freqentemente til ter ambos.
Tabela 1.5 Conjunto de Dados de Painel sobre Estatsticas de Crime nas Cidades para Dois Anos
homicds 5 8 2 1 . . . 10 6 25 32
Um segundo ponto que os dois anos dos dados para a cidade 1 preenchem as duas primeiras linhas ou observaes. As observaes 3 e 4 correspondem cidade 2, e assim por diante. Como cada uma das 150 cidades tem duas linhas de dados, qualquer pacote economtrico ver isso como 300 observaes. Esse conjunto de dados pode ser tratado como um corte transversal agrupado, em que as mesmas cidades aparecem em cada ano. Porm, como veremos nos Captulos 13 e 14, podemos tambm usar a estrutura de painel para responder a questes que no podem ser respondidas simplesmente vendo isso como um corte transversal agrupado. Ao organizar as observaes na Tabela 1.5, colocamos os dois anos dos dados de cada cidade um ao lado do outro, com o primeiro ano antecedendo o segundo em todos os casos. Apenas por questes prticas, esse o modo preferido de se ordenar conjuntos de dados de painel. Essa organizao contrasta com o modo pelo qual os cortes transversais agrupados so armazenados na Tabela 1.4. Em resu-
12
mo, a razo para ordenar os dados de painel como na Tabela 1.5 que precisaremos fazer transformaes dos dados para cada cidade nos dois anos. Como os dados de painel requerem a repetio das mesmas unidades ao longo do tempo, os conjuntos de dados de painel, especialmente aqueles sobre indivduos, famlias e empresas, so mais difceis de se obter que os cortes transversais agrupados. No surpreendentemente, observar as mesmas unidades ao longo do tempo traz vrias vantagens sobre os dados de corte transversal ou mesmo sobre os de dados de cortes transversais agrupados. O benefcio que salientaremos neste livro que ter mltiplas observaes sobre as mesmas unidades nos permite controlar certas caractersticas no observveis dos indivduos, firmas etc. Como veremos, o uso de mais de uma observao pode facilitar a inferncia causal em situaes em que inferir causalidade seria muito difcil se somente um nico corte transversal estivesse disponvel. Uma segunda vantagem dos dados de painel que eles, freqentemente, nos permitem estudar a importncia das defasagens do comportamento ou o resultado de tomar decises. Essa informao pode ser importante, visto que se pode esperar o impacto em muitas polticas pblicas somente aps algum tempo. A maior parte dos livros para cursos de nvel superior no contm uma discusso de mtodos economtricos para dados de painel. Entretanto, os economistas agora reconhecem que algumas questes so difceis, se no impossveis, de serem respondidas satisfatoriamente sem dados de painel. Como voc ver, podemos fazer considerveis progressos com anlises simples de dados de painel, um mtodo que no muito mais difcil do que trabalhar com um conjunto de dados de corte transversal padro.