5) Variáveis Binárias - Dummy
5) Variáveis Binárias - Dummy
5) Variáveis Binárias - Dummy
VARIVEIS BINRIAS
Obs.: os exerccios que indicam arquivos para serem resolvidos so do livro do Wooldridge.
Os arquivos necessrios esto na pasta Banco de dados Wooldridge, na rea Programao
em R.
A varivel dormir o total de minutos gastos por semana dormindo a noite, trabtot o total
de minutos semanais gastos trabalhando, educ e idade so medidas em anos e masculino
uma varivel dummy de gnero.
a) Supondo todos os outros fatores iguais, existe evidencia de que os homens durmam mais
que as mulheres? O quanto essa evidncia forte?
b) Existe uma relao de substituio estatisticamente significante entre trabalhar e dormir?
Qual a relao de substituio estimada?
c) Que outras regresses voc precisa executar para testar a hiptese nula de que, mantendo
fixos os outros fatores, a idade no tem efeito sobre dormir?
e
log() = 4,65 0,0052cigs +0,0110log(rendfam) + 0,017ordnas +0,034masculino
(0,38) (0,0010) (0,0085) (0,006) (0,011)
+0,045branco -0,0030educmae +0,0032educpai
(0,015) (0,0030) (0,0026)
n=1.191 ; R=0,0493
As variveis so definidas, mas adicionamos uma varivel dummy para o caso de a criana ser
do sexo masculino e uma varivel dummy que indica se a criana classificada como branca.
(
)= 4,59 +0,257log(vendas) +0,011roe +0,158financeira +0,181prodcons
(0,30) (0,032) (0,004) (0,089) (0,085)
-0,283servpub
(0,099)
n=209, R=0,357.
6. Nos dados sobre salrios dos jogadores de beisebol encontrados no arquivo MLB1.RAW, os
jogadores ocupam uma de seis posies: pribase, segbase, terbase, interbase, jardext ou
receptor. Para possibilitar diferenas salariais entre as posies, com determinados defensores
(jardext) como o grupo base, quais variveis dummy voc incluiria como variveis
independentes?
em que trein uma varivel binria igual unidade se um trabalhador participou do programa.
Pense no termo de erro u como contendo a aptido no observada do trabalhador. Se
trabalhadores menos aptos tiverem maior oportunidade de serem selecionados para o
programa, o que voc pode dizer sobre o provvel vis no estimador MQO de 1?
8. Suponha que voc colete dados de uma pesquisa sobre salrios, educao, experincia e
gnero. Alm disso, voc solicita informaes sobre o uso de maconha. A pergunta original :
em quantas ocasies distintas, no ms passado, voc fumou maconha?.
a) Escreva uma equao que permita a voc estimar os efeitos do uso de maconha sobre os
salrios com todos os outros fatores controlados. Voc deve ter condies de fazer
declaraes do tipo Estima-se que fumar maconha cinco vezes ou mais por ms altera os
salrios em x%.
b) Escreva um modelo que permita verificar se o uso de drogas tem efeitos diferentes sobre os
salrios dos homens e das mulheres. Como voc verificaria que no existem diferenas nos
efeitos do uso de drogas nos homens e nas mulheres?
c) Suponha que voc considere ser melhor avaliar o uso de maconha colocando as pessoas em
uma de quatro categorias: no usurio, usurio leve ( um a cinco vezes por ms), usurio
moderado (seis a dez vezes por ms), e usurio inveterado (mais de dez vezes por ms). Agora
escreva um modelo que permita estimar os efeitos da maconha sobre os salrios.
d) Usando o modelo da parte c), explique em detalhes como testar a hiptese nula de que o
uso de maconha no tem efeito sobre o salrio. Seja bastante especifico e inclua uma relao
cuidadoso de graus de liberdade.
e) Quais so alguns dos problemas potenciais de procurar inferncia causal utilizando os dados
da pesquisa que voc coletou?
9. Que d seja uma varivel dummy (binria) e que z seja uma varivel quantitativa. Considere o
modelo
y = 0 + 0d + 1z +1d.z + u ;
esta uma verso geral de um modelo com uma interao entre uma varivel dummy e uma
quantitativa.
a) Como isto no alterar nada importante, defina o erro com valor zero, u = 0. Ento, quando
d = 0, podemos escrever o relacionamento entre y e z como a funo f0(z)= 0 + 1z. Escreva a
mesma relao quando d=1, em que voc deve usar f1(z) no lado esquerdo para denotar a
funo linear de z.
b) Considerando 1 0 (o que significa que as duas no so paralelas), demonstre que o valor
de z* de tal forma que f0(z*)= f1(z*) seja z*=- 0/ 1 . Este o ponto no qual as duas linhas se
cruzam. Demonstre que z* ser positivo se, e somente se, 0 e 1 tiverem sinais opostos.
10. Para uma criana i morando em determinada regio de ensino, defina voucheri como uma
varivel dummy igual a um se a criana for selecionada para participar de um programa de
bolsas de estudos em uma escola, e defina scorei como a nota da criana em um exame
padronizado subsequente. Suponha que a varivel de participao, voucheri, seja
completamente aleatorizada para que ela seja independente tanto dos fatores observados
quanto dos no observados que possam afetar a nota do teste de avaliao.
a) Se voc executar uma regresso simples de scorei sobre voucheri usando uma amostra
aleatria de tamanho n, o estimador MQO produzir um estimador no viesado do efeito do
programa de bolsas de estudos?
b) Suponha que voc possa coletar informaes adicionais de perfis familiares tais como renda
familiar, estrutura familiar (por exemplo, se a criana mora com os dois pais), e nvel de
escolaridade dos pais. Voc precisar controlar esses fatores para obter um estimador no
viesado dos efeitos do programa de bolsas de estudos? Explique.
c) Por que voc precisar incluir as variveis de perfis familiares na regresso? Existe uma
situao em que voc no incluiria as variveis de perfis familiares?
11. Qual o efeito da raa sobre a probabilidade de recusa de uma hipoteca, mantendo
constante a razo prestao-renda? Para quantificar esse efeito, estimamos uma regresso
probit tendo razo P/R e negro como regressores.
( = 1| , )= (-2,26 +2,74 razo P/R + 0,71negro)
(0,16) (0,44) (0,083)
Utilize esse modelo para responder s seguintes questes:
a) Um requerente da hipoteca negro possui uma razp P/R de 0,35. Qual a probabilidade de
que seu pedido seja rejeitado?
b) Suponha que o requerente reduziu sua razo para 0,30. Que efeito isso teria sobre sua
probabilidade de ter uma hipoteca recusada?
c) Repita as partes a) e b) para um requerente branco.
d) O efeito marginal da razo P/R sobre a probabilidade de recusa da hipoteca depende da
raa? Explique.
SOLUES
1. No, pois no ficaria claro quando partido seria um ou zero. Um nome melhor seria algo
como Dem, que seria um para os candidatos Democratas, e zero, para os Republicanos. Ou
Rep, que seria um para os Republicanos, e zero, para os Democratas.
6. Com jardtext como o grupo base, incluiramos as variveis dummy pribase, segbase, terbase,
interbase e receptor.