Stata Economistas 2018 - Puno
Stata Economistas 2018 - Puno
Stata Economistas 2018 - Puno
2018
El Instituto Peruano de Economía (IPE) es una asociación civil de derecho privado y sin fines de
lucro, cuyo objetivo es realizar estudios destinados a promover el desarrollo equilibrado y sostenido
de la economía de mercado.
Los estudios del IPE tienen por finalidad divulgar los trabajos realizados por profesionales de esta
institución o encargados por ella a terceros, con el objetivo de aportar al debate de tópicos
económicos relevantes y presentar nuevos enfoques en el análisis de los mismos. La difusión de los
estudios sólo intenta facilitar el intercambio de ideas y dar a conocer investigaciones, con carácter
preliminar, para su discusión y comentarios.
La publicación de los estudios no está sujeta a la aprobación previa de los miembros del Directorio
del IPE. Tanto el contenido de los estudios como también los análisis y conclusiones que se
desprenden de ellos, son de exclusiva responsabilidad de su(s) autor(es) y no reflejan
necesariamente la opinión del Instituto ni de los miembros de su Directorio.
Los estudios y documentos de trabajo del IPE pueden obtenerse en versión PDF en forma gratuita en la dirección
electrónica: http://www.ipe .org.pe /publicaciones. Existe la posibilidad de solicitar una copia impresa a través del fax: (51
1) 421-2793 o del correo electrónico: ipe@ipe.org.pe
IPE Working Papers can be downloaded in PDF format free of charge from: http://www.ipe.org.pe.
Printed versions can be ordered individually either by fax: (51 1) 421-2793 or by e-mail: ipe@ipe.org.pe
Introducción
La presente guía es un esfuerzo del IPE, con el auspicio de la Fundación M. J. Bustamante
de la Fuente, para contribuir a la educación de los estudiantes universitarios del Perú.
Mediante la realización de los Foros de Desarrollo Económico Regionales se intenta
involucrar a los alumnos en la problemática local y nacional. Para lograr dicho cometido,
resulta relevante que los alumnos de economía tengan la capacidad de aprovechar las
principales fuentes de información provistas por el Instituto Nacional de Estadística (INEI),
como las Encuestas Nacionales de Hogares (ENAHO).
El manejo de la ENAHO 2017 permitirá replicar los principales indicadores como pobreza,
gastos e ingresos de los hogares, cobertura de la telefonía móvil, cobertura eléctrica,
material predominante en pisos, paredes y techos, etc. Usando los comandos descritos
líneas abajo y explorando en el manual de ayuda de STATA, los alumnos pueden
incrementar sus conocimientos de manera autodidacta.
Índice
Introducción .................................................................................................................................... 2
A. Conceptos básicos ................................................................................................................. 4
I. Entorno de STATA ................................................................................................................. 5
II. Abrir/Guardar una base de datos .................................................................................... 6
III. Cambiar el directorio de trabajo ...................................................................................... 6
IV. Repaso rápido de comandos más usados...................................................................... 6
B. Aplicación: ENAHO 2017 ........................................................................................................ 8
I. Base de datos ...................................................................................................................... 9
II. Ejercicios básicos ................................................................................................................. 9
III. Ejercicios intermedios ........................................................................................................ 11
A. Conceptos
básicos
I. Entorno de STATA
El despliegue inicial de STATA presenta cuatro ventanas:
Do-file editor. Ventana que permite editar textos y ejecutar una lista
de comandos.
STATA browser. Permite visualizar los datos sin editarlos.
STATA editor. Permite navegar y modificar los datos como si fuese una
hoja Excel.
Variables manager. Ventana que permite administrar integralmente
cada una de las variables.
Nota: Si alguna de las ventanas básicas está cerrada, se puede acceder a ellas a través
de la opción Windows del menú principal.
1 Existen dos tipos de archivos más: nombre.log y nombre.ado. Para mayor información revisar el Help de STATA.
3. Expresiones condicionales
if
Permite hacer instrucciones condicionales, ya sea con
comandos descriptivos o de creación.
by
Permite realizar instrucciones basándose en la clasificación
de una variable en específico.
B. Aplicación:
ENAHO 2017
I. Base de datos
En la ventana de comandos escribir:
clear all
En mi caso es el siguiente:
cd "C:\Users\Rodrigo\Desktop\STATAparaEconomistas"
Al comparar con los datos ofrecidos por el INEI notaremos que los resultados no son
correctos, ¿qué ocurre? Hasta ahora solo habíamos estado trabajando con la base
de datos y sus variables; no obstante, al iniciar los cálculos sobre ellas debemos
recordar que se trata de una encuesta y no de la población. Por lo tanto, debemos
considerar los factores de expansión o ponderadores que hacen que los indicadores
muestrales se conviertan en representaciones poblacionales.
lookfor factor
codebook factor07
Tabulamos la pobreza para cada una de las regiones con el factor de expansión para
personas facpob07:
table region [iw=facpob07] if p204==1 & (p203!= 8 | p203!=9), c(mean pobreza2) row
tab region pobreza2 if p204==1 & (p203!= 8 | p203!=9) [iw=facpob07], row
Usamos el comando xtile para calcular los quintiles. Primero revisamos qué nos dice
STATA:
help xtile
¿Podemos usar esta variable para calcular los quintiles por regiones?
table region quintiles_ing [iw=factor07], c(mean inghog2d)
No, porque esta variable ha sido calculada usando como población objetivo al Perú.
Demostrémoslo:
table region quintiles_ing [iw=factor07], row
La tabla nos muestra las observaciones según quintiles. Solo en la última fila, referida
al Total o Perú, los montos son estadísticamente semejantes. Por lo tanto, para
calcular los quintiles de ingresos según regiones, estos se deben calcular
independientemente. Para el caso de Puno:
xtile quintiles_ing_Puno = inghog2d [w=factor07] if region==21,nq(5)
table quintiles_ing_Puno [iw=factor07], c(mean inghog2d)
Antes de seguir guardemos nuestra base datos. Recordar ponerle otro nombre, para
no modificar la base de datos inicial:
save sumaria-2017-2.dta,replace
3 Hasta ahora hemos estado trabajando con los módulos Sumaria y 200.
tab result
keep if result==1|result==2
El error se debe a que las variables que habíamos generado en los ejercicios
anteriores no se encuentran en esta base de datos. Al respecto, se pueden emplear
dos soluciones similares. Generar todas las variables calculadas previamente usando
los comandos descritos líneas arriba o combinar las bases de datos. En este caso
usaremos la primera alternativa; usaremos la segunda más adelante.
Como puede haber notado, al revisar las variables del módulo 100, el procedimiento
aplicado también puede servir para obtener la cobertura de teléfono, internet y tv
cable. Pista:
lookfor p114
12. Calcular la cobertura de electricidad de los hogares
En primer lugar, debemos encontrar la variable de interés:
lookfor electricidad
codebook p1121
tab p1121
gen elect=p1121
label variable elect "Electricidad"
label define elect 0 "No tiene” 1 “Alumbrado eléctrico”
label values elect elect
Generamos una variable más amigable usando la definición del INEI sobre acceso
a red pública de agua:
gen agua=.
replace agua=1 if p110<=3
replace agua=0 if p110>3
label variable agua "Acceso a red pública de agua"
label define agua 0 "No tiene” 1 "Tiene acceso a red pública"
label values agua agua
Notamos que las observaciones que solo están incluidas en la base de datos del
módulo 100 representan missing values. Para evitar posibles problemas, solo
guardamos las variables presentes en ambas bases de datos o, que es lo mismo,
aquellas incluidas en Sumaria.
keep if _merge==3
También podríamos haber usado las bases de datos que modificamos al trabajar los
cálculos previos:
use enaho01-2017-100-mod.dta, clear
sort conglome vivienda hogar
save enaho01-2017-100-mod.dta,replace
Con las variables “limpias”, obtenemos el ingreso anual total proveniente del trabajo.
Luego lo hacemos mensual e incluimos las etiquetas a las nuevas variables:
egen ingtrabw = rowtotal(i524a1 d529t i530a d536 i538a1 d540t i541a d543 d544t)
gen ingtra_n=ingtrabw/(12)
Además, debemos filtrar por las personas residentes de la muestra. Según la definición de
residencia del INEI, ésta requiere que sea miembro del hogar y que no se encuentre
ausente del mismo en los últimos 30 días o que no sea miembro del hogar pero se
encuentre presente en los últimos 30 días.
gen resident=1 if ((p204==1 & p205==2) | (p204==2 & p206==1))
El INEI, con el objetivo de eliminar los efectos que podrían introducir en los cálculos los
valores extremos, se eliminan los ingresos mensuales que superen los S/. 25,000.
keep if ocu==1 & ingtra_n>0 & ingtra_n<25000
_______________________________________________________________________________