Stata Economistas 2018 - Puno

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 19

Foro de Desarrollo Económico Regional Puno

2018

STATA para Economistas:


Guía básica

Puno, mayo del 2018


Stata para Economistas: Guía básica

El Instituto Peruano de Economía (IPE) es una asociación civil de derecho privado y sin fines de
lucro, cuyo objetivo es realizar estudios destinados a promover el desarrollo equilibrado y sostenido
de la economía de mercado.

Los estudios del IPE tienen por finalidad divulgar los trabajos realizados por profesionales de esta
institución o encargados por ella a terceros, con el objetivo de aportar al debate de tópicos
económicos relevantes y presentar nuevos enfoques en el análisis de los mismos. La difusión de los
estudios sólo intenta facilitar el intercambio de ideas y dar a conocer investigaciones, con carácter
preliminar, para su discusión y comentarios.

La publicación de los estudios no está sujeta a la aprobación previa de los miembros del Directorio
del IPE. Tanto el contenido de los estudios como también los análisis y conclusiones que se
desprenden de ellos, son de exclusiva responsabilidad de su(s) autor(es) y no reflejan
necesariamente la opinión del Instituto ni de los miembros de su Directorio.

STATA para Economistas: Guía básica

Mayo del 2018

Instituto Peruano de Economía

Instituto Peruano de Economía © 2018


Amador Merino Reyna 460, Oficina 201
San Isidro, Lima 27, Perú
Teléfonos: (511) 442-0168, 442-0286
Fax: (511) 421-7393
Email: ipe@ipe.org.pe

Los estudios y documentos de trabajo del IPE pueden obtenerse en versión PDF en forma gratuita en la dirección
electrónica: http://www.ipe .org.pe /publicaciones. Existe la posibilidad de solicitar una copia impresa a través del fax: (51
1) 421-2793 o del correo electrónico: ipe@ipe.org.pe

IPE Working Papers can be downloaded in PDF format free of charge from: http://www.ipe.org.pe.
Printed versions can be ordered individually either by fax: (51 1) 421-2793 or by e-mail: ipe@ipe.org.pe

Foro de Desarrollo Económico Regional Puno 2018 1


Stata para Economistas: Guía básica

Introducción
La presente guía es un esfuerzo del IPE, con el auspicio de la Fundación M. J. Bustamante
de la Fuente, para contribuir a la educación de los estudiantes universitarios del Perú.
Mediante la realización de los Foros de Desarrollo Económico Regionales se intenta
involucrar a los alumnos en la problemática local y nacional. Para lograr dicho cometido,
resulta relevante que los alumnos de economía tengan la capacidad de aprovechar las
principales fuentes de información provistas por el Instituto Nacional de Estadística (INEI),
como las Encuestas Nacionales de Hogares (ENAHO).

De manera sencilla, se presenta el entorno del software estadístico y econométrico STATA


12. Asimismo, se muestra el funcionamiento de los principales botones de la interfaz que
permitirán una mayor interacción al usar las bases de datos. Además, se incluyen
aplicaciones prácticas para reforzar el aprendizaje a nivel de investigador. La base de
datos empleada es la ENAHO 2017.

El manejo de la ENAHO 2017 permitirá replicar los principales indicadores como pobreza,
gastos e ingresos de los hogares, cobertura de la telefonía móvil, cobertura eléctrica,
material predominante en pisos, paredes y techos, etc. Usando los comandos descritos
líneas abajo y explorando en el manual de ayuda de STATA, los alumnos pueden
incrementar sus conocimientos de manera autodidacta.

Finalmente, para lograr un correcto entendimiento de la presente guía se recomienda


revisar en paralelo el do-file anexo STATA_para_economistas_2017.do. Todas las consultas
o dudas pueden ser realizadas a los correos reyzaguirre@ipe.org.pe o portiz@ipe.org.pe.

Foro de Desarrollo Económico Regional Puno 2018 2


Stata para Economistas: Guía básica

Índice

Introducción .................................................................................................................................... 2
A. Conceptos básicos ................................................................................................................. 4
I. Entorno de STATA ................................................................................................................. 5
II. Abrir/Guardar una base de datos .................................................................................... 6
III. Cambiar el directorio de trabajo ...................................................................................... 6
IV. Repaso rápido de comandos más usados...................................................................... 6
B. Aplicación: ENAHO 2017 ........................................................................................................ 8
I. Base de datos ...................................................................................................................... 9
II. Ejercicios básicos ................................................................................................................. 9
III. Ejercicios intermedios ........................................................................................................ 11

Foro de Desarrollo Económico Regional Puno 2018 3


Stata para Economistas: Guía básica

A. Conceptos
básicos

Foro de Desarrollo Económico Regional Puno 2018 4


Stata para Economistas: Guía básica

I. Entorno de STATA
El despliegue inicial de STATA presenta cuatro ventanas:

Review Comandos utilizados recientemente durante la sesión.


Command Se emplea para crear líneas de comandos que deseamos que STATA
lleve a cabo
Variables Detalla a las variables disponibles en la base de datos.
Results Permite visualizar los resultados (outputs) de los cálculos que hemos
pedido que realice STATA.
Properties Brinda información sobre características de una variable en particular.
Además, indica el número de variables y cantidad de observaciones
de la base de datos.

Los siguientes botones abren nuevas ventanas:

Do-file editor. Ventana que permite editar textos y ejecutar una lista
de comandos.
STATA browser. Permite visualizar los datos sin editarlos.
STATA editor. Permite navegar y modificar los datos como si fuese una
hoja Excel.
Variables manager. Ventana que permite administrar integralmente
cada una de las variables.
Nota: Si alguna de las ventanas básicas está cerrada, se puede acceder a ellas a través
de la opción Windows del menú principal.

Foro de Desarrollo Económico Regional Puno 2018 5


Stata para Economistas: Guía básica

Al trabajar en STATA ocuparemos los siguientes tipos de archivos1:

base_de_datos.dta Base de datos en STATA.


programa.do Archivo con líneas de comandos, que en conjunto
conforman un programa. Al correr un programa el trabajo se
hace más interactivo y sencillo.

II. Abrir/Guardar una base de datos


Para abrir/guardar una base de datos existen dos caminos posibles:

Directo. Usar el mouse:

FileOpen/SaveSeleccionar archivo/Nombrar archivo

Programando. Escribir las siguientes líneas:


use/save “[Disco]\[ruta de acceso]\[nombre del archive.dta]”, clear/replace
Por ejemplo:
use “C:\Users\Rodrigo\Desktop\STATA12paraEconomistas\sumaria-2017.dta”, clear
save “C:\Users\Rodrigo\Desktop\STATA12paraEconomistas\sumaria-2017.dta”, replace

III. Cambiar el directorio de trabajo


Para verificar en qué directorio se está trabajando actualmente se utiliza los comandos:
cd
O bien:
pwd

Para cambiar el directorio de trabajo:


cd “[Disco]\[ruta de acceso]\”
Por ejemplo:
cd “C:\Users\Rodrigo\Desktop\STATA12paraEconomistas\”

IV. Repaso rápido de comandos más usados


1. Principales comandos

help Permite obtener ayuda de STATA. Por ejemplo,


help operators
describe (des) Despliega un resumen de los contenidos de la base de datos
en uso.
codebook Reporta información detallada de las variables de la base
de datos.
summarize (sum) Computa estadísticas descriptivas.
tabulate (tab) Computa frecuencias.

1 Existen dos tipos de archivos más: nombre.log y nombre.ado. Para mayor información revisar el Help de STATA.

Foro de Desarrollo Económico Regional Puno 2018 6


Stata para Economistas: Guía básica

table Computa estadísticas descriptivas según las categorías de


una, dos o hasta tres variables.
generate (gen) Permite crear variables.

2. Expresiones lógicas y matemáticas más usadas

+ Suma >= Mayor o igual ~= Distinto de


- Resta > Mayor & y
* Multiplicación <= Menor o igual | o
/ División < Menor exp() Exponencial
== Igual != Distinto de ln() Logaritmo base E

3. Expresiones condicionales

if
Permite hacer instrucciones condicionales, ya sea con
comandos descriptivos o de creación.
by
Permite realizar instrucciones basándose en la clasificación
de una variable en específico.

4. Algunos comandos adicionales

drop Permite borrar variables u observaciones.


keep
Elimina variables u observaciones, excepto las que cumplan
las condiciones especificadas según el comando.
preserve
Guarda temporalmente la base de datos en el estado en el
que se encuentre.
Recupera la base de datos guardada previamente, sin
restore importar los cambios realizados por comandos aplicados
desde entonces.
replace
Permite reemplazar variables o valores de observaciones por
otras.
Permite crear variables, pero a partir de la aplicación de una
egen función conocida por STATA sobre alguna(s) variable(s) en
particular.
sort
Permite ordenar la base de datos en orden ascendente
según una o un grupo de variables especificadas.
lookfor
Permite encontrar variables o explorar la búsqueda en la
base de datos.

Foro de Desarrollo Económico Regional Puno 2018 7


Stata para Economistas: Guía básica

B. Aplicación:
ENAHO 2017

Foro de Desarrollo Económico Regional Puno 2018 8


Stata para Economistas: Guía básica

I. Base de datos
En la ventana de comandos escribir:
clear all

Además, agregar la siguiente línea considerando su propia ruta:


cd "C:[ruta]\ENAHO"

En mi caso es el siguiente:
cd "C:\Users\Rodrigo\Desktop\STATAparaEconomistas"

Luego, ejecutar el comando aprendido líneas arriba:

use sumaria-2017.dta, clear

Nota: al usar el comando cd permitimos el uso de más archivos alojados en la misma


ubicación sin tener que escribir la ruta completa otra vez. Esto será de suma utilidad más
adelante cuando juntemos dos bases de datos.

II. Ejercicios básicos

1. ¿Cuántas variables y observaciones se incluyen en la base datos?


browse

2. ¿Qué características tienen cada de una de las variables?


Codebook

3. ¿Qué nos dice la variable ubigeo?


codebook ubigeo
sum ubigeo
describe ubigeo

4. Transformemos la variable ubigeo para hacerla trabajable:


comando destring
destring ubigeo, replace

5. Dado que la ENAHO solo es representativa a nivel regional, no tiene


sentido hacer inferencia sobre la base de información desagregada
a niveles más específicos. Por lo tanto, debemos usar el ubigeo al nivel
de regiones.

Foro de Desarrollo Económico Regional Puno 2018 9


Stata para Economistas: Guía básica

gen region = int(ubigeo/10000)


label variable region "Región"
label define region 1 "Amazonas" 2 "Áncash" 3 "Apurímac" […]
label values region region
tab region

6. ¿Qué nos dice la variable dominio?


codebook dominio
sum dominio
describe dominio

7. Construyamos la variable regiones naturales


gen region_natural=.
label variable region_natural "Región Natural"
replace region_natural=1 if dominio<=3|dominio==8
replace region_natural=2 if dominio>=4& dominio<=6
replace region_natural=3 if dominio==7
label define region_natural 1 "Costa" 2 "Sierra" 3 "Selva"
label values region_natural region_natural
tab region_natural
tab region region_natural

8. ¿Qué nos dice la variable estrato? Construyamos la variable ámbito


gen ambito=.
label variable ambito "ambito"
replace ambito = 0 if estrato>=6 & estrato <=8
replace ambito = 1 if estrato>0 & estrato <=5
label define ambito 1 "Urbano" 0 "Rural"
label value ambito ambito
tab ambito
tab region ambito
tab region_natural ambito
tab region ambito region_natural
table region ambito region_natural

Con todo lo anterior, ya estamos en la capacidad de calcular variables


desagregadas por región, nivel de urbanidad y tipo de región natural.

Foro de Desarrollo Económico Regional Puno 2018 10


Stata para Economistas: Guía básica

III. Ejercicios intermedios


9. Calcular la pobreza por regiones
Primero encontramos la variable de interés: pobreza
lookfor pobreza
codebook pobreza
sum pobreza
tab pobreza

Recodificamos la variable pobreza:


generate pobreza2=0 if pobreza==3
replace pobreza2=1 if pobreza==2 | pobreza==1
label define pobreza2 1 "Pobre" 0 "No pobre"
label value pobreza2 pobreza2
tab pobreza2

Ahora ejecutamos el comando para cumplir con las condiciones:


table region, c(mean pobreza)
tab region pobreza2, row

Al comparar con los datos ofrecidos por el INEI notaremos que los resultados no son
correctos, ¿qué ocurre? Hasta ahora solo habíamos estado trabajando con la base
de datos y sus variables; no obstante, al iniciar los cálculos sobre ellas debemos
recordar que se trata de una encuesta y no de la población. Por lo tanto, debemos
considerar los factores de expansión o ponderadores que hacen que los indicadores
muestrales se conviertan en representaciones poblacionales.
lookfor factor
codebook factor07

Es importante notar que la variable factor07 es el factor de ponderación o expansión


para los hogares. Sin embargo, la pobreza se mide al nivel de personas. Para ello,
debemos juntar “sumaria”, la cual identifica la condición de pobreza de cada hogar,
con el Modulo 2, que está a nivel de personas.

Para combinar bases de datos es necesario tener una variable o un conjunto de


variables que sirvan como identificadores en ambas bases de datos. A través de
dichos identificadores, se combinarán las variables de ambas bases de datos en una
sola; en otras palabras, debemos identificar qué variable asigna a cada persona con
su respectivo hogar. El identificador natural de nuestra base de datos son los hogares,
debido a que estas son las unidades muestrales. Sin embargo, los hogares están
distribuidos según conglomerados2 y viviendas.

Ordenamos la base de datos sumaria y la salvamos:

2 Los conglomerados son unidades primarias de muestreo.

Foro de Desarrollo Económico Regional Puno 2018 11


Stata para Economistas: Guía básica

sort conglome vivienda hogar


save sumaria-2017-1.dta

Abrimos el Módulo 200, lo ordenamos y usamos el comando merge:


use enaho01-2017-200.dta, clear
sort conglome vivienda hogar
merge conglome vivienda hogar using sumaria-2017-1.dta

Tabulamos la pobreza para cada una de las regiones con el factor de expansión para
personas facpob07:
table region [iw=facpob07] if p204==1 & (p203!= 8 | p203!=9), c(mean pobreza2) row
tab region pobreza2 if p204==1 & (p203!= 8 | p203!=9) [iw=facpob07], row

Podemos calcular la pobreza para otras categorías:


table region [iw=facpob07] if p204==1 & (p203!= 8 | p203!=9), c(mean pobreza2)
table region [iw=facpob07] if p204==1 & (p203!= 8 | p203!=9), c(mean pobreza2) row
table region ambito [iw=facpob07] if p204==1 & (p203!= 8 | p203!=9), c(mean pobreza2)
row col
table region region_natural [iw=facpob07] if p204==1 & (p203!= 8 | p203!=9), c(mean
pobreza2) row col
table region ambito region_natural [iw=facpob07] if p204==1 & (p203!= 8 | p203!=9),
c(mean pobreza2) row

En la medida que la ENAHO es una encuesta, la pobreza calculada tiene un error


muestral. Para observar el error muestral debemos utilizar el módulo de encuestas del
STATA. Primero se le debe decir al STATA que tipo de muestreo se utilizó en la ENAHO:
svyset conglome [pweight=factor], strata (estrato)

Para ver los errores muestrales de pobreza se utiliza el siguiente comando:


svy: proportion pobreza2
svy: tabulate region pobreza2
svy: tabulate region pobreza2, row ci se
svy: tabulate ambito pobreza2, row ci se
svy: tabulate region_natural pobreza2, row ci se

10. Calcular los ingresos netos anuales según quintiles


Regresemos a Sumaria:

use sumaria-2017-1.dta, clear

En primer lugar, debemos encontrar la variable de interés:


lookfor ingreso
codebook inghog2d
sum inghog2d

Usamos el comando xtile para calcular los quintiles. Primero revisamos qué nos dice
STATA:

Foro de Desarrollo Económico Regional Puno 2018 12


Stata para Economistas: Guía básica

help xtile

Calculamos los ingresos por quintiles:


xtile quintiles_ing = inghog2d [w=factor07], nq(5)

Comprobamos que la variable ha sido correctamente calculada:


tab quintiles_ing
tab quintiles_ing [iw=factor07]

Calculamos los ingresos por quintiles:


table quintiles_ing [iw=factor07], c(mean inghog2d)
table quintiles_ing [iw=factor07], c(mean inghog2d) row

¿Podemos usar esta variable para calcular los quintiles por regiones?
table region quintiles_ing [iw=factor07], c(mean inghog2d)

No, porque esta variable ha sido calculada usando como población objetivo al Perú.
Demostrémoslo:
table region quintiles_ing [iw=factor07], row

La tabla nos muestra las observaciones según quintiles. Solo en la última fila, referida
al Total o Perú, los montos son estadísticamente semejantes. Por lo tanto, para
calcular los quintiles de ingresos según regiones, estos se deben calcular
independientemente. Para el caso de Puno:
xtile quintiles_ing_Puno = inghog2d [w=factor07] if region==21,nq(5)
table quintiles_ing_Puno [iw=factor07], c(mean inghog2d)

Es posible generalizar el cálculo para el resto de regiones cambiando la identificación


de la región. Por ejemplo, “15” para Lima ó “23” para Tacna

Antes de seguir guardemos nuestra base datos. Recordar ponerle otro nombre, para
no modificar la base de datos inicial:
save sumaria-2017-2.dta,replace

11. Calcular la tenencia de celulares en los hogares


En primer lugar, debemos encontrar la variable de interés:
lookfor celular

STATA no encuentra la variable porque dicha variable no existe. Para asegurarnos


revisamos el Diccionario de Datos de la ENAHO 2017. Al investigar en ella, advertimos
que dicha variable se encuentra en el módulo 1003. Por lo tanto, abrimos dicha base
de datos:

3 Hasta ahora hemos estado trabajando con los módulos Sumaria y 200.

Foro de Desarrollo Económico Regional Puno 2018 13


Stata para Economistas: Guía básica

use enaho01-2017-100.dta, clear


lookfor celular
codebook p1142
sum p1142
tab p1142

¿Debemos considerar todas las observaciones?


tab p101
tab p101, mis

tab result
keep if result==1|result==2

Generamos una variable más amigable


gen celular=p1142
label variable celular "Tenencia de celular en el hogar"
label define celular 1 "Tiene celular" 0 "No tiene”
label values celular celular

Calculamos la tenencia de celulares por hogares


sum celular
sum celular [iw=factor07]

Calculamos la tenencia de celulares por hogares por regiones


table region [iw=factor07], c(mean celular)

El error se debe a que las variables que habíamos generado en los ejercicios
anteriores no se encuentran en esta base de datos. Al respecto, se pueden emplear
dos soluciones similares. Generar todas las variables calculadas previamente usando
los comandos descritos líneas arriba o combinar las bases de datos. En este caso
usaremos la primera alternativa; usaremos la segunda más adelante.

Luego de volver a calcular las variables de regiones, regiones naturales y nivel de


urbanidad, calculamos lo solicitado:
table region [iw=factor07], c(mean celular)

Como puede haber notado, al revisar las variables del módulo 100, el procedimiento
aplicado también puede servir para obtener la cobertura de teléfono, internet y tv
cable. Pista:
lookfor p114
12. Calcular la cobertura de electricidad de los hogares
En primer lugar, debemos encontrar la variable de interés:
lookfor electricidad
codebook p1121
tab p1121

Generamos una variable más amigable:

Foro de Desarrollo Económico Regional Puno 2018 14


Stata para Economistas: Guía básica

gen elect=p1121
label variable elect "Electricidad"
label define elect 0 "No tiene” 1 “Alumbrado eléctrico”
label values elect elect

Calculamos la cobertura de electricidad:


sum elect [iw=factor07]

Calculamos la cobertura de electricidad por regiones:


table region [iw=factor07], c(mean elect)
table region ambito [iw=factor07], c(mean elect)

13. Calcular el acceso a red pública de agua


En primer lugar, debemos encontrar la variable de interés:
lookfor agua
codebook p110
tab p110

Generamos una variable más amigable usando la definición del INEI sobre acceso
a red pública de agua:
gen agua=.
replace agua=1 if p110<=3
replace agua=0 if p110>3
label variable agua "Acceso a red pública de agua"
label define agua 0 "No tiene” 1 "Tiene acceso a red pública"
label values agua agua

Calculamos el acceso a red pública de agua nacional:


sum agua [iw=factor07]

Calculamos el acceso a red pública de agua por regiones:


table region [iw=factor07], c(mean agua)
table region ambito [iw=factor07], c(mean agua)
save enaho01-2017-100-mod.dta,replace

Se pueden emplear similares comandos para las variables de material predominante


en pisos (p103), paredes (p102) y techo (p103a). También para el combustible usado
en la cocina (p113a). Lo más importante son las condiciones bajo las que definimos
las nuevas variables.

14. Calcular la cobertura eléctrica según quintiles de ingresos

En primer lugar, debemos advertir que la variable de ingresos pertenece al módulo


Sumaria; mientras, la variable de abastecimiento eléctrico, al módulo 100. Por lo
tanto, resulta necesario combinar dichas bases de datos.

Foro de Desarrollo Económico Regional Puno 2018 15


Stata para Economistas: Guía básica

Para combinar bases de datos es necesario tener una variable o un conjunto de


variables que sirvan como identificadores en ambas bases de datos. A través de
dichos identificadores, se combinarán las variables de ambas bases de datos en una
sola. El identificador natural de nuestra base de datos son los hogares, debido a que
estas son las unidades muestrales. Sin embargo, los hogares están distribuidos según
conglomerados4 y viviendas. Por lo tanto, el procedimiento a seguir es:

Abrimos la base de datos a anexar, la ordenamos según los identificadores y la


guardamos:
use enaho01-2017-100.dta, clear
sort conglome vivienda hogar
save enaho01-2017-100-para-combinar.dta,replace

Abrimos la base de datos maestra y la ordenamos según los identificadores:


use sumaria-2017.dta, clear
sort conglome vivienda hogar

Combinamos ambas bases de datos teniendo en cuenta los identificadores usado


el comando merge:
merge conglome vivienda hogar using enaho01-2017-100-para-combinar.dta
br

Veamos cómo está compuesta la nueva base de datos:


tab _merge
br if _merge==2

Notamos que las observaciones que solo están incluidas en la base de datos del
módulo 100 representan missing values. Para evitar posibles problemas, solo
guardamos las variables presentes en ambas bases de datos o, que es lo mismo,
aquellas incluidas en Sumaria.
keep if _merge==3

También podríamos haber usado las bases de datos que modificamos al trabajar los
cálculos previos:
use enaho01-2017-100-mod.dta, clear
sort conglome vivienda hogar
save enaho01-2017-100-mod.dta,replace

use sumaria-2017-2.dta, clear


sort conglome vivienda hogar

merge conglome vivienda hogar using enaho01-2017-100-mod.dta

Calcular la cobertura eléctrica según quintiles de ingresos:

4 Los conglomerados son unidades primarias de muestreo

Foro de Desarrollo Económico Regional Puno 2018 16


Stata para Economistas: Guía básica

table quintiles_ing [iw=factor07], c(mean elect)

Calcular la cobertura eléctrica según quintiles de ingresos Puno:

table quintiles_ing_Puno [iw=factor07], c(mean elect)


table quintiles_ing_Puno ambito [iw=factor07], c(mean elect)

15. Calcular los ingresos provenientes del trabajo según región


La variable de los ingresos provenientes del trabajo se construye a partir de la información
provista en el módulo de “Ingresos y gastos” de la ENAHO. Por lo tanto, es necesario
cambiar de base de datos.
use enaho01a-2017-500.dta, clear

A continuación, tenemos que “limpiar” las variables de las fuentes de ingresos:


recode i524a1 d529t i530a d536 i538a1 d540t i541a d543 d544t(.=0)

Con las variables “limpias”, obtenemos el ingreso anual total proveniente del trabajo.
Luego lo hacemos mensual e incluimos las etiquetas a las nuevas variables:
egen ingtrabw = rowtotal(i524a1 d529t i530a d536 i538a1 d540t i541a d543 d544t)

gen ingtra_n=ingtrabw/(12)

label var ingtrabw "ingreso por trabajo anual"


label var ingtra_n "ingreso por trabajo mensual nominal"

Además, debemos filtrar por las personas residentes de la muestra. Según la definición de
residencia del INEI, ésta requiere que sea miembro del hogar y que no se encuentre
ausente del mismo en los últimos 30 días o que no sea miembro del hogar pero se
encuentre presente en los últimos 30 días.
gen resident=1 if ((p204==1 & p205==2) | (p204==2 & p206==1))

Adicionalmente, es necesario que solo se incluya a las personas ocupadas.

gen ocu=1 if ocu500==1 & resident==1

El INEI, con el objetivo de eliminar los efectos que podrían introducir en los cálculos los
valores extremos, se eliminan los ingresos mensuales que superen los S/. 25,000.
keep if ocu==1 & ingtra_n>0 & ingtra_n<25000

Finalmente, calculamos el ingreso promedio mensual proveniente del trabajo según


región.
table region [iw=fac500a] if resident==1, c(mean ingtra_n) row

_______________________________________________________________________________

Foro de Desarrollo Económico Regional Puno 2018 17


Stata para Economistas: Guía básica

La presente guía constituye una primera herramienta para aprovechar la información


provista por el INEI. Se deja como asignación personal la investigación de nuevos
comandos y la aplicación sobre nuevos módulos de la ENAHO. Finalmente, la principal
herramienta para avanzar en el dominio de STATA radica en el uso del Manual de Ayuda
(comando help).

Foro de Desarrollo Económico Regional Puno 2018 18

También podría gustarte