Econometria Clase01
Econometria Clase01
Econometria Clase01
Fuentes de datos
Fundamentos MCO
Coeficiente de determinación 𝑟 2
Modelo clásico de regresión lineal
normal
Distribución de las perturbaciones 𝑢𝑖
Supuesto de normalidad de 𝑢𝑖
Heteroscedasticidad
Autocorrelación
Macros y Escalares
• Escalares: Es una expresión que contiene un número o una
expresión de texto.
• Una vez defino el escalar, puedo invocarlo por su nombre. (display)
Macros y Escalares
• Macro - global
Looping
• Hay muchas tareas que por sus características mecánicas y
repetitivas pueden ser programadas fácilmente para que el
computador las realice automática y eficientemente
• Para ello, se utilizan los “loops” denominados foreach y forvalues
Looping
• Forvalues: Iteractua sobre serie de valores. Es decir ejecuta
repetidamente la macro local para cada elemento del rango
encerrado en llaves.
• El bucle se ejecuta cero o más veces.
Looping
• Forvalues:
Looping
• Foreach: El comando iteractua por todos los contenidos de una
macro. Puede ser una lista de variables.
• ereturn list
PROGRAMACIÓN CON STATA
• Útil para poder mejorar los códigos y a la vez la construcción de
nuestras rutinas.
• El lenguaje de programación es continuamente mejorando y
actualizado.
Program
• Stata provee de la especificación de programas que el usuario bien
podría crear. Crearemos un programa básico.
Diseños muéstrales
Técnicas de muestreo
Muestreo sin y con reemplazo
• Muestreo sin Reemplazo: Es el que se efectúa sin devolver a la
población los elementos que se van eligiendo para construir la
muestra, sin ser seleccionado más de una vez.
Donde:
pweight: define el ponderador.
strata: define los estratos.
psu: define la unidad primaria de muestreo.
fpc: define el factor de corrección para poblaciones finitas.
Diseños Muéstrales
Para ilustrar se utilizará la base de sumaria 2021, el cual contiene las variables de
gasto e ingreso. En este archivo, el estrato viene definido por la variable “estrato”, la
unidad primaria de muestreo por “conglomerado”. También utilizaremos como
ponderados la variable “facpob”.
pweight es facpob
strata es estrato
psu es conglome
Técnicas de muestreo
Muestreo Aleatorio Simple
Muestreo Sistemático
Montecarlo
Bootstrap
Bootstrap y montecarlo
• Las técnicas de simulación en estadística, conocidos como
bootstrap, son de gran utilidad para calcular medidas de
incertidumbre como la desviación estándar de estimadores y los
intervalos de confianza.
• Estos métodos de simulación permite obtener estimaciones con
menores supuestos que los métodos analíticos, a cambio de un
trabajo computacional mas intenso.
• Dos métodos que son aplicables en el análisis de datos de
medición, son el método de simulación de Monte Carlo y el
remuestreo de bootstrap
Montecarlo
• Se introduce la técnica de la “Simulación de Montecarlo” que es una
herramienta que sirve para la identificación de la incertidumbre
mediante el uso de variables aleatorias.
• Se explican los principales conceptos relacionados con esta
herramienta para poder aplicarla a cualquier situación real.
Montecarlo
• La simulación es una técnica cuantitativa utilizada para obtener la
respuesta más probable de un evento por medio de la simulación de
un modelo matemático.
𝑦𝑖 = 𝛽1 + 𝛽2 𝑥𝑖 +𝑢𝑖
• Esta herramienta combina conceptos estadísticos con la capacidad
de programas computacionales capaces de generar números seudo
aleatorios y automatizar cálculos.
• Este nombre es relativamente reciente y fue atribuido a Jon von
Neumann y Stanislaw Ulam cuando trabajaban en el proyecto
Manhattan durante la segunda guerra mundial.
• Su capacidad de modelar sistemas complejos y de poder trabajar
con cualquier tipo de distribución de probabilidad.
• Es una herramienta intuitiva, relativamente fácil de implementar y
con tiempo de obtención de resultados.
Montecarlo
• La simulación de Monte Carlo en su estado puro, la cual está
fundamentada en la generación de números aleatorios, se deben
seguir los siguientes pasos:
– Determinar las variables aleatorias y sus distribuciones.
– Iterar tantas veces como sean necesarias:
✓ Generar un número aleatorio.
✓ Uniforme [0,1].
✓ Determinar el valor para el número aleatorio generado de
acuerdo al rango o clases que se especifiquen.
– Calcular media, desviación estándar o métodos estadísticos
comparables.
– Analizar los resultados.
Montecarlo
• Funciones de distribuciones de probabilidad (FDP)
• Toda variable aleatoria posee una distribución de probabilidad que
describe su comportamiento. Si la variable es discreta, es decir, si
toma valores aislados dentro de un intervalo, su distribución de
probabilidad especifica todos los valores posibles de la variable
junto con su probabilidad de ocurrencia.
Montecarlo
• Al final las iteraciones, se utilizan, para extraer información de los
resultados, medias, desviaciones estándares o percentiles que
pueden ser de gran ayuda.
• El resultado obtenido después de todas las iteraciones e
interpretadas por métodos estadísticos puede tener diferentes
significados dependiendo del objetivo y de lo que se esté buscando.
Montecarlo
• Aplicación:
• Dados los supuesto del modelo clásico de regresión lineal, los
estimadores de minimos cuadrados, dentro de la clase de
estimadores lineales insesgados, tienen varianza minima, es decir
son MELI.
• Comprobar propiedad de insesgamiento:
– Coeficientes
– Varianza del modelo
• Procedimiento:
– Generar una muestra que provenga de una población (con coeficientes (betas) y
varianza del modelo conocidos (constante)).
– Calcular para la muestra una estimación de los coeficientes y de la varianza del
modelo.
– Almacenar las estimaciones.
– Repetir el proceso para un gran número de muestras (repeticiones del
experimento).
– Analizar los resultados agregados (para todas las restricciones)
Montecarlo
• Aplicación:
• Explicación:
– Definición de la variables
(coeficientes y sigma)
– Proceso para una muestra
– Creación del programa
– Simulaciones
– Análisis de resultados
𝑦𝑖 = 𝛽1 + 𝛽2 𝑥𝑖 +𝑢𝑖
Montecarlo
Montecarlo
Montecarlo
Bootstrap
• La calidad de un estimador está relacionada con la varianza de
dicho estimador e ir acompañado por una estimación de su
varianza, o una medida de su incertidumbre.
• La metodología, que fue desarrollada en 1979 por Efron , para
calcular la variabilidad de un estimador, conocida como bootstrap,
consiste en tomar muestras aleatorias de la muestra que tenemos
originalmente
• Este proceso lo repetimos un número grande “N” de veces y
encontramos la distribución empírica de las estimaciones.
• El paradigma de esta técnica surge de una analogía en la cual la
muestra observada asume el papel de la población de la cual
proviene.es decirla muestra observada asume el papel de la
población de la cual proviene. El procedimiento consiste en tomar
muestras de una muestra se le conoce como remuestreo.
Algoritmo de remuestreo
• El punto de partida es una muestra de tamaño n, x=(x1, x2, ..., xn)
tomada de la población. Tomamos una muestra de tamaño n con
reemplazo, 𝑥𝑏∗ = (𝑥1∗ , 𝑥2∗ , …,𝑥𝑛∗ ) calculamos la estimación 𝜃𝑏∗ de la
cantidad de interés 𝜃.
Algoritmo de remuestreo
• Repetimos lo anterior B veces, y obtenemos la distribución empírica
de las estimación bootstrap 𝜃𝑏∗ , b=1,2,3,…,B.
• De esta distribución empírica, calculamos finalmente la desviación
estándar, y un intervalo de confianza, medidas de incertidumbre del
estimador 𝜃 de 𝜃.መ
• Calcular la estimación bootstrap de la desviación estándares.
Tipos de mapas
dta
shp
dta
Construcción del mapa coropletico
Construcción del mapa coropletico
Web Scraping
Extracción de datos
Preguntas:
¿Es legal?, Alguien viniera scrapear tus datos.
¿Cómo funciona y utilidad?
• Funciona mediante dos partes: un rastreador web (crawler) y un raspador web
(scraper). El rastreador podría ser el caballo y el raspador el carro.
• El rastreador (crawler) al que generalmente llamamos «araña», es una inteligencia
artificial que navega por Internet para indexar y buscar contenido siguiendo
enlaces y explorando.
• El scraper es una herramienta especializada diseñada para extraer datos de una
página web con precisión y rapidez.
Los usos de la Web Scraping :
• Investigación de mercado.
• Comparación de precios.
• Supervisión de datos
• Detección de cambios Webs
• Integración de datos Webs
Extracción de datos
• Existen distintos niveles de automatización que las existentes
tecnologías de Web Scraping pueden brindar:
– «Copiar y pegar» humano.
– Uso de expresiones regulares.
– Protocolo HTTP.
– Algoritmos de minería de datos.
– Parsers de HTML.
– Aplicaciones para web scraping.
– Reconocimiento de información semántica.
Web Scraping con Stata
• El Stata respecto a la Web Scarping esta en sus primeras etapas.
• Se han escrito varios programas que pueden realizar la tarea
sencillas de Web Scraping. El Stata presenta el paquete “readhtml”.
• El comando para instalar:
– net install readhtml, from(https://ssc.wisc.edu/sscc/stata/) o
– net from https://ssc.wisc.edu/sscc/stata/
dta
Web Scraping con Stata
COMUNICACIÓN PERMANENTE CON LA ESCUELA