08 Tobit
08 Tobit
08 Tobit
respuesta cualitativa:
- Truncados
- Censurados
Modelo TOBIT
1
Motivación
• Habíamos indicado que en la regresión tradicional MCO, la variable dependiente o
endógena (convencionalmente denominada Y) es cuantitativa, mientras que las
variables explicativas o exógenas (convencionalmente denominadas Xi), pueden ser
cuantitativas, cualitativas (por ejemplo dicotómicas), o una mezcla de ambas.
• Sin embargo, debido a que en las ciencias sociales abundan los casos de respuesta
cualitativa, resultaba necesario comprender la naturaleza de ese proceso generador
de datos, pues se presentan interesantes retos respecto de su cálculo y estimación
• Con ese marco, desarrollamos como una variante, el caso en que la variable
dependiente (la variable Y) puede ser en sí misma de naturaleza cualitativa,
mediante los modelos:
• Logit
• Probit
2
Definiciones
• Sin embargo, es posible que no se observen datos de la variable dependiente Y,
así como de las variables explicativas para toda la población.
• En situaciones como esas, estaremos frente al caso de muestras censuradas o
muestras truncadas, según sea el tipo de limitación en la información disponible.
• Los modelos de selección muestral constituyen una especialmente importante
generalización de estos modelos.
• Los modelos truncados o censurados: Son modelos econométricos donde la
variable dependiente solo representa a una parte de la población (datos
disponibles para una subpoblación inferior a la población total):
• La media de la variable truncada o censurada no será la misma que la original.
3
Definiciones
• Si la variable objeto de estudio es una medición continua que se distribuye según
una ley normal, en la que existen uno o varios puntos de truncamiento y/o censura,
no es posible utilizar los habituales modelos de regresión lineal estimados por
mínimos cuadrados ordinarios (MCO), porque proporcionan estimaciones incorrectas
del efecto y de su variabilidad.
• Cuando la variable de interés tiene un punto de truncamiento se debe utilizar el
denominado modelo de regresión truncado.
• Si tiene un único punto de censura tiene que utilizarse el llamado modelo de
regresión censurado o modelo Tobit.
• Cuando existen varios puntos de truncamiento o censura, o cuando coexisten al
mismo tiempo censura y truncamiento, se utilizan las respectivas generalizaciones de
estos modelos.
4
Tomado de https://www.gacetasanitaria.org/es-pdf-S0213911102716518
Definiciones
• El modelo tobit fue propuesto por Tobin en 1958 (*) y es en su honor
por lo que se denomina de este modo. (economista y premio nóbel)
• El modelo Tobit es como una mezcla del modelo de regresión y el
modelo Probit:
• Es parcialmente Probit porque la variable endógena es binaria.
• Es parcialmente un modelo de regresión lineal por la inclusión de variables
continuas.
(*) Tobin, J. Estimation of relationships for limited dependent variables. Econométrica 1958;26:24-36.
5
Definiciones
• La censura no es una característica intrínseca de la
distribución de la variable objeto de estudio, sino un
defecto de los datos de la muestra, que si no estuvieran
censurados constituirían una muestra representativa de la
población de interés no censurada. a
• Un ejemplo de una variable censurada sería el tiempo de
• La línea discontinua representa la
supervivencia desde el diagnóstico de una enfermedad hasta la
función de densidad de una
fecha de muerte (evento). En la práctica el estudio tendrá
distribución N(0,1)
definida una fecha de finalización (punto de censura) en la que • La línea en negrita es la función de
ocurrirá que no todos los sujetos de la muestra escogida habrán densidad de una N(0,1) censurada
muerto (algunos seguirán vivos). inferiormente en a = –1,5, donde el
• El objetivo es estudiar el tiempo de supervivencia en la población área (probabilidad) de la cola inferior
de enfermos diagnosticados de dicha enfermedad. Como no es que queda a la izquierda del punto
posible disponer en la muestra de los tiempos de supervivencia de censura se acumula en dicho
de todos los enfermos. La variable tiempo de supervivencia se punto de censura: a. Así, la altura de
dice entonces que está censurada superiormente. la línea vertical en el punto de
censura representa el valor de esta
área inferior. 6
Tomado de https://www.gacetasanitaria.org/es-pdf-S0213911102716518
Variables censuradas
Para algunas observaciones, sólo se sabe que la variable es mayor (o menor) que
un valor.
• La censura puede producirse por diversos motivos: Como resultado del proceso
de recogida de datos o por soluciones económicas en esquina.
7
Ejemplo: cobro de comisión por administrar
un fondo de pensiones (AFP)
• Dependiente sin censura: 1% de la • Dependiente censurada:
• Comisiones de gestión de fondos de pensión:
rentabilidad • Comisión mínima 0.5%
• Fondo: capital = 1,000,000.... Bolsa de valores • Comisión máxima 2%
• Fondo genera una rentabilidad (variable)….
+10%, +20%, +1%, 0%, -1%
• Como la AFP administran el fondo… Entonces • Administración de un fondo: capital = 1,000,000.... Bolsa
de valores
cobran un comisión
• Fondo genera una rentabilidad (variable)…. +10%, +20%,
• 10% = 100,000…. 1% = 1,000 +1%, 0%, -1%
• 20% = 200,000…. 1% = 2,000 • Como la AFP administran el fondo… Entonces cobran un
De la rentabilidad. comisión
• 1% = 10,000……… 1% = 100 • 10% = 100,000…. 2% = 20,000
• 0% = 0……… 1% = 0 • 20% = 200,000…. 2% = 20,000
• -1% = -10,000 …..1% = -100 • 1% = 10,000…….. Fondo: Capital.
• 0% = 0……… 0.5% = 5,000 De 1,000,000.
• -1% = -10,000 …..0.5% = 5,000
8
Definiciones
• El truncamiento de la variable objeto de estudio,
de la cual se extraen los datos de la muestra, se
produce cuando sólo la parte de la distribución de
la variable que se encuentra por encima (o por a
debajo) del denominado punto de truncamiento
• La línea discontinua muestra la
contiene la información relevante que se desea
función de densidad de una
estudiar. distribución N(0,1)
• La línea continua es la función de
• Un ejemplo de variable truncada sería el valor de densidad de una N(0,1) truncada
hemoglobina cuando el interés reside en estudiar a inferiormente en el punto a = –1,5,
donde el área (probabilidad) de la
aquellos pacientes con valores inferiores a 8 g/dl en la
cola de la N(0,1) que queda a la
población. El punto de truncamiento es 8 g/dl. izquierda del punto de truncamiento
se reparte entre el conjunto de
puntos no truncados, haciendo que
la función de densidad de la N(0,1)
truncada integre la unidad. 9
Tomado de https://www.gacetasanitaria.org/es-pdf-S0213911102716518
Variables truncadas
La muestra excluye determinadas observaciones.
10
Formalización
• La censura/truncamiento puede considerarse como una situación en
que falta información (completa) sobre la variable dependiente
comparada con observar plenamente Y*
• Formalmente, la variable observada Y resulta de una mixtura de:
• Un proceso latente continuo Y*
• Un mecanismo de selección (censura o truncamiento), modelizado en forma
binaria
• O como:
• La variable latente satisface los supuestos del modelo lineal clásico; en particular,
tiene una distribución normal, homocedástica con una media condicional lineal.
La variable observable, , cuando
Pero , cuando
• Debido a que se distribuye normalmente, tiene una distribución continua a través
de valores estrictamente positivos.
• En particular, la densidad de dado es la misma que la densidad de dado para
valores positivos.
• Además de ello:
b) La expectativa no condicional:
Esta ecuación muestra que cuando Y sigue un modelo Tobit, es una función no lineal de X y
también de
Con base en esta último ecuación existen dos métodos para calcular un factor de ajuste
para obtener efectos parciales (para variables explicativas continuas).
Primero: El efecto parcial al promedio, EPA, que se obtiene al evaluar que se denota .
Segundo: El efecto parcial promedio, EPP cuya fórmula es
• Los factores escalares EPA y EPP siempre están entre cero y uno.
• Ambos factores (EPA y EPP) tienden a uno cuando hay pocas observaciones .
• Si para toda i, los parámetros de Tobit y MCO son idénticos (entonces no tiene sentido aplicar TOBIT).
20
Estimando un Tobit censurado
• A continuación, se selecciona una de las tres
distribuciones para el término de error (EViews
permite tres posibles opciones):
22
Fuente: Guía de uso Eviews
Estimando un Tobit censurado
Caso de puntos límite no conocidos
- En algunos casos, el punto de censura hipotético es
desconocido para algunos individuos (y no se
conocen para todas las observaciones).
- Esta situación se produce a menudo con datos en los
que la censura se indica con una variable ficticia cero-
uno, pero no se proporciona información adicional
sobre los posibles puntos de censura.
- EViews proporciona un método para describir la
censura de datos que se ajustan a este formato.
- Se selecciona “Zero/one censoring indicator” y se
introduce la expresión de la serie para el/los
indicador/es de censura en el/los campo/s de edición
apropiado/s.
23
Fuente: Guía de uso Eviews
Estimando un Tobit censurado
Caso de puntos límite no conocidos…. continúa
- Tal es el caso de la variable ficticia, las observaciones con
un indicador de censura de “1” se suponen censuradas,
mientras que las que tienen un valor de “0” se suponen
respuestas reales.
- Por ejemplo:
- Asumiendo que se tienen observaciones sobre el tiempo que
un individuo ha estado desempleado (U), pero que algunas
de estas observaciones representan el desempleo en curso
en el momento en que se toma la muestra.
- Estas últimas observaciones pueden tratarse como
censuradas a la derecha en el valor declarado.
- Si la variable RCENS es una variable ficticia que representa la
censura, puede hacer clic en el ajuste Campo es cero/un
indicador de censura y entrar:
- Left: [en blanco] ; Right: rcens
24
Fuente: Guía de uso Eviews
Estimando un Tobit censurado
Caso de puntos límite no conocidos…. continúa
- Por ejemplo:
- Si los datos están censurados tanto a la izquierda como a la
derecha, se utiliza indicadores binarios separados para cada
forma de censura:
- Left: lcens
- Right: rcens
Donde LCENS es también un indicador binario.
25
Fuente: Guía de uso Eviews
Estimando un Tobit censurado Dependent Variable: INFIEL
Method: ML - Censored Normal (TOBIT) (Newton-Raphson / Marquardt
Interpretación de los resultados steps)
Date: 11/17/21 Time: 12:11
Sample: 1 601
Included observations: 601
Si el modelo converge, EViews mostrará los Left censoring (value) at zero
Convergence achieved after 8 iterations
los coeficientes, incluidos los errores estándar Coefficient covariance computed using observed Hessian
asintóticos, los estadísticos z y los niveles de Variable Coefficient Std. Error z-Statistic Prob.
significación.
C 7.608487 3.905987 1.947904 0.0514
GENERO 0.945787 1.062866 0.889847 0.3735
EDAD -0.192698 0.080968 -2.379921 0.0173
• Como en otros modelos de variable dependiente TIEMPO_MATRI 0.533190 0.146607 3.636852 0.0003
HIJOS 1.019182 1.279575 0.796500 0.4257
limitada, los coeficientes estimados no tienen una RELIGION -1.699000 0.405483 -4.190061 0.0000
EDUCACION 0.025361 0.227667 0.111394 0.9113
interpretación directa como el efecto marginal del OCUPACION
VALORA_MATRI
0.212983
-2.273284
0.321157
0.415407
0.663173
-5.472429
0.5072
0.0000
regresor asociado. Error Distribution
• En los modelos de regresión censurada, un cambio SCALE:C(10) 8.258432 0.554581 14.89131 0.0000
en "xij" tiene dos efectos: un efecto sobre la media Mean dependent var 1.455907 S.D. dependent var 3.298758
McDonald y Moffitt, 1980). Left censored obs 451 Right censored obs
27
0
Uncensored obs 150 Total obs 601
Fuente: Guía de uso Eviews
Estimando un Tobit censurado Dependent Variable: INFIEL
Method: ML - Censored Normal (TOBIT) (Newton-Raphson / Marquardt
Interpretación de los resultados steps)
Date: 11/17/21 Time: 12:11
Sample: 1 601
Included observations: 601
• También hay coeficiente adicional denominado Left censoring (value) at zero
Convergence achieved after 8 iterations
SCALE, que es el factor de escala estimado "σ". Coefficient covariance computed using observed Hessian
• Este factor de escala puede utilizarse para Variable Coefficient Std. Error z-Statistic Prob.
• Al igual que en los modelos binarios y SCALE:C(10) 8.258432 0.554581 14.89131 0.0000
31
Fuente: Guía de uso Eviews
Estimando un Tobit truncado
• La estimación truncada sólo está disponible para los
modelos en los que se conocen los puntos de
truncamiento.
• Especificar puntos de truncamiento por índice, emitirá
un mensaje de error indicando que esta selección no
está disponible.
• Se emitirá un mensaje de error si algún valor de la
variable dependiente está fuera de los puntos de
truncamiento.
• Se excluirá automáticamente cualquier observación que
sea exactamente igual a un punto de truncamiento.
• Así, si se especifica cero como límite inferior de truncamiento,
saldrá un mensaje de error si alguna observación es menor
que cero, y se excluirá cualquier observación en la que la
variable dependiente sea exactamente igual a cero.
32
Fuente: Guía de uso Eviews
Estimando un Tobit truncado
Caso de puntos límite conocidos
- Introducir los puntos de truncamiento izquierdo y
derecho en los campos de edición como necesarios.
- Si se deja un campo de edición en blanco, EViews
asume que no hay truncamiento en las
observaciones.
- Por ejemplo
- Datos truncados a la izquierda en “0” y sin
truncamiento a la derecha.
- Left: 0 ; Right: [en blanco]
- Datos truncados por arriba pueden especificarse como
- Left: [en blanco] ; Right: 20000
- Truncamiento izquierda y derecha
- Left: 10000 ; Right: 20000
33
Fuente: Guía de uso Eviews
Estimando un Tobit truncado
Dependent Variable: INFIEL
Method: ML - Censored Normal (TOBIT) (Newton-Raphson / Marquardt
Interpretación de los resultados steps)
Date: 11/19/21 Time: 18:35
Sample (adjusted): 452 601
Included observations: 150 after adjustments
Una vez especificado el modelo, se hace clic en Truncated sample
Left censoring (value) at zero
aceptar y EViews estimará los parámetros del modelo Convergence achieved after 10 iterations
Coefficient covariance computed using observed Hessian
utilizando las técnicas iterativas adecuadas. Variable Coefficient Std. Error z-Statistic Prob.
Error Distribution
36
Circulo de la pobreza: Transmisión
intergeneracional de la pobreza
• Situación de embarazo
• Embarazo no planificado
• Madre soltera
• Embarazo planificado • Trabaja labores manuales
• Edad
• Madre menor de edad
• Sector informal
• Madre es mayor de edad • Salario: bajo
• Nivel educativo
• Madres tiene pocos años (primaria..)
• Situación de pobreza
• Madre tiene estudios avanzados
• Situación económica
• Condición de pobreza
• Hogares no pobres
• Hija(o)s
• Pareja • Situación de pobreza
• Acompaña el embarazo
• No acompaña • Mundo de pobreza, informalidad,
• Padres delincuencia
• Apoyan (ayudan) a la embarazada
• No apoyan (expulsan del hogar)
• Cuando crezcan y tengan hijos
37
Tobit con datos de MROZ: Trabajo mujeres
Estimamos un MCO
LS hours nwifeinc educ exper expersq age kidslt6 kidsge6 c
Estimamos un TOBIT
• Opción 1: En el menú de opciones: Quick/Estimate Equation o en la barra de comandos:
Censored. En el cuadro de diálogo que se abre en la ventana de especificación,
escribimos la regresión. Con los datos de M. Roz sería:
hours nwifeinc educ exper expersq age kidslt6 kidsge6 c
• Opción 2: Estima un tobit censurado a la izquierda en 0. Guardar resultado como "eq1“:
tobit hours nwifeinc educ exper expersq age kidslt6 kidsge6 c
• Opción 3: Estima un tobit censurado a la izquierda en 0 y guarda directamente el
resultado con el nombre “eq1”
equation eq1.tobit hours nwifeinc educ exper expersq age kidslt6 kidsge6 c
38
Tobit con datos de MROZ: Trabajo mujeres
Dependent Variable: HOURS
R-squared 0.265624 Mean dependent var 740.5764 σ SCALE:C(9) 1122.022 41.57910 26.98523 0.0000
Adjusted R-squared 0.258724 S.D. dependent var 871.3142 Mean dependent var 740.5764 S.D. dependent var 871.3142
S.E. of regression 750.1786 Akaike info criterion 16.08907 S.E. of regression 746.7157 Akaike info criterion 10.16758
Sum squared resid 4.19E+08 Schwarz criterion 16.13819 Sum squared resid 4.15E+08 Schwarz criterion 10.22285
Log likelihood -6049.534 Hannan-Quinn criter. 16.10799 Log likelihood -3819.095 Hannan-Quinn criter. 10.18887
F-statistic 38.49534 Durbin-Watson stat 1.371237 Avg. log likelihood -5.071839
Prob(F-statistic) 0.000000
Left censored obs 325 Right censored obs 0
Uncensored obs 428 Total obs 39 753
Tobit con datos de MROZ: Trabajo mujeres
• El signo de los coeficientes estimados de la regresión Tobit, así como la significancia
estadística de los mismos es similar.
• Pero, las magnitudes de las estimaciones de MCO y de Tobit no son comparables. El
hecho que algunos coeficientes Tobit, como la variable “kidslt6” sean
aproximadamente el doble que el respectivo coeficiente MCO, ello no implica una
respuesta mayor de horas trabajadas.
EFECTOS MARGINALES
1) El EPA (Efecto parcial al promedio)
• Si se desea el efecto estimado, por ejemplo, de otro año de educación a partir
de los valores promedio de todas las variables explicativas, entonces se calcula
el factor escalar EPA (Efecto parcial al promedio)
40
Tobit con datos de MROZ: Trabajo mujeres
El efecto marginal (continua….)….Procedimiento en Eviews
• Extraemos el XB ajustado en cada observación i de la muestra de
pronóstico (o solución de modelo)
eq1.fit(i) xb
• Obtenemos las medias de XB, ajustando el cuadrado de la media(exper) en
lugar de la media de expersq
xb = xb - expersq*eq1.c(4)
scalar meanxb = @mean(xb) + @mean(exper)^2*eq1.c(4)
• Usamos las medias de XB para calcular el factor el cual viene dado por la
"CDF" de la escala normal multiplicado por el sigma estimado
vector tobit_beta = eq1.@coefs
scalar sigma = tobit_beta(@rows(tobit_beta))
scalar ufactor = @cnorm(meanXB / sigma)
41
Tobit con datos de MROZ: Trabajo mujeres
El efecto marginal (continua….)….Procedimiento en Eviews
42
Tobit con datos de MROZ: Trabajo mujeres
El efecto marginal (continua….)….Procedimiento en Eviews
43