Replica Econometria
Replica Econometria
Replica Econometria
2021
1. Introducción
El presente documento realiza una réplica del artículo titulado “Análisis del rendimiento
académico mediante un modelo Logit” de Maria del Carmen Ibarra y Juan Carlos Michalus
publicado en la Revista Ingeniera Industrial de la Universidad Nacional de Misiones,
Argentina. En este articulo Carmen y Juan tienen por objetivo principal analizar el rendimiento
académico de los estudiantes de la Facultad de Ingeniería de la Universidad Nacional de
Misiones según el promedio de materias aprobadas anualmente para el cual se hace uso del
modelo Logit y mediante la técnica estadística multivariada de Regresión Logística, se
determina la incidencia de los factores de índole personal, socioeconómica y académica.
Finalmente, esta replica tiene como objetivo comparar los resultados del estudio analizado con
los datos obtenidos de la encuesta realizada a estudiantes universitarios de al menos primer
semestre, para así evidenciar mediante la aplicación de un Modelo Logit Binomial la
significancia de diferentes variables en el rendimiento académico de los estudiantes
participantes en el estudio, esta replica se basa en emplear herramientas econométricas para
suscitar predicciones en el comportamiento de una variable ante factores externos.
Maria del Carmen y Juan Carlos dan inicio explicando como realizaron su análisis del
rendimiento académico de los estudiantes de la FI – UNAM mediante una regresión lineal
múltiple con los datos de 594 alumnos de las cohortes de 1999 a 2003 desde la cual se define
“Rendimiento Académico” al cociente entre número de materias aprobadas y años de
permanencia en la institución, a mayores porcentajes mayor o mejor será dicho rendimiento y
viceversa.
Además, los autores hacen consideración a otros factores como las características del entorno
socioeconómico, condiciones académicas del nivel medio y promedio del primer año de carrera
y número de materias aprobadas los cuales ellos logran identificar como influyentes para el
rendimiento, siendo está ultima variable mencionada la más significativa del modelo.
Los datos utilizados en el documento de Ibarra y Michalus se basan en cinco cohortes de las
carreras: Ingeniería Electromecánica, Electrónica, Civil e Industrial de 1999 a 2003 de la
Universidad Nacional de Misiones en Argentina tomando como población objetivo a 589
estudiantes los cuales cumplen con los requisitos para participar en el estudio.
La muestra para el desarrollo de la réplica obtiene los datos de una encuesta aplicada a
estudiantes de pregrado y agrupa la población que haya culminado al menos su primer semestre
universitario. A partir del articulo replicado se seleccionaron las variables que fueron
consideradas por los autores como influyentes en el rendimiento académico de los estudiantes,
este medido cuantitativamente como el promedio de materias aprobadas en su primer semestre
de estudio, para considerarlo como el indicador de éxito o fracaso académico; a mayor número
de asignaturas aprobadas se concibe un mejor desempeño académico y viceversa.
Es aquí, donde Ibarra y Michalus hacen referencia a como mediante un modelo Logit se puede
calcular para cada conjunto poblacional, la probabilidad de pertenecer a una u otra de las
categorías formalizadas para la variable dependiente (perdió o no una materia en su primer
semestre académico universitario). Entre más alto sea el valor de la probabilidad, el evento
tendrá más posibilidades de ocurrir e inversamente, si sus valores son bajos o cercanos a 0, las
posibilidades de que ocurra serán muy pocas.
5. Resultados
Tabla 1. Variables
Estadístico de Wald
BETAS P-Value
(estimado/error) =Z
PM1U 1,7563 2,5679 0,683944079 0.4940 Y
Sexo -1,2914 0,8327 -1,55085865 0.1209 X1
NEM -0,8149 0,4447 -1,83247133 0.0669 . X2
NEP 0,7747 0,3701 2,093218049 0.0363 * X3
INST -1,5722 1,2777 -1,23049229 0.2185 X4
PC 1,1151 1,0376 1,074691596 0.2825 X5
CdadC 0,1415 0,1344 1,052827381 0.2924 X6
TC 0,8708 0,9482 0,918371652 0.3584 X7
P1U -2,0332 1,1148 -1,8238249 0.0682 . X8
Nota: Los datos de esta tabla han sido recopilados mediante una encuesta con un tamaño de
muestra de 72 personas.
Se puede ver en los resultados del modelo Logit, que las variables que hacen que el estudiante
no haya perdido materias en su primer semestre académico universitario (Y) son: Nivel
educativo del padre, Nivel educativo de la madre y el promedio de notas del primer semestre
académico universitario (está en orden de más a menos afectación a la Y, que es en este caso,
perdió o no materias en su primer semestre universitario). Sin embargo, analizando los
resultados de los estimados (betas), se encontró que el sexo, nivel educativo de la madre, la
institución bachiller (privada o pública) y el promedio del primer semestre universitario del
estudiante muestran una menor probabilidad de que el individuo pierda una materia o no, en su
primer semestre académico universitario.
Estos resultados se han comparado con los resultados de la investigación original, el cual arrojo
que las variables de afectación a la Y eran diferentes en ambas investigaciones. Las variables
arrojadas en la investigación base fueron las siguientes: Sexo (0,020), Promedio del colegio
(0,003) e institución si es privada o pública (0,004). Respecto al análisis de los estimados
(betas), las variables: Sexo, Nivel educativo del padre, Ciudad del colegio y el titulo bachiller,
son los que tienen menos probabilidad de que el estudiante pierda una materia o no, en su
primer semestre académico universitario; hablando de las variables, Nivel educativo del padre,
Ciudad del colegio y el Titulo bachiller, tienen más probabilidad en que el estudiante pierda o
no una materia en su primer semestre académico universitario, en la réplica o segunda
investigación.
• Sexo: Es 2,6 veces más probable que el sexo del estudiante afecte si perdió o no una
materia en su primer semestre académico universitario. También tiene más veces de
probabilidad en esta nueva investigación que en la investigación base (0,12 veces).
• NEM y NEP (Nivel educativo de la madre y del padre): NEM es 1,3 veces
aproximadamente y el NEP es, 1,17 veces más probable que influya en, si el estudiante
perdió o no una materia en su primer semestre académico universitario. Comparado
estos resultados con la investigación base (0,99 veces), sigue siendo más probable que
el suceso pase en la réplica de la investigación.
• INST(institución del colegio privada o pública): Es 3,8 veces más probable que si la
institución es privada o pública, esta influya en si el estudiante perdió o no una materia
en su primer semestre académico universitario, en comparación con la investigación
base(2,6 veces) esta es menor, quiere decir que en que la institución del colegio sea
privada o pública influye menos veces de probabilidad que el suceso pase, es decir, que
el estudiante pierda o no una materia en su primer semestre académico universitario.
• PC (Promedio del colegio): Es 2,0 veces más probable que el nivel de promedio de
notas del colegio influya, en si el estudiante perdió o no una materia en su primer
semestre académico universitario, comparado estos resultados con los resultados de la
investigación base, se concluye que es más veces probable que influya el PC en ella
(2,25 veces), que en la segunda investigación.
• CdadC (Ciudad del colegio): Es 0,15 veces más probable que la ciudad del colegio
influya en si el estudiante perdió o no una materia en su primer semestre académico
universitario, en comparación con las veces probables de la investigación base (0,99
veces) este es mucho mayor, que los resultados de la segunda investigación.
• TC (Titulo bachiller): Es 1,39 veces aproximadamente más probable que el que sea
bachiller académico o técnico, influya en si el estudiante perdió o no una materia en su
primer semestre académico universitario. Comparado con la investigación base (0,609
veces), este sigue siendo mucho menor que los resultados de la segunda investigación.
• P1U (promedio del primer semestre académico universitario): Es 6,6 veces más
probable que el promedio del primer semestre académico universitario influya en si
perdió o no materias en este mismo. Comparado con los resultados de la investigación
base (1,3 veces), este es mucho menor que los resultados de la nueva investigación.
Analizando los efectos marginales de cada variable se encontró lo siguiente:
7. Código en R
## Entrega Econometría II - 2021 - 1 ##
## Réplica articulo "Análisis del Rendimiento Academico Mediante un
modelo Logit"
## Michalus ( 2010 ), Revista Ingeniería Industrial .
### Código R Studio
Library ( readxl )
proyecto = read_excel ( "C: / Users / mfern / Downloads / DATOS ECONOMETRIA
II.xlsx" )
attach ( proyecto )
names ( proyecto )
View ( proyecto )
## Modelos logit
reg = glm ( PM1U ~ Sexo + NEM + NEP + INST + PC + CdadC + TC + P1U , data
= proyecto , family = binomial ( link = logit ))
summary ( reg )
## Odd ratios
exp( coeficientes ( reg ))
## Efectos marginales
EfSexo = ( exp (- 1.2914 ) / ( 1 + exp (- 1.2914 )))
Efmg1 = - 1.2914 * EfSexo * ( 1 - EfSexo )