Ejercicico 11.23 de Guajarati

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 8

Estime la siguiente regresión con base en estos datos y obtenga el estadístico de reusch-

Pagan-Godfrey para ver si hay heteroscedasticidad:


salarioi = β1 + β2antigüedadi + β3edadi + β4ventasi + β5utilidadesi + β6activosi + ui
Para el desarrollo del presente ejercicio de “Heterocedasticidad” utilizando el método
estadístico de Breusch-Pagan-Godfrey, se tomó dos variables las cuales estarían en
función una de la otra con el método de Mínimos Cuadrados Ordinarios. El número de
datos utilizado en la base de datos es de 447 (n=447).
Resumen
Para el desarrollo del presente ejercicio de “Heterocedasticidad”
Estadísticas de la regresión utilizando el método estadístico de Breusch-Pagan-Godfrey, se tomó
Coeficiente de correlación múltiple 0,725970143 dos variables las cuales estarían en función una de la otra con el
Coeficiente de determinación R^2 0,527032648
R^2 ajustado 0,5259698 método de Mínimos Cuadrados Ordinarios. En este caso se escoge la
Error típico 11131,89792 variable ventas (Y) y ganancias (X) con un número de datos de 447
Observaciones 447
(n=447).
ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 1 61447581892 61447581892 495,868324 2,32094E-74
Residuos 445 55144022320 123919151,3
Total 446 1,16592E+11

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
Intercepción 6227,710393 578,3742621 10,76761329 3,4845E-24 5091,026127 7364,394659 5091,026127 7364,394659
Variable X 1 7,60937687 0,341716469 22,26810105 2,3209E-74 6,937798344 8,280955395 6,937798344 8,280955395

Análisis de los residuales

Pronóstico para
Observación Y Residuos Residuos al cuadrado Pi
1 28721,02842 132593,9716 17581161299 142,513708
2 174174,2673 -29758,26729 885554471,9 7,17834558
3 39937,24993 99270,75007 9854681820 79,8825074
4 54699,44105 45997,55895 2115775429 17,1505737
5 76964,47778 23504,52222 552462565 4,47828715
6 54379,84723 27287,15277 744588706,5 6,03567056
7 50415,36188 26015,63812 676813427 5,486281
8 47105,28294 10707,71706 114655204,7 0,9294004
9 14750,21249 41403,78751 1714273620 13,8959814
10 54912,50361 -1324,503606 1754309,803 0,01422052
SUMA 55144022320
n 447
Varianza 123364703,2

En este punto expongo el encabezado y un número limitados de los datos que en el total del análisis son 447.
Resumen

Estadísticas de la regresión
XCoeficiente de correlación múltiple 0,192953849
Coeficiente de determinación R^2 0,037231188
R^2 ajustado 0,035067662
Error típico 7,687136593
Observaciones 447

ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 1 1016,890257 1016,890257 17,2085743 4,01291E-05
Residuos 445 26295,97071 59,092069
Total 446 27312,86096

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
Intercepción 0,31432612 0,39939658 0,787002534 0,43169932 -0,470611658 1,099263898 -0,470611658 1,099263898
Variable X 1 0,00097889 0,000235972 4,14832186 4,0129E-05 0,000515131 0,001442648 0,000515131 0,001442648

Análisis de los residuales VC 508,4451287


1/2*SCR
Observación Pronóstico para Y Residuos
1 3,207923939 139,3057842 GL K-1
2 21,91939969 -14,74105411 GL 5
3 4,65080729 75,23170016
4 6,54985322 10,60072044 Nivel de significancia 0,05
5 9,414084349 -4,935797199 X2 11,0705
6 6,508739855 -0,473069299 Como resultado del presente análisis observamos que la hipótesis
7 5,998738344 -0,512457346 alterna (HI=HETEROCEDASTICIDAD) que para este caso le
8 5,572921345 -4,643520943 corresponde el Valor Crítico (VC) que es de 508,445 que supera al
9 1,410682534 12,48529886 valor de la hipótesis nula (H0=HOMOCEDASTICIDAD) que
corresponde al valor de X2 igual a 11,0705 (valor tomado de la tabla
10 6,57726213 -6,563041614 "Chi Cuadrado X2, para un nivel de significancia de 0,05 y 06 Betas), lo
cual significa que en el modelo la varianza del error es diferente para
En este punto expongo el encabezado y un número limitados de los
cada valor de x, los errores son heterocedasticos, los estimadores MCO
datos que en el total del análisis son 447. siguen insesgados y consistentes, bajo la heterocedasticidad, los
errores estándar de los estimadores están sesgados.
a) ¿Parece existir un problema de heteroscedasticidad?
Teniendo en cuenta el resultado del análisis realizado, observamos que si existe un problema de heteroscedasticidad, debido
a que la hipótesis alterna (HI=HETEROCEDASTICIDAD) que para este caso le corresponde el Valor Crítico (VC) que es de
508,445 que supera al valor de la hipótesis nula (H0=HOMOCEDASTICIDAD) que corresponde al valor de X2 igual a 11,0705
(valor tomado de la tabla "Chi Cuadrado X2, para un nivel de significancia de 0,05 y 06 Betas), lo cual significa que en el
modelo la varianza del error es diferente para cada valor de x, los errores son heterocedasticos, los estimadores MCO siguen
insesgados y consistentes, bajo la heterocedasticidad, los errores estándar de los estimadores están sesgados y son
robustos, en tal sentido la varianza estimada fue corregida por los grados de libertad (GL), para ello, la multiplicamos por n/(n
− k − 1).
b) Ahora cree un segundo modelo con ln (salario) como variable dependiente.

Resumen
Para el desarrollo del presente ejercicio de “Heterocedasticidad”
utilizando el método estadístico de Breusch-Pagan-Godfrey, se
Estadísticas de la regresión
Coeficiente de correlación
tomó dos variables las cuales estarían en función una de la otra
múltiple 0,37031521 con el método de Mínimos Cuadrados Ordinarios. En este caso se
Coeficiente de determinación R^2 0,137133355 escoge la variable salario (Y) y ganancia (X) con un número de
R^2 ajustado 0,135194328
Error típico 1601,89938 datos de 447 (n=447).
Observaciones 447

ANÁLISIS DE VARIANZA
Promedio de los
Grados de libertad Suma de cuadrados cuadrados F Valor crítico de F
Regresión 1 181480470,4 181480470,4 70,72279723 5,6299E-16
Residuos 445 1141906323 2566081,625
Total 446 1323386794

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
Intercepción 1737,85212 83,22905752 20,88035323 5,4129E-68 1574,281287 1901,422954 1574,281287 1901,422954
Variable X 1 0,413534401 0,049173591 8,409684728 5,6299E-16 0,316893089 0,510175714 0,316893089 0,510175714

En este punto expongo el encabezado y un número limitados de los datos que en el total del análisis son 447.
Análisis de los residuales

Observación Pronóstico para Y Residuos Residuos al cuadrado Pi


1 2960,25981 69,74018965 4863,694052 0,001903896
2 10864,96989 -4814,96989 23183935,04 9,075367001
3 3569,809518 1,190482214 1,417247903 5,54783E-07
4 4372,066256 -1072,066256 1149326,058 0,44990446
5 5582,067914 4417,932086 19518123,91 7,640382764
6 4354,697811 5020,302189 25203434,07 9,865901255
7 4139,246388 5385,753612 29006341,97 11,35455212
8 3959,358924 1040,641076 1082933,85 0,423915185
9 2201,01065 -1202,01065 1444829,602 0,565579522
10 4383,645219 -1083,645219 1174286,962 0,459675423
11 3873,757303 -373,7573027 139694,5213 0,054683515
SUMA 1141906323
n 447
Varianza 2554600,276
En este punto expongo el encabezado y un número limitados de los datos que en el total del análisis son 447.

Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,114951783
Coeficiente de determinación R^2 0,013213912
R^2 ajustado 0,010996416
Error típico 4,612526629
Observaciones 447

ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 1 126,7786689 126,7786689 5,958931796 0,015031715
Residuos 445 9467,553846 21,2754019
Total 446 9594,332515

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
Intercepción 0,757895057 0,23965066 3,16249935 0,00167123 0,286907407 1,228882708 0,286907407 1,228882708
Variable X 1 0,000345637 0,000141591 2,441092337 0,015031715 6,73666E-05 0,000623907 6,73666E-05 0,000623907
Análisis de los residuales VC 63,38933444
1/2*SCR
Observación Pronóstico para Y Residuos
1 1,779596999 -1,777693103 GL K-1
2 8,386441595 0,688925407 GL 5
3 2,289065424 -2,289064869
4 2,959600528 -2,509696068 Nivel de significacncia 0,05
5 3,97093337 3,669449394 X2 11,0705
6 2,945083788 6,920817467 Como resultado del presente análisis observamos que la hipótesis
7 2,765007093 8,589545024 alterna (HI=HETEROCEDASTICIDAD) que para este caso le
8 2,61465515 -2,190739964 corresponde el Valor Crítico (VC) que es de 63, 3893 que supera al
9 1,145008107 -0,579428585 valor de la hipótesis nula (H0=HOMOCEDASTICIDAD) que
10 2,969278354 -2,509602931 corresponde al valor de X2 igual a 11,0705 (valor tomado de la tabla
11 2,543108363 -2,488424848 "Chi Cuadrado X2, para un nivel de significancia de 0,05 y 06 Betas),
lo cual significa que en el modelo la varianza del error es diferente
12 1,346859912 -1,345862197
para cada valor de x, los errores son heterocedasticos, los
13 1,775794996 -1,348557537 estimadores MCO siguen insesgados y consistentes, bajo la
heterocedasticidad, los errores estándar de los estimadores están
En este punto expongo el encabezado y un número limitados de los
sesgados.
datos que en el total del análisis son 447.

¿Observa alguna mejora en la heteroscedasticidad?


Según el resultado obtenido, observamos que si existe una mejora en la heteroscedasticidad, teniendo en cuenta que la hipótesis
alterna (HI=HETEROCEDASTICIDAD) que para este caso le corresponde el Valor Crítico (VC) que es de 63, 3893 el cual es más
bajo que en el análisis anterior, pero que a un supera al valor de la hipótesis nula (H0=HOMOCEDASTICIDAD) que corresponde al
valor de X2 igual a 11,0705 (valor tomado de la tabla "Chi Cuadrado X2, para un nivel de significancia de 0,05 y 06 Betas), lo cual
significa que en el modelo la varianza del error es diferente para cada valor de x, los errores son heterocedasticos, los estimadores
MCO siguen insesgados y consistentes, bajo la heterocedasticidad, los errores estándar de los estimadores están sesgados.
También se observa una disminución en este supuesto de error debido a que las dos variables acogidas son mas dependientes la
una de la otra.
c) Cree diagramas de dispersión del salario sobre cada variable independiente.

Grafico de disperción - Salario sobre variables independientes


800000

700000

600000

500000

400000

300000

200000

100000

0
0 2000 4000 6000 8000 10000 12000 14000 16000 18000
-100000

totcomp Tenencia Años Ventas Ganancias Bienes

d) ¿Puede discernir qué variables contribuyen al problema?


Observando el diagrama de dispersión, podemos identificar que las variables bienes, “totcomp” son las más dispersas y
diferentes en el ejercicio que en la práctica es un modelo de regresión lineal, lo cual significa que son las que contribuyen al
error y aportan más residuos no normales al problema y estos no son constantes a lo largo de toda la muestra o perturbación
alrededor de la línea de regresión que va creciendo a medida los valores de la variable explicativa X crece, como se muestra
en el gráfico de dispersión anterior. Esto estaría en relación al desglosar la palabra “heterocedasticidad” en dos partes, hetero
(diferente) y cedasticidad (dispersión), de tal manera que obtendríamos “diferentes dispersiónes”.
e) ¿Qué propondría ahora para resolverlo?
En estadística se dice que un modelo de regresión lineal presenta heterocedasticidad cuando la varianza de los errores no es
constante en todas las observaciones realizadas. Esto implica el incumplimiento de una de las hipótesis básicas sobre las
que se asienta el modelo de regresión lineal. En tal sentido una solución utilizada habitualmente para resolver el problema de
la heterocedasticidad consiste en utilizar los estimadores calculados mediante el método de mínimos cuadrados ordinarios
(MCO) que fue utilizado para realizar el presente ejercicio.
Para otras situaciones se podrían utilizar funciones de varianza (varFunc) y estructuras de correlación (corStruct) para
corregir la heterocedasticidad y modelar dependencia de los errores, respectivamente.

También podría gustarte