Trabajo (Heteroscedasticidad)
Trabajo (Heteroscedasticidad)
Trabajo (Heteroscedasticidad)
ALUMNO:
LARREA GUZMÁN, RAÚL ALEJANDRO
AREQUIPA - PERÚ
2021
HALLAR LA PRESENCIA DE HETEROCEDASTICIDAD
Y X
Ei, σi, Primero realizamos la regresión como ya conocemos…
rendimiento desviación
promedio estándar del
anual, rendimiento
% anual, %
12.4 12.1
14.4 21.4
14.6 18.7
16 21.7
11.3 12.5
10 10.4
16.2 20.8
10.4 10.2
13.1 16
11.3 12
1 Establezca si las siguientes afi rmaciones son verdaderas, falsas o inciertas y comente sus
razones brevemente:
c) En presencia de heteroscedasticidad, el método de MCO habitual siempre sobreestima los errores estándar de l
1 -> Luego, al mostrar heterocedasticidad, el modelo pierde eficiencia.
d) Si los residuales estimados mediante una regresión por MCO exhiben un patrón sistemático, significa que hay h
1 -> El patrón en el residual de MCO es un signo de la existencia de heterocedasticidad.
e) No hay una prueba general de heteroscedasticidad que no esté basada en algún supuesto acerca de cuál variab
0 -> La prueba de White se basa en este principio.
f ) Si el modelo de regresión está mal especifi cado (por ejemplo, si se omitió una variable importante), los residuo
1 -> Debido a un error de especificación, se implementó un modo constante en el modelo.
g) Si una regresora con varianza no constante se omite (incorrectamente) de un modelo, los residuos (MCO) serán
1 -> Al igual que en el punto anterior, la omisión de variables genera problemas de heteroce
neficientes.
e vuelven ineficientes.
a) Residuos
d) Correlación
iste heteroscedasticidad en
e hay correlación entre la
os.
iste heteroscedasticidad en
e hay correlación entre la
os.
a)
c)
podemos ver que los valores p de esta regresión entre los errores al cuadrado
y las X nos dan a conocer que en la mayoría de las variables podemos
encontrar presencia de heteroscedasticidad (a excepción de la variable VOL).
Por lo que podemos decir que de acuerdo a la prueba White este modelo no
es válido.
> cor(data1)
> vif(modelo2)
Analizamos la heteroscedasticidad
La ecuación (3.2.2) establece que la varianza de ui para cada Xi (es decir, la varianza condicional de ui) es algún número
constante igual a σ2. Técnicamente, la ecuación (3.2.2) representa el supuesto de homoscedasticidad, o igual (homo) d
(cedasticidad), o igual varianza. La palabra proviene del verbo griego skedanime, que significa dispersar o esparcir. Plan
forma, (3.2.2) significa que las poblaciones Y correspondientes a diversos valores de X tienen la misma varianza. En térm
variación alrededor de la línea de regresión (la línea de la relación promedio entre X y Y) es la misma para todos los valo
aumenta ni disminuye conforme varía X. En el diagrama de la fi gura 3.4 se aprecia esta situación.
De ella se deriva que los datos con los que se trabaja son heterogéneos, ya que provienen de distribuciones de probabi
Existen diferentes razones o situaciones en las que cabe encontrarse con perturbaciones heteroscedásticas.
1 Naturaleza de la heteroscedasticidad
1
0 4
9
2 CAUSAS
Aunque ya establecimos que, en caso de heteroscedasticidad, son los MCG y no los MCO los que son MELI,
4 Detección de la heteroscedasticidad
La prueba de White
El test de Breusch-Pagan
La prueba de Glejser
La prueba de Park
La prueba de Goldfeld-Quandt
Métodos informales
Naturaleza del problema
Método gráfico
Métodos formales SI SON SIGNIFICATIVOS LOS ESTADISTICOS A ESTIMAR , ENTONCES HAY HETEROCED
EN ESE CASO SE ACEPTA LA H1 Y SE RECHAZA LA H0
1 Prueba de Park
1. SIMILAR A LA P. DE PARK
2. sugiere una regresión sobre los valores absolutos de ˆui sobre la variable X
3. Si β resulta estadísticamente signifi cativo, esto sugerirá heteroscedasticidad en los datos.
Si resulta no signifi cativo, podemos aceptar el supuesto de homoscedasticidad.
INTERPRETACION:
Como se aprecia de esta regresión, no hay relación entre el valor absoluto de los residuos y la
regresora, la productividad promedio. Lo anterior refuerza la conclusión basada en la prueba
de Park. NO HAY HETEROCEDASTICIDAD
y luego …
REGLA DE DECISIÓN:
tc > tt HETEROCEDASTICIDAD
tc < tt HOMOCEDASTICIDAD
CASO:
Para ilustrar la prueba de correlación de orden, considere los datos, que corresponden
al rendimiento anual promedio (E, %) y la desviación estándar del rendimiento anual
(σi,%) de 10 fondos de inversión
Paso 1 Paso 2
Ei, σi,
rendimiento desviación
promedio estándar del
anual, rendimiento excel* excel* Ordenación Ordenación
Ei, σi,
% anual, % de σi de |uˆi|
RESIDUOS RESIDUOS
0.95735548
HALLAR EL r DE SPEARMAN
r s = 0.3333
tc = 1.0000
tt = 2.30600
INTERPRETACION:
Como se aprecia de esta regresión, no hay relación entre el valor absoluto de los resid
NO HAY heterocedasticidad
4 Prueba de Goldfeld-Quandt signifi caría que σ2i sería mayor mientras mayores fueran los valores de
Paso 1. Ordene las observaciones de acuerdo con los valores de Xi, a partir del valor más bajo de X
Paso 2. Omita las c observaciones centrales, donde c se especifi có a priori, y divida las observacion
restantes (n − c) en dos grupos, cada uno de (n − c)/2 observaciones.
Paso 3. Ajuste regresiones MCO separadas a las primeras (n − c)/2 observaciones y a las
últimas (n − c)/2 observaciones, y obtenga las respectivas sumas de cuadrados residuales
SCR1 y SCR2; SCR1 representa la SCR de la regresión correspondiente a los valores más
bajos de Xi (el grupo de varianza pequeña), y SCR2, a los valores más grandes de Xi (el
grupo de varianza grande). Cada SCR tiene
Paso 4. Calcule la razón
Si en una aplicación λ (_x0002_ F) calculada es superior al F crítico en el nivel de signifi cancia sele
podemos rechazar la hipótesis de homoscedasticidad, es decir, podemos afi rmar que
la heteroscedasticidad es muy probable
CASO
Para ilustrar la prueba de Goldfeld-Quandt presentamos en la tabla 11.3 información sobre el
gasto de consumo en relación con el ingreso de una muestra transversal de 30 familias. Suponga
que postulamos que el gasto de consumo está relacionado linealmente con el ingreso pero que
hay heteroscedasticidad en los datos. Postulamos además que la naturaleza de la heteroscedasticid
es como la de (11.5.10). En la tabla 11.3 presentamos también el reordenamiento
necesario de los datos para aplicar la prueba.
Fc = 4.07460
Ft = 2.82000
2.81793
INTERPRETACION:
El valor F crítico para 11 gl en el numerador y 11 gl en el denominador e
2.82. Como el valor F(= λ) estimado excede al valor crítico, podemos con
en la varianza del error.
5 Prueba Breusch-Pagan-Godfrey
Por consiguiente, si en una aplicación el (= χ2) calculado excede al valor crítico χ2 en
el nivel de signifi cancia seleccionado, se rechaza la hipótesis de homoscedasticidad; de lo
contrario, no se rechaza.
CASO: A manera de ejemplo, reconsidere la información (tabla 11.3) para ilustrar la prueba de heterosced
de Goldfeld-Quandt. Al efectuar la regresión de Y sobre X, obtenemos lo siguiente:
PASO: 1
PASO: 2
˜σ2 = 78.7051083
ch2 c = 5.2140
ch2 t = 5.9915
INTERPRETACION:
Con los supuestos de la prueba BPG, ji
cuadrada con 1 gl. Ahora, de la tabla ji cuadrada
vemos que, para 1 gl, el valor crítico de ji cuadrada en 5% es 3.8414, y el valor χ2 críti
1% es 6.6349. Por tanto, el valor observado ji cuadrada de 5.2140 es signifi cativo en e
signifi cancia de 5% pero no en el nivel de 1%.
E DECISIÓN:
ENTONCES SIGNIFICA QUE LOS NUEVOS BETAS DE
CEDASTICIDAD LA REGRESIÓN DE LOS ERRORES NO DEBEN SER
OCEDASTICIDAD SEGNIFICATIVOS
de los residuos y la
sada en la prueba
ene los valores |ˆu i|
l coefi ciente de correlación de orden de Spearman dado antes.
s es cero y n > 8,
nte manera:
esis de heteroscedasticidad;
rresponden
d,
diferencia
entre las
dos
ordenacione d^2
s Análisis de los residuales
5 25
1 1 Observación
Pronóstico para YResiduos
-3 9 1 11.3728251 1.0271749
-5 25 2 15.6411373 -1.24113733
1 1 3 14.4019499 0.19805009
5 25 4 15.7788248 0.22117518
0 0 5 11.5564084 -0.25640842
2 4 6 10.592596 -0.59259599
-4 16 7 15.3657623 0.83423765
-2 4 8 10.5008043 -0.10080432
9 13.1627625 -0.06276249
10 11.3269293 -0.02692927
lor absoluto de los residuos y la
ciones y a las
dos residuales
valores más
formación sobre el
30 familias. Suponga
el ingreso pero que
a de la heteroscedasticidad
gl en el denominador en el nivel de 5% es
or crítico, podemos concluir que hay heteroscedasticidad
a prueba de heteroscedasticidad
ch2 c = 5.21
ch2 c > ch2 t heteroscedasticidad ch2 t = 5.99
gl = se refiere al nro de variables INTERPRETACIÓN
COMO EL CH2 C>CH2 T, ENTONCES SI HAY HETEROCEDASTICIDAD
SE ACEPTA LA HIPOTESIS ALTERNATIVA
H0 = Fc < Ft HOMOCEDASTICIDAD
H1 = Fc > Ft HETEROCEDASTICIDAD
.8414, y el valor χ2 crítico en
140 es signifi cativo en el nivel de
que los individuos o empresas o unidades económicas no suelen tener un comportamiento homogéneo.
O ES SIGNIFICATIVA) Según la prueba
Y HETEROCEDASTICIDAD
Table 11.1
Compensation Per Employee ($) in Nondurable Manufacturing
Industries According to Employment Size of Establishment, 1958
IND = Industry
where: 1=Food and Kindred Products
2=Tobacco Products
3=Textile Mill Products
4=Apparel and Related Products
5=Paper and Allied Products
6=Printing and Publishing
7=Chemicals and Allied Products
8=Petroleum and Coal Products
9=Rubber and Plastic Products
10=Leather and Leather Products
11=Average Compensation
12=Standard Deviation
13=Average Productivity
EMPLOYMENT SIZE = Average Number of Employees
where: A=1 to 4
B=5 to 9
C=10 to 19
D=20 to 49
E=50 to 99
F=100 to 249
G=250 to 499
H=500 to 999
I=1000 to 2499
IND A B C D E F
1 2994 3295 3565 3907 4189 4486
2 1721 2057 3336 3320 2980 2848
3 3600 3657 3674 3437 3340 3334
4 3494 3787 3533 3215 3030 2834
5 3498 3847 3913 4135 4445 4885
6 3611 4206 4695 5083 5301 5269
7 3875 4660 4930 5005 5114 5248
8 4616 5181 5317 5337 5421 5710
9 3538 3984 4014 4287 4221 4539
10 3016 3196 3149 3317 3414 3254
11 3396.00 3787.00 4013.00 4104.00 4146.00 4241.00
12 743.70 851.40 727.80 805.06 929.90 1080.60
13 9355.00 8584.00 7962.00 8275.00 8389.00 9418.00
Resumen
Estadísticas de la regresión
Coeficiente de c0.66143822877
Coeficiente de 0.43750053047
R^2 ajustado 0.3571434634
Error típico 337.226396881
Observaciones 9
ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadrados F
Regresión 1 619152.500729 619152.500729 5.44445618037
Residuos 7 796051.499271 113721.642753
Total 8 1415204
2
ABSOLUTO
DE
salario produccion modelresid RESIDUOS
3396.00 9355.00 (775.6579) 775.66
3787.00 8584.00 (205.0481) 205.05
4013.00 7962.00 165.8512 165.85
4104.00 8275.00 183.9356 183.94
4146.00 8389.00 199.3785 199.38
4241.00 9418.00 54.6658 54.67
4387.00 9795.00 112.8410 112.84
4538.00 10281.00 150.6239 150.62
4843.00 11750.00 113.4100 113.41
Resumen
-0.0203402721
G H I
4676 4968 5342
3072 2969 3822
3225 3163 3168
2750 2967 3453
5132 5342 5326
5182 5395 5552
5630 5870 5876
6316 6455 6347
4721 4905 5481
3177 3346 4067
4387.00 4538.00 4843.00 salario
1243.20 1307.70 1112.50
9795.00 10281.00 11750.00 produccion
modelresid ln y ln x
(775.6579) 601,645.22 13.3074232223 9.14366623871
(205.0481) 42,044.72 10.6464889764 9.05765528431
165.8512 27,506.61 10.2221816399 8.98243550356
183.9356 33,832.32 10.4291717189 9.02099420025
199.3785 39,751.80 10.5904103574 9.03467660285
54.6658 2,988.35 8.00247565609 9.1503780308
112.8410 12,733.09 9.45195931916 9.18962733038
150.6239 22,687.55 10.0295717371 9.23805281054
113.4100 12,861.84 9.46201984706 9.37160851957
-2.8010281109 35.8172962928
Valor crítico de F
0.0523561127
-1.4005140554 17.9086481464
407.345543679
Table 11.3 3
Hypothetical Data on Consumption Expenditure and Income
Y = Consumption Expenditure, $
X = Income, $
RY = Consumption Expenditure Ranked by X Values
RX = Ranked Income
Y X RY RX
55 80 55 80 1
65 100 70 85 2
70 85 75 90 3
80 110 65 100 4
79 120 74 105 5
84 115 80 110 6
98 130 84 115 7
95 140 79 120 8
90 125 90 125 9
75 90 98 130 10
74 105 95 140 11
110 160 108 145 12
113 150 113 150 13
125 165 110 160
108 145 125 165
115 180 115 180
140 225 130 185
120 200 135 190 1
145 240 120 200 2
130 185 140 205 3
152 220 144 210 4
144 210 152 220 5
175 245 140 225 6
180 260 137 230 7
135 190 145 240 8
140 205 175 245 9
178 265 189 250 10
191 270 180 260 11
137 230 178 265 12
189 250 191 270 13
Table 11.7
Passenger Car Mileage Data
CF MPG VM VOL WT SP
IND = Industry
where: 1=Food and Kindred Products
2=Tobacco Products
3=Textile Mill Products
4=Apparel and Related Products
5=Paper and Allied Products
6=Printing and Publishing
7=Chemicals and Allied Products
8=Petroleum and Coal Products
9=Rubber and Plastic Products
10=Leather and Leather Products
11=Average Compensation
12=Standard Deviation
13=Average Productivity
EMPLOYMENT SIZE = Average Number of Employees
where: A=1 to 4
B=5 to 9
C=10 to 19
D=20 to 49
E=50 to 99
F=100 to 249
G=250 to 499
H=500 to 999
I=1000 to 2499
IND A B C D E F G
1 2994 3295 3565 3907 4189 4486 4676
2 1721 2057 3336 3320 2980 2848 3072
3 3600 3657 3674 3437 3340 3334 3225
4 3494 3787 3533 3215 3030 2834 2750
5 3498 3847 3913 4135 4445 4885 5132
6 3611 4206 4695 5083 5301 5269 5182
7 3875 4660 4930 5005 5114 5248 5630
8 4616 5181 5317 5337 5421 5710 6316
9 3538 3984 4014 4287 4221 4539 4721
10 3016 3196 3149 3317 3414 3254 3177
11 3396 3787 4013 4014 4146 4241 4387
12 743.7 851.4 727.8 805.06 929.9 1080.6 1243.2
13 9355 8584 7962 8275 8389 9418 9795
H I
4968 5342
2969 3822
3163 3168
2967 3453
5342 5326
5395 5552
5870 5876
6455 6347
4905 5481
3346 4067
4538 4843
1307.7 1112.5
10281.00 1 1750