Acunaregresionbook 1!40!46

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 7

Edgar Acuña Capítulo 1 Regresión Lineal Simple 34

EJERCICIOS

1. Considerando un modelo de regresión lineal simple, calcular Cov(Y ,  )
2. Probar que la línea de regresión estimada pasa por ( X , Y )
n
3. En un modelo de regresión lineal simple calcular E[SST]=E[  ( y i  y ) 2 ]
i 1
4. Regresión que pasa por el origen. Algunas veces se conoce de anteamano que la linea de
regresión pasa por el origen. Es decir el modelo es de la forma yi=xi+ei.
a) Hallar el estimador por cuadrados mínimos de . Cuál es su varianza?
b) Hallar el estimador de la varianza poblacional 2
c) Establecer la formula para un intervalo de confianza del 100(1-)% de confianza para 

   x 2
5. Probar que Cov(  ,  ) 
Sxx

6. En un estudio del desarrollo del conocimiento se registra la edad (X ) en meses) a la que 21


niños dicen su primera palabra y el puntaje en la prueba de Gessell (Y), un test de habilidad que toma
posteriormente el niño (ver datos Gessell en la página de internet del curso). Los resultados son como
siguen

Edad Puntaje Edad Puntaje


15 95 9 96
26 71 10 83
10 83 11 84
9 91 11 102
15 102 10 100
20 87 12 105
18 93 42 57
10 100 17 121
8 104 11 86
20 94 10 100
7 113

a) Hallar la linea de regresión. e interpretar los coeficientes de la linea de regresión


b) Trazar la linea de regresión encima del diagrama de puntos.
c) Probar la hipótesis de que la pendiente es cero. Comentar su resultado
d) Interpretar el coeficiente de determinación R2
e) Hallar un intervalo de confianza del 99% para la pendiente de la linea de regresión poblacional
f) Asigne un valor adecuado a la variable predictora y halle un intervalo de confianza del 95% para el
valor individual y valor medio de la variable de respuesta e intrepretar el resultado.

7. En un pueblo se eligen 15 personas al azar y se anota su salario mensual (X) , y la cantidad que
ahorran mensualmente (Y). Ambas cantidades están expresadas en dólares. (ver datos salarios en la
página de internet del curso).

Salario Ahorro
800 150
850 100
Edgar Acuña Capítulo 1 Regresión Lineal Simple 35

900 280
1200 400
1500 350
1700 500
1900 635
2000 600
2300 750
2500 680
2700 900
3000 800
3200 300
3500 1200
5000 1000

a) Hallar la linea de regresión. e interpretar los coeficientes de la linea de regresión


b) Trazar la linea de regresión encima del diagrama de puntos.
c) Interpretar el coeficiente de determinación
d)Probar la hipótesis de que la pendiente es cero. Comentar su resultado
e) Hallar un intervalo de confianza del 95% para la pendiente de regresión poblacional.
f) Asigne un valor adecuado a la variable predictora y halle un intervalo de confianza del 90 para el
valor individual y el valor medio de la variable de respuesta e intrepretar el resultado.

8. Leer el conjunto de datos brain que aparece en la página de internet del texto y considerar las
variables:
MRI (X), conteo en pixels del 18 scans de resonancia magnetica del cerebro de una persona
Score_IQ, (Y) score en un test de inteligencia.
Mientras más alto sea el conteo de pixels mas grande es el cerebro de las personas.

a) Hallar la linea de regresión ajustada. e interpretar los coeficientes de la linea de regresión


b) Trazar la linea de regresión encima del diagrama de puntos.
c) Probar la hipótesis de que la pendiente es cero (usando las pruebas t y F). Comentar su resultado
d) Interpretar el Coeficiente de Determinación.
e) Hallar un intervalo de confianza del 99% para la pendente de la regresion poblacional e
interpretar su resultado
f) Asigne un valor adecuado a la variable predictora y halle un intervalo de confianza del 90
porciento para el valor individual y el valor medio de la variable de respuesta e intrepretar el
resultado.

9.
a) Si Y=3.5-1.5X , SST=219 y SSE=59, hallar e interpretar el valor de la correlación entre X y Y
b) Considerando los datos dados en a) y que la muestra de entrenamiento consiste de 36 datos, hallar
el valor de la prueba estadística para probar que la pendiente de regresión es cero.

10. Considerando un modelo de regresión lineal simple, calcular

Cov(Yi  Yˆi , Yˆi  Y )

11. Probar que el coeficiente de correlación muestral r cae entre –1 y 1.

12. Suponga que en el modelo de regresión lineal simple los valores xi y yi son reemplazados por
axi+b y cyi+d respectivamente donde a,b,c y d son constantes tales que a≠0 y c≠0. Cuál es el efecto
Edgar Acuña Capítulo 1 Regresión Lineal Simple 36

de estas transformaciones en ̂ , ˆ , ˆ 2 , R2 y la prueba estadística para probar la hipótesis nula


Ho:=0.?

13. Considere el modelo de regresión lineal simple Y    X   , donde tanto X como Y y  son
variables aleatorias con varianzas  x2 ,  y2 y  2 respectivamente y xy representa la covarianza
entre X y Y. En la estimación mínimo cuadrática de  y  se minimiza la suma de cuadrados de las
distancias verticales de las observaciones a la linea ajustada. En Regresión Ortogonal la
estimación de  y  se hace considerando que la línea es ajustada de tal manera que se minimiza la
distancia más corta de las observaciones a la la linea ajustada. Hallar los estimadores de los
coeficientes de la regresión ortogonal.

14. Los siguientes datos fueron recolectados por el físico James Forbes para estimar indirectamente la
altura sobre el nivel del mar de acuerdo a las mediciones del punto de ebullición (boiling point) del
agua. (ver datos Forbes en la página de internet del curso).

Columna 1: Numero de la observación


Columna 2: Boiling Point( oF)
Columna 3: Pressure (in. Hg)
Columna 3: Log(Pressure)
Columna 4: 100*Log(Pressure)

1 194.5 20.79 1.3179 131.79


2 194.3 20.79 1.3179 131.79
3 197.9 22.40 1.3502 135.02
4 198.4 22.67 1.3555 135.55
5 199.4 23.15 1.3646 136.46
6 199.9 23.35 1.3683 136.83
7 200.9 23.89 1.3782 137.82
8 201.1 23.99 1.3800 138.00
9 201.4 24.02 1.3806 138.06
10 201.3 24.01 1.3804 138.04
11 203.6 25.14 1.4004 140.04
12 204.6 26.57 1.4244 142.44
13 209.5 28.49 1.4547 145.47
14 208.6 27.76 1.4434 144.34
15 210.7 29.04 1.4630 146.30
16 211.9 29.88 1.4754 147.54
17 212.2 30.06 1.4780 147.80

a) Hacer un diagrama de puntos de Pressure versus Boiling point. Piensa Ud. que hay una tendencia
lineal.
b) Hacer un diagrama de puntos de 100*log(Pressure) versus Boiling point. Piensa Ud. que se
observa mejor la tendencia lineal que en a)
c) Ajustar la linea de regresión de 100*log(Pressure) versus Boiling point. Trazar la linea sobre el
plot hallado en b). Comentar los coeficientes de regresión. Interpretar los “p-values” de la prueba
t y el de la prueba F.
d) Interpretar el Coeficiente de determinación R2
e) Obtener un intervalo de confianza del 99% para . Interpretar su resultado
f) Obtener un intervalo de confianza del 99% para el valor predicho y un intervalo de confianza para
el valor medio de 100*log(Pressure) cuando el Boiling Point es de 195 oF.
Edgar Acuña Capítulo 1 Regresión Lineal Simple 37

15. Los siguientes datos fueron recolectado para tratar de pronosticar el nivel del agua del rio Snake
en Wyoming. (ver datos River en la página de internet del curso).

Columna 1: Contenido de agua en la nieve caida hasta Abril 1, desde 1919 hast 1935
Colunna 2: Produccion de agua (en pulgadas) en el rio Snake, entre los meses de abril y julio.

23.1 10.5
32.8 16.7
31.8 18.2
32.0 17.0
30.4 16.3
24.0 10.5
39.5 23.1
24.2 12.4
52.5 24.9
37.9 22.8
30.5 14.1
25.1 12.9
12.4 8.8
35.1 17.4
31.5 14.9
21.1 10.5
27.6 16.1

a) Hacer un diagrama de puntos de la producción de agua versus cantidad de agua en la nieve.


Piensa Ud. que hay una tendencia lineal.
b) Ajustar la linea de regresión producción de agua versus cantidad de agua en la nieve. Trazar
la linea sobre el plot hallado en a). Comentar los coeficientes de regresión. Interpretar los “p-
values” de la prueba t y el de la prueba F.
c) Interpretar el Coeficiente de determinación R2.
d) Hallar un intervalo de confianza del 95% para la pendiente. Interpretar su resultado.
e) Obtener un intervalo de confianza del 95% para el valor predicho y un intervalo de confianza
para el valor medio de la producción de agua cuando la cantida de agua en la nieve es de un
35%.

16. Los siguientes datos fueron registrados en el río Amazonas (Iquitos, Perú) para observar si la
deforestación afecta los niveles del agua del río. (Ver datos Amazonas en la página de internet del
curso).

columna 1: año
columna 2: nivel de agua máximo (en metros) en el rio Amazonas en Iquitos
columna 3: nivel de agua mínimo (en metros) en el rio Amazonas en Iquitos

1962 25.82 18.24


1963 25.35 16.50
1964 24.29 20.26
1965 24.05 20.97
1966 24.89 19.43
1967 25.35 19.31
1968 25.23 20.85
1969 25.06 19.54
1970 27.13 20.49
1971 27.36 21.91
1972 26.65 22.51
Edgar Acuña Capítulo 1 Regresión Lineal Simple 38

1973 27.13 18.81


1974 27.49 19.42
1975 27.08 19.10
1976 27.51 18.80
1977 27.54 18.80
1978 26.21 17.57

a) Hacer un diagrama de puntos de Nivel máximo versus año, Nivel mínimo versus año y de Nivel
Máximo versus Nivel mínimo. Piensa Ud. que hay una tendencia lineal?.
b) Obtener la linea de regresion de Nivel máximo versus año, Nivel mínimo versus año y de Nivel
Máximo versus Nivel mínimo. Piensa Ud. que hay una tendencia lineal. Interpretar los
coeficientes y los “p-values” de la pruebas t y F.
c) Interpretar el Coeficiente de determinación R2 para cada una de las 3 regresiones.
d) Obtener un intervalo de confianza del 95% para el valor predicho y un intervalo de confianza para
el valor medio del nivel máximo del agua para el año 1980.

17. Los siguientes datos se han recolectado para explicar el rendimiento en millas por gallon de
varios modelos de carros.

Columna 1: Modelo de carro


Columna 2.VOL: Volumen de la cabina del carro.
Columna 3.HP: caballos de potencia del motor
Columna 4.MPG: millas promedio por galón
Columna 5 .SP: Velocidad máxima (mph)
Columna 6.WT: Peso de vehiculo (100 lb)

Modelo de carro VOL HP MPG SP WT

GM/GeoMetroXF1 89 49 65.4 96 17.5


GM/GeoMetro 92 55 56.0 97 20.0
GM/GeoMetroLSI 92 55 55.9 97 20.0
SuzukiSwift 92 70 49.0 105 20.0
DaihatsuCharade 92 53 46.5 96 20.0
GM/GeoSprintTurbo 89 70 46.2 105 20.0
GM/GeoSprint 92 55 45.4 97 20.0
HondaCivicCRXHF 50 62 59.2 98 22.5
HondaCivicCRXHF 50 62 53.3 98 22.5
DaihatsuCharade 94 80 43.4 107 22.5
SubaruJusty 89 73 41.1 103 22.5
HondaCivicCRX 50 92 40.9 113 22.5
HondaCivic 99 92 40.9 113 22.5
SubaruJusty 89 73 40.4 103 22.5
SubaruJusty 89 66 39.6 100 22.5
SubaruJusty4wd 89 73 39.3 103 22.5
ToyotaTercel 91 78 38.9 106 22.5
HondaCivicCRX 50 92 38.8 113 22.5
ToyotaTercel 91 78 38.2 106 22.5
FordEscort 103 90 42.2 109 25.0
HondaCivic 99 92 40.9 110 25.0
PontiacLeMans 107 74 40.7 101 25.0
IsuzuStylus 101 95 40.0 111 25.0
DodgeColt 96 81 39.3 105 25.0
GM/GeoStorm 89 95 38.8 111 25.0
HondaCivicCRX 50 92 38.4 110 25.0
Edgar Acuña Capítulo 1 Regresión Lineal Simple 39

HondaCivicWagon 117 92 38.4 110 25.0


HondaCivic 99 92 38.4 110 25.0
Subaru Loyale 102 90 29.5 109 25.0
VolksJettaDiesel 104 52 46.9 90 27.5
Mazda323Protege 107 103 36.3 112 27.5
FordEscortWagon 114 84 36.1 103 27.5
FordEscort 101 84 36.1 103 27.5
GM/GeoPrism 97 102 35.4 111 27.5
ToyotaCorolla 113 102 35.3 111 27.5
EagleSummit 101 81 35.1 102 27.5
NissanCentraCoupe 98 90 35.1 106 27.5
NissanCentraWagon 88 90 35.0 106 27.5
ToyotaCelica 86 102 33.2 109 30.0
ToyotaCelica 86 102 32.9 109 30.0
ToyotaCorolla 92 130 32.3 120 30.0
ChevroletCorsica 113 95 32.2 106 30.0
ChevroletBeretta 106 95 32.2 106 30.0
ToyotaCorolla 92 102 32.2 109 30.0
PontiacSunbirdConv 88 95 32.2 106 30.0
DodgeShadow 102 93 31.5 105 30.0
DodgeDaytona 99 100 31.5 108 30.0
EagleSpirit 111 100 31.4 108 30.0
FordTempo 103 98 31.4 107 30.0
ToyotaCelica 86 130 31.2 120 30.0
ToyotaCamry 101 115 33.7 109 35.0
ToyotaCamry 101 115 32.6 109 35.0
ToyotaCamry 101 115 31.3 109 35.0
ToyotaCamryWagon 124 115 31.3 109 35.0
OldsCutlassSup 113 180 30.4 133 35.0
OldsCutlassSup 113 160 28.9 125 35.0
Saab9000 124 130 28.0 115 35.0
FordMustang 92 96 28.0 102 35.0
ToyotaCamry 101 115 28.0 109 35.0
ChryslerLebaronConv 94 100 28.0 104 35.0
DodgeDynasty 115 100 28.0 105 35.0
Volvo740 111 145 27.7 120 35.0
FordThunderbird 116 120 25.6 107 40.0
ChevroletCaprice 131 140 25.3 114 40.0
LincolnContinental 123 140 23.9 114 40.0
ChryslerNewYorker 121 150 23.6 117 40.0
BuickReatta 50 165 23.6 122 40.0
OldsTrof/Toronado 114 165 23.6 122 40.0
Oldsmobile98 127 165 23.6 122 40.0
PontiacBonneville 123 165 23.6 122 40.0
LexusLS400 112 245 23.5 148 40.0
Nissan300ZX 50 280 23.4 160 40.0
Volvo760Wagon 135 162 23.4 121 40.0
Audi200QuatroWag 132 162 23.1 121 40.0
BuickElectraWagon 160 140 22.9 110 45.0
CadillacBrougham 129 140 22.9 110 45.0
CadillacBrougham 129 175 19.5 121 45.0
Mercedes500SL 50 322 18.1 165 45.0
Mercedes560SEL 115 238 17.2 140 45.0
JaguarXJSConvert 50 263 17.0 147 45.0
BMW750IL 119 295 16.7 157 45.0
Rolls-RoyceVarious 107 236 13.2 130 55.0
Edgar Acuña Capítulo 1 Regresión Lineal Simple 40

a) Hacer un diagrama de puntos de MPG versus HP. Piensa Ud. que hay una tendencia lineal.
b) Ajustar la linea de regresión de MPG versus HP. Trazar la linea sobre el plot hallado en a).
Comentar los coeficientes de regresión. Interpretar los “p-values” de la prueba t y el de la prueba
F.
c) Interpretar el Coeficiente de determinación R2
d) Obtener un intervalo de confianza del 99% para . Interpretar su resultado
e) Obtener un intervalo de confianza del 90% para el valor predicho y un intervalo de confianza para
el valor medio de MPG cuando HP=100.
f) Hacer un diagrama de puntos de MPG versus WT. Piensa Ud. que hay una tendencia lineal.
g) Ajustar la linea de regresión de MPG versus WT. Trazar la linea sobre el plot hallado en a).
Comentar los coeficientes de regresión. Interpretar los “p-values” de la prueba t y el de la prueba
F.
h) Interpretar el Coeficiente de determinación R2
i) Obtener un intervalo de confianza del 99% para . Interpretar su resultado
j) Obtener un intervalo de confianza del 90% para el valor predicho y un intervalo de confianza para
el valor omedio de MPG cuando WT=35.

18.
a) Si Y=3.5-1.5X , SST=219 y SSE=59, hallar e interpretar el valor de la correlación entre X y Y
b) Considerando los datos dados en a) y que la muestra de entrenamiento consiste de 36 datos, hallar
el valor de la prueba estadística para probar que la pendiente de regresión es cero.

19.Considere que (X,Y) tiene una distribución normal bivariada con parámetros x, y, x , y y el
coeficiente de correlación . Probar que

y
a)La media condicional de Y dado X es E (Y / X )    x . Donde    , y    y   x .
x
Notar que si la pendiente de la línea de regresión es cero entonces la correlación es 0, y que  y 
varian en la misma dirección.

b)La varianza condicional de las Y dado X, está dado por  y2 / x   y2 (1   2 ) . Luego, si   1 ,


entonces  y / x  0 , implicando que hay una perfecta relación lineal entre Y y X. Más
2

especificamente, si   1 , entonces X y Y crecen en la misma dirección y si   1 , Y decrece


cuando X crece.

También podría gustarte