3ra Unidad Laboratorio
3ra Unidad Laboratorio
3ra Unidad Laboratorio
En los
datos que se presentan en la tabla siguiente se da la temperatura (°F) y el precio ($) de 11
modelos de sacos de dormir fabricados por Bergans (Backpacker 2006 Gear Guide)
a) Trace un diagrama de dispersión con estos datos, en el que la variable independiente
sea la temperatura (°F).
b) ¿Qué indica el diagrama de dispersión del inciso? respecto a la relación entre
temperatura y precio?
c) Use el método de mínimos cuadrados para obtener la ecuación de regresión estimada.
d) Prediga cuál será el precio de un saco de dormir si el índice de temperatura (°F) es 20.
e) Dé una estimación puntual del precio de un saco de dormir cuya temperatura sea 30.
f) Dé un intervalo de 95% de confianza para el precio medio de todos los sacos de dormir
cuya temperatura sea 30.
g) Suponga que Bergans elabora un nuevo modelo cuya temperatura es 30. Dé un
intervalo de predicción de 95% para el precio de este nuevo modelo.
h) Pruebe la normalidad de los errores utilizando la prueba de Jarque bera
SOLUCIÓN: a)
Diagrama de dispersión
450
400
350
300
DEPENDIENTE
250
VARIABLE
200
)
150
Y
R² = 0.8043
100
50
(
0
0 5 10 15 20 25 30 35 40 45 50
X(VARIABLE )
INDEPENDIENTE
Variable Variable
Dependiente Independiente
b) Y X
Precio Temperatura
319 12
289 24
389 3
239 13
149 38
289 4
359 5
259 15
229 25
129 45
199 25
-Entre mayor sea la temperatura a la que estará expuesto el saco, menor será su
precio, teniendo en cuenta que la temperatura es medida en grados sobre 0.
Pendiente
12 319 -420.00 49.00 3600.00 144.00 101761.00 3828.00
24 289 150.00 25.00 900.00 576.00 83521.00 6936.00
3 389 -2080.00 256.00 16900.00 9.00 151321.00 1167.00
13 239 120.00 36.00 400.00 169.00 57121.00 3107.00
38 149 -2090.00 361.00 12100.00 1444.00 22201.00 5662.00
4 289 -450.00 225.00 900.00 16.00 83521.00 1156.00
804091.0
209.00 2849.00 -10090.00 1912.00 66200.00 5883.00 0 44041.00
= 19.00 = 259.00
= 13.8275 =
81.3634
PENDIENTE:
b = -5.2772
Ordenada al origen
= 359.2667
Y=359.2667 5.2772
d)
X= 20
y=253.7228
e)
X= 30
Y=200.9508
-Una estimación puntual del precio de un saco de dormir cuya temperatura
es 30 es de S/200.95
ESTIMACIÓN DE LA VARIANZA DE b
ERROR ESTANDAR DE b
DATOS:
N.C=0.95
α=0.05
F.L error=9
Error estándar de b=0.87
b=-5.28
=2.262
𝟕. 𝟐𝟑𝟗𝟗 ≤ 𝜷 ≤ 𝟑. 𝟑𝟏𝟒5
−5.28
T cal=
0.8676
T cal=−6.0825
T cal=T α / 2 ,GL =T 0.05/ 2.9=2.262
Decisión: Se acepta la HO
Conclusión: No existe regresión significativa entre ambas variables
Anova para β
Hipotesís:
HO : β = 0
H1 : β ≠ 0
SCT=66200
SCREGRESION=5324.91
SCResidual=12953.09
G.L TOTAL = 10 Gl REGRESION=1
GLERROR=9
ANALISIS DE
VARIANZA PARA b
CAUSA MEDIA
SUMA DE
DE DE LOS
G.L. CUADR
VARIAC CUADR Fta
ADOS
IÓN ADOS Fcal b
5.
Regresión 1
53246.91 53246.91 37.00 12
Residual 9 12953.09 1439.23
TOTAL 10 66200.00
INTERVALOS DE ESTIMACIÓN
=200.951
n=11
=19
S=37.937
Sxx =1912
=0.05
GL=9
TTab=2.262
Nos dan : 30
DATOS:
a=359.267
b=-5.277
xo=30
=200.951
n=11
=19
S=37.937
Sxx =1912
=0.05
GL=9
TTab=2.262
108.75 ≤ ⁄ ≤ 293.15
Hipotesís:
HO: La distribución de los errores de los datos se aproxima a una
normal
H1: La distribución de los errores de los datos no se aproxima a una
normal
DATOS:
n=11
G.L=2
tperiodo=11
𝜶=0.05
𝑿𝟐𝑻𝒂𝒃=5.991
RESID e2 e3 e4
UOS e
K =1.9003
JB =0.5562
CORRELACIÓN
COEFICIENTE DE DETERMINACIÓN
Coeficiente de determinación muestral
Ajustado
INFERENCIAS ACERCA DE ρ
Hipotesís:
HO : ρ = 0
H1 : ρ ≠ 0
DATOS:
r=-0.8968
r2=0.8043
n=11
α=0.05
G.L=9
√ 1−r √
T tab=2.262 T cal=r n−22 T cal=−0.8968
Conclusión: No es significativo
2) Aunque actualmente en los aeropuertos grandes los retrasos son menos
frecuentes, es útil saber en qué aeropuertos es más probable que le echen a
perder a uno sus planes. Además, si su vuelo llega con retraso a un
determinado aeropuerto en el que tiene que hacer un trasbordo, ¿cuál es la
probabilidad de que se retrase la salida y que pueda hacer así el trasbordo? En
la tabla siguiente se muestra el porcentaje de llegadas y salidas retrasadas
durante el mes de agosto en 13 aeropuertos (Business 2.0, febrero 2002).
a)Trace un diagrama de dispersión con estos datos, en el que la variable
independiente sean las llegadas retrasadas.
b)¿Qué indica el diagrama de dispersión del inciso a) respecto a la
relación entre llegadas retrasadas y salidas retrasadas?
c)Use el método de mínimos cuadrados para obtener la ecuación de
regresión estimada.
d)Pruebe la normalidad de los errores utilizando la prueba de Jarque
bera
e)¿Cómo se debe interpretar la pendiente de la ecuación de regresión
estimada?
f)Suponga que en el aeropuerto de Filadelfia hubo 22% de llegadas
retrasadas. ¿Cuál es el porcentaje estimado de salidas retrasadas?
SOLUCIÓN:
a)
Diagrama de
35 dispersión
30
25
DEPENDIENTE
20
YVARIABLE
)
15
10
(
0
0 5 10 15 20 25 30 35
X(VARIABLE )
INDEPENDIENTE
Y X
Salidas Llegadas
retrasadas retrasadas
22 24
20 20
29 30
19 20
22 20
23 23
19 18
16 20
18 18
22 21
22 25
17 18
16 16
c)
Linea recta de mejor ajuste
Ordenada al origen
Pendiente
Pendiente
b = 0.8554
Ordenada al origen
a = 2.4208
Y=2.42208+0.8554x
TABLA DE RESIDUALES
Y= 2.4208 0.8554 x
PRONOSTICO 𝑒
RESIDUO ̅
S
22.95 -0.95 6.59
19.53 0.47 0.73
28.08 0.92 59.27
19.53 -0.53 0.73
19.53 2.47 0.73
22.10 0.90 2.93
17.82 1.1 6.59
19.53 8
-3.53 0.73
17.82 0.18 6.59
20.38 1.62 0.00
23.81 -1.81 11.7
17.82 -0.82 1
6.59
16.1 -0.11 18.29
1
1.00
RESIDU
0.00
0.00 5.00 10.00 15.00 20.00 25.00 30.0
OS
-1.00
-2.00
-3.00
-4.00
X
ESTIMACIÓN DE LA VARIANZA DE LA
REGRESIÓN POBLACIONAL
ESTIMACIÓN DE LA VARIANZA DE b
ERROR ESTANDAR DE b
DATOS
0. N.C 0.95
0.05
G.L error 11
Error
0.13
estandar de b
b 0.86
2.201
Hipotesís:
HO : β = β 0
H1 : β ≠ β0
Decisión: Se rechaza la
Conclusión: Existe regresión significativa entre ambas variables
Anova para
Hipotesís:
HO : β = 0
H1 : β ≠ 0
SCT=151.08
scrEGRESIÓN=121.47
SCResidual=29.61
G.L G.L.
G.L TOTAL
12 Regresión 1 Residual 11
ANALISIS DE
VARIANZA PARA b
CAUSA MEDIA DE
SUMA DE
DE LOS
G.L. CUADRAD
VARIACI CUADRAD
OS
ÓN OS Fcal Ftab
RESIDU e2 e3 e4
OS e
K= 3.1823
JB = 0.9206
f)
X= 22%
Y = 21.2400
Diagrama de
4500 dispersión
4000
3500
DEPENDIENTE
3000
YVARIABLE
2500
)
2000
1500
1000
500
(
0
0 0.5 1 1.5 2 2.5 3 3.5 4
X(VARIABLE )
INDEPENDIENTE
a)
Anova para
Hipotesís:
HO : β = 0
H1 : β ≠ 0
SCT=335000
SCRegresión=249864.86
SCResidual=85135.14
G.L G.L.
G.L TOTAL
5 Regresión 1 Residual 4
ANALISIS DE
VARIANZA PARA b
CAUSA MEDIA DE
SUMA DE
DE LOS
G.L. CUADRAD
VARIACI CUADRAD
OS
ÓN OS Fcal Ftab
b) COEFICIENTE DE DETERMINACIÓN
Coeficiente de determinación muestral
Ajustado
INFERENCIAS ACERCA DE ρ
Hipotesís:
HO : ρ = 0
H1 : ρ ≠ 0
Datos:
r=0.8636
r2=0.7459
n=6
=0.05
G.L=4
Ttab=2.776
T cal=r
√ n−2
1−r √
2 T cal =0.8636
6−2
1−0.7459
T cal=3.4263
Nueva Hipotesís:
HO: ρ = 0.9
H1: ρ > 0.9
Zcal = -0.2853
Ztab = 1.6449
Decisión: Se acepta la y se rechaza la
Conclusión: Se concluye que no hay evidencia de que el
coeficiente de correlación poblacional excede el valor 0.9
INTERVALOS DE ESTIMACIÓN
Nos dan :3
DATOS
a 1790.541
b 581.081
x0 3
3533.784
n 6
= 3.200
S 145.890
Sxx 0.74
0.05
G.L. 4
3343.49 3724.08
INTERPRETACIÓN: Esto quiere que decir que si el promedio
obtenido por los estudiantes que terminaron la licenciatura de
administración con especialidad en sistemas de información
(Variable independiente) es de 3, se estima que los salarios (Variable
dependiente) se encuentra entre 3343.49 y 3724.08 dólares con un
nivel de confianza de 95%
Nos dan :3
DATOS
a 1790.54
1
b 581.081
x0 3
3533.784
n 6
= 3.200
S 145.890
Sxx 0.74
0.05
G.L 4
.
TT 2.776
ab
𝟏 𝒙𝟎 ̅𝒙 𝟐 𝟏
𝒚̅𝒊 𝒕𝒐 𝑺√𝟏 ≤𝒖𝒀⁄𝑿 ≤𝒚̅𝒊 𝒕𝒐 𝑺√𝟏
𝒏 𝑺𝑿𝑿 𝒏
𝑺𝑿𝑿
𝟏 𝟑 𝟑. 𝟐 𝟐
𝟑 𝟑.𝟐 𝟐
𝟑𝟓𝟑𝟑. 𝟕𝟖 𝟐. 𝟕𝟕𝟔 𝟏𝟒𝟓.𝟖𝟗√𝟏 ≤ 𝒖𝒀⁄𝑿 ≤ 𝟑𝟓𝟑𝟑. 𝟕𝟖 𝟐.𝟕𝟕𝟔 𝟏𝟒𝟓. 𝟖𝟗√
𝟔 𝟎. 𝟕𝟒
𝟎. 𝟕𝟒
3086.25 ≤ ⁄ ≤ 3981.31
SOLUCIÓN:
Diagrama de
4500 dispersión
4000
3500
3000
DEPENDIENTE
2500
YVARIABLE
)
2000
1500
1000
(
500
0
0 10 20 30 40 50 60 70
X(VARIABLE )
INDEPENDIENTE
Variable
Variable
Independient
Dependiente
e
Y X
Puntuación en la
Precio E.
2800 62
2800 53
2700 44
3500 50
3300 54
2000 39
4000 66
3000 55
2500 34
3000 39
333.0
496.00 0 256.20 982.40 25584.00 13025.00
= 49.60 = 33.30
= 10.4478 = 14.66
70
Pen
d
i
e
n
t
e
b = 0.2608
Ordenada al origen
a = 20.3648
Línea recta de mejor ajuste
20.3648 0.2608
TABLA DE
RESIDUALES
Y 20.3648 0.2608x
= PRONOSTI RESIDU
𝑒 ̅
CO OS
36.53 - 10.4
18.53 6
34.1 - 0.79
9 12.19
31.8 -2.84 2.1
4 3
33.40 -0.40 0.0
1
34.45 4.55 1.3
2
30.54 19.4 7.64
6
37.58 27.42 18.2
9
34.7 - 1.9
1 13.7 8
29.23 -5.23
1 16.5
30.54 1.4 7.64
6
333.00 0.0000 66.8
1
GRAFICO DE LOS
30.00 RESIDUALES
20.00
10.00
RESIDU
0.00
OS
0.00 5.00 10.00 15.00 20.00 25.00 30.00 35.00 40.00
-10.00
-20.00
-30.00
X
b) CORRELACIÓN
𝑆
𝑟
𝑆 𝑆 √
256.20
𝑟
1379.14
12191.85
SOLUCIÓN:
a)
Diagrama de
8000 dispersión
7000
6000
DEPENDIENTE
5000
YVARIABLE
)
4000
3000
2000
(
1000
0
0 100 200 300 400 500 600 700 800
X(VARIABLE )
INDEPENDIENTE
Variable Variable
Dependiente Independiente
Y X
Volumen de
Costos totales producción
4000 400
5000 450
5400 550
5900 600
6400 700
7000 750
Ordenada al origen
Pendiente
16000000.
400 4000 282916.67 30625.00 2613611.11 160000.0000 1600
25000000.0 225
450 5000 77083.33 15625.00 380277.78 202500.00 0 0
29160000. 297
550 5400 5416.67 625.00 46944.44 302500.00 00 0
34810000. 354
600 5900 7083.33 625.00 80277.78 360000.00 00 0
700 6400 97916.67 15625.00 613611.11 490000.00 40960000.0 448
0 0
750 7000 242083.33 30625.00 1913611.11 562500.00 49000000.0 525
0 0
5648333. 2077500. 19493000 2
3450.00 33700.00 712500.00 93750.00 33 00 0.00
= 575.00 = 5616.67
= =
136.9306 1062.8578
Pen
d
i
e
n
t
e
b = 7.6000
Ordenada al origen
a = 1246.6667
1246.6667 7.6
ESTIMACIÓN DE LA VARIANZA DE LA
REGRESIÓN POBLACIONAL
ESTIMACIÓN DE LA VARIANZA
DE b
ERROR ESTANDAR DE b
Hipotesís:
HO : β = β 0
H1 : β ≠ β 0
Decisión: Se rechaza la
Conclusión: Existe regresión significativa entre ambas variables
Anova para
Hipotesís:
HO : β = 0
H1 : β ≠ 0
5648333.
SCT 33
SCRegres 5415000.0
ión 0
SCResid 233333.3
ual 3
G.L G.L.
G.L TOTAL
5 Regresión 1 Residual 4
ANALISIS DE
VARIANZA PARA b
CAUSA MEDIA
SUMA DE
DE DE LOS
G.L. CUADRA
VARIAC CUADRA
DOS
IÓN DOS Fcal Ftab
7.
Regresión 1
5415000.00 5415000.00 92.83 71
Residual 4 233333.33 58333.33
TOTAL 5 5648333.33
c)
PRUEBA DE NORMALIDAD DE ERRORES O
RESIDUOS
Hipotesís:
HO La distribución de los errores de los datos se
aproxima a una normal
H1 La distribución de los errores de los datos no se
aproxima a una normal
DATOS
n 6
G.L. 2
t 6
(period
o)
0.05
5.991
RESID e2 e3 e4
UOS e
-
23557629. 675318716
-286.67 82177.78 63 0.49
333.33 111111.1 37037037 1234567901
1 .04 2.35
-26.67 711.11 -18962.96 505679.01
93.33 8711.11 813037.04 75883456.
79
-166.67 27777.78 - 771604938
4629629.6 .27
3
53.33 2844.44 151703.70 8090864.2
0
0.00 233333. 9795555. 199549511
33 56 11.11
A= 0.2129
JB = 0.2057
d) CORRELACIÓN
COEFICIENTE DE DETERMINACIÓN
Coeficiente de determinación muestral
Ajustado
e)
X=500
SOLUCIÓN:
Diagrama de
2500 dispersión
2000
DEPENDIENTE
1500
YVARIABLE
)
1000
500
(
0
0 5 10 15 20 25 30
X(VARIABLE )
INDEPENDIENTE
a)
Variable
Variable
Independient
Dependiente
e
Y X
PRECIO VELOCIDAD
199 12
499 10
299 12.2
299 10.3
399 11.7
1850 17.8
1000 16.1
1387 11.8
2089 19.8
2200 28.2
O
r
d
e
n
a
d
a
a
l
o
r
i
g
e
n
Pendiente
b = 117.9173
Ordenada al origen
a = -745.4806
745.4806 117.9173
b >0, entonces la tendencia lineal es creciente
Ya que .
Y -745.4806 117.91x
= PRONOST RESID
73 𝑒 ̅
ICO UOS
669.53 -470.53 124307.5
7
433.69 65.3 346223.30
1
693. - 108233.9
11 394.1 7
469.0 - 305844.65
1
7 170.07
634.1 - 150503.6
5 235.15 4
1353.4 496.5 109791.2
5 5 8
1152.9 - 17131.
9 152.99 73
645.9 741.0 141493.5
4 6 3
1589.2 499.7 321695.7
8 2 7
2579.7 -379.79 2426391.28
9
10221.0 0.0000 4051616.7
0 2
GRAFICO DE LOS
1000.00 RESIDUALES
800.00
600.00
400.00
RESIDU
200.00
OS
0.00
0.00 500.00 1000.00 1500.00 2000.00 2500.00 3000.00
-200.00
-400.00
-600.00
X
ESTIMACIÓN DE LA VARIANZA DE LA
REGRESIÓN POBLACIONAL
ESTIMACIÓN DE LA VARIANZA DE b
ERROR ESTANDAR DE b
Intervalo de confianza para
DATOS
N.C 0.95
0.05
G.L error 8
Error estandar
26.83
de b
b 117.92
2.306
Decisión: Se rechaza la
Conclusión: Existe regresión significativa entre ambas variables
Anova para
Hipotesís:
HO : β = 0
H1 : β ≠ 0
5729910.
SCT 90
SCRegres 4051616.
ión 72
SCResid 1678294.
ual 18
G.L G.L.
G.L TOTAL
9 Regresión 1 Residual 8
ANALISIS DE
VARIANZA PARA b
CAUSA MEDIA
SUMA DE
DE DE LOS
G.L. CUADRA
VARIAC CUADRA
DOS
IÓN DOS Fcal Ftab
b) COEFICIENTE DE DETERMINACIÓN
Coeficiente de determinación muestral
Ajustado
𝑆
𝑟
𝑆 𝑆 √
34359.81
𝑟
40861.14
𝑟 0.8409
𝑟 0.7071
INFERENCIAS ACERCA DE ρ
Hipotesís:
HO : ρ = 0
H1 : ρ ≠ 0
DATOS
r 0.840
9
0.707
r2 1
n 10
0.05
G.L. 8
TTab 2.306
𝑛2
𝑡𝑐 𝑙 𝑟√1 𝑟
10 2
𝑡𝑐 𝑙 0.8409√
1 0.7071
tcal= 4.3947
d)
-Conclusión de ANOVA: Con un nivel de significancia del
5%, existe suficiente evidencia estadística para afirmar que
, es decir se refleja la validez del modelo de regresión
poblacional entre ambas variables 7) En Estados Unidos casi
todo el sistema de tranvías usa vagones eléctricos que corren
sobre vías a nivel de la calle. La Administración de Tránsito
Federal afirma que el tranvía es uno de los medios de
transporte más seguros, ya que la tasa de accidentes es 0.99
accidentes por millón de millas-pasajero en comparación con
2.29 en los autobuses. En los datos siguientes se dan las
millas de vía y la cantidad de pasajeros transportados en los
días laborables, en miles, de seis sistemas de tranvías (USA
Today, 7 de enero 2003).
a)Use estos datos para obtener la ecuación de regresión estimada
que podría emplearse para predecir la cantidad de pasajeros
dadas las millas de vías.
b)¿Proporciona la ecuación de regresión estimada un buen
ajuste? Explique.
c) Obtenga un intervalo de 95% de confianza para la media de la
cantidad de pasajeros transportados en los días laborables en
los sistemas de tranvías que tienen 30 millas de vías.
d)Suponga que Charlotte está considerando la construcción de un
sistema de tranvía de 30 millas de vías. Dé un intervalo de
predicción de 95% para la cantidad de pasajeros transportada
en un día laborable por el sistema Charlotte. ¿Cree usted que el
intervalo de predicción que desarrolló pueda ser útil a los que
están planeando Charlotte para anticipar la cantidad de
pasajeros en un día laborable en su sistema de tranvía?
Explique
SOLUCIÓN:
Diagrama de
90 dispersión
80
70
60
DEPENDIENTE
50
YVARIABLE
)
40
30
20
(
10
0
0 5 10 15 20 25 30 35 40 45 50
X(VARIABLE )
INDEPENDIENTE
Variable
Variable
Independient
Dependiente
e
Y X
Pasajeros trans. Millas de vías
15 15
35 17
81 38
31 21
75 47
30 31
42 34
Ordenada al origen
Pendiente
15 15 408.00 196.00 849.31 225.00 225.00 225
17 35 109.71 144.00 83.59 289.00 1225.00 595
38 81 331.71 81.00 1358.45 1444.00 6561.00 3078
21 31 105.14 64.00 172.73 441.00 961.00 651
47 75 555.43 324.00 952.16 2209.00 5625.00 3525
31 30 -28.29 4.00 200.02 961.00 900.00 930
34 42 -10.71 25.00 4.59 1156.00 1764.00 1428
P
e
n
d
i
e
n
t
e
b = 1.7554
Ordenada al origen
a = -6.7629
6.7629 1.7554
TABLA DE
RESIDUALES
Y -6.7629 1.755x
= PRONOST RESID
4 𝑒 ̅
ICO UOS
19.5 -4.57 603.94
7
23.08 11. 443.7
92 1
59.9 21.0 249.59
4 6
30.1 0.90 197.2
0 0
75.7 -0.74 998.35
4
47.65 - 12.3
17.65 3
52.9 - 77.03
2 10.92
309.00 0.0000 2582.1
5
GRAFICO DE LOS
25.00 RESIDUALES
20.00
15.00
10.00
RESIDU
5.00
OS 0.00
0.00 10.00 20.00 30.00 40.00 50.00 60.00 70.00 80.00
-5.00
-10.00
-15.00
-20.00
X
ESTIMACIÓN DE LA VARIANZA DE LA
REGRESIÓN POBLACIONAL
VARIANZA DE LA REGRESIÓN
MUESTRAL
ERROR ESTANDAR DE b
DATOS
N.C 0.95
0.05
G.L error 5
Error
0.498
estandar de b
b 1.76
2.571
1.
Hipotesís:
HO : β = β 0
H1 : β ≠ β 0
Decisión: Se rechaza la
Conclusión: Existe regresión significativa entre ambas variables
b) Anova para
Hipotesís:
HO : β = 0
H1 : β ≠ 0
SCT 3620.86
𝑆𝑈𝑀𝐴 𝐷𝐸 𝐶𝑈𝐴𝐷𝑅𝐴𝐷𝑂𝑆 𝐷𝐸 𝐿𝐴 𝑅𝐸𝐺𝑅𝐸𝑆𝐼Ó𝑁: ̅𝑖
SCRegres
ión 2582.15
SCResid
ual 1038.71
G.L
G.L TOTAL
Regresió G.L.
6 n 1 Residual 5
ANALISIS DE
VARIANZA PARA b
CAUSA MEDIA
SUMA DE
DE DE LOS
G.L. CUADRA
VARIAC CUADRA
DOS
IÓN DOS Fcal Ftab
INTERVALOS DE ESTIMACIÓN
Nos dan : 30
DATOS
a -6.763
b 1.755
x0 30
45.898
n 7
= 29.00
0
S 14.41
3
838.0
Sxx 0
0.05
G.L 5
.
TTab 2.571
31.84 59.96
Nos dan : 30
DATOS
a -
6.763
b 1.755
x0 30
45.898
n 7
= 29.00
0
S 14.41
3
838.0
Sxx 0
0.05
G.L. 5
TTab 2.571
𝟏 𝒙𝟎 𝒙
̅ 𝟐 𝟏𝒙
𝒚̅𝒊 𝒕𝒐 𝑺√𝟏 ≤𝒖𝒀⁄𝑿 ≤𝒚̅𝒊 𝒕𝒐 𝑺√𝟏
𝒏 𝑺𝑿𝑿 𝒏
𝑺𝑿𝑿
𝟏 𝟑𝟎 𝟐𝟗 𝟐
𝟐
𝟑𝟎 𝟐𝟗
𝟒𝟓. 𝟖𝟗𝟖 𝟐. 𝟓𝟕𝟏 𝟏𝟒. 𝟒𝟏𝟑√𝟏 ≤ 𝒖𝒀⁄𝑿 ≤ 𝟒𝟓. 𝟖𝟗𝟖 𝟐. 𝟓𝟕𝟏 𝟏𝟒. 𝟒𝟏𝟑√𝟏
𝟕 𝟖𝟑𝟖
𝟖𝟑𝟖
6.27 85.53
60
50
DEPENDIENTE
40
YVARIABLE
)
30
20
(
10
0
0 5 10 15 20 25
X(VARIABLE )
INDEPENDIENTE
a)
Linea recta de mejor ajuste
Ordenada al origen
Pendiente
Variable
Variable
Independient
Dependiente
e
Y X
Precio Peso (Onzas)
10 3
12 4
12 5
20 7
25 8
25 9
35 9
35 11
45 21
40 15
60 18
30 9
40 12
60 14
65 16
65 16
20 3
7 1
10 2
10 1
30 8
40 14
35 9
55 19
50 14
60 13
b = 2.9370
Ordenada al origen
a = 4.9785
4.9785 2.9370
66.66 - 1036.4
21.66 6
49.03 -9.03 212.3
5
57.84 2.1 546.77
6
31.4 - 9.30
1 1.4
40.22 -0.22 33.1
1
9
46.1 13.9 135.3
0 0 7
51.9 13.0 306.57
7 3
51.9 13.0 306.57
7 3
13.7 6.2 427.33
9896.00 10.0000 7167.87
10.8 -0.85 557.39
5
7.92 2.08 704.69
28.4 1.5 35.84
7 3
46.1 - 135.3
VARIANZA
0 DE LA
6.10 REGRESIÓN
7
31.4 3.59 9.30
MUESTRAL
1
60.78 -5.78 692.75
46.1 3.90 135.3
0 7
43.1 16.8 75.66
6 4
GRAFICO DE LOS
20.00 RESIDUALES
15.00
10.00
5.00
RESIDU
0.00
0.00 10.00 20.00 30.00 40.00 50.00 60.00 70.00
OS
-5.00
-10.00 INFERENCIASSOBRE LOS
-15.00 COEFICIENTES DE REGRESIÓN
-20.00
ESTIMACIÓN
-25.00
DE LA VARIANZA DE b
X
ERROR ESTANDAR DE b
Intervalo de confianza para
DATOS
N.C 0.95
0.05
G.L error 24
Error estandar
0.293
de b
b 2.94
2.064
2.
Hipotesís:
HO : β = β 0
H1 : β ≠ β 0
Decisión: Se rechaza la
Conclusión: Existe regresión significativa entre ambas variables
C) Anova para
Hipotesís:
HO : β = 0
H1 : β ≠ 0
SCT 8884.46
SCRegres
ión 7167.87
SCResid
ual 1716.59
G.L G.L.
G.L TOTAL
25 Regresión 1 Residual 24
ANALISIS DE
VARIANZA PARA b
CAUSA MEDIA
SUMA DE
DE DE LOS
G.L. CUADRA
VARIAC CUADRA
DOS
IÓN DOS Fcal Ftab
INTERVALOS DE ESTIMACIÓN
Nos dan : 10
DATOS
a 4.979
b 2.937
x0 10
34.349
n 26
= 10.038
S 8.457
830.9
Sxx 6
0.05
G.L 24
.
TTab 2.064
30.93 37.77
INTERPRETACIÓN: Esto quiere que decir que si el
peso de las onzas (Variable independiente) es de 10, se
estima que el precio (Variable dependiente) se encuentra
entre 30.93 y 37.77 dólares con un nivel de confianza de
95%
34.349
n 26
= 10.03
8
S 8.45
7
830.9
Sxx 6
0.05
G.L. 24
TTab 2.064
𝒚̅𝒊 𝒕𝒐 𝑺√𝟏 𝟏 𝒙𝟎 𝒙
̅ 𝟐 ≤𝒖𝒀⁄𝑿 ≤𝒚̅𝒊 𝒕𝒐 𝑺√𝟏 𝟏 𝒙𝟎 𝒙̅ 𝟐
𝒏 𝑺𝑿𝑿 𝒏
𝑺𝑿𝑿
𝟏 𝟏𝟎 𝟏𝟎. 𝟎𝟑𝟖 𝟐 𝟏
𝟐
𝟏𝟎 𝟏𝟎. 𝟎𝟑𝟖
𝟑𝟒.𝟑𝟒𝟗 𝟐. 𝟎𝟔 𝟖. 𝟒𝟔√𝟏 ≤ 𝒖𝒀⁄𝑿 ≤ 𝟑𝟒.𝟑𝟒𝟗 𝟐. 𝟎𝟔 𝟖. 𝟒𝟔√𝟏
𝟐𝟔 𝟖𝟑𝟎. 𝟗𝟔 𝟐𝟔
𝟖𝟑𝟎. 𝟗𝟔
16.56 ≤ ⁄ ≤ 52.14
CORRELACIÓN
COEFICIENTE DE DETERMINACIÓN
Coeficiente de determinación muestral
Ajustado
𝑆
𝑟
𝑆 𝑆 √
2440.54
𝑟
2717.10
INFERENCIAS
ACERCA DE ρ
Hipotesís:
HO : ρ = 0
H1 : ρ ≠ 0
DATOS
r 0.898
2
r2 0.806
8
n 26
𝑛2
0.05
𝑡𝑐 𝑙 𝑟√1 𝑟
G.L
. 24
TTa
b 2.064
26 2
𝑡𝑐 𝑙 0.8982√
1 0.8068
tcal= 10.0108
Si es significativo:
F) Nueva Hipotesís:
HO: ρ = 0.9
H1: ρ 0.9
Zcal = -0.0447
Ztab = 1.9600
g)PRUEBA DE
NORMALIDAD DE
ERRORES O RESIDUOS
Hipotesís:
HO La distribución de los errores de los datos se
aproxima a una normal
H1 La distribución de los errores de los datos no se
aproxima a una normal
DATOS
n 26
G.L. 2
t 26
(period
o)
𝜶 0.05
𝑿𝟐𝑻𝒂𝒃 5.991
RESIDU e2 e3 e4
OS e
A= -0.0081
K= 3.6493
-Decisión: Ya que , se acepta y se rechaza
30
DEPENDIENTE
25
YVARIABLE
)
20
15
10
(
0
0 5 10 15 20 25
X(VARIABLE )
INDEPENDIENTE
O
r
d
e
n
a
d
a
a
l
o
r
i
g
e
n
Pendiente
Variable
Variable
Independient
Dependiente
e
Y X
Tasa promedio Tasa de desoc.
% %
18.54 21.9
33.7 6
19.67 22.8
21.01 18.1
35.09 12.7
19.41 14.5
25.28 20
17.02 19.2
24.04 16
31.42 6.6
18.74 15.9
26.76 9.2
27.72 19.7
18.2 20
25 8.3
29.78 17.1
37.03 10.8
28.64 11.1
Ecuación de la recta
de regresión:
Pen
d
i
e
n
t
e
b = -0.7792
Ordenada al origen
a = 37.0747
37.0747 0.7792
Ya que b < 0, entonces la tendencia lineal es decreciente.
Podemos deducir que “a “nos dice que cuando la tasa de
desocupación % es igual a 0, la tasa promedio es % 37.07.
TABLA DE
RESIDUALES
Y 37.074 -0.7792x
= PRONOSTI
7 𝑒
RESIDU ̅
CO OS
20.0 - 28.95
1 1.47
32.40 1.3 49.1
0 1
19.3 0.36 36.99
1
22.9 - 5.86
7 1.96
27.1 7.9 3.20
8 1
25.78 -6.37 0.1
5
21.4 3.79 15.2
9 1
22.1 -5.09 10.7
1 4
24.6 -0.57 0.6
1 1
31.9 - 42.78
3 0.51
24.69 -5.95 0.50
29.9 - 20.38
1 3.15
21.7 5.99 13.4
3 4
21.4 -3.29 15.2
9 1
30.6 - 27.2
1 5.61 1
23.75 6.03 2.69
28.66 8.3 10.6
7 8
28.43 0.2 9.2
1 1
457.05 0.0000 292.91
GRAFICO DE LOS
10.00 RESIDUALES
8.00
6.00
4.00
RESIDU
2.00
OS 0.00
0.00 5.00 10.00 15.00 20.00 25.00 30.00 35.00
-2.00
-4.00
-6.00
-8.00
X
d) PRUEBAS DE SIGNIFICANCIA
ESTIMACIÓN DE LA VARIANZA DE LA
REGRESIÓN POBLACIONAL
ERROR ESTANDAR DE b
DATOS
N.C 0.95
0.05
G.L error 16
Error estandar
0.22238
de b
b -0.78
2.120
Prueba de hipótesis para trata de
probar la hipótesis
o
Hipotesís:
HO : β = β 0
H1 : β ≠ β 0
Decisión: Se acepta la
Conclusión: No existe regresión significativa entre ambas variables
e) Anova para
Hipotesís:
HO : β = 0
H1 : β ≠ 0
SCT 674.68
𝑆𝑈𝑀𝐴 𝐷𝐸 𝐶𝑈𝐴𝐷𝑅𝐴𝐷𝑂𝑆 𝐷𝐸 𝐿𝐴 𝑅𝐸𝐺𝑅𝐸𝑆𝐼Ó𝑁: ̅𝑖
SCRegres
ión 292.91
SCResid
ual 381.77
G.L
G.L TOTAL
Regresió G.L.
17 n 1 Residual 16
ANALISIS DE
VARIANZA PARA b
CAUSA MEDIA
SUMA DE
DE DE LOS
G.L. CUADRA
VARIAC CUADRA
DOS
IÓN DOS Fcal Ftab
f)
X= 25 %
X= 11.3 %