3ra Unidad Laboratorio

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 110

1) Bergans of Norway ha estado fabricando equipo para excursionismo desde 1908.

En los
datos que se presentan en la tabla siguiente se da la temperatura (°F) y el precio ($) de 11
modelos de sacos de dormir fabricados por Bergans (Backpacker 2006 Gear Guide)
a) Trace un diagrama de dispersión con estos datos, en el que la variable independiente
sea la temperatura (°F).
b) ¿Qué indica el diagrama de dispersión del inciso? respecto a la relación entre
temperatura y precio?
c) Use el método de mínimos cuadrados para obtener la ecuación de regresión estimada.
d) Prediga cuál será el precio de un saco de dormir si el índice de temperatura (°F) es 20.
e) Dé una estimación puntual del precio de un saco de dormir cuya temperatura sea 30.
f) Dé un intervalo de 95% de confianza para el precio medio de todos los sacos de dormir
cuya temperatura sea 30.
g) Suponga que Bergans elabora un nuevo modelo cuya temperatura es 30. Dé un
intervalo de predicción de 95% para el precio de este nuevo modelo.
h) Pruebe la normalidad de los errores utilizando la prueba de Jarque bera

SOLUCIÓN: a)

Diagrama de dispersión
450
400
350
300
DEPENDIENTE

250
VARIABLE

200
)

150
Y

R² = 0.8043
100
50
(

0
0 5 10 15 20 25 30 35 40 45 50
X(VARIABLE )
INDEPENDIENTE
Variable Variable
Dependiente Independiente

b) Y X
Precio Temperatura
319 12
289 24
389 3
239 13
149 38

289 4

359 5
259 15
229 25
129 45

199 25

-Entre mayor sea la temperatura a la que estará expuesto el saco, menor será su
precio, teniendo en cuenta que la temperatura es medida en grados sobre 0.

-Se denota que la relación es fuerte y directa


-El coeficiente de correlación lineal es 0.8968
c)
Linea recta de mejor ajuste
Y=a+bx
Ordenada al origen

Pendiente
12 319 -420.00 49.00 3600.00 144.00 101761.00 3828.00
24 289 150.00 25.00 900.00 576.00 83521.00 6936.00
3 389 -2080.00 256.00 16900.00 9.00 151321.00 1167.00
13 239 120.00 36.00 400.00 169.00 57121.00 3107.00
38 149 -2090.00 361.00 12100.00 1444.00 22201.00 5662.00
4 289 -450.00 225.00 900.00 16.00 83521.00 1156.00

5 359 -1400.00 196.00 10000.00 25.00 128881.00 1795.00


15 259 0.00 16.00 0.00 225.00 67081.00 3885.00

25 229 -180.00 36.00 900.00 625.00 52441.00 5725.00


45 129 -3380.00 676.00 16900.00 2025.00 16641.00 5805.00
25 199 -360.00 36.00 3600.00 625.00 39601.00 4975.00

804091.0
209.00 2849.00 -10090.00 1912.00 66200.00 5883.00 0 44041.00
= 19.00 = 259.00
= 13.8275 =
81.3634

Ecuación de la recta de regresión:

PENDIENTE:
b = -5.2772

Ordenada al origen

= 359.2667

Línea recta de mejor ajuste

Y=359.2667 5.2772

->Ya que b < 0, entonces la tendencia lineal es decreciente

d)

X= 20

y=253.7228

->Podemos predecir que si el índice de temperatura (°F) es 20, el precio de un


saco de dormir es S/ 253,72

e)

X= 30
Y=200.9508
-Una estimación puntual del precio de un saco de dormir cuya temperatura
es 30 es de S/200.95

ESTIMACIÓN DE LA VARIANZA DE LA REGRESIÓN


POBLACIONAL

VARIANZA DE LA REGRESIÓN MUESTRAL

INFERENCIAS SOBRE LOS COEFICIENTES DE REGRESIÓN

ESTIMACIÓN DE LA VARIANZA DE b
ERROR ESTANDAR DE b

Intervalo de confianza para β

DATOS:
N.C=0.95
α=0.05
F.L error=9
Error estándar de b=0.87
b=-5.28
=2.262

𝟕. 𝟐𝟑𝟗𝟗 ≤ 𝜷 ≤ 𝟑. 𝟑𝟏𝟒5

Prueba de hipótesis para β trata de probar la


hipótesis
𝑯𝑶:𝜷 𝜷𝟎 𝑽𝑺 𝑯𝟏:𝜷 < 𝜷𝟎 , 𝜷 > 𝜷𝟎 o 𝜷 ≠ 𝜷0
Hipotesís:
HO : β = β 0
H1 : β ≠ β0

−5.28
T cal=
0.8676
T cal=−6.0825
T cal=T α / 2 ,GL =T 0.05/ 2.9=2.262

Decisión: Se acepta la HO
Conclusión: No existe regresión significativa entre ambas variables

Anova para β

Hipotesís:
HO : β = 0
H1 : β ≠ 0

SCT=66200

SCREGRESION=5324.91

SCResidual=12953.09
G.L TOTAL = 10 Gl REGRESION=1

GLERROR=9

ANALISIS DE
VARIANZA PARA b

CAUSA MEDIA
SUMA DE
DE DE LOS
G.L. CUADR
VARIAC CUADR Fta
ADOS
IÓN ADOS Fcal b

5.
Regresión 1
53246.91 53246.91 37.00 12
Residual 9 12953.09 1439.23
TOTAL 10 66200.00

-Decisión: Ya que , se rechaza y se acepta


-Conclusión: Con un nivel de significancia del 5%, existe suficiente
evidencia estadística para afirmar que , es decir se refleja la
validez del modelo de regresión poblacional entre ambas variables

INTERVALOS DE ESTIMACIÓN

f) Intervalo de confianza para la media de Y dado un valor de X Nos dan


: 30
DATOS:
a=359.267
b=-5.277
xo=30

=200.951
n=11
=19
S=37.937
Sxx =1912
=0.05
GL=9
TTab=2.262

INTERPRETACIÓN: Esto quiere que decir que si la temperatura


(Variable independiente) es de 30, se estima que el precio de los
sacos de dormir (Variable dependiente) se encuentra entre 167.25 y
234.65 dólares con un nivel de confianza de 95%

g) Intervalo de predicción para Y dado un valor de X

Nos dan : 30

DATOS:
a=359.267
b=-5.277
xo=30

=200.951
n=11
=19
S=37.937
Sxx =1912
=0.05
GL=9
TTab=2.262

108.75 ≤ ⁄ ≤ 293.15

INTERPRETACIÓN: Esto quiere que decir que si la temperatura (Variable


independiente) es de 30, se estima que el precio de los sacos de dormir
(Variable dependiente) se encuentra entre 108.75 y 293.15 dólares con un
nivel de confianza de 95%

h) PRUEBA DE NORMALIDAD DE ERRORES O RESIDUOS

Hipotesís:
HO: La distribución de los errores de los datos se aproxima a una
normal
H1: La distribución de los errores de los datos no se aproxima a una
normal

DATOS:
n=11
G.L=2
tperiodo=11
𝜶=0.05
𝑿𝟐𝑻𝒂𝒃=5.991
RESID e2 e3 e4
UOS e

23.06 531.75 12261.87 282754.06


56.39 3179.3 179272.4 10108451.5
8 2 2
45.56 2076.1 94599.74 4310423.24
6
-51.66 2669.0 - 7124010.25
8 137893.3
8
-9.73 94.74 -922.09 8974.99
-49.16 2416.5 - 5839491.72
0 118790.3
8
26.12 682.22 17818.94 465417.38
-21.11 445.58 -9405.67 198542.31
1.66 2.77 4.60 7.65
7.21 51.94 374.36 2698.02
-28.34 802.98 - 644769.45
22753.77
0.00 12953. 14566.63 28985540.5
09 8
A= 0.0328

K =1.9003

JB =0.5562

-Decisión: Ya que , se acepta y se rechaza


-Conclusión: Con un nivel de significancia del 5%, existe suficiente
evidencia estadística para afirmar que La distribución de los errores de
los datos se aproxima a una normal

CORRELACIÓN

COEFICIENTE DE DETERMINACIÓN
Coeficiente de determinación muestral
Ajustado

INTERPRETACIÓN: El valor R2 y R2 ajustado se interpretan de la


misma forma; y esto significa que el 80.43% de la variación de la
variable dependiente es explicada por la regresión lineal

COEFICIENTE DE CORRELACION (+1 -1)


Coeficiente de correlación muestral
INTERPRETACIÓN: El grado de la relación lineal es de -1 < r
<0,porque r=-0.8968; por lo tanto, tiene una correlación negativa
moderada

INFERENCIAS ACERCA DE ρ
Hipotesís:
HO : ρ = 0
H1 : ρ ≠ 0
DATOS:
r=-0.8968
r2=0.8043
n=11
α=0.05
G.L=9

√ 1−r √
T tab=2.262 T cal=r n−22 T cal=−0.8968

Decisión: Se acepta la y se rechaza la


11−2 T =−6.0825
1−0.8043
cal

Conclusión: No es significativo
2) Aunque actualmente en los aeropuertos grandes los retrasos son menos
frecuentes, es útil saber en qué aeropuertos es más probable que le echen a
perder a uno sus planes. Además, si su vuelo llega con retraso a un
determinado aeropuerto en el que tiene que hacer un trasbordo, ¿cuál es la
probabilidad de que se retrase la salida y que pueda hacer así el trasbordo? En
la tabla siguiente se muestra el porcentaje de llegadas y salidas retrasadas
durante el mes de agosto en 13 aeropuertos (Business 2.0, febrero 2002).
a)Trace un diagrama de dispersión con estos datos, en el que la variable
independiente sean las llegadas retrasadas.
b)¿Qué indica el diagrama de dispersión del inciso a) respecto a la
relación entre llegadas retrasadas y salidas retrasadas?
c)Use el método de mínimos cuadrados para obtener la ecuación de
regresión estimada.
d)Pruebe la normalidad de los errores utilizando la prueba de Jarque
bera
e)¿Cómo se debe interpretar la pendiente de la ecuación de regresión
estimada?
f)Suponga que en el aeropuerto de Filadelfia hubo 22% de llegadas
retrasadas. ¿Cuál es el porcentaje estimado de salidas retrasadas?

SOLUCIÓN:
a)
Diagrama de
35 dispersión

30

25

DEPENDIENTE
20
YVARIABLE
)

15

10
(

0
0 5 10 15 20 25 30 35
X(VARIABLE )
INDEPENDIENTE

b) Que los valores se ven demasiado aproximados


entre las variables X y Y
Variable
Variable
Independient
Dependiente
e

Y X
Salidas Llegadas
retrasadas retrasadas
22 24

20 20

29 30

19 20

22 20

23 23

19 18

16 20

18 18

22 21

22 25

17 18

16 16

c)
Linea recta de mejor ajuste

Ordenada al origen

Pendiente

24 22 4.85 9.00 2.61 576.00 484.00 528.00


20 20 0.38 1.00 0.15 400.00 400.00 400.00
30 29 77.54 81.00 74.22 900.00 841.00 870.00
20 19 1.38 1.00 1.92 400.00 361.00 380.00
20 22 -1.62 1.00 2.61 400.00 484.00 440.00
23 23 5.23 4.00 6.84 529.00 529.00 529.00

18 19 4.15 9.00 1.92 324.00 361.00 342.00


20 16 4.38 1.00 19.22 400.00 256.00 320.00

18 18 7.15 9.00 5.69 324.00 324.00 324.00


2.61
21 22 0.00 0.00 441.00 484.00 462.00
2.61
25 22 6.46 16.00 625.00 484.00 550.00

18 17 10.15 9.00 324.00 289.00 306.00


16 16 21.92 25.00 256.00 256.00 256.00

273.00 265.00 142.00 166.00 5899.00 5553.00 5707.00


= 21.00 = 20.38
= 3.7193 = 3.5482

Ecuación de la recta de regresión:

Pendiente

b = 0.8554
Ordenada al origen

a = 2.4208

Línea recta de mejor ajuste

Y=2.42208+0.8554x

-Ya que b > 0, entonces la tendencia lineal es creciente

TABLA DE RESIDUALES
Y= 2.4208 0.8554 x
PRONOSTICO 𝑒
RESIDUO ̅
S
22.95 -0.95 6.59
19.53 0.47 0.73
28.08 0.92 59.27
19.53 -0.53 0.73
19.53 2.47 0.73
22.10 0.90 2.93
17.82 1.1 6.59
19.53 8
-3.53 0.73
17.82 0.18 6.59
20.38 1.62 0.00
23.81 -1.81 11.7
17.82 -0.82 1
6.59
16.1 -0.11 18.29
1

265.00 0.0000 121.47


GRAFICO DE LOS
3.00 RESIDUALES
2.00

1.00

RESIDU
0.00
0.00 5.00 10.00 15.00 20.00 25.00 30.0

OS
-1.00

-2.00

-3.00

-4.00
X

ESTIMACIÓN DE LA VARIANZA DE LA
REGRESIÓN POBLACIONAL

VARIANZA DE LA REGRESIÓN MUESTRAL

INFERENCIAS SOBRE LOS COEFICIENTES DE REGRESIÓN

ESTIMACIÓN DE LA VARIANZA DE b
ERROR ESTANDAR DE b

Intervalo de confianza para

DATOS
0. N.C 0.95
0.05
G.L error 11
Error
0.13
estandar de b
b 0.86
2.201

Prueba de hipótesis para trata de probar la hipótesis


o

Hipotesís:
HO : β = β 0
H1 : β ≠ β0

Decisión: Se rechaza la
Conclusión: Existe regresión significativa entre ambas variables

Anova para

Hipotesís:
HO : β = 0
H1 : β ≠ 0

SCT=151.08

scrEGRESIÓN=121.47

SCResidual=29.61
G.L G.L.
G.L TOTAL
12 Regresión 1 Residual 11

ANALISIS DE
VARIANZA PARA b
CAUSA MEDIA DE
SUMA DE
DE LOS
G.L. CUADRAD
VARIACI CUADRAD
OS
ÓN OS Fcal Ftab

Regresión 1 121.47 121.47 45.13 4.84


Residual 11 29.61 2.69
TOTAL 12 151.08

-Decisión: Ya que , se rechaza y se acepta


-Conclusión: Con un nivel de significancia del 5%, existe suficiente
evidencia estadística para afirmar que , es decir se refleja la
validez del modelo de regresión poblacional entre ambas variables

d) PRUEBA DE NORMALIDAD DE ERRORES O


RESIDUOS
Hipotesís:
HO: La distribución de los errores de los datos se aproxima a una
normal
H1: La distribución de los errores de los datos no se aproxima a una
normal
DATOS:
n=13
G.L=2
t periodos=13
α=0.05
=5.991

RESIDU e2 e3 e4
OS e

-0.95 0.90 -0.86 0.82


0.47 0.22 0.10 0.05
0.92 0.84 0.77 0.71
-0.53 0.28 -0.15 0.08
2.47 6.10 15.08 37.27
0.90 0.82 0.74 0.67
1.18 1.40 1.65 1.95
-3.53 12.46 -43.96 155.13
0.18 0.03 0.01 0.00
1.62 2.61 4.22 6.81
-1.81 3.26 -5.89 10.65
-0.82 0.67 -0.55 0.45
-0.11 0.01 0.00 0.00
0.00 29.61 -28.84 214.58
A= -0.6454

K= 3.1823

JB = 0.9206

-Decisión: Ya que , se acepta y se rechaza


-Conclusión: Con un nivel de significancia del 5%, existe
suficiente evidencia estadística para afirmar que La distribución
de los errores de los datos se aproxima a una normal
e)
SABEMOS QUE CUANDO UN VUELO LLEGA CON
RETRASO; OCASIONA QUE SE ATRASEN LAS SALIDAS
DE
LOS VUELOS, ES DECIR SI AUMENTA LA INCIDENCIA
DE LLEGADAS ATRASADAS, SE VAN A INCREMENTAR
LAS SALIDAS RETRASADAS DE LOS VUELOS

f)
X= 22%

Y = 21.2400

El porcentaje estimado de salidas retrasadas es de


21.24%

3) En los datos siguientes, y corresponde a los salarios mensuales


y x es el promedio obtenido por los estudiantes que terminaron la
licenciatura de administración con especialidad en sistemas de
información. La ecuación de regresión estimada obtenida con
estos datos es yˆ  1790.5x  581.1x
a) Calcule SCE, STC y SCR.
b) Calcule el coeficiente de determinación r2 . Haga un
comentario sobre la bondad del ajuste. c) Calcule el
coeficiente de correlación muestral.
d) Dé un intervalo de 95% de confianza para el salario medio
inicial de todos los estudiantes cuyo promedio fue 3.0.
e) Dé un intervalo de 95% de predicción para el salario medio
inicial de Joe Heller cuyo promedio fue 3.0
SOLUCIÓN:

Diagrama de
4500 dispersión
4000

3500
DEPENDIENTE

3000
YVARIABLE

2500
)

2000

1500

1000

500
(

0
0 0.5 1 1.5 2 2.5 3 3.5 4
X(VARIABLE )
INDEPENDIENTE

a)
Anova para

Hipotesís:
HO : β = 0
H1 : β ≠ 0
SCT=335000

SCRegresión=249864.86

SCResidual=85135.14

G.L G.L.
G.L TOTAL
5 Regresión 1 Residual 4

ANALISIS DE
VARIANZA PARA b
CAUSA MEDIA DE
SUMA DE
DE LOS
G.L. CUADRAD
VARIACI CUADRAD
OS
ÓN OS Fcal Ftab

Regresión 1 249864.86 249864.86 11.74 7.71


Residual 4 85135.14 21283.78
TOTAL 5 335000.00

-Decisión: Ya que , se rechaza y se acepta


-Conclusión: Con un nivel de significancia del 5%, existe suficiente
evidencia estadística para afirmar que , es decir se refleja la
validez del modelo de regresión poblacional entre ambas variables
CORRELACIÓN

b) COEFICIENTE DE DETERMINACIÓN
Coeficiente de determinación muestral

Ajustado

INTERPRETACIÓN: El valor R2 y R2 ajustado se interpretan de la


misma forma; y esto significa que el 74.59% de la variación de
la variable dependiente es explicada por la regresión lineal

c) COEFICIENTE DE CORRELACION (+1 -1)


Coeficiente de correlación muestral
INTERPRETACIÓN: El grado de la relación lineal es de 0< r < 1,
porque r=0.8636; por lo tanto, tiene una correlación positiva

INFERENCIAS ACERCA DE ρ
Hipotesís:
HO : ρ = 0
H1 : ρ ≠ 0

Datos:
r=0.8636
r2=0.7459
n=6
=0.05
G.L=4
Ttab=2.776
T cal=r
√ n−2
1−r √
2 T cal =0.8636
6−2
1−0.7459
T cal=3.4263

Decisión: Se rechaza la y se acepta la


Conclusión: Es significativo

Nueva Hipotesís:
HO: ρ = 0.9
H1: ρ > 0.9
Zcal = -0.2853

Ztab = 1.6449
Decisión: Se acepta la y se rechaza la
Conclusión: Se concluye que no hay evidencia de que el
coeficiente de correlación poblacional excede el valor 0.9

INTERVALOS DE ESTIMACIÓN

d) Intervalo de confianza para la media de Y dado un valor de X

Nos dan :3

DATOS
a 1790.541
b 581.081
x0 3

3533.784
n 6
= 3.200
S 145.890
Sxx 0.74
0.05
G.L. 4

3343.49 3724.08
INTERPRETACIÓN: Esto quiere que decir que si el promedio
obtenido por los estudiantes que terminaron la licenciatura de
administración con especialidad en sistemas de información
(Variable independiente) es de 3, se estima que los salarios (Variable
dependiente) se encuentra entre 3343.49 y 3724.08 dólares con un
nivel de confianza de 95%

e) Intervalo de predicción para Y dado un valor de X

Nos dan :3
DATOS
a 1790.54
1
b 581.081
x0 3

3533.784
n 6
= 3.200
S 145.890
Sxx 0.74
0.05
G.L 4
.
TT 2.776
ab

𝟏 𝒙𝟎 ̅𝒙 𝟐 𝟏
𝒚̅𝒊 𝒕𝒐 𝑺√𝟏 ≤𝒖𝒀⁄𝑿 ≤𝒚̅𝒊 𝒕𝒐 𝑺√𝟏
𝒏 𝑺𝑿𝑿 𝒏
𝑺𝑿𝑿
𝟏 𝟑 𝟑. 𝟐 𝟐
𝟑 𝟑.𝟐 𝟐
𝟑𝟓𝟑𝟑. 𝟕𝟖 𝟐. 𝟕𝟕𝟔 𝟏𝟒𝟓.𝟖𝟗√𝟏 ≤ 𝒖𝒀⁄𝑿 ≤ 𝟑𝟓𝟑𝟑. 𝟕𝟖 𝟐.𝟕𝟕𝟔 𝟏𝟒𝟓. 𝟖𝟗√

𝟔 𝟎. 𝟕𝟒
𝟎. 𝟕𝟒

3086.25 ≤ ⁄ ≤ 3981.31

INTERPRETACIÓN: Esto quiere que decir que si el


promedio obtenido por los estudiantes que terminaron la
licenciatura de administración con especialidad en
sistemas de información (Variable independiente) es de
3, se estima que los salarios (Variable dependiente) se
encuentra entre 3086.25 y 3981.31 dólares con un nivel
de confianza de 95%

4) Consumer Reports publica pruebas y evaluaciones sobre


televisores de alta definición. Para cada modelo se elaboró una
evaluación general basada principalmente en la calidad de la
imagen. Una evaluación más alta indica un mejor
funcionamiento. En los datos siguientes se dan evaluación
general y precio de televisores de plasma de 45 pulgadas
(Consumer Reports, marzo 2006).
a)Use estos datos para obtener una ecuación de regresión
estimada que pueda emplearse para estimar la puntuación en la
evaluación general de una televisión de 42 pulgadas dado el
precio.
b)Calcule ¿Proporcionó un buen ajuste la ecuación de regresión
estimada?
c) Estime la puntuación en la evaluación general de un televisor
cuyo precio es $3200.

SOLUCIÓN:
Diagrama de
4500 dispersión
4000

3500

3000

DEPENDIENTE
2500

YVARIABLE
)

2000

1500

1000
(

500

0
0 10 20 30 40 50 60 70
X(VARIABLE )
INDEPENDIENTE
Variable
Variable
Independient
Dependiente
e

Y X
Puntuación en la
Precio E.
2800 62
2800 53
2700 44
3500 50
3300 54
2000 39

4000 66
3000 55
2500 34
3000 39

62 18 -189.72 153.76 234.09 3844.00 324.00 1


53 22 -38.42 11.56 127.69 2809.00 484.00 1
44 29 24.08 31.36 18.49 1936.00 841.00 1
50 33 -0.12 0.16 0.09 2500.00 1089.00 1
54 39 25.08 19.36 32.49 2916.00 1521.00 2
39 50 -177.02 112.36 278.89 1521.00 2500.00 1

66 65 519.88 268.96 1004.89 4356.00 4225.00 4


55 21 -66.42 29.16 151.29 3025.00 441.00 1

34 24 145.08 243.36 86.49 1156.00 576.00


39 32 13.78 112.36 1521.00 1024.00 1

333.0
496.00 0 256.20 982.40 25584.00 13025.00
= 49.60 = 33.30
= 10.4478 = 14.66
70

a) Ecuación de la recta de regresión:

Pen
d
i
e
n
t
e

b = 0.2608

Ordenada al origen

a = 20.3648
Línea recta de mejor ajuste

20.3648 0.2608

 Ya que b > 0, entonces la tendencia lineal es creciente

TABLA DE
RESIDUALES
Y 20.3648 0.2608x
= PRONOSTI RESIDU
𝑒 ̅
CO OS
36.53 - 10.4
18.53 6
34.1 - 0.79
9 12.19
31.8 -2.84 2.1
4 3
33.40 -0.40 0.0
1
34.45 4.55 1.3
2
30.54 19.4 7.64
6
37.58 27.42 18.2
9
34.7 - 1.9
1 13.7 8
29.23 -5.23
1 16.5
30.54 1.4 7.64
6
333.00 0.0000 66.8
1

GRAFICO DE LOS
30.00 RESIDUALES
20.00

10.00

RESIDU
0.00

OS
0.00 5.00 10.00 15.00 20.00 25.00 30.00 35.00 40.00
-10.00

-20.00

-30.00
X

b) CORRELACIÓN

COEFICIENTE DE CORRELACION (+1 -1)


Coeficiente de correlación muestral

𝑆
𝑟
𝑆 𝑆 √

256.20
𝑟
1379.14

INTERPRETACIÓN: El grado de la relación lineal es de 0< r < 1,


porque r=0.1858; por lo tanto, tiene una
correlación positiva
c) Estime la puntuación en la
evaluación general de un televisor cuyo
precio es Y= $3200

12191.85

 La estimación de la puntuación en la evaluación de un televisor


cuyo precio es de $ 3200 es de 12192

5) Una aplicación importante del análisis de regresión a la


contaduría es la estimación de costos. Con datos sobre
volumen de producción y costos y empleando el método de
mínimos cuadrados para obtener la ecuación de regresión
estimada que relacione volumen de producción y costos, los
contadores pueden estimar los costos correspondientes a un
determinado volumen de producción. Considere la siguiente
muestra de datos sobre volumen de producción y costos totales
de una operación de fabricación.
a)Con estos datos obtenga la ecuación de regresión estimada
para pronosticar los costos totales dado un volumen de
producción.
b)¿Cuál es el costo por unidad producida?
c) Pruebe la normalidad de los errores utilizando la prueba de
Jarque bera
d)Calcule el coeficiente de determinación. ¿Qué porcentaje de
la variación en los costos totales puede ser explicada por el
volumen de producción?
e) De acuerdo con el programa de producción de la empresa, el
mes próximo se deberán producir 500 unidades. ¿Cuál es el
costo total estimado de esta operación?
f) Use α = 0.05 para determinar si el volumen de producción
está relacionado de manera significativa con los costos
totales. Dé la tabla ANOVA. ¿Cuál es la conclusión?

SOLUCIÓN:
a)

Diagrama de
8000 dispersión
7000

6000
DEPENDIENTE

5000
YVARIABLE
)

4000

3000

2000
(

1000

0
0 100 200 300 400 500 600 700 800
X(VARIABLE )
INDEPENDIENTE
Variable Variable
Dependiente Independiente

Y X
Volumen de
Costos totales producción

4000 400
5000 450

5400 550
5900 600

6400 700
7000 750

Linea recta de mejor ajuste

Ordenada al origen

Pendiente
16000000.
400 4000 282916.67 30625.00 2613611.11 160000.0000 1600
25000000.0 225
450 5000 77083.33 15625.00 380277.78 202500.00 0 0
29160000. 297
550 5400 5416.67 625.00 46944.44 302500.00 00 0
34810000. 354
600 5900 7083.33 625.00 80277.78 360000.00 00 0
700 6400 97916.67 15625.00 613611.11 490000.00 40960000.0 448
0 0
750 7000 242083.33 30625.00 1913611.11 562500.00 49000000.0 525
0 0
5648333. 2077500. 19493000 2
3450.00 33700.00 712500.00 93750.00 33 00 0.00
= 575.00 = 5616.67
= =
136.9306 1062.8578

Ecuación de la recta de regresión:

Pen
d
i
e
n
t
e
b = 7.6000

Ordenada al origen

a = 1246.6667

Línea recta de mejor ajuste

1246.6667 7.6

Ya que b > 0,


entonces la tendencia
lineal es creciente. b)
Además, nos refiere que, por el incremento de una unidad producida,
los costos de producción aumentan a $7.6
 Podemos deducir que “a “nos dice que cuando la
producción es igual a 0, los costos crecen a $1246.667

ESTIMACIÓN DE LA VARIANZA DE LA
REGRESIÓN POBLACIONAL

VARIANZA DE LA REGRESIÓN MUESTRAL


INFERENCIAS SOBRE LOS
COEFICIENTES DE REGRESIÓN

ESTIMACIÓN DE LA VARIANZA
DE b

ERROR ESTANDAR DE b

Intervalo de confianza para


DATOS
N.C 0.95
0.05
G.L error 4
Error estandar
0.789
de b
7.
b 7.60
2.776

Prueba de hipótesis para trata de


probar la hipótesis
o

Hipotesís:
HO : β = β 0
H1 : β ≠ β 0

Decisión: Se rechaza la
Conclusión: Existe regresión significativa entre ambas variables
Anova para

Hipotesís:
HO : β = 0
H1 : β ≠ 0

𝑆𝑈𝑀𝐴 𝐷𝐸 𝐶𝑈𝐴𝐷𝑅𝐴𝐷𝑂𝑆 𝑂 𝐴𝐿:

5648333.
SCT 33

𝑆𝑈𝑀𝐴 𝐷𝐸 𝐶𝑈𝐴𝐷𝑅𝐴𝐷𝑂𝑆 𝐷𝐸 𝐿𝐴 𝑅𝐸𝐺𝑅𝐸𝑆𝐼Ó𝑁: ̅𝑖

SCRegres 5415000.0
ión 0

SCResid 233333.3
ual 3

G.L G.L.
G.L TOTAL
5 Regresión 1 Residual 4
ANALISIS DE
VARIANZA PARA b

CAUSA MEDIA
SUMA DE
DE DE LOS
G.L. CUADRA
VARIAC CUADRA
DOS
IÓN DOS Fcal Ftab
7.
Regresión 1
5415000.00 5415000.00 92.83 71
Residual 4 233333.33 58333.33
TOTAL 5 5648333.33

-Decisión: Ya que , se rechaza y se acepta


-Conclusión: Con un nivel de significancia del 5%, existe
suficiente evidencia estadística para afirmar que
, es decir se refleja la validez del modelo de regresión
poblacional entre ambas variables

c)
PRUEBA DE NORMALIDAD DE ERRORES O
RESIDUOS

Hipotesís:
HO La distribución de los errores de los datos se
aproxima a una normal
H1 La distribución de los errores de los datos no se
aproxima a una normal
DATOS
n 6
G.L. 2
t 6
(period
o)
0.05

5.991
RESID e2 e3 e4
UOS e
-
23557629. 675318716
-286.67 82177.78 63 0.49
333.33 111111.1 37037037 1234567901
1 .04 2.35
-26.67 711.11 -18962.96 505679.01
93.33 8711.11 813037.04 75883456.
79
-166.67 27777.78 - 771604938
4629629.6 .27
3
53.33 2844.44 151703.70 8090864.2
0
0.00 233333. 9795555. 199549511
33 56 11.11
A= 0.2129

JB = 0.2057

-Decisión: Ya que , se acepta y se rechaza

-Conclusión: Con un nivel de significancia del 5%,


existe suficiente evidencia estadística para afirmar
que La distribución de los errores de los datos se
aproxima a una normal

d) CORRELACIÓN

COEFICIENTE DE DETERMINACIÓN
Coeficiente de determinación muestral
Ajustado

INTERPRETACIÓN: El valor R2 y R2 ajustado se interpretan de la misma


forma; y esto significa que el 95.87 % de la variación de
la variable dependiente es explicada por la regresión lineal

e)
X=500

f) Conclusión de ANOVA: Con un nivel de significancia


del 5%, existe suficiente evidencia estadística para afirmar
que , es decir se refleja la validez del modelo de
regresión poblacional entre ambas variables 6) PC World
publicó evaluaciones de las cinco mejores impresoras láser
de oficina y de las cinco mejores impresoras láser
corporativas (PC World, febrero 2003). La impresora de
oficina mejor evaluada fue la MinoltaQMS PagePro
1250W, que en la evaluación general obtuvo una
puntuación de 91 puntos. La impresora láser corporativa
mejor evaluada fue la Xerox Phase 4400/N, que en la
evaluación general obtuvo una puntuación de 83 puntos.
En la tabla siguiente se da rapidez, en páginas por minuto
(ppm), en la impresión de texto y precio de cada impresora
a)Dé la ecuación de regresión estimada empleando
velocidad como variable independiente.
b)Calcule r2 . ¿Qué porcentaje de la variación del precio
puede ser explicado por la velocidad de la impresora?
c) ¿Cuál es el coeficiente de correlación muestral entre
velocidad y precio? ¿Refleja este coeficiente una relación
fuerte o débil entre la velocidad de la impresora y el
costo?
d)¿Indican las evidencias que haya una relación significante
entre velocidad de impresión y precio? Realice la prueba
estadística apropiada y dé su conclusión. Use α = 0.05.

SOLUCIÓN:
Diagrama de
2500 dispersión

2000

DEPENDIENTE
1500

YVARIABLE
)

1000

500
(

0
0 5 10 15 20 25 30
X(VARIABLE )
INDEPENDIENTE

a)
Variable
Variable
Independient
Dependiente
e

Y X
PRECIO VELOCIDAD
199 12
499 10

299 12.2
299 10.3
399 11.7
1850 17.8

1000 16.1

1387 11.8

2089 19.8

2200 28.2

Linea recta de mejor ajuste

O
r
d
e
n
a
d
a

a
l

o
r
i
g
e
n
Pendiente

1 19 2461.0 8.94 677493.61 144.0 39601.00


2 9 7 0
1 499 2610.2 24.90 273633.61 100.0 249001.00
0 7 0
12. 299 2017.4 7.78 522873.61 148.8 89401.00
2 5 4
10. 299 3391.3 22.00 522873.61 106.0 89401.00
3 4 9
11. 399 2050.00 10.8 388253.61 136.8 159201.0
7 2 9 0
17. 185 2326.40 7.90 685418.4 316.8 3422500.00
8 0 1 4
16. 100 -24.53 1.2 488.4 259.2 1000000.00
1 0 3 1 1
11. 138 - 10.1 133152.0 139.2 1923769.00
8 7 1164.03 8 1 4
19. 2089 5131.7 23.1 1138275.6 392.04 4363921.00
8 9 4 1
28.2 2200 15560.06 174.5 1387448.4 795.24 4840000.00
0 1
149.9 10221.0 34359.8 291.3 5729910.90 2538.39 16176795.0
̅ =
𝒙 014.9 ̅ =
𝒚 01022.1 1 9 0
𝑺𝑿 = 9 𝑺𝒀 = 797.9077
5.6900 0

Ecuación de la recta de regresión:


Pen
d
i
e
n
t
e

b = 117.9173

Ordenada al origen

a = -745.4806

Línea recta de mejor ajuste

745.4806 117.9173
b >0, entonces la tendencia lineal es creciente
Ya que .

Y -745.4806 117.91x
= PRONOST RESID
73 𝑒 ̅
ICO UOS
669.53 -470.53 124307.5
7
433.69 65.3 346223.30
1
693. - 108233.9
11 394.1 7
469.0 - 305844.65
1
7 170.07
634.1 - 150503.6
5 235.15 4
1353.4 496.5 109791.2
5 5 8
1152.9 - 17131.
9 152.99 73
645.9 741.0 141493.5
4 6 3
1589.2 499.7 321695.7
8 2 7
2579.7 -379.79 2426391.28
9
10221.0 0.0000 4051616.7
0 2

GRAFICO DE LOS
1000.00 RESIDUALES
800.00

600.00

400.00
RESIDU

200.00
OS

0.00
0.00 500.00 1000.00 1500.00 2000.00 2500.00 3000.00
-200.00

-400.00

-600.00
X
ESTIMACIÓN DE LA VARIANZA DE LA
REGRESIÓN POBLACIONAL

VARIANZA DE LA REGRESIÓN MUESTRAL

INFERENCIAS SOBRE LOS


COEFICIENTES DE REGRESIÓN

ESTIMACIÓN DE LA VARIANZA DE b

ERROR ESTANDAR DE b
Intervalo de confianza para

DATOS
N.C 0.95
0.05
G.L error 8
Error estandar
26.83
de b
b 117.92
2.306

Prueba de hipótesis para trata de


probar la hipótesis
o
Hipotesís:
HO : β = β 0
H1 : β ≠ β 0

Decisión: Se rechaza la
Conclusión: Existe regresión significativa entre ambas variables

Anova para

Hipotesís:
HO : β = 0
H1 : β ≠ 0

5729910.
SCT 90
SCRegres 4051616.
ión 72

SCResid 1678294.
ual 18

G.L G.L.
G.L TOTAL
9 Regresión 1 Residual 8
ANALISIS DE
VARIANZA PARA b

CAUSA MEDIA
SUMA DE
DE DE LOS
G.L. CUADRA
VARIAC CUADRA
DOS
IÓN DOS Fcal Ftab

Regresión 1 4051616.72 4051616.72 19.31 5.32


Residual 8 1678294.18 209786.77
TOTAL 9 5729910.90

-Decisión: Ya que , se rechaza y se acepta


-Conclusión: Con un nivel de significancia del 5%, existe
suficiente evidencia estadística para afirmar que
, es decir se refleja la validez del modelo de regresión
poblacional entre ambas variables
CORRELACIÓN

b) COEFICIENTE DE DETERMINACIÓN
Coeficiente de determinación muestral

Ajustado

INTERPRETACIÓN: El valor R2 y R2 ajustado se interpretan de la misma


forma; y esto significa que el 70.71% de la variación de la
variable dependiente es explicada por la regresión lineal

c) COEFICIENTE DE CORRELACION (+1 -1)


Coeficiente de correlación muestral

𝑆
𝑟
𝑆 𝑆 √

34359.81
𝑟
40861.14

𝑟 0.8409
𝑟 0.7071

INTERPRETACIÓN: El grado de la relación lineal es de


0< r < 1, porque r=0.8409; por lo tanto, tiene una
correlación positiva

INFERENCIAS ACERCA DE ρ
Hipotesís:
HO : ρ = 0
H1 : ρ ≠ 0

DATOS
r 0.840
9
0.707
r2 1
n 10
0.05
G.L. 8

TTab 2.306

𝑛2
𝑡𝑐 𝑙 𝑟√1 𝑟

10 2
𝑡𝑐 𝑙 0.8409√
1 0.7071
tcal= 4.3947

Decisión: Se rechaza la y se acepta la


Conclusión: Es significativo, existe correlación lineal

d)
-Conclusión de ANOVA: Con un nivel de significancia del
5%, existe suficiente evidencia estadística para afirmar que
, es decir se refleja la validez del modelo de regresión
poblacional entre ambas variables 7) En Estados Unidos casi
todo el sistema de tranvías usa vagones eléctricos que corren
sobre vías a nivel de la calle. La Administración de Tránsito
Federal afirma que el tranvía es uno de los medios de
transporte más seguros, ya que la tasa de accidentes es 0.99
accidentes por millón de millas-pasajero en comparación con
2.29 en los autobuses. En los datos siguientes se dan las
millas de vía y la cantidad de pasajeros transportados en los
días laborables, en miles, de seis sistemas de tranvías (USA
Today, 7 de enero 2003).
a)Use estos datos para obtener la ecuación de regresión estimada
que podría emplearse para predecir la cantidad de pasajeros
dadas las millas de vías.
b)¿Proporciona la ecuación de regresión estimada un buen
ajuste? Explique.
c) Obtenga un intervalo de 95% de confianza para la media de la
cantidad de pasajeros transportados en los días laborables en
los sistemas de tranvías que tienen 30 millas de vías.
d)Suponga que Charlotte está considerando la construcción de un
sistema de tranvía de 30 millas de vías. Dé un intervalo de
predicción de 95% para la cantidad de pasajeros transportada
en un día laborable por el sistema Charlotte. ¿Cree usted que el
intervalo de predicción que desarrolló pueda ser útil a los que
están planeando Charlotte para anticipar la cantidad de
pasajeros en un día laborable en su sistema de tranvía?
Explique

SOLUCIÓN:

Diagrama de
90 dispersión
80

70

60
DEPENDIENTE

50
YVARIABLE
)

40

30

20
(

10

0
0 5 10 15 20 25 30 35 40 45 50
X(VARIABLE )
INDEPENDIENTE
Variable
Variable
Independient
Dependiente
e

Y X
Pasajeros trans. Millas de vías
15 15
35 17
81 38
31 21
75 47
30 31

42 34

Linea recta de mejor ajuste

Ordenada al origen

Pendiente
15 15 408.00 196.00 849.31 225.00 225.00 225
17 35 109.71 144.00 83.59 289.00 1225.00 595
38 81 331.71 81.00 1358.45 1444.00 6561.00 3078
21 31 105.14 64.00 172.73 441.00 961.00 651
47 75 555.43 324.00 952.16 2209.00 5625.00 3525
31 30 -28.29 4.00 200.02 961.00 900.00 930
34 42 -10.71 25.00 4.59 1156.00 1764.00 1428

203.00 309.00 1471.00 838.00 3620.86 6725.00 17261.00 104


= 29.00 = 44.14
= 11.8181 = 24.5658

Ecuación de la recta de regresión:

P
e
n
d
i
e
n
t
e
b = 1.7554

Ordenada al origen

a = -6.7629

Línea recta de mejor ajuste

6.7629 1.7554

Ya que b > 0, entonces la tendencia lineal es creciente.

TABLA DE
RESIDUALES
Y -6.7629 1.755x
= PRONOST RESID
4 𝑒 ̅
ICO UOS
19.5 -4.57 603.94
7
23.08 11. 443.7
92 1
59.9 21.0 249.59
4 6
30.1 0.90 197.2
0 0
75.7 -0.74 998.35
4
47.65 - 12.3
17.65 3
52.9 - 77.03
2 10.92
309.00 0.0000 2582.1
5
GRAFICO DE LOS
25.00 RESIDUALES
20.00
15.00
10.00

RESIDU
5.00
OS 0.00
0.00 10.00 20.00 30.00 40.00 50.00 60.00 70.00 80.00
-5.00
-10.00
-15.00
-20.00
X

ESTIMACIÓN DE LA VARIANZA DE LA
REGRESIÓN POBLACIONAL

VARIANZA DE LA REGRESIÓN
MUESTRAL

INFERENCIAS SOBRE LOS


COEFICIENTES DE REGRESIÓN
ESTIMACIÓN DE LA VARIANZA DE b

ERROR ESTANDAR DE b

Intervalo de confianza para

DATOS
N.C 0.95
0.05
G.L error 5
Error
0.498
estandar de b
b 1.76
2.571
1.

Prueba de hipótesis para trata de


probar la hipótesis
o

Hipotesís:
HO : β = β 0
H1 : β ≠ β 0

Decisión: Se rechaza la
Conclusión: Existe regresión significativa entre ambas variables

b) Anova para

Hipotesís:
HO : β = 0
H1 : β ≠ 0

SCT 3620.86
𝑆𝑈𝑀𝐴 𝐷𝐸 𝐶𝑈𝐴𝐷𝑅𝐴𝐷𝑂𝑆 𝐷𝐸 𝐿𝐴 𝑅𝐸𝐺𝑅𝐸𝑆𝐼Ó𝑁: ̅𝑖

SCRegres
ión 2582.15

SCResid
ual 1038.71

G.L
G.L TOTAL
Regresió G.L.
6 n 1 Residual 5
ANALISIS DE
VARIANZA PARA b

CAUSA MEDIA
SUMA DE
DE DE LOS
G.L. CUADRA
VARIAC CUADRA
DOS
IÓN DOS Fcal Ftab

Regresión 1 2582.15 2582.15 12.43 6.61


Residual 5 1038.71 207.74
TOTAL 6 3620.86
-Decisión: Ya que , se rechaza y se acepta
-Conclusión: Con un nivel de significancia del 5%,
existe suficiente evidencia estadística para afirmar que
, es decir se refleja la validez del modelo de
regresión poblacional entre ambas variables

INTERVALOS DE ESTIMACIÓN

c) Intervalo de confianza para la media de Y


dado un valor de X

Nos dan : 30

DATOS
a -6.763
b 1.755
x0 30

45.898
n 7
= 29.00
0
S 14.41
3
838.0
Sxx 0
0.05
G.L 5
.
TTab 2.571
31.84 59.96

INTERPRETACIÓN: Esto quiere que decir que


si las millas de vías (Variable independiente) es de
30, se estima que los pasajeros transportados
(Variable dependiente) se encuentra entre 31.84 y
59.96 mil con un nivel de confianza de 95%

d) Intervalo de predicción para Y dado


un valor de X

Nos dan : 30
DATOS
a -
6.763
b 1.755
x0 30

45.898
n 7
= 29.00
0
S 14.41
3
838.0
Sxx 0
0.05
G.L. 5
TTab 2.571

𝟏 𝒙𝟎 𝒙
̅ 𝟐 𝟏𝒙
𝒚̅𝒊 𝒕𝒐 𝑺√𝟏 ≤𝒖𝒀⁄𝑿 ≤𝒚̅𝒊 𝒕𝒐 𝑺√𝟏
𝒏 𝑺𝑿𝑿 𝒏
𝑺𝑿𝑿

𝟏 𝟑𝟎 𝟐𝟗 𝟐
𝟐
𝟑𝟎 𝟐𝟗
𝟒𝟓. 𝟖𝟗𝟖 𝟐. 𝟓𝟕𝟏 𝟏𝟒. 𝟒𝟏𝟑√𝟏 ≤ 𝒖𝒀⁄𝑿 ≤ 𝟒𝟓. 𝟖𝟗𝟖 𝟐. 𝟓𝟕𝟏 𝟏𝟒. 𝟒𝟏𝟑√𝟏

𝟕 𝟖𝟑𝟖
𝟖𝟑𝟖

6.27 85.53

INTERPRETACIÓN: Esto quiere que decir que si


las millas de vías (Variable independiente) es de
30, se estima que los pasajeros transportados
(Variable dependiente) se encuentra entre 6.27 y
85.53 mil con un nivel de confianza de 95%
8) Los expertos en salud recomiendan que los corredores
beban 4 onzas de agua por cada 15 minutos que corran.
Aunque las botellas de plástico son una buena alternativa para
la mayoría de los corredores, cuando se corre todo un día a
campo traviesa se requieren sistemas de hidratación que se
llevan sobre la cintura o sobre la espalda. Estos sistemas de
hidratación además de permitir llevar más agua permiten
llevar también alimento o ropas. Por supuesto, a medida que
aumenta la capacidad de estos sistemas, aumenta también su
peso y su precio. En la lista siguiente se da peso y precio de 26
de estos sistemas de hidratación (Trail Runner Gear Guide,
2003).
a)Con estos datos obtenga una ecuación de regresión estimada
que pueda ser empleada para predecir el precio de un
sistema de hidratación en función de su peso. Interprete el
valor de sus coeficientes. Realice el diagrama de dispersión
b)Pruebe la significancia de la relación empleando 0.05 como
nivel de significancia.
c) ¿Proporciona un buen ajuste la ecuación de regresión
estimada?
d)Suponga que la ecuación de regresión estimada obtenida en
el inciso a) también pueda usarse para sistemas de
hidratación elaborados por otras empresas. Obtenga un
intervalo de confianza de 95% para estimar el precio de
todos los sistemas de hidratación que pesan 10 onzas.
e) Suponga que la ecuación de regresión estimada obtenida en
el inciso a) también pueda usarse para sistemas de
hidratación elaborados por otras empresas. Obtenga un
intervalo de predicción de 95% para estimar el precio del
sistema Back Draft elaborado por Eastern Mountain Sports;
este sistema de hidratación pesa 10 onzas. f) Evaluar que ρ
≠ 0.90
g) Pruebe la normalidad de los errores utilizando la prueba de
Jarque bera
Diagrama de
70 dispersión

60

50

DEPENDIENTE
40

YVARIABLE
)

30

20
(
10

0
0 5 10 15 20 25
X(VARIABLE )
INDEPENDIENTE

a)
Linea recta de mejor ajuste

Ordenada al origen

Pendiente
Variable
Variable
Independient
Dependiente
e

Y X
Precio Peso (Onzas)
10 3

12 4

12 5

20 7

25 8

25 9

35 9

35 11

45 21

40 15

60 18

30 9

40 12

60 14

65 16

65 16
20 3

7 1

10 2

10 1

30 8

40 14

35 9

55 19

50 14

60 13

3 10 172.17 49.54 598.37 9.00 100.00 3


4 12 135.63 36.46 504.52 16.00 144.00 4
5 12 113.17 25.39 504.52 25.00 144.00 6
7 20 43.94 9.23 209.14 49.00 400.00 1
8 25 19.29 4.16 89.52 64.00 625.00 2
9 25 9.83 1.08 89.52 81.00 625.00 2

9 35 -0.56 1.08 0.29 81.00 1225.00 3


11 35 0.52 0.92 0.29 121.00 1225.00 3

21 45 115.52 120.16 111.06 441.00 2025.00 9


15 40 27.48 24.62 30.67 225.00 1600.00 6
18 60 203.33 63.39 652.21 324.00 3600.00 1
9 30 4.63 1.08 19.91 81.00 900.00 2
12 40 10.86 3.85 30.67 144.00 1600.00 4
14 60 101.17 15.69 652.21 196.00 3600.00 8
16 65 182.06 35.54 932.60 256.00 4225.00 1
16 65 182.06 35.54 932.60 256.00 4225.00 1
3 20 101.79 49.54 209.14 9.00 400.00 6
1 7 248.21 81.69 754.14 1.00 49.00
2 10 196.63 64.62 598.37 4.00 100.00 2
1 10 221.09 81.69 598.37 1.00 100.00
8 30 9.09 4.16 19.91 64.00 900.00 2
14 40 21.94 15.69 30.67 196.00 1600.00 5
9 35 -0.56 1.08 0.29 81.00 1225.00 3
19 55 184.06 80.31 421.83 361.00 3025.00 1
14 50 61.56 15.69 241.44 196.00 2500.00 7
13 60 75.63 8.77 652.21 169.00 3600.00 7
261. 896.0 2440.54 830.96 8884.46 3451.00
00 0 39762.00 1143
= 10. = 34.46
04
= 5.76 = 18.85
53 15

Ecuación de la recta de regresión:


Pen
d
i
e
n
t
e

b = 2.9370

Ordenada al origen

a = 4.9785

Línea recta de mejor ajuste

4.9785 2.9370

Ya que b > 0, entonces la tendencia lineal es Creciente.


Además, nos refiere que, por el incremento del peso, el costo
es $2.93
 Podemos deducir que “a “nos dice que cuando el peso es
igual a 0, los costos crecen a $4.9785
TABLA DE
RESIDUALES
Y 4.9785 2.9370x
= PRONOSTI RESIDU
𝑒 ̅
CO OS
13.7 -3.79 427.33
9
16.7 -4.73 314.5
3 3
b) PRUEBAS DE 19.6 -7.66 218.9
6 8
SIGNIFICACANCIA 25.54 -5.54 79.64
28.4 -3.47 35.84
ESTIMACIÓN DE LA 7
VARIANZA DE LA 31.4 - 9.30
1 6.41
REGRESIÓN POBLACIONAL 31.4 3.59 9.30
1
37.29 -2.29 7.98

66.66 - 1036.4
21.66 6
49.03 -9.03 212.3
5
57.84 2.1 546.77
6
31.4 - 9.30
1 1.4
40.22 -0.22 33.1
1
9
46.1 13.9 135.3
0 0 7
51.9 13.0 306.57
7 3
51.9 13.0 306.57
7 3
13.7 6.2 427.33
9896.00 10.0000 7167.87
10.8 -0.85 557.39
5
7.92 2.08 704.69
28.4 1.5 35.84
7 3
46.1 - 135.3
VARIANZA
0 DE LA
6.10 REGRESIÓN
7
31.4 3.59 9.30
MUESTRAL
1
60.78 -5.78 692.75
46.1 3.90 135.3
0 7
43.1 16.8 75.66
6 4

GRAFICO DE LOS
20.00 RESIDUALES
15.00
10.00
5.00
RESIDU

0.00
0.00 10.00 20.00 30.00 40.00 50.00 60.00 70.00
OS

-5.00
-10.00 INFERENCIASSOBRE LOS
-15.00 COEFICIENTES DE REGRESIÓN
-20.00
ESTIMACIÓN
-25.00
DE LA VARIANZA DE b
X

ERROR ESTANDAR DE b
Intervalo de confianza para

DATOS
N.C 0.95
0.05
G.L error 24
Error estandar
0.293
de b
b 2.94
2.064

2.

Prueba de hipótesis para trata de


probar la hipótesis
o

Hipotesís:
HO : β = β 0
H1 : β ≠ β 0
Decisión: Se rechaza la
Conclusión: Existe regresión significativa entre ambas variables

C) Anova para

Hipotesís:
HO : β = 0
H1 : β ≠ 0

𝑆𝑈𝑀𝐴 𝐷𝐸 𝐶𝑈𝐴𝐷𝑅𝐴𝐷𝑂𝑆 𝑂 𝐴𝐿:

SCT 8884.46

SCRegres
ión 7167.87

SCResid
ual 1716.59
G.L G.L.
G.L TOTAL
25 Regresión 1 Residual 24

ANALISIS DE
VARIANZA PARA b

CAUSA MEDIA
SUMA DE
DE DE LOS
G.L. CUADRA
VARIAC CUADRA
DOS
IÓN DOS Fcal Ftab

Regresión 1 7167.87 7167.87 100.22 4.26


Residual 24 1716.59 71.52
TOTAL 25 8884.46

-Decisión: Ya que , se rechaza y se acepta


-Conclusión: Con un nivel de significancia del 5%, existe
suficiente evidencia estadística para afirmar que
, es decir se refleja la validez del modelo de regresión
poblacional entre ambas variables

INTERVALOS DE ESTIMACIÓN

d) Intervalo de confianza para la media de Y


dado un valor de X

Nos dan : 10

DATOS
a 4.979
b 2.937
x0 10

34.349
n 26
= 10.038
S 8.457
830.9
Sxx 6
0.05
G.L 24
.
TTab 2.064

30.93 37.77
INTERPRETACIÓN: Esto quiere que decir que si el
peso de las onzas (Variable independiente) es de 10, se
estima que el precio (Variable dependiente) se encuentra
entre 30.93 y 37.77 dólares con un nivel de confianza de
95%

e) Intervalo de predicción para Y dado


un valor de X
Nos dan : 10
DATOS
a 4.979
b 2.93
7
x0 10

34.349
n 26
= 10.03
8
S 8.45
7
830.9
Sxx 6
0.05
G.L. 24
TTab 2.064

𝒚̅𝒊 𝒕𝒐 𝑺√𝟏 𝟏 𝒙𝟎 𝒙
̅ 𝟐 ≤𝒖𝒀⁄𝑿 ≤𝒚̅𝒊 𝒕𝒐 𝑺√𝟏 𝟏 𝒙𝟎 𝒙̅ 𝟐
𝒏 𝑺𝑿𝑿 𝒏
𝑺𝑿𝑿

𝟏 𝟏𝟎 𝟏𝟎. 𝟎𝟑𝟖 𝟐 𝟏
𝟐
𝟏𝟎 𝟏𝟎. 𝟎𝟑𝟖
𝟑𝟒.𝟑𝟒𝟗 𝟐. 𝟎𝟔 𝟖. 𝟒𝟔√𝟏 ≤ 𝒖𝒀⁄𝑿 ≤ 𝟑𝟒.𝟑𝟒𝟗 𝟐. 𝟎𝟔 𝟖. 𝟒𝟔√𝟏

𝟐𝟔 𝟖𝟑𝟎. 𝟗𝟔 𝟐𝟔
𝟖𝟑𝟎. 𝟗𝟔

16.56 ≤ ⁄ ≤ 52.14

INTERPRETACIÓN: Esto quiere que decir que si el peso


de las onzas (Variable independiente) es de 10, se estima
que el precio (Variable dependiente) se encuentra entre
16,56 y 52.14 dólares con un nivel de confianza de 95%

CORRELACIÓN

COEFICIENTE DE DETERMINACIÓN
Coeficiente de determinación muestral

Ajustado

INTERPRETACIÓN: El valor R2 y R2 ajustado se interpretan de la misma


forma; y esto significa que el 80.68% de la variación de
la variable dependiente es explicada por la regresión lineal

COEFICIENTE DE CORRELACION (+1 -1)


Coeficiente de correlación muestral

𝑆
𝑟
𝑆 𝑆 √

2440.54
𝑟
2717.10

INTERPRETACIÓN: El grado de la relación lineal es de


0< r < 1, porque r=-0.8968; por lo tanto, tiene una
correlación positiva

INFERENCIAS
ACERCA DE ρ
Hipotesís:
HO : ρ = 0
H1 : ρ ≠ 0
DATOS
r 0.898
2
r2 0.806
8
n 26
𝑛2
0.05
𝑡𝑐 𝑙 𝑟√1 𝑟
G.L
. 24
TTa
b 2.064

26 2
𝑡𝑐 𝑙 0.8982√
1 0.8068
tcal= 10.0108

Decisión: Se rechaza la y se acepta la


Conclusión: Es significativo, existe correlación lineal

Si es significativo:

F) Nueva Hipotesís:
HO: ρ = 0.9
H1: ρ 0.9
Zcal = -0.0447

Ztab = 1.9600

Decisión: Se acepta la 𝐻𝑂y se rechaza la 𝐻1


Conclusión: Se concluye que no hay evidencia de que el
coeficiente poblacional es diferente al valor 0.9

g)PRUEBA DE
NORMALIDAD DE
ERRORES O RESIDUOS

Hipotesís:
HO La distribución de los errores de los datos se
aproxima a una normal
H1 La distribución de los errores de los datos no se
aproxima a una normal
DATOS
n 26
G.L. 2
t 26
(period
o)
𝜶 0.05
𝑿𝟐𝑻𝒂𝒃 5.991
RESIDU e2 e3 e4
OS e

-3.79 14.36 -54.42 206.23


-4.73 22.34 -105.59 499.09
-7.66 58.73 -450.08 3449.21
-5.54 30.66 -169.81 940.32
-3.47 12.07 -41.95 145.75
-6.41 41.11 -263.57 1689.89
3.59 12.88 46.21 165.81
-2.29 5.22 -11.94 27.29
-
10155.7
-21.66 468.97 7 219929.61
-9.03 81.61 -737.20 6659.54
2.16 4.65 10.01 21.58
-1.41 1.99 -2.81 3.97
-0.22 0.05 -0.01 0.00
13.90 193.30 2687.59 37366.66
13.03 169.77 2211.94 28820.17
13.03 169.77 2211.94 28820.17
6.21 38.57 239.54 1487.63
-0.92 0.84 -0.77 0.70
-0.85 0.73 -0.62 0.53
2.08 4.35 9.06 18.88
1.53 2.33 3.55 5.41
-6.10 37.17 -226.60 1381.50
3.59 12.88 46.21 165.81
-5.78 33.43 -193.26 1117.38
3.90 15.24 59.47 232.15
16.84 283.60 4775.93 80428.57
0.00 1716.59 -112.96 413583.8
6

A= -0.0081

K= 3.6493
-Decisión: Ya que , se acepta y se rechaza

-Conclusión: Con un nivel de significancia del 5%,


existe suficiente evidencia estadística para afirmar que
La distribución de los errores de los datos se aproxima a
una normal

9) Cushman Wakefield, Inc. recoge datos sobre la tasa de


desocupación en edificios de oficinas y las tasas de las
rentas en mercados de Estados Unidos. Los datos
siguientes dan la tasa de desocupación (%) y las tasas de
rentas promedio (por pie cuadrado) en las zonas
comerciales centrales de 18 mercados.
a) Con estos datos trace un diagrama de dispersión; en el
eje horizontal grafique la tasa de desocupación.
b)¿Parece haber alguna relación entre las tasas de
desocupación y las tasas de rentas?
c) Dé la ecuación de regresión para predecir la tasa
promedio de renta en función de una tasa de
desocupación dada.
d)Empleando como nivel de significancia 0.05 pruebe la
significancia de esta relación.
e) ¿Proporciona, la ecuación de regresión estimada, un
buen ajuste? Explique.
f) Pronostique la tasa de renta esperada en los mercados
en los que la tasa de desocupación en zonas
comerciales centrales es 25%.
g) La tasa de desocupación general en la zona comercial
central de Ft. Lauderdale es 11.3%. Pronostique la tasa
de renta esperada en Ft. Lauderdale.
a)
Diagrama de
40 dispersión
35

30
DEPENDIENTE

25
YVARIABLE
)

20

15

10
(

0
0 5 10 15 20 25
X(VARIABLE )
INDEPENDIENTE

b) Que los valores se ven aproximados entre las variables


XyY
c)
Linea recta de mejor ajuste

O
r
d
e
n
a
d
a

a
l

o
r
i
g
e
n

Pendiente

Variable
Variable
Independient
Dependiente
e

Y X
Tasa promedio Tasa de desoc.
% %
18.54 21.9
33.7 6
19.67 22.8
21.01 18.1
35.09 12.7
19.41 14.5

25.28 20
17.02 19.2
24.04 16
31.42 6.6
18.74 15.9
26.76 9.2
27.72 19.7
18.2 20
25 8.3
29.78 17.1
37.03 10.8
28.64 11.1
Ecuación de la recta
de regresión:
Pen
d
i
e
n
t
e

b = -0.7792

Ordenada al origen

a = 37.0747

Línea recta de mejor ajuste

37.0747 0.7792
Ya que b < 0, entonces la tendencia lineal es decreciente.
 Podemos deducir que “a “nos dice que cuando la tasa de
desocupación % es igual a 0, la tasa promedio es % 37.07.
TABLA DE
RESIDUALES
Y 37.074 -0.7792x
= PRONOSTI
7 𝑒
RESIDU ̅
CO OS
20.0 - 28.95
1 1.47
32.40 1.3 49.1
0 1
19.3 0.36 36.99
1
22.9 - 5.86
7 1.96
27.1 7.9 3.20
8 1
25.78 -6.37 0.1
5
21.4 3.79 15.2
9 1
22.1 -5.09 10.7
1 4
24.6 -0.57 0.6
1 1
31.9 - 42.78
3 0.51
24.69 -5.95 0.50
29.9 - 20.38
1 3.15
21.7 5.99 13.4
3 4
21.4 -3.29 15.2
9 1
30.6 - 27.2
1 5.61 1
23.75 6.03 2.69
28.66 8.3 10.6
7 8
28.43 0.2 9.2
1 1
457.05 0.0000 292.91
GRAFICO DE LOS
10.00 RESIDUALES
8.00
6.00
4.00

RESIDU
2.00
OS 0.00
0.00 5.00 10.00 15.00 20.00 25.00 30.00 35.00
-2.00
-4.00
-6.00
-8.00
X

d) PRUEBAS DE SIGNIFICANCIA

ESTIMACIÓN DE LA VARIANZA DE LA
REGRESIÓN POBLACIONAL

VARIANZA DE LA REGRESIÓN MUESTRAL

INFERENCIAS SOBRE LOS


COEFICIENTES DE REGRESIÓN
ESTIMACIÓN DE LA VARIANZA DE b

ERROR ESTANDAR DE b

Intervalo de confianza para

DATOS
N.C 0.95
0.05
G.L error 16
Error estandar
0.22238
de b
b -0.78
2.120
Prueba de hipótesis para trata de
probar la hipótesis
o

Hipotesís:
HO : β = β 0
H1 : β ≠ β 0
Decisión: Se acepta la
Conclusión: No existe regresión significativa entre ambas variables

e) Anova para

Hipotesís:
HO : β = 0
H1 : β ≠ 0

𝑆𝑈𝑀𝐴 𝐷𝐸 𝐶𝑈𝐴𝐷𝑅𝐴𝐷𝑂𝑆 𝑂 𝐴𝐿:

SCT 674.68
𝑆𝑈𝑀𝐴 𝐷𝐸 𝐶𝑈𝐴𝐷𝑅𝐴𝐷𝑂𝑆 𝐷𝐸 𝐿𝐴 𝑅𝐸𝐺𝑅𝐸𝑆𝐼Ó𝑁: ̅𝑖

SCRegres
ión 292.91

SCResid
ual 381.77

G.L
G.L TOTAL
Regresió G.L.
17 n 1 Residual 16
ANALISIS DE
VARIANZA PARA b

CAUSA MEDIA
SUMA DE
DE DE LOS
G.L. CUADRA
VARIAC CUADRA
DOS
IÓN DOS Fcal Ftab

Regresión 1 292.91 292.91 12.28 4.49


Residual 16 381.77 23.86
TOTAL 17 674.68

-Decisión: Ya que , se rechaza y se acepta


-Conclusión: Con un nivel de significancia del 5%, existe
suficiente evidencia estadística para afirmar que ,
es decir se refleja la validez del modelo de regresión
poblacional entre ambas variables

f)

X= 25 %

 Podemos predecir que si La tasa de desocupación general


en la zona comercial central de Ft. Lauderdale del 25 % ,
la tasa de renta esperada en Ft. Lauderdale es 17.5958 %
g)

X= 11.3 %

 Podemos predecir que si La tasa de desocupación general


en la zona comercial central de Ft. Lauderdale del
11.3 % , la tasa de renta esperada en Ft. Lauderdale es 28.27
%.

También podría gustarte