Trabajo Unidad IV

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 26

C

UNIVERSIDAD VERACRUZANA

Facultad de ciencias químicas


Orizaba-Córdoba
Químico farmacéutico biólogo
Sección: 103 Métodos Estadísticos y de Desarrollo
experimental.
Profesor. Carlos Díaz Ramos.

Trabajo Unidad IV
Equipo 5: Gabriel González Hernández
Monserrat Espinoza Ruiz
Guillermo Ávila Herrera

02-diciembre -21.

Introducción
En la siguiente actividad se les presentara el desarrollo de los problemas del
capitulo 14 correspondientes a la Unidad IV, en los cuales aplicaremos el uso de
diagramas de dispersión, los que a su vez nos permiten estudiar las relaciones
entre dos conjuntos de datos asociados que aparecen en pares. Gracias a la
realización de estos problemas podremos observar varios de sus usos, entre los
cuales destaca el hecho de que es utilizado para descubrir y mostrar las
relaciones entre dos conjuntos de datos y confirmar relaciones anticipadas entre
dos conjuntos de datos, esta y varios usos más serán aplicados a lo largo de este
trabajo, el cual esperamos sea de su total comprension.

Capítulo 14
4. Los datos siguientes son estatura (en pulgadas) y pesos (en libras) de
nadadoras.
Estatur 68 64 62 65 66
a
Peso 132 10 102 115 128
8

a) Trace
Datos de nadadoras. el
140 128 132
115
120 102 108
100
80
Peso

60
40
20
0
61 62 63 64 65 66 67 68 69

Estatura

diagrama de dispersión de estos datos usando la estatura como variable


independiente.
b) ¿Qué indica el diagrama de dispersión del inciso a) respecto de la relación
entre las dos variables?
Parece haber una relación lineal positiva entre x = estatura y y = peso
c) Trate de aproximar la relación entre estatura y peso trazando una línea recta
a través de los puntos de los datos.

Datos de nadadoras.
140 128 132
115
120 108
102
100
80
Peso

60
40
20
0
61 62 63 64 65 66 67 68 69

Estatura

d) Desarrolle la ecuación de regresión estimada calculando los valores de b 0 y


b1

x=
∑ xi = 365 =65 y=
∑ yi = 585 =117
n 5 n 5

xi−x xi−x
(¿) yi− y )=110
( ¿
¿
∑¿ ∑¿
xi
xi−x
¿
2
¿
¿ b0 = y−b 1 x=117−( 5.5 )( 65 ) =−240.5
∑¿
∑ (¿−x )( yi− y )
¿
b 1=¿
^y =−240.5+5.5 x

e) Si la estatura de una nadadora es de 63 pulgadas, ¿cuál será su peso


estimado?
^y =−240.5+5.5 ( 63 )=106 El peso estimado es 106 libras.

5. Las ejercitadoras elípticas se están convirtiendo en una de las máquinas de


ejercicio más populares. Su movimiento de bajo impacto es suave y estable, lo
que las vuelve la elección preferida por las personas con problemas en rodillas y
tobillos. Sin embargo, elegir la ejercitadora adecuada puede resultar un proceso
difícil. El precio y la calidad son factores importantes en cualquier decisión de
compra. ¿Están asociados los precios altos con las ejercitadoras elípticas de alta
calidad? Consumer Reports realizó amplias pruebas para desarrollar una
clasificación general basada en facilidad de uso, ergonomía, construcción y rango
de ejercicio.
A continuación, se muestran los datos de precio (Price) y calificación (Rating) de
ocho ejercitadoras elípticas probadas, de las cuales se detallan marca y modelo
(Brand and Model) (Consumer Reports, febrero de 2008).

a) Trace un diagrama de dispersión con estos datos empleando el precio


como variable independiente.

Gráfico de Dispersión
100
90
80
70
60
50
40
30
20
10
0
0 500 1000 1500 2000 2500 3000 3500 4000
b) Una tienda de equipo para ejercitarse que vende principalmente equipo caro
puso un letrero sobre el área de exhibición que dice: “Calidad: usted obtiene lo que
paga.” Con base en su análisis de los datos, ¿considera usted que el letrero refleja
de manera justa la relación precio-calidad de las ejercitadoras elípticas?

Del gráfico de dispersión se obtuvo el coeficiente de correlación, el cuál es 0.8774


y se llega a la conclusión de que el letrero refleja de manera justa la relación
precio-calidad.

c) Utilice el método de mínimos cuadrados para obtener la ecuación de regresión


estimada.

Del procedimiento realizado en Excel, se obtiene la ecuación de regresión


^y i=58.15849+0.008 x i
La cual va de acuerdo con el modelo ^y i=b 0+ b1 x i

d) Utilice la ecuación de regresión estimada para predecir la clasificación de una


ejercitadora elíptica con un precio de $1500.

Con la ecuación obtenida, se sustituye el valor de 1500


^y i=58.15849+0.008 x i
^y i=58.15849+0.008 ( 1500 )
^y i=58.15849+12
^y i=70.15849

Gráfico de Dispersión En el siguiente


100 gráfico se
90 muestra donde
80
se ubica la
ejercitadora
70
elíptica de
60 $1500.
50
40
30
20
10
0
0 500 1000 1500 2000 2500 3000 3500 4000
6. El costo de un automóvil seminuevo depende de factores como marca y
modelo, año, millas recorridas, condiciones y si se compra en una agencia o a un
vendedor particular. Para investigar la relación entre millas (Miles) recorridas y
precio (Price) de venta, se obtuvieron los datos de 10 operaciones de compra-
venta entre particulares de un Honda Accord modelo 2000 (sitio web de PriceHub,
octubre de 2008).

a) Trace un
diagrama de dispersión tomando las millas como la variable independiente.

b) ¿Qué indica el diagrama de dispersión del inciso a) acerca de la relación entre


las dos
variables?
Aunque
existe una relación
cercana a la
recta no es muy
contundente
su relación, por
lo que se
necesitan
más muestras
para establecer
una evaluación más cercana a la realidad.

El coeficiente de relación se encuentra por debajo de lo solicitado que sería un


mínimo de 0.8 o lo más cercano posible al 1, sin embargo, al haber datos que se
ubican en la recta, se podría pensar que con mayor información se puede tener
una conclusión más certera.

c) Use el método de mínimos cuadrados para desarrollar la ecuación de regresión


estimada.

n ∑ XY −∑ X ∙ ∑ Y 5∗2764,5−392∗35,3
b= 2
= 2
=−0,003458543289
2
n ∑ X −( ∑ X ) 5∗31606−392

x́ 78,4

ý 7,06 n ∑ xy −∑ x ∑ y
b= 2
n ∑ x2 −( ∑ x )
a= 7,3311464

Y= 7,3311-0,0035x

d) Proporcione una interpretación para la pendiente de la ecuación de regresión estimada.


Al parecer hay una relación estrecha entre para establecer el precio de acuerdo con las
millas recorridas, a mayor número de millas recorridas el precio baja, aunque a simple
vista no es una constante exacta por lo que pudiera haber otras variables que influyen en
el precio
e) Prediga el precio de venta de un Honda Accord 2000 con 100 000 millas

Interpretación:
y= 7,3311-0,0035x
y= 7,3311-0,0035(100)
y= 6,9811 o aproximadamente ($ 6 981,1)

7. Un gerente de ventas obtuvo los


siguientes datos sobre ventas anuales (Annual Sales) y años de experiencia (Years of
Experience) de 10 vendedores (Salesperson)

a) Trace un diagrama de dispersión con estos datos tomando como variable


independiente los años de experiencia.
160

140

120

100
Axis Title
80

60

40

20

0
0 2 4 6 8 10 12 14
Axis Title

b) Obtenga una ecuación de regresión estimada que pueda utilizarse para predecir las
ventas anuales proporcionando los años de experiencia.
Solución
=x́7 ∑ y −a ∑ x
b=
=ý 108 n
∑ x=70 1080−4 (70)
b= =80
∑ y =1080 10
n=10 x
Fórmulas ∑ ¿2
¿
γ =αx+ b n ∑ x 2−¿
x n ∑ xy−∑ x ∑ y
α=
¿
∑ ¿2 10 ( 8128 )−(70)(1080)
¿ a= =4
n ∑ x 2−¿ 10 ( 632 ) −(70)2
n ∑ xy−∑ x ∑ y
α=
¿
x y xy x^2
1 80 80 1
3 97 291 9
4 92 368 16
4 102 408 16
6 103 618 36
8 111 888 64
10 119 1190 100
10 123 1230 100
11 117 1287 121
13 136 1768 169
Sumatoria 70 1080 8128 632
Media 7 108

c) Utilice la ecuación de regresión estimada para predecir las ventas anuales


de un vendedor con 9 años de experiencia.
Solución
y=4 x+ 80
y=4( 9)+ 80=116

Con 9 años de experiencia se estima que un vendedor venderá anualmente 116


pesos.
8. Bergans of Norway fabrica equipo para deportes a la intemperie desde 1908.
Los siguientes datos muestran el rango de temperatura (Temperature Rating) en
ºF y el precio (Price) en dólares de 11 modelos (Model) de sleeping bags
fabricados por Bergans (Backpacker 2006 Gear Guide).
Model Temperature rating (° F) Price ($)
Ranger 3-Seasons 12 319
Ranger Spring 24 289
Ranger Winter 3 389
Rondane 3-Season 13 239
Rondane Summer 38 149
Rondane Winter 4 289
Senja Ice 5 359
Senja Snow 15 259
Senja Zero 25 229
Super Light 45 129
Tight & Light 25 199

a) Trace un diagrama de dispersión con estos datos, en el que la variable independiente sea el
rango de temperatura (°F).
Scatterplot of Price ($) vs Temperature rating (° F)
400

350

300
Price ($)

250

200

150

100
0 10 20 30 40 50
Temperature rating (° F)

b) ¿Qué indica el diagrama de dispersión del inciso a) respecto de la relación entre el rango
de temperatura (°F) y precio?

Correlation: Temperature rating (° F), Price ($)

Pearson correlation of Temperature rating (° F) and Price ($) = -0.897

Esto quiere decir que a mayor precio hay menos temperatura


c) Use el método de mínimos cuadrados para desarrollar la ecuación de regresión estimada.
Fitted Line Plot
Price ($) = 359.3 - 5.277 Temperature rating (° F)
400 S 37.9372
R-Sq 80.4%
R-Sq(adj) 78.3%
350

300
Price ($)

250

200

150

100
0 10 20 30 40 50
Temperature rating (° F)

yˆ = 359.2668 - 5.2772x
d) Prediga cuál será el precio de un sleeping bag si el rango de temperatura (°F) es 20.
Se remplaza X por 20 en la ecuación de regresión:
yˆ =359.2668 - 5.2772 (20) = 254
$254

18. En los datos siguientes, y corresponde a los sueldos mensuales y x es el


promedio obtenido por los estudiantes que terminaron su grado en administración
con especialidad en sistemas de información. La ecuación de regresión estimada
con estos datos es ^y = 1 790.5 + 581.1x.
Promedio x Sueldo mensual ($) y

2.6 3 300
3.4 3 600
3.6 4 000
3.2 3 500
3.5 3 900
2.9 3 600
a) Calcule las SCE, STC y SCR
b) Calcule el coeficiente de determinación r 2. Haga un comentario sobre la
bondad del ajuste.
c) Determine el valor del coeficiente de correlación muestral.
Resolución:
- Se suman los datos correspondientes para el promedio (x), obteniéndose:
19.2 ÷ 6 = 3.2
- Se suman los datos correspondientes para el salario mensual (y),
obteniéndose: 21 900 ÷ 6 = 3 650
- Producto de xy : 70 510
- x2 e y2 : 62.18 y 80 270 000
- Se adjunta el cálculo de coeficiente de correlación, obteniéndose:0.8636
- Se obtiene el coeficiente de determinación, el cual da como resultado:
r2 = (0.8636)2
r2 = 0.746 = 74.6%

a) Ecuación de regresión estimada y media para la variable dependiente:


^y = 1 790.5 + 581.1x
ý = 3 650

La suma de cuadrados debido al error y la suma total de cuadrados:

y i−^y 2
SCE = ∑ ) = 85 135.14
¿
y i− ý 2
STC = ∑ ) = 335 000
¿
Por tanto, SCR = STC – SCE
= 335 000 – 85 135.14 = 249 864.86
2 SCR 249 864.86
b) r = = =0.746
STC 335,000
La recta de mínimos cuadrados representa 74.6% de la suma total.

c) r xy = √ 0.746=+ 0.8637

∑X ∑Y ∑XY ∑X2 ∑Y2

2.6 3 300 8 580 6.76 10 890 000

3.4 3 600 12 240 11.56 12 960 000

3.6 4 000 14 400 12.96 16 000 000

3.2 3 500 11 200 10.24 12 250 000


3.5 3 900 13 650 12.25 15 210 000

2.9 3 600 10 440 8.41 12 960 000

19.2 21 900 70 510 62.18 80 270 000

¿
n ∑Y −(∑Y ¿2)
2

X 2−(¿ ∑ X ¿2)∗¿
n∑ ¿
¿
√¿
n ∑ XY −∑ X ∑ Y
r=
¿

6∗62.18−(19.2)
¿2
21900 ¿
¿
¿❑
6∗80 270 000−¿ = 0.8636
( ¿¿ 2)∗¿
¿
√¿
6∗70 510−19.2∗21900
r= ¿
Se puede concluir que el coeficiente de correlación es positivo, por lo cual urge
una alta correlación entre los salarios mensuales con respecto a los promedios de
los estudiantes.
Por otra parte, el porcentaje del coeficiente de determinación indica que más del
74% de los salarios mensuales de la muestra se explican por sus respectivos
promedios de estudiantes.
19. En el ejercicio 7 un gerente de ventas obtuvo los siguientes datos sobre y= ventas
anuales (Annual Sales) y x= años de experiencia (Years of Experience) de 10
vendedores (Salesperson).
La ecuación de regresión estimada para estos datos es ^y = 80 + 4x.
Ventas
pronostica Error al
Xi (Años de s Total, de
Yi (Ventas Error cuadrado
Vendedores experiencia Y ^ i cuadrado
anuales) Yi - Y (Yi - Y ^
) ¿ = (Yi – ý )2
i) 2

¿^
80+4x)
1 1 80 84 -4 16 784
2 3 97 92 5 25 121
3 4 92 96 -4 16 256
4 4 102 96 6 36 36
5 6 103 104 -1 1 25
6 8 111 112 -1 1 9
7 10 119 120 -1 1 121
8 10 123 120 3 9 225
9 11 117 124 -7 49 81
10 13 136 132 4 16 784
∑Yi= 1080 ∑= 170 ∑= 2442

a) Calcule las SCE, STC y SCR.

SCE = ∑ (Yi - Y^ i)2= 170


STC = ∑ (Yi - Ý )2= 2442
SCR = STC – SCE= 2442 – 170= 2272
b) Calcule el coeficiente de determinación r2. Haga un comentario sobre la bondad del
ajuste.
SCR 2272
r2= = =0.9304
STC 2442
El 93.04% de la variabilidad en las ventas se debe a la relación lineal que existe
entre los años de experiencia y las ventas. Sería bueno que la ecuación de
regresión tuviera un ajuste tan bueno.
c) ¿Cuál es el valor del coeficiente de correlación muestral?

rxy= (signo de b) √ r2
rxy= (+) √ ❑0.9304=0.9646
Se concluye que existe una relación lineal fuerte entre x y y.

20. Consumer Reports publica extensas pruebas y evaluaciones de más de 100


televisores de alta definición. Para cada modelo se elaboró una puntuación
general basada principalmente en la calidad de la imagen. Una puntuación más
alta indica un mejor funcionamiento. En los datos siguientes se proporcionan el
precio (Price) y la puntuación (Score) general de 10 televisores de plasma de 42
pulgadas con su respectiva marca (Brand) (Consumer Reports, marzo de 2006).
a) Utilice estos datos para desarrollar una ecuación de regresión estimada que pueda emplearse
para determinar la puntuación general de un televisor de plasma de 42 pulgadas dado el precio.

Primero hay que desarrollar una tabla para más facilidad en los resultados que se van a desarrollar

Ahora como la fórmula dice hay que sumar todos los resultados X,Y ,X*Y ,X*X

Y hacer lo que emplea en la siguiente fórmula para obtener a y también b

a=

∑ Y ⋅∑ X 2−∑ X ⋅∑ XY 496∗90360000∗29600∗1503000
= = 12.017
n ⋅ Σ X 2− ( ∑ X ) 2 10∗90360000∗2960 02
b=
29600 ¿2
n∗∑ XY ⋅−∑ X ⋅∑Y 10∗90360000−¿
= =0.013
n⋅ Σ X 2 −( ∑ X )2 10∗1503000−29600∗496
¿
ahora solo es sustituir

y= a+b*z

y= 12.017 +0.013*z
b) Calcule r2 . ¿Proporcionó un buen ajuste la ecuación de regresión estimada?
En esta ecuación hay que sacar la suma de los cuadrados
2
yi− ý ¿
SST= ¿ =982.4
∑¿
^y i− ý ¿ 2
SSR= ¿ = 471.7821
∑ ¿

^y i− yi¿ 2
SSE= ¿ = 548.3421
∑¿
Ahora para el coeficiente de determinación es la relación entre SSR Y SST

SSR 471.7821
r 2= = =0.4802=48.02 %
SST 982.4
Según el resultado que nos dio la ecuación la variabilidad es de un 48.2% y es una ecuación de
regresión hasta cierto punto de un buen ajuste

c) Estime la puntuación general de un televisor cuyo precio es de $3 200.

Solo se toma los valores antes mencionados en los cuestionamientos y se ordena de la sig manera
agregando un (3200) a la ecuación y nos dará el resultado

Y= 12.017 + 0.013(3200) =53.617

21. Una aplicación importante del análisis de regresión en la contaduría es la estimación de costos.
Partiendo de datos sobre volumen de producción y costos, y empleando el método de mínimos
cuadrados para desarrollar una ecuación de regresión estimada que relacione ambos datos, un
contador puede calcular los costos correspondientes a un determinado volumen de producción.
Considere la siguiente muestra de datos sobre volumen de producción y costo total de una
operación de manufactura.
Costo total
Volumen de producción (unidades)
($)
400 4000
450 5000
550 5400
600 5900
700 6400
750 7000

a) Utilice estos datos para desarrollar la ecuación de regresión estimada útil a efecto de
pronosticar los costos totales dado un volumen de producción determinado.
Análisis de regresión: Costo total ($) vs. Volumen de producción (unidades)

Análisis de Varianza

Fuente GL SC Ajust. MC Ajust. Valor F Valor p


Regresión 1 5415000 5415000 92.83 0.001
Volumen de producción (unidades) 1 5415000 5415000 92.83 0.001
Error 4 233333 58333
Total 5 5648333

Resumen del modelo

R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
241.523 95.87% 94.84% 88.36%

Coeficientes

EE del
Término Coef coef. Valor T Valor p VIF
Constante 1247 464 2.69 0.055
Volumen de producción (unidades 7.600 0.789 9.63 0.001 1.00

Ecuación de regresión
Ŷ=b0 + b1xi
Costo total ($) = 1247 + 7.600 Volumen de producción (unidades)
Ŷ= 1247 + 7.600Xi

b) ¿Cuál es el costo variable por unidad producida? 7.600


c) Calcule el coeficiente de determinación. ¿Qué porcentaje de la variación en
los costos totales puede ser explicada por el volumen de producción? Un
95.87%
d) Con base en el programa de producción de la empresa, el mes próximo se
deberán producir 500 unidades. ¿Cuál es el costo total estimado para esta
operación?
Y= 1247 + (7.6)(500) Y= 1247 + 3800
Y= 5,047
26. En el ejercicio 18, los datos sobre el promedio obtenido en la licenciatura y los
sueldos mensuales fueron los siguientes
Promedio Sueldo mensual Promedio Sueldo mensual
$ $
2.6 3300 3.2 3500
3.4 3600 3.5 3900
3.6 4000 2.9 3600
a) ¿La prueba t indica que hay una relación significativa entre el promedio y el
sueldo mensual? ¿Cuál es su conclusión? Use α = 0.05.
SCE 85,135.14
S 2=CMB= = =21,238.79
n−2 4
S= √ CMB=√ 21238.79=21238.79
(X 1−x )=0.74
s 145.89
Sb 1=1+ = =169.59
√ Ʃ ( Xi−x ) 2 4
b1−β 1 581.08−0
t=1+ + =3.43
Sb 1 169.59
Resolución.
De la tabla 1 (4 grados de libertad), el área de la cola esta entre 0.01 y 0.025
El valor -p esta entre 0.02 y 0.05
Utilizando minitap el valor -p correspondiente a t = 3.43 es 0.0266
Debido a que el valor -p ≤ α, Ho es rechazada: β1 = 0
b) Determine si la relación es significativa usando la prueba F. ¿Cuál es su
conclusión? Utilice α=0.05.
SCR 249,864.86
CRM= = =249,864.86
1 1
CMR 249,864.86
F= + =11.74
CME 21,283.79

Resolución.
De la tabla 1 (1 grado de libertad en el numerador y 4 en el denominador, el valor
-p esta entre 0.025 y 0.05 utilizando minitab el valor correspondiente a F = 11.74 =
0.0266
Debido a que el valor -p ≤ α, Ho es rechazada: β1 = 0
c) Muestre la tabla de ANOVA
Fuente de Suma de Grados de Cuadrado F Valor -p
variación cuadrados libertad medido

Regresión 249,864.8 1 249,864.8 11.74 0.0266


6 6
Error 85,135.14 4 21,283.79
total 335 000 5

27. La revista Outside Magazine probó 10 modelos de mochilas y botas para


excursionismo. En la tabla siguiente se presentan los datos de soporte superior
(Upper Support) y precio (Price) de cada fabricante y modelo (Manufacturer and
Model). El soporte superior se midió con una escala del 1 al 5, en la que 1 significa
aceptable y 5 denota excelente soporte superior (Outside Magazine Buyer’s Guide
2001).
Upper Price
Manufacturer and Model
Support ($)
Salomon Super Raid 2 120
Merrell Chameleon Prime 3 125
Teva Challenger 3 130
Vasque Fusion 3 135
Boreal Maigmo 3 150
L.L. Bean GTX Super
5 189
Guide
Lowa Kibo 5 190
Asolo AFX 520 GTX 4 195
Raichle Mt. Trail GTX 4 200
Scarpa Delta SL M3 5 220

a) Use estos datos para desarrollar la ecuación de regresión estimada a efecto


de estimar el precio de las mochilas y las botas para excursionismo con
base en el soporte superior.
Análisis de regresión: Price ($) vs. Upper Support
Análisis de Varianza

Fuente GL SC Ajust. MC Ajust. Valor F Valor p


Regresión 1 9836.7 9836.7 31.63 0.000
Upper Support 1 9836.7 9836.7 31.63 0.000
Error 8 2487.7 311.0
Total 9 12324.4

Resumen del modelo


R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
17.6340 79.82% 77.29% 69.67%

Coeficientes
EE del
Término Coef coef. Valor T Valor p VIF
Constante 49.9 21.3 2.35 0.047
Upper Support 31.21 5.55 5.62 0.000 1.00
Ecuación de regresión
Ŷ=b0 + bix
Price ($) = 49.9 + 31.21 Upper Support
Ŷ= 49.9 + 31.21Xi

b) Empleando un nivel de significancia de 0.05, determine si hay relación entre soporte


superior y precio.
Gráfica de distribución
T, df=8
0.4

0.3
Densidad

0.2

0.1

0.025 0.025
0.0
-2.306 0 2.306
X

Debido a que 2.35>2.306 se rechaza la hipótesis nula, por lo tanto están relacionados
c) ¿Confiaría en usar la ecuación de regresión estimada desarrollada en el inciso a) para
estimar el precio de las mochilas y las botas con base en la evaluación del soporte
superior?
Sí, ya que tiene un coeficiente de determinación de .7982, lo que diría que el 79% de la
variabilidad en ventas se explica por la relación lineal que existe entre soporte y precio.
d) Estime el precio de una mochila que tiene 4 como evaluación del soporte superior.
Y= 49.9 + (31.21)(4)
Y= 49.9 + 124.84
Y= 174.74

28. En el ejercicio 8, con los datos x _ rango de temperatura (°F) y y _ precio ($) de 11
sleepingbags fabricados por Bergans of Norway se obtuvo la ecuación de regresión
estimada y 359.2668 _ 5.2772x. Empleando 0.05 como nivel de significancia, determine si
el rango de temperatura y el precio están relacionados. Muestre la tabla de ANOVA. ¿Cuál
es su conclusión?
Análisis de Varianza

Fuente GL SC Ajust. MC Ajust. Valor F Valor p


(°F) 9 65750.0 7305.6 16.23 0.190
Error 1 450.0 450.0
Total 10 66200.0

Resumen del modelo

R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
21.2132 99.32% 93.20% *

Sí están relacionados, y coeficiente de determinación explica dicha relación.


47. A continuación se presentan datos sobre los gastos en publicidad y los
ingresos (en miles de dólares) del restaurante Four Seasons.
Gastos en publicidad Ingresos

1 19

2 32

4 44

6 40

10 52

14 53

20 54

a) Sea x igual a gastos en publicidad y y igual a ingresos. Utilice el método de


mínimos cuadrados para obtener una recta que aproxime la relación entre las dos
variables.

b) Empleando como nivel de significancia 0.05, pruebe si los ingresos y los gastos
en publicidad están relacionados.
Observando el diagrama del inciso a) podemos decir que existe relación lineal
entre ambas variables.
Ahora calculamos el coeficiente de determinación lineal para obtener una medida
descriptiva del grado de asociación lineal que existe entre las variables.
La expresión del coeficiente de determinación es:
2
2 sx y
r= 2 2
sx x sy
Donde Sxy representa la covarianza de las variables X e Y. Cuya expresión
simplificada es:
Σ Xi Y i ~
s Xy = − X × ý
n
Para clarificar la forma de cálculo construimos la siguiente tabla: (variable X=
Ingresos y variable Y= Gastos en publicidad)

Y X Y2 X2 YX
1 19 1 361 19
2 32 4 1024 64
4 44 16 1936 176
6 40 36 1296 240
10 52 100 10000 520
14 53 196 38416 742
20 54 400 160000 1080
57 294 753 213,033 2841

X= 42; Y=8.142; Sx=20.728; Sxy=61.38


Substituyendo obtenemos el r2 esperado después de observar el diagrama del
inciso a.
c) Elabore una gráfica de residuales de y yˆ contra yˆ. Use el resultado del inciso
a) para obtener los valores de yˆ.

d) ¿Qué conclusiones se pueden formular del análisis de residuales? ¿Se puede


aplicar este modelo o se debe buscar uno mejor?
Desde mi punto de vista si nos funcionó bien este modelo para conocer los
residuos, es preciso y efectivo, pero puede que existan otros métodos que sean
más rápidos y concretos.
48. Remítase al ejercicio 7, donde se obtuvo una ecuación de regresión estimada
que relaciona los años de experiencia con las ventas anuales.
a) Calcule los residuales y trace una gráfica de residuales para este problema.

b) A la luz de la gráfica, ¿Los supuestos acerca de los términos del error parecen
razonables?
Por supuesto que sí, a simple vista se puede observar una discrepancia, es
mínima pero se puede encontrar fácilmente.
49. Las ventas recientes de casas familiares en San Antonio proporcionan los
datos que se listan a continuación acerca de la extensión en pies cuadrados
(Square Footage) y precio (Price) de los inmuebles (sitio web de San Antonio
Realty Watch, noviembre de 2008).
square price
1580 142500
1572 145000
1352 115000
2224 155900
1556 95000
1435 128000
1438 100000
1089 55000
1941 142000
1698 115000
1539 115000
1364 105000
1979 155000
2183 132000
2096 140000
1400 85000
2372 145000
1752 155000
1386 80000
1163 100000
a) Obtenga una ecuación de regresión estimada que pueda utilizarse para
pronosticar los precios de venta dada la extensión en pies cuadrados.
Ecuación de regresión
Precio = 22636 + 58.96 cuadrado
b) Construya una gráfica de residuales estandarizados contra la variable
independiente.

c) A la luz de la gráfica, ¿los supuestos acerca de los términos del error y de la


forma del modelo parecen razonables?
Sí parecen razonables, el modelo de regresión es adecuado y representa
adecuadamente la relación entre las variables. Pero con respecto a lo que se
observa se concluye que la varianza del error no es constante y diferente para
cada valor de x.

Ecuación de regresión
Precio = 22636 + 58.96 cuadrado

S = 19166.0 R-Sq = 57.0% R-Sq(adj) = 54.6%

Análisis de varianza

Source DF SS MS F P
Regression 1 8.74856E+09 8748562231 23.82 0.000
Error 18 6.61204E+09 367335543
Total 19 1.53606E+10
Conclusión
Una vez realizados los ejercicios anteriores, hemos podido analizarlos y podemos
concluir que este tipo de diagramas nos pueden ayudar a demostrar y corroborar
la veracidad de trabajos y proyectos tanto escolares como profesionales, así como
demostrar el desarrollo de estos mismos, también nos hemos percatado que son
una herramienta de gran utilidad en el ámbito estadístico, laborar o profesional y
consideramos que el haberlos conocido y puesto en práctica nos será de gran
ayuda en el futuro ya que ahora contamos con una nueva herramienta para
próximos proyectos.

Bibliografía
Anderson, D. R., Sweeney, D. J., Williams, T. A., Roa, M. D. C. H., & Álvarez, T. L.
(2001). Estadística para administración y economía.
Laguna, C. (2014). Correlación y regresión lineal. Instituto Aragonés de Ciencias
de la Salud, 4, 1-18.
Yrigoyen, C. C., & Calderón, G. F. A. (2009). Análisis de datos espacio-temporales
para la economía y el geomarketing. Netbiblo.
Vallejo, P. M. (2012). Correlación y regresión, simple y múltiple. Universidad
Pontificia Comillas, Madrid. Recuperado de http://web. upcomillas.
es/personal/peter/investigacion/Regresion. pdf.
Castro, J. A. E. (2008). Interpretación de los diagramas de dispersión por
estudiantes de Bachillerato. Enseñanza de las ciencias: revista de investigación y
experiencias didácticas, 257-270

También podría gustarte