Trabajo Unidad IV
Trabajo Unidad IV
Trabajo Unidad IV
UNIVERSIDAD VERACRUZANA
Trabajo Unidad IV
Equipo 5: Gabriel González Hernández
Monserrat Espinoza Ruiz
Guillermo Ávila Herrera
02-diciembre -21.
Introducción
En la siguiente actividad se les presentara el desarrollo de los problemas del
capitulo 14 correspondientes a la Unidad IV, en los cuales aplicaremos el uso de
diagramas de dispersión, los que a su vez nos permiten estudiar las relaciones
entre dos conjuntos de datos asociados que aparecen en pares. Gracias a la
realización de estos problemas podremos observar varios de sus usos, entre los
cuales destaca el hecho de que es utilizado para descubrir y mostrar las
relaciones entre dos conjuntos de datos y confirmar relaciones anticipadas entre
dos conjuntos de datos, esta y varios usos más serán aplicados a lo largo de este
trabajo, el cual esperamos sea de su total comprension.
Capítulo 14
4. Los datos siguientes son estatura (en pulgadas) y pesos (en libras) de
nadadoras.
Estatur 68 64 62 65 66
a
Peso 132 10 102 115 128
8
a) Trace
Datos de nadadoras. el
140 128 132
115
120 102 108
100
80
Peso
60
40
20
0
61 62 63 64 65 66 67 68 69
Estatura
Datos de nadadoras.
140 128 132
115
120 108
102
100
80
Peso
60
40
20
0
61 62 63 64 65 66 67 68 69
Estatura
x=
∑ xi = 365 =65 y=
∑ yi = 585 =117
n 5 n 5
xi−x xi−x
(¿) yi− y )=110
( ¿
¿
∑¿ ∑¿
xi
xi−x
¿
2
¿
¿ b0 = y−b 1 x=117−( 5.5 )( 65 ) =−240.5
∑¿
∑ (¿−x )( yi− y )
¿
b 1=¿
^y =−240.5+5.5 x
Gráfico de Dispersión
100
90
80
70
60
50
40
30
20
10
0
0 500 1000 1500 2000 2500 3000 3500 4000
b) Una tienda de equipo para ejercitarse que vende principalmente equipo caro
puso un letrero sobre el área de exhibición que dice: “Calidad: usted obtiene lo que
paga.” Con base en su análisis de los datos, ¿considera usted que el letrero refleja
de manera justa la relación precio-calidad de las ejercitadoras elípticas?
a) Trace un
diagrama de dispersión tomando las millas como la variable independiente.
n ∑ XY −∑ X ∙ ∑ Y 5∗2764,5−392∗35,3
b= 2
= 2
=−0,003458543289
2
n ∑ X −( ∑ X ) 5∗31606−392
x́ 78,4
ý 7,06 n ∑ xy −∑ x ∑ y
b= 2
n ∑ x2 −( ∑ x )
a= 7,3311464
Y= 7,3311-0,0035x
Interpretación:
y= 7,3311-0,0035x
y= 7,3311-0,0035(100)
y= 6,9811 o aproximadamente ($ 6 981,1)
140
120
100
Axis Title
80
60
40
20
0
0 2 4 6 8 10 12 14
Axis Title
b) Obtenga una ecuación de regresión estimada que pueda utilizarse para predecir las
ventas anuales proporcionando los años de experiencia.
Solución
=x́7 ∑ y −a ∑ x
b=
=ý 108 n
∑ x=70 1080−4 (70)
b= =80
∑ y =1080 10
n=10 x
Fórmulas ∑ ¿2
¿
γ =αx+ b n ∑ x 2−¿
x n ∑ xy−∑ x ∑ y
α=
¿
∑ ¿2 10 ( 8128 )−(70)(1080)
¿ a= =4
n ∑ x 2−¿ 10 ( 632 ) −(70)2
n ∑ xy−∑ x ∑ y
α=
¿
x y xy x^2
1 80 80 1
3 97 291 9
4 92 368 16
4 102 408 16
6 103 618 36
8 111 888 64
10 119 1190 100
10 123 1230 100
11 117 1287 121
13 136 1768 169
Sumatoria 70 1080 8128 632
Media 7 108
a) Trace un diagrama de dispersión con estos datos, en el que la variable independiente sea el
rango de temperatura (°F).
Scatterplot of Price ($) vs Temperature rating (° F)
400
350
300
Price ($)
250
200
150
100
0 10 20 30 40 50
Temperature rating (° F)
b) ¿Qué indica el diagrama de dispersión del inciso a) respecto de la relación entre el rango
de temperatura (°F) y precio?
300
Price ($)
250
200
150
100
0 10 20 30 40 50
Temperature rating (° F)
yˆ = 359.2668 - 5.2772x
d) Prediga cuál será el precio de un sleeping bag si el rango de temperatura (°F) es 20.
Se remplaza X por 20 en la ecuación de regresión:
yˆ =359.2668 - 5.2772 (20) = 254
$254
2.6 3 300
3.4 3 600
3.6 4 000
3.2 3 500
3.5 3 900
2.9 3 600
a) Calcule las SCE, STC y SCR
b) Calcule el coeficiente de determinación r 2. Haga un comentario sobre la
bondad del ajuste.
c) Determine el valor del coeficiente de correlación muestral.
Resolución:
- Se suman los datos correspondientes para el promedio (x), obteniéndose:
19.2 ÷ 6 = 3.2
- Se suman los datos correspondientes para el salario mensual (y),
obteniéndose: 21 900 ÷ 6 = 3 650
- Producto de xy : 70 510
- x2 e y2 : 62.18 y 80 270 000
- Se adjunta el cálculo de coeficiente de correlación, obteniéndose:0.8636
- Se obtiene el coeficiente de determinación, el cual da como resultado:
r2 = (0.8636)2
r2 = 0.746 = 74.6%
y i−^y 2
SCE = ∑ ) = 85 135.14
¿
y i− ý 2
STC = ∑ ) = 335 000
¿
Por tanto, SCR = STC – SCE
= 335 000 – 85 135.14 = 249 864.86
2 SCR 249 864.86
b) r = = =0.746
STC 335,000
La recta de mínimos cuadrados representa 74.6% de la suma total.
c) r xy = √ 0.746=+ 0.8637
¿
n ∑Y −(∑Y ¿2)
2
X 2−(¿ ∑ X ¿2)∗¿
n∑ ¿
¿
√¿
n ∑ XY −∑ X ∑ Y
r=
¿
6∗62.18−(19.2)
¿2
21900 ¿
¿
¿❑
6∗80 270 000−¿ = 0.8636
( ¿¿ 2)∗¿
¿
√¿
6∗70 510−19.2∗21900
r= ¿
Se puede concluir que el coeficiente de correlación es positivo, por lo cual urge
una alta correlación entre los salarios mensuales con respecto a los promedios de
los estudiantes.
Por otra parte, el porcentaje del coeficiente de determinación indica que más del
74% de los salarios mensuales de la muestra se explican por sus respectivos
promedios de estudiantes.
19. En el ejercicio 7 un gerente de ventas obtuvo los siguientes datos sobre y= ventas
anuales (Annual Sales) y x= años de experiencia (Years of Experience) de 10
vendedores (Salesperson).
La ecuación de regresión estimada para estos datos es ^y = 80 + 4x.
Ventas
pronostica Error al
Xi (Años de s Total, de
Yi (Ventas Error cuadrado
Vendedores experiencia Y ^ i cuadrado
anuales) Yi - Y (Yi - Y ^
) ¿ = (Yi – ý )2
i) 2
¿^
80+4x)
1 1 80 84 -4 16 784
2 3 97 92 5 25 121
3 4 92 96 -4 16 256
4 4 102 96 6 36 36
5 6 103 104 -1 1 25
6 8 111 112 -1 1 9
7 10 119 120 -1 1 121
8 10 123 120 3 9 225
9 11 117 124 -7 49 81
10 13 136 132 4 16 784
∑Yi= 1080 ∑= 170 ∑= 2442
rxy= (signo de b) √ r2
rxy= (+) √ ❑0.9304=0.9646
Se concluye que existe una relación lineal fuerte entre x y y.
Primero hay que desarrollar una tabla para más facilidad en los resultados que se van a desarrollar
Ahora como la fórmula dice hay que sumar todos los resultados X,Y ,X*Y ,X*X
a=
∑ Y ⋅∑ X 2−∑ X ⋅∑ XY 496∗90360000∗29600∗1503000
= = 12.017
n ⋅ Σ X 2− ( ∑ X ) 2 10∗90360000∗2960 02
b=
29600 ¿2
n∗∑ XY ⋅−∑ X ⋅∑Y 10∗90360000−¿
= =0.013
n⋅ Σ X 2 −( ∑ X )2 10∗1503000−29600∗496
¿
ahora solo es sustituir
y= a+b*z
y= 12.017 +0.013*z
b) Calcule r2 . ¿Proporcionó un buen ajuste la ecuación de regresión estimada?
En esta ecuación hay que sacar la suma de los cuadrados
2
yi− ý ¿
SST= ¿ =982.4
∑¿
^y i− ý ¿ 2
SSR= ¿ = 471.7821
∑ ¿
^y i− yi¿ 2
SSE= ¿ = 548.3421
∑¿
Ahora para el coeficiente de determinación es la relación entre SSR Y SST
SSR 471.7821
r 2= = =0.4802=48.02 %
SST 982.4
Según el resultado que nos dio la ecuación la variabilidad es de un 48.2% y es una ecuación de
regresión hasta cierto punto de un buen ajuste
Solo se toma los valores antes mencionados en los cuestionamientos y se ordena de la sig manera
agregando un (3200) a la ecuación y nos dará el resultado
21. Una aplicación importante del análisis de regresión en la contaduría es la estimación de costos.
Partiendo de datos sobre volumen de producción y costos, y empleando el método de mínimos
cuadrados para desarrollar una ecuación de regresión estimada que relacione ambos datos, un
contador puede calcular los costos correspondientes a un determinado volumen de producción.
Considere la siguiente muestra de datos sobre volumen de producción y costo total de una
operación de manufactura.
Costo total
Volumen de producción (unidades)
($)
400 4000
450 5000
550 5400
600 5900
700 6400
750 7000
a) Utilice estos datos para desarrollar la ecuación de regresión estimada útil a efecto de
pronosticar los costos totales dado un volumen de producción determinado.
Análisis de regresión: Costo total ($) vs. Volumen de producción (unidades)
Análisis de Varianza
R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
241.523 95.87% 94.84% 88.36%
Coeficientes
EE del
Término Coef coef. Valor T Valor p VIF
Constante 1247 464 2.69 0.055
Volumen de producción (unidades 7.600 0.789 9.63 0.001 1.00
Ecuación de regresión
Ŷ=b0 + b1xi
Costo total ($) = 1247 + 7.600 Volumen de producción (unidades)
Ŷ= 1247 + 7.600Xi
Resolución.
De la tabla 1 (1 grado de libertad en el numerador y 4 en el denominador, el valor
-p esta entre 0.025 y 0.05 utilizando minitab el valor correspondiente a F = 11.74 =
0.0266
Debido a que el valor -p ≤ α, Ho es rechazada: β1 = 0
c) Muestre la tabla de ANOVA
Fuente de Suma de Grados de Cuadrado F Valor -p
variación cuadrados libertad medido
Coeficientes
EE del
Término Coef coef. Valor T Valor p VIF
Constante 49.9 21.3 2.35 0.047
Upper Support 31.21 5.55 5.62 0.000 1.00
Ecuación de regresión
Ŷ=b0 + bix
Price ($) = 49.9 + 31.21 Upper Support
Ŷ= 49.9 + 31.21Xi
0.3
Densidad
0.2
0.1
0.025 0.025
0.0
-2.306 0 2.306
X
Debido a que 2.35>2.306 se rechaza la hipótesis nula, por lo tanto están relacionados
c) ¿Confiaría en usar la ecuación de regresión estimada desarrollada en el inciso a) para
estimar el precio de las mochilas y las botas con base en la evaluación del soporte
superior?
Sí, ya que tiene un coeficiente de determinación de .7982, lo que diría que el 79% de la
variabilidad en ventas se explica por la relación lineal que existe entre soporte y precio.
d) Estime el precio de una mochila que tiene 4 como evaluación del soporte superior.
Y= 49.9 + (31.21)(4)
Y= 49.9 + 124.84
Y= 174.74
28. En el ejercicio 8, con los datos x _ rango de temperatura (°F) y y _ precio ($) de 11
sleepingbags fabricados por Bergans of Norway se obtuvo la ecuación de regresión
estimada y 359.2668 _ 5.2772x. Empleando 0.05 como nivel de significancia, determine si
el rango de temperatura y el precio están relacionados. Muestre la tabla de ANOVA. ¿Cuál
es su conclusión?
Análisis de Varianza
R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
21.2132 99.32% 93.20% *
1 19
2 32
4 44
6 40
10 52
14 53
20 54
b) Empleando como nivel de significancia 0.05, pruebe si los ingresos y los gastos
en publicidad están relacionados.
Observando el diagrama del inciso a) podemos decir que existe relación lineal
entre ambas variables.
Ahora calculamos el coeficiente de determinación lineal para obtener una medida
descriptiva del grado de asociación lineal que existe entre las variables.
La expresión del coeficiente de determinación es:
2
2 sx y
r= 2 2
sx x sy
Donde Sxy representa la covarianza de las variables X e Y. Cuya expresión
simplificada es:
Σ Xi Y i ~
s Xy = − X × ý
n
Para clarificar la forma de cálculo construimos la siguiente tabla: (variable X=
Ingresos y variable Y= Gastos en publicidad)
Y X Y2 X2 YX
1 19 1 361 19
2 32 4 1024 64
4 44 16 1936 176
6 40 36 1296 240
10 52 100 10000 520
14 53 196 38416 742
20 54 400 160000 1080
57 294 753 213,033 2841
b) A la luz de la gráfica, ¿Los supuestos acerca de los términos del error parecen
razonables?
Por supuesto que sí, a simple vista se puede observar una discrepancia, es
mínima pero se puede encontrar fácilmente.
49. Las ventas recientes de casas familiares en San Antonio proporcionan los
datos que se listan a continuación acerca de la extensión en pies cuadrados
(Square Footage) y precio (Price) de los inmuebles (sitio web de San Antonio
Realty Watch, noviembre de 2008).
square price
1580 142500
1572 145000
1352 115000
2224 155900
1556 95000
1435 128000
1438 100000
1089 55000
1941 142000
1698 115000
1539 115000
1364 105000
1979 155000
2183 132000
2096 140000
1400 85000
2372 145000
1752 155000
1386 80000
1163 100000
a) Obtenga una ecuación de regresión estimada que pueda utilizarse para
pronosticar los precios de venta dada la extensión en pies cuadrados.
Ecuación de regresión
Precio = 22636 + 58.96 cuadrado
b) Construya una gráfica de residuales estandarizados contra la variable
independiente.
Ecuación de regresión
Precio = 22636 + 58.96 cuadrado
Análisis de varianza
Source DF SS MS F P
Regression 1 8.74856E+09 8748562231 23.82 0.000
Error 18 6.61204E+09 367335543
Total 19 1.53606E+10
Conclusión
Una vez realizados los ejercicios anteriores, hemos podido analizarlos y podemos
concluir que este tipo de diagramas nos pueden ayudar a demostrar y corroborar
la veracidad de trabajos y proyectos tanto escolares como profesionales, así como
demostrar el desarrollo de estos mismos, también nos hemos percatado que son
una herramienta de gran utilidad en el ámbito estadístico, laborar o profesional y
consideramos que el haberlos conocido y puesto en práctica nos será de gran
ayuda en el futuro ya que ahora contamos con una nueva herramienta para
próximos proyectos.
Bibliografía
Anderson, D. R., Sweeney, D. J., Williams, T. A., Roa, M. D. C. H., & Álvarez, T. L.
(2001). Estadística para administración y economía.
Laguna, C. (2014). Correlación y regresión lineal. Instituto Aragonés de Ciencias
de la Salud, 4, 1-18.
Yrigoyen, C. C., & Calderón, G. F. A. (2009). Análisis de datos espacio-temporales
para la economía y el geomarketing. Netbiblo.
Vallejo, P. M. (2012). Correlación y regresión, simple y múltiple. Universidad
Pontificia Comillas, Madrid. Recuperado de http://web. upcomillas.
es/personal/peter/investigacion/Regresion. pdf.
Castro, J. A. E. (2008). Interpretación de los diagramas de dispersión por
estudiantes de Bachillerato. Enseñanza de las ciencias: revista de investigación y
experiencias didácticas, 257-270