T6 Regresión

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 9

INSTITUCION UNIVERSITARIA ANTONIO JOSE CAMACHO

PROFESOR

JOSE ALFREDO DIAZ

INTEGRANTES

BRAYAN FUENTES

KATHERINE HURTADO

ANDRES REDIN

GRUPO 6490

SANTIAGO DE CALI NOVIEMBRE 2019

1
INSTITUCIÓN UNIVERSITARIA “ANTONIO JOSÉ CAMACHO”
TALLER SEXTO ENCUENTRO
CUARTA UNIDAD CURSO DE ESTADÍSTICA APLICADA A LA SALUD OCUPACIONAL II
Regresión

Temas:
 Regresión lineal simple
 Correlación

TALLER
1. Identificar la variable dependiente y la independiente en cada uno de estos casos:

a) El tiempo estudiando para un examen y la nota obtenida

R/
Variable dependiente: Nota obtenida
Variable independiente: El tiempo estudiando.

b) La estatura de un hijo y la estatura del padre


R/
Variable dependiente: Estatura de un hijo
Variable independiente: Estatura del padre.

c) La edad de una mujer y el costo de su seguro de vida.


R/
Variable dependiente: Costo de seguro de vida
Variable independiente: Edad de una mujer

d) El precio de un producto y el número de unidades vendidas


R/
Variable dependiente: Precio de un producto
Variable independiente: número de unidades vendidas

e) La demanda de un producto y el numero de consumidores en el mercado


R/
Variable dependiente: Demanda de un producto
Variable independiente: número de consumidores en el mercado

2
Numero de llamadas de Numero de fotocopiadoras vendidas
ventas
20 40

40 60
20 40

30 60
10 30
10 40
20 40
20 50
20 40
30 50

2. El gerente de una compañía, que tiene una fuerza de venta muy numerosa en Estados Unidos
y Canadá, quiere determinar si existe una relación entre el número de llamadas de ventas que
se realizan al mes y el número de fotocopiadoras que se venden durante este mes. El gerente
selecciona una muestra aleatoria de 10 vendedores y determina el numero de llamadas de
ventas que cada uno hizo el mes pasado y la cantidad de fotocopiadoras vendidas. La
información se muestra en la siguiente tabla:

a) Determine la variable dependiente y la independiente

R/
Variable dependiente: número de fotocopiadoras vendidas
Variable independiente: Número de llamadas de ventas
b) Elabore y analice el diagrama de dispersión
R/

3
Numero de fotocopiadoras vendidas
70
60
Fotocopiadoras vendidas

f(x) = 0.92 x + 24.74


50 R² = 0.76
Numero de fotocopiadoras
40 vendidas
30 Linear (Numero de fotocopiadoras
vendidas)
20
10
0
5 10 15 20 25 30 35 40 45
llamadas de ventas

Analisis: se evidencia como el numero de llamadas de ventas es casi proporcional al numero de


fotocopiadores vendidas, con una tendencia lineal creciente.

c) Cuántas fotocopiadoras se esperan vender en promedio si se hacen 20 llamadas?

R/ E(x) = β0 + β1 x= 24,737+ 0,921X


E ( 20 )=0,921∗( 20 ) +24,737=43,157 ≈ 43 fotocopiadoras vendidas

d) Calcule e interprete el coeficiente de correlación de Pearson

Tabla 1. Cálculos para el coeficiente de Pearson FUENTE: Los autores (Excel 2013)

Xi Yi Xi*Yi Xi2 Yi2


20 40 800 400 1600
40 60 2400 1600 3600
20 40 800 400 1600
30 60 1800 900 3600
10 30 300 100 900
10 40 400 100 1600
20 40 800 400 1600
20 50 1000 400 2500
20 40 800 400 1600
30 50 1500 900 2500
suma 220 450 10600 5600 21100

X́ =
∑ Xi = 220 =22
N 10
4
Ý =
∑ Yi = 450 =45
N 10
2
∑X
Sx=
√∑ N
Y2
− X́ 2=
5600
√10
−222=8,718

Sy=
√ N
−Ý 2=
21100
√10
−452=9,22

∑ XiYi − X́ Ý10600
−( 22∗45 )
N 10
r xy = = =0,871
Sx S y 8,718∗9,22
Interpretación: el número de fotocopiadoras vendidas tiene un correlación MUY ALTA (Ver. Figura
1) con el número de llamadas de ventas recibidas.

Figura 1. interpretacion coeficiente de variacion: FUENTE [ CITATION blo13 \l 9226 ]

e) Calcule e interprete el coeficiente de determinación


2 ∑ e2 205 , ,26
R =1− 2
=1− =1−0,241=0,758
∑ (Y − ý ) 850
Interpretación: El 75,8% de la variabilidad total es explicada con el modelo lineal Y= 0,92X+ 24,737.
Y=24,737+ 0,921X (Excel 2013)

Numero de Numero de Y (Y-


llamadas de fotocopiadoras calculad Error Cuadrado promY)
ventas (xi) vendidas (Yi) a "e" Error "e2" 2
20 40 43,159 -3,159 9,979281 25,0
40 60 61,581 -1,581 2,499561 225,0
20 40 43,159 -3,159 9,979281 25,0
30 60 52,37 7,63 58,2169 225,0
10 30 33,948 -3,948 15,586704 225,0
10 40 33,948 6,052 36,626704 25,0
20 40 43,159 -3,159 9,979281 25,0
20 50 43,159 6,841 46,799281 25,0
20 40 43,159 -3,159 9,979281 25,0
30 50 52,37 -2,37 5,6169 25,0
Suma 220 450 450,012 -0,012 205,26317 850,0

5
4

f) Podemos llegar a la conclusión de que la correlación en la población es diferente de 0?

Si, por el valor r distinto de cero que obtuvo con el coeficiente de Pearson.

3. Un articulo reciente mencionó las “Mejores Pequeñas Empresas”. Nos interesa conocer los
resultados actuales de las ventas y ganancias de las compañías. Se seleccionó una muestra
aleatoria de 12 empresas y a continuación se reportan sus ventas y ganancias en millones de
pesos.

Ventas (millones de Ganancias (millones de pesos)


a) Determine la variable pesos)
dependiente y la 89,2 4,9
independiente 18,6 4,4
18,2 1,3
Variable dependiente: 71,7 8,0
Ganancias (millones de pesos) 58,6 6,6
Variable independiente: Ventas 46,8 4,1
(millones de pesos) 17,5 2,6
11,9 1,7
19,6 3,5
51,2 8,2
28,6 6,0
69,2 12,8

b) Elabore y analice el diagrama de dispersión.

6
Ganancias en Millones de pesos
14

12

10
Millones de pesos

8 f(x) = 0.08 x + 1.85


R² = 0.45
6

0
0 10 20 30 40 50 60 70 80 90 100
Ventas en Millones de pesos

Figura 2. Ganancias en Millones de pesos


Interpretación: El valor en ventas tiene una relación proporcional con la ganancia, puesto que los
datos siguen una tendencia lineal.

c) Calcule e interprete el coeficiente de correlación de Pearson


Tabla 2. Cálculos para coeficiente de Pearson Ejercicio 2 FUENTE: Los autores (Excel 2013)

Ventas Ganancias
(millones de (millones de Xi*Yi Xi2 Yi2
Xi pesos) Yi
89,2 4,9 437,08 7956,64 24,01
18,6 4,4 81,84 345,96 19,36
18,2 1,3 23,66 331,24 1,69
71,7 8 573,6 5140,89 64
58,6 6,6 386,76 3433,96 43,56
46,8 4,1 191,88 2190,24 16,81
17,5 2,6 45,5 306,25 6,76
11,9 1,7 20,23 141,61 2,89
19,6 3,5 68,6 384,16 12,25
51,2 8,2 419,84 2621,44 67,24
28,6 6 171,6 817,96 36
69,2 12,8 885,76 4788,64 163,84
SUMA 501,1 64,1 3306,35 28458,99 458,41

X́ =
∑ Xi = 501,1 =41,758
N 12
Ý =
∑ Yi = 64,1 =5,341
N 12

7
∑ X 2 − X́ 2=
Sx=


N√
Y2
28.548,99
12 √ −(41,758)2=25,206

Sy=
N√ −Ý 2=
458,41
12 √
−(5,341)2=2,95

∑ XiYi − X́ Ý 3.306,35
−( 41,753∗5,341 )
N 12
r xy = = =0,706
Sx S y 25,206∗2,95
Interpretación: la ganancia obtenida en millones de pesos tiene un correlación ALTA (Ver.
Figura 1) con el valor de las ventas en millones de pesos.

d) Calcule e interprete el coeficiente de determinación

y = 0,0836x + 1,8517
Siendo y el valor de la ganancia y la variable independiente x el valor de las ventas, ambas
representadas en millones de pesos.

Ventas Ganancias
(millones de (millones de Y Cuadrado (Y-
Xi pesos) Yi calculada Error "e" Error "e2" promY)2
19,437693
89,2 4,9
9,30882 -4,40882 8 0,2
0,9867243
18,6 4,4
3,40666 0,99334 6 0,9
4,2982411
18,2 1,3
3,37322 -2,07322 7 16,3
0,0237714
71,7 8
7,84582 0,15418 7 7,1
0,0226984
58,6 6,6
6,75066 -0,15066 4 1,6
2,7694950
46,8 4,1
5,76418 -1,66418 7 1,5
0,5107960
17,5 2,6
3,3147 -0,7147 9 7,5
1,3145539
11,9 1,7
2,84654 -1,14654 7 13,3
9,4868E-
19,6 3,5
3,49026 0,00974 05 3,4
4,2765412
51,2 8,2
6,13202 2,06798 8 8,2
3,0882438
28,6 6
4,24266 1,75734 8 0,4
26,658427
69,2 12,8
7,63682 5,16318 7 55,6
Suma 403,3 45,3 52,23288 -6,93288 33,640610 59,9
8
5

2 ∑ e2 33,6406
R =1− 2
=1− =1−0,5611=0,439
∑ (Y − ý ) 59,9

Interpretación: El 43,9% de la variabilidad total es explicada con el modelo lineal y = 0,0836x +


1,8517
.
e) Podemos llegar a la conclusión de que la correlación en la población significativa?

Las variables ganancia y ventas tiene una correlación media-alta, con tendencia lineal creciente,
pero la correlación no llega a ser del todo significativa por la dispersión de los datos al modelo.

f) Cuáles son las ganancias esperadas si se venden 50 millones de pesos?

E(X)= Y = 0,0836x + 1,8517


E ( 50 )=0,0836∗( 50 )+1,8517=6,033 Millones de ganancia si se venden 50 millones de pesos.

También podría gustarte