T6 Regresión
T6 Regresión
T6 Regresión
PROFESOR
INTEGRANTES
BRAYAN FUENTES
KATHERINE HURTADO
ANDRES REDIN
GRUPO 6490
1
INSTITUCIÓN UNIVERSITARIA “ANTONIO JOSÉ CAMACHO”
TALLER SEXTO ENCUENTRO
CUARTA UNIDAD CURSO DE ESTADÍSTICA APLICADA A LA SALUD OCUPACIONAL II
Regresión
Temas:
Regresión lineal simple
Correlación
TALLER
1. Identificar la variable dependiente y la independiente en cada uno de estos casos:
R/
Variable dependiente: Nota obtenida
Variable independiente: El tiempo estudiando.
2
Numero de llamadas de Numero de fotocopiadoras vendidas
ventas
20 40
40 60
20 40
30 60
10 30
10 40
20 40
20 50
20 40
30 50
2. El gerente de una compañía, que tiene una fuerza de venta muy numerosa en Estados Unidos
y Canadá, quiere determinar si existe una relación entre el número de llamadas de ventas que
se realizan al mes y el número de fotocopiadoras que se venden durante este mes. El gerente
selecciona una muestra aleatoria de 10 vendedores y determina el numero de llamadas de
ventas que cada uno hizo el mes pasado y la cantidad de fotocopiadoras vendidas. La
información se muestra en la siguiente tabla:
R/
Variable dependiente: número de fotocopiadoras vendidas
Variable independiente: Número de llamadas de ventas
b) Elabore y analice el diagrama de dispersión
R/
3
Numero de fotocopiadoras vendidas
70
60
Fotocopiadoras vendidas
Tabla 1. Cálculos para el coeficiente de Pearson FUENTE: Los autores (Excel 2013)
X́ =
∑ Xi = 220 =22
N 10
4
Ý =
∑ Yi = 450 =45
N 10
2
∑X
Sx=
√∑ N
Y2
− X́ 2=
5600
√10
−222=8,718
Sy=
√ N
−Ý 2=
21100
√10
−452=9,22
∑ XiYi − X́ Ý10600
−( 22∗45 )
N 10
r xy = = =0,871
Sx S y 8,718∗9,22
Interpretación: el número de fotocopiadoras vendidas tiene un correlación MUY ALTA (Ver. Figura
1) con el número de llamadas de ventas recibidas.
5
4
Si, por el valor r distinto de cero que obtuvo con el coeficiente de Pearson.
3. Un articulo reciente mencionó las “Mejores Pequeñas Empresas”. Nos interesa conocer los
resultados actuales de las ventas y ganancias de las compañías. Se seleccionó una muestra
aleatoria de 12 empresas y a continuación se reportan sus ventas y ganancias en millones de
pesos.
6
Ganancias en Millones de pesos
14
12
10
Millones de pesos
0
0 10 20 30 40 50 60 70 80 90 100
Ventas en Millones de pesos
Ventas Ganancias
(millones de (millones de Xi*Yi Xi2 Yi2
Xi pesos) Yi
89,2 4,9 437,08 7956,64 24,01
18,6 4,4 81,84 345,96 19,36
18,2 1,3 23,66 331,24 1,69
71,7 8 573,6 5140,89 64
58,6 6,6 386,76 3433,96 43,56
46,8 4,1 191,88 2190,24 16,81
17,5 2,6 45,5 306,25 6,76
11,9 1,7 20,23 141,61 2,89
19,6 3,5 68,6 384,16 12,25
51,2 8,2 419,84 2621,44 67,24
28,6 6 171,6 817,96 36
69,2 12,8 885,76 4788,64 163,84
SUMA 501,1 64,1 3306,35 28458,99 458,41
X́ =
∑ Xi = 501,1 =41,758
N 12
Ý =
∑ Yi = 64,1 =5,341
N 12
7
∑ X 2 − X́ 2=
Sx=
∑
N√
Y2
28.548,99
12 √ −(41,758)2=25,206
Sy=
N√ −Ý 2=
458,41
12 √
−(5,341)2=2,95
∑ XiYi − X́ Ý 3.306,35
−( 41,753∗5,341 )
N 12
r xy = = =0,706
Sx S y 25,206∗2,95
Interpretación: la ganancia obtenida en millones de pesos tiene un correlación ALTA (Ver.
Figura 1) con el valor de las ventas en millones de pesos.
y = 0,0836x + 1,8517
Siendo y el valor de la ganancia y la variable independiente x el valor de las ventas, ambas
representadas en millones de pesos.
Ventas Ganancias
(millones de (millones de Y Cuadrado (Y-
Xi pesos) Yi calculada Error "e" Error "e2" promY)2
19,437693
89,2 4,9
9,30882 -4,40882 8 0,2
0,9867243
18,6 4,4
3,40666 0,99334 6 0,9
4,2982411
18,2 1,3
3,37322 -2,07322 7 16,3
0,0237714
71,7 8
7,84582 0,15418 7 7,1
0,0226984
58,6 6,6
6,75066 -0,15066 4 1,6
2,7694950
46,8 4,1
5,76418 -1,66418 7 1,5
0,5107960
17,5 2,6
3,3147 -0,7147 9 7,5
1,3145539
11,9 1,7
2,84654 -1,14654 7 13,3
9,4868E-
19,6 3,5
3,49026 0,00974 05 3,4
4,2765412
51,2 8,2
6,13202 2,06798 8 8,2
3,0882438
28,6 6
4,24266 1,75734 8 0,4
26,658427
69,2 12,8
7,63682 5,16318 7 55,6
Suma 403,3 45,3 52,23288 -6,93288 33,640610 59,9
8
5
2 ∑ e2 33,6406
R =1− 2
=1− =1−0,5611=0,439
∑ (Y − ý ) 59,9
Las variables ganancia y ventas tiene una correlación media-alta, con tendencia lineal creciente,
pero la correlación no llega a ser del todo significativa por la dispersión de los datos al modelo.