Regresion y Correlacion
Regresion y Correlacion
Regresion y Correlacion
Regresión y Correlación
Bibliografía
1
16/10/2014
Qué es?
El modelo de regresión y correlación estudia
la relación estadística entre dos variables
cuantitativas.
No implica causa y efecto sino solo el “tipo
de relación estadística”.
Ejemplos:
edad y peso
Horas de estudio y notas obtenidas
Gramos de proteínas consumidas y notas
Cociente intelectual de la madre y del hijo.
2
16/10/2014
Objetivo
3
16/10/2014
Simple 2 variables
Múltiple Más de 2
variables
lineal
no lineal
4
16/10/2014
DISPERSIÓN 0 1 2 3 4 5 6 7 8 9 Variable
X
explicativa
Coeficiente de determinación= R2 = 1
Coeficiente de correlación = 1
Ecuación de la recta de estimación= Y’ = 0,8 X + 2
Variable independiente X
Variable dependiente Y
DIAGRAMA 4
2 Variable
DE 0 explicativa
DISPERSIÓN 0 2 4 6 8 10
Coeficiente de determinación= R2 1
Coeficiente de correlación = -1
Ecuación de la recta de estimación= Y’ = -0,09 X +9
Variable independiente X
Variable dependiente Y
5
16/10/2014
DE 2
0
DISPERSIÓN Variable
0 2 4 6 8 10
y = -1,1738x + 10,857 X explicativa
R² = 0,7758
6
16/10/2014
MODELO DE REGRESIÓN
7
16/10/2014
MODELO DE REGRESION
Variable explicativa
Recta:
Variable explicada
Ŷ = a + b X + ei
RECTA
CONCEPTO FIJO + SISTEMATICA + ALEATORIA
Donde:
a = ordenada al origen o factor fijo de la
variable
b = pendiente de la recta de regresión.
e = factor aleatorio
X= variable explicativa
Y = variable explicada
8
16/10/2014
Cálculo de la Recta:
• Las “Y”
Y valor real
Y valor estimado
Y media de Y
9
16/10/2014
Cálculo de la Recta:
Método de mínimos cuadrados
Características:
2
La suma de los desvíos de Y es nula. Y Y
Es mínima la suma del cuadrado de Y observado
los desvíos.
Y valor calculado de Y
Y n.a b. X b
n. X .Y X .Y .
2
X .Y a. X b. X 2
n. X 2 X
Resolviendo se llega a : a Y b X
n
Cálculo de la Recta:
Método simplificado: la pendiente
Pasos:
1º) Se calculan las medias de las dos variables.
2º) se calculan los coeficientes de regresión,
que determinan el incremento de una
variable en función del incremento unitario
de la otra: x.y ( x m( x) ).( y m( y ) )
b1
( x m( x ) ) 2
x
2
b2
x.y ( x m( x ) ).( y m( y ) )
( y m( y ) ) 2
y
2
10
16/10/2014
Cálculo de la Recta:
Método simplificado
3º Cálculo de a: a1 b1.mx m y
a2 b2 .m y mx
4º Quedan determinadas 1º Re cta de regresión
las rectas:
Y a1 b1 X
2º Re cta de regresión
X a bY2 2
Ejemplo:
Determine la relación entre el número de
accidentes y las horas de capacitación anuales
en una empresa. Hs de Nº de
Capacitación Accidentes
y = -0,0059x + 8,4431
9,0
8,0
R² = 0,9084
X Y
7,0 200 7,0
6,0
500 6,4
5,0
4,0
450 5,2
3,0 800 4,0
2,0 900 3,1
1,0
150 8,0
0,0
0 200 400 600 800 1000
300 6,5
600 4,4
3900 44,6
DIAGRAMA DE
DISPERSIÓN
11
16/10/2014
Ejemplo:
Hs de Nº de
Desvío Desvío desvio de X.
Capacitación Accidentes de X de Y desvio de Y
Ejemplo:
b1= -3022,50 -0,0059
513750,00
a1=-(-0,0059)*487,5+5,575= 8,45
a2=-(-154,41)*5,5+487,5= 1336,76
1 º R e c ta d e r e g r e s ió n
Y 8 , 4 5 0 , 0 0 5 9 . X
2 º R e c ta d e r e g r e s ió n
X 1 3 3 6 , 7 6 1 5 4 , 4 1 .Y
12
16/10/2014
Ejemplo:
7,0
6,0
5,0
4,0
3,0
2,0
1,0
Hs de Nº de
Capacitaci Accidente desvío de desvío de desvio de 0,0
0 200 400 600 800 1000
ón s X Y X.Y
(x-mx).(y-
X Y (x-mx) (y-my) my) (x-mx)2 (y-my)2 Ŷ
X
200 7,0 -287,5 1,4 -409,69 82656,25 2,03 7,27 255,91
500 6,4 12,5 0,8 10,31 156,25 0,68 5,51 348,56
450 5,2 -37,5 -0,4 14,06 1406,25 0,14 5,80 533,84
800 4,0 312,5 -1,6 -492,19 97656,25 2,48 3,74 719,13
900 3,1 412,5 -2,5 -1020,94 170156,25 6,13 3,16 858,10
150 8,0 -337,5 2,4 -818,44 113906,25 5,88 7,57 101,51
300 6,5 -187,5 0,9 -173,44 35156,25 0,86 6,69 333,12
600 4,4 112,5 -1,2 -132,19 12656,25 1,38 4,92 657,37
3900 44,6 -3022,50 513750,00 19,58 44,67 3807,53
COEFICIENTE DE DETERMINACION = R2
VARIACION EXPLICADA
13
16/10/2014
MODELO DE REGRESION:
Variaciones
MODELO DE REGRESION:
Variaciones
Variación
Total
Variación Variación no
explicada Explicada
Y Y Y Y
14
16/10/2014
Coeficiente de determinación:R2
Es la proporción de las variaciones que son
explicadas por el modelo.
R 2 b1. b2
Si R2 es menor al 70% . El modelo lineal no es
apropiado para realizar estimaciones.
Coeficiente de determinación:R2
R 2 b1 . b2
R 2 0, 0059. 154, 41
R 2 0, 91
15
16/10/2014
Coeficiente de indeterminación:
(1-R2)
• El coeficiente de indeterminación es la
proporción de la variación total que NO es
explicada por el modelo.
(1 R 2 ) 1 0,91
(1 R 2 ) 0, 09
De PUNTO
2
0
0
y = 0,7669x 5
+ 2,6189 10
R² = 0,7629 X
Estimación
De
INTERVALO
16
16/10/2014
Varianza total
Es la varianza de los datos originales (Y).
2
2
(x m )
x
19,58
2, 44
n 8
2, 44 . 0, 91 2, 22 2, 44 . 0,09 0, 22
COEFICIENTE DE CORRELACION
17
16/10/2014
R b1 . b2
( X X ).(Y Y )
cov( X , Y ) n
R
X . y X . y
Tipos de correlación
Funcional
-1
Inversa
No Funcional
-1<R<0
Inversa
No hay
R 0
relación
No Funcional
0<R<1
Directa
Funcional
1
Directa
18
16/10/2014
El signo de R
El coeficiente de correlación tiene el signo de la
pendiente!!!
Se debe elegir el valor de la raíz cuyo signo
coincide con el de la pendiente (b)
Relación Relación
inversa inversa
POSITIVA NEGATIVA
19
16/10/2014
ATRIBUTOS CUALITATIVOS
( AB )( ) ( A ).( B )
Q
( AB )( ) ( A ).( B )
1 Q 1
20
16/10/2014
Disociación
-1
Total
-1<Q<0 Disociación
Q 0 Independencia
0<Q<1 Asociación
Asociación
1
Total
Ejemplo
Se desea saber si es posible que la implementación de cierta
publicidad en algunos comercios han tenido algún efecto en
las ventas.
Se analiza si hay alguna asociación entre dichos hechos
(variables).
21
16/10/2014
Próxima Clase
SERIES CRONOLÓGICAS
22