Unidad 3 Correlación y Regresión

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 14

ESTADÍSTICA DESCRIPTIVA

MBA Rubén Darío Martínez Pure


Docente - Asesor
rdmartinezp@gmail.com
Unidad 3: Análisis de
regresión y correlación
Introducción.
En las unidades 1 y 2, se estudió el comportamiento de una variable en particular, “el
foco de interés cambia hacia el estudio de la relación entre dos variables de intervalo (o de razón).
En todos los campos de negocios, identificar y estudiar las relaciones entre variables puede
proporcionar información sobre las formas de elevar las ganancias, métodos para reducir los costos
o variables para predecir la demanda. Para comercializar sus productos, muchas empresas reducen
sus precios a través de cupones y descuentos para aumentar sus ventas.

En este ejemplo, nos interesa la relación entre dos variables: la reducción de precios y las ventas.
Para recabar datos, una compañía puede probar en el mercado una variedad de métodos de
reducción de precios y observar el comportamiento de las ventas. En economía, usted encontrará
muchas relaciones entre ambas variables que constituyen la base de la economía, tales como
abastecimiento y demanda, y demanda y precio. Lind, D; Marchald, W; Wathen, S. (2012) pag. 458).
En esta unida estudiaremos el análisis de correlación entre dos variables y luego el análisis de
regresión .

3.1 Análisis de correlación

En el análisis de correlación estudia la relación entre variables a través de un grupo de técnicas para
medir la asolación entre dos variables. La idea básica del análisis de correlación es reportar la
asociación entre dos variables. Por lo general, el primer paso es trazar los datos en un diagrama de
dispersión. Un ejemplo ilustrará cómo se emplea un diagrama de dispersión. Lind, D; Marchald, W;
Wathen, S. (2012) pag. 459).
Ejemplo

Lind, D; Marchald, W; Wathen, S. (2012) pag. 463).


Lind, D; Marchald, W; Wathen, S. (2012) pag. 463).
3.2 El coeficiente de correlación

El coeficiente de correlación, creado por Karl Pearson alrededor de 1900, describe la


fuerza de la relación entre dos conjuntos de variables en escala de intervalo o de
razón. Se designa con la letra r, y con frecuencia se le conoce como r de Pearson y
coeficiente de correlación producto-momento. Puede adoptar cualquier valor de 1.00
a 1.00, inclusive. Un coeficiente de correlación de 1.00 o bien de 1.00 indica una
correlación perfecta. Lind, D; Marchald, W; Wathen, S. (2012) pags. 464 465).
¿Cómo se determina el coeficiente de correlación? Como ejemplo,
emplee los datos de Copier Sales of America, que se reportan en la
tabla 13-2. Inicie con un diagrama de dispersión.

Lind, D; Marchald, W; Wathen, S. (2012) pags. 467 468).


Lind, D; Marchald, W; Wathen, S. (2012) pags. 467 468).
No. de No. de
Representante llamadas de copiadoras
de ventas (X - ) (Y- ) (X - ) (Y- ) Diagrama de dispersión
ventas vendidas
80
1 20 30 -2 -15 30
2 40 60 18 15 270 70
3 20 40 -2 -5 10

Copiadoras vendidas
60
4 30 60 8 15 120 50
5 10 30 -12 -15 180 40
6 10 40 -12 -5 60
30
7 20 40 -2 -5 10
20
8 20 50 -2 5 -10
9 20 30 -2 -15 30 10
10 30 70 8 25 200 0
5 10 15 20 25 30 35 40 45
Media
aritmética 22 45   ∑ 900 No. de llamadas

sx 9,1894
sy 14,3372
r 0,759
3.3 Análisis de regresión

En la sección anterior se desarrollaron medidas para expresar la fuerza y la dirección de la


relación lineal entre dos variables. En esta sección se elabora una ecuación para expresar
la relación lineal entre dos variables. Además, se desea estimar el valor de la variable
dependiente Y con base en un valor seleccionado de la variable independiente X. La
técnica para desarrollar la ecuación y proporcionar las estimaciones se denomina análisis
de regresión.

En el análisis de regresión, el objetivo es utilizar los datos para trazar una línea que
represente mejor la relación entre las dos variables. Nuestro primer enfoque es utilizar
un diagrama de dispersión para visualizar la posición de la línea.
Lind, D; Marchald, W; Wathen, S. (2012) pag. 476).

Lind, D; Marchald, W; Wathen, S. (2012) pag. 478).


Existen varias formas de hallar a y b de la ecuación de la regresión lineal donde Y prima (o
estimado), es el valor de la estimación de la variable Y para un valor X seleccionado.
a es la intersección con Y. Es el valor estimado de Y cuando X = 0. En otras palabras, a es el valor
estimado de Y donde la recta de regresión cruza el eje Y cuando X es cero.
b es la pendiente de la recta, o el cambio promedio en por cada cambio de una unidad (ya sea
aumento o reducción) de la variable independiente X.
X es cualquier valor de la variable independiente que se seleccione.
La forma general de la ecuación de la regresión lineal es exactamente la misma que la ecuación de
cualquier línea. a es la intersección con Y y b es la pendiente. El propósito de un análisis de
regresión es calcular los valores de a y b para desarrollar una ecuación lineal que se ajuste mejor a
los datos. (Lind, D; Marchald, W; Wathen, S. (2012) pag. 478).

Existen varias formas de hallar a y b de la ecuación de la regresión lineal. Las fórmulas de a y b son:
  𝑠𝑦   14,337
𝑏=𝑟
𝑠𝑥
𝑏=0.759 =1,1842
9,189

  -b 𝑎=45 − 1,1842 (22) = 18,9476
 

Igualmente, podemos calcular a y b considerando los datos originales de la tabla de


frecuencia.
a
 Y  X    X  XY 
2
N  XY -  X  Y 
b
N X    X  N X    X 
2 2 2
2

Tomemos los datos de Copier Sales of America.


Representante de No. de llamadas de No. de copiadoras X^2 XY
ventas ventas (x) vendidas (y)

1 20 30 400 600
2 40 60 1.600 2.400
3 20 40 400 800
4 30 60 900 1.800
5 10 30 100 300
6 10 40 100 400
7 20 40 400 800
8 20 50 400 1.000
9 20 30 400 600
10 30 70 900 2.100
∑ 220 450 5.600 10.800

Numerador 144.000
a 18,9474
Denominador 7.600
       
b Numerador 9.000 1,1842
Denominador 7.600
Ejercicio de aplicación

(Lind, D; Marchald, W; Wathen, S. (2012) pag. 481).


3.4. Coeficiente de determinación

El coeficiente de determinación es fácil de calcular. Es el coeficiente de correlación al cuadrado.


Por lo tanto, también se usa el término R al cuadrado. En el caso de Copier Sales of America, el
coeficiente de correlación de la relación entre el número de copiadoras vendidas y el número de
llamadas de ventas es 0.759. Si calculamos (0.759)2, el coeficiente de determinación es 0.576.
Nuestro análisis muestra que sólo 57.6% de la variación del número de copiadoras vendidas se
explica por la variación del número de llamadas de ventas que se realizó.

(Lind, D; Marchald, W; Wathen, S. (2012) pag. 487).


(Ejercicio).
a) ¿Cuál variable es dependiente, y cuál independiente? b) Trace un diagrama de dispersión.
b) Halle la recta de regresión
c) Interprete a y b
d) Determine el coeficiente de correlación.
e) Interprete el coeficiente de correlación. ¿Le sorprende que sea negativo ?

Ejercicio.
Si la serie de consumo e ingreso per cápita de cierto producto es como sigue:

Ingreso/año Consumo
Año Miles USD (kg) 1. Halle el modelo potencial
2012 120 7
2013 140 8 2. ¿Qué tipo de bien es?
2014 160 10 3. ¿Cuánto es la demanda si el ingreso
2015 180 12
2016 210 14 asciende a 350?
2017 230 15
2018 250 17
2019 280 19
2020 300 20
Proyección de la demanda
25

20
f(x) = 0.02 x^1.18
R² = 0.99
15

10

0
100 150 200 250 300 350

También podría gustarte