Cap11.-ANÁLISIS DE REGRESIÓNCOMPLETA

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 7

ANÁLISIS DE REGRESIÓN

Con frecuencia se quiere estudiar, la relación entre presión


sanguina y edad, consumo de azúcar y aumento de peso, ingreso
familiar y gastos médicos, o intensidad de un estímulo y tiempo de
reacción.

El Análisis de Regresión es una técnica estadística utilizada para


estudiar la relación entre variables.

El objetivo final es predecir o estimar el valor de una variable con


respecto a otra variable.

Tanto en el caso de dos variable (regresión simple) como en el caso


de dos o más variables (regresión múltiple), el análisis de regresión
lineal puede utilizarse para cuantificar la relación entre una variable
dependiente (Y) y una o más variables llamadas independientes (X 1,
X2,…Xk), así como para obtener una ecuación lineal con fines
predictivos.

Diagrama de Dispersión
Nos ofrece una idea bastante aproximada del tipo de relación
existente entre dos variables, pero además nos muestra el grado de
relación lineal al observar como la nube de puntos se ajusta a la
línea recta.

Pero lo que nos interesa es describir la nube de puntos mediante


una función matemática simple, tal como una línea recta.

La línea recta posee una formula muy simple

Yi = b0 + b1 Xi

b1 = pendiente de la recta: cambio que se produce en Y i por cada


unidad de cambio en Xi.

b0 = punto en que la recta corta el eje vertical

Pero en una nube de puntos es posible trazar varias rectas


diferentes, y lo que nos interesa es la recta que se ajusta mejor a la
nube de puntos.

Hay diferentes procedimientos para ajustar una función simple,


pero la elección preferida es aquella que hace mínima la suma de
los cuadrados de las distancias verticales entre cada punto y la
recta. Usando el método de mínimos cuadrados se pueden
determinar b0 y b1 resolviendo las ecuaciones normales siguientes:

n b0 + (ΣX) b1 = ΣY

(ΣX) b0+ (ΣX2) b1 = ΣXY

Las soluciones son:


Σχу Σ ( Xi− X ) (Yi−Y ) ΣXY −( ΣX )(ΣY )/ n
b1 = Σχ 2 = Σ ( Xi− X ) 2 = Σ X 2 −¿ ¿

b0 = Y - b1 X

Con estos valores podemos establecer la recta de regresión


siguiente:

Y^ = b0 + b1 X

La recta de regresión nos permite interpolar y extrapolar (predecir).

Ejemplo:

La siguiente tabla muestra las puntuaciones finales en Algebra y


Física de 10 estudiantes escogidos al azar.

Algebra X 75 80 93 65 87 71 98 68 84 77
Física Y 82 78 86 72 91 80 95 72 89 74

a). - Hallar la recta de mínimos cuadrados que se ajuste a los datos,


tomando X como variable independiente.

ΣXY −( ΣX )( ΣY )/n
b1 = 2
Σ X −¿ ¿
b1 = [66045 –(798)(819)/10]/64722-(636804)/10]
=[66045-(65356.2)]/ (64722-63680.4)

=[688.8 /1041.6]

b1 = 0.66
También podemos calcular b1 de la siguiente manera:

b1 = Σ XY / Σ X2

donde X (xi- X ) y Y (yi - Y )

b1 = 674.8 / 1041.6 = 0.66

Ahora calculemos: b0

b0 = Y -b1 X

b0 = 81.9 – (0.66 *79.8)

b0= 81.9 – (52.668)

b0 = 29.23

La recta de regresión es: Y^ = 29.23+ 0.66 X

Lo que esto quiere decir es que, por cada unidad de X, Y


aumenta en 0.66 unidades y que 29.23 es el punto en que la
recta corta el eje vertical.
b).- Si un estudiante tiene una puntuación de 75 en algebra
¿cuál es su puntuación esperada en Física?.
^
Yi = 29.23 + 0.66 (75) = 78.73

BONDAD DE AJUSTE
Grado en que la recta se ajusta a la nube de puntos o grado
de fidelidad con que la recta describe la relación existente
entre los datos.
¿Cómo podemos cuantificar ese mejor o peor ajuste a la
recta?
Para ello utilizaremos el COEFICIENTE DE DETERMINACIÓN
(r2) que toma valores entre 0 y 1. Toma valor 0 cuando las
variables son independientes y 1 cuando la relación entre
ellas es perfecta.
EL COEFICIENTE DE DETERMINACIÓN (r2 ) es el cuadrado del
COEFICIENTE DE CORRELACIÓN (r)
r2 = [b1*Σ(Xi- X )(Yi-Y )]/ Σ (Yi-Y )2
r2 = b1* Σ XY / Σ Y2 donde X = (Xi- X ), Y = ( Yi-Y ¿

r2 = 0.66 * 688.8/598.9 = 0.76


En nuestro ejemplo vemos que r2 = 0.76 mostrándonos que
hay un buen ajuste.

ANÁLISIS DE CORRELACIÓN
Mide la intensidad de relación entre las variables.
COEFICIENTE DE CORRELACÍON
En estadística, el coeficiente de correlación de Pearson es
una medida de la relación lineal entre dos variables
aleatorias cuantitativas
El rango de valores del Coeficiente de Correlación es:
-1 ≤ r ≤ 1
Otra forma de expresión del Coeficiente de Correlación es:

En nuestro ejemplo r = √0.76= .87

En base a la segunda fórmula calcularemos r

r = 688.8/√(1041.6)*(598.9) = 688.8/√623814

= 688.8/789.82 = 0.8721

Donde se comprueba que: r2 = (.8721)2 = .7605

También podría gustarte