Trabajo de Metodos Regresion Lineal
Trabajo de Metodos Regresion Lineal
Trabajo de Metodos Regresion Lineal
Micaela Bastidas de
Apurímac
Escuela académica profesional de ingeniería
agroindustrial
Código: 102078
Abancay- Apurímac
2023
PRACTICA DE REGRESION LINEAL
Para estudiar la relación entre el peso y la altura en bebes, se midió la altura (cm) que depende
de su peso obtenido por él bebe, registrándose 15 mediciones. Los datos se encuentran en:
LA TABLA SIGUIENTE.
Análisis estadístico
El objetivo del estudio fue establecer la relación del peso si afecta la altura datos en estudio. Se
intentó modelar la relación existente entre la variación de la altura con el peso de los bebes.
Siendo la variable dependiente la altura (y) y la independiente el peso(x). Previo a someter los
datos a un análisis de varianza (ANDEVA), se verificaron los supuestos del modelo de regresión
sobre los términos del error. Usualmente se suponen normales y aleatorios. Para ello se
utilizaron técnicas basadas en los residuos. Se utilizó la prueba de Anderson–Darling para
verificar el supuesto de normalidad de los residuos.
El supuesto de aleatoriedad de los residuos se verificó utilizando una prueba gráfica de los
Residuos v/s los predichos. En el caso de que los supuestos no se cumplan, se deberán probar
trasformaciones de las variables originales. Posteriormente a la verificación de los supuestos,
se procedió a interpretar el ANDEVA.
Las hipótesis de interés se contrastaron usando un nivel de significación del 5%. Paralelamente
se probó la significancia de los parámetros α y β. Se plantearon las siguientes
hipótesis:
Las hipótesis de interés se contrastaron usando un nivel de significación del 5%. Para medir la
bondad del modelo se obtuvo el Coeficiente de Determinación (R2), que expresa el porcentaje
de la variación total de “y” que se debe al efecto de la variable “x”.
Resultados
a) Grafico de dispersión
Se tomó como variable dependiente a la altura y como variable regresora el peso. El siguiente
La ecuación de regresión es
Peso (g): X = 73.6 + 11.0 Altura (cm): y
Coef.
Predictor Coef de EE T P
Constante 73.589 6.145 11.97 0.000
Altura (cm): y 10.9737 0.1566 70.09 0.000
Análisis de varianza
Fuente GL SC MC F P
Regresión 1 220053 220053 4912.40 0.000
Error residual 13 582 45
Total 14 220635
60
50
40
30
20
10
1
-15 -10 -5 0 5 10 15
RESID1
La ecuación de regresión es
Peso (g): X = 73.6 + 11.0 Altura (cm): y
Coef.
Predictor Coef de EE T P
Constante 73.589 6.145 11.97 0.000
Altura (cm): y 10.9737 0.1566 70.09 0.000
Análisis de varianza
Fuente GL SC MC F P
Regresión 1 220053 220053 4912.40 0.000
Error residual 13 582 45
Total 14 220635
vs. ajustes
(la respuesta es Peso (g): X)
15
10
5
Residuo
-5
-10
Para que exista aleatoriedad de los residuos, estos deben comportarse de forma uniforme, sin
patrón alguno, como en una franja, es decir, la variabilidad de los residuos debe ser siempre
constante, independiente del valor que tomen los valores “y” estimados (ó “fitted values” ó
“predichos”).
Por tanto, en este caso se acepta el supuesto de aleatoriedad de los errores.
La ecuación de regresión es
Peso (g): X = 73.6 + 11.0 Altura (cm): y
Coef.
Predictor Coef de EE T P
Constante 73.589 6.145 11.97 0.000
Altura (cm): y 10.9737 0.1566 70.09 0.000
Análisis de varianza
Fuente GL SC MC F P
Regresión 1 220053 220053 4912.40 0.000
Error residual 13 582 45
Total 14 220635
Como puede verse en la salida de los resultados, hay una relación lineal significativa entre el
peso y la altura (p value = 0,000 < 0,05), sustentada en el rechazo de la hipótesis nula, por lo
tanto se concluye que la regresión es significativa. Tomando la información sobre los
coeficientes de regresión se puede escribir la ecuación del modelo ajustado:
Esta recta permite estimar el valor de “y” (valor predicho) para cualquier valor de “x”. El
modelo ajustado puede ser usado con fines predictivos; por ejemplo, para una altura de 55 el
peso esperado es de 689gr.
S = √ 45 = 6.71
F = 220053/45 = 4890.07
T (para la constante) = 73.589/6.145 = 11.97
La ecuación de regresión es
Peso (g): X = 73.59 + 10.97 Altura (cm): y
Análisis de varianza
Fuente GL SC MC F P
Regresión 1 220053 220053 4912.40 0.000
Error 13 582 45
Total 14 220635
600
Peso (g): X
500
400
300
20 30 40 50 60
Altura (cm): y
10
5
Residuo
-5
-10