Investigacion Regresion Lineal
Investigacion Regresion Lineal
Investigacion Regresion Lineal
mor.
Fecha: 10/06/2024
1
INDICE:
INTRODUCCION..............................................................................................................................3
Investiga el origen de los términos regresión lineal y regresión múltiple......................................4
Regresión lineal:.............................................................................................................................4
Regresión lineal multiple:..............................................................................................................4
¿Qué es el análisis de regresión?.......................................................................................................5
En el análisis de regresión ¿Qué es una ecuación de estimación?..................................................6
Explique la diferencia entre las relaciones lineales y curvilíneas...................................................6
La correlación lineal:.....................................................................................................................6
Correlación curvilínea:..................................................................................................................7
¿Qué es un diagrama de dispersión?................................................................................................8
Explique por qué y cómo se construye un diagrama de dispersión...............................................9
Investigue los tipos de modelos de regresión y explique cada uno mostrando cada relación
mediante una gráfica........................................................................................................................10
Modelo de regresión lineal simple...............................................................................................10
Modelo de regresión lineal múltiple............................................................................................11
Modelo de regresión no lineal......................................................................................................12
¿En que consiste el método de mínimos cuadrados?.....................................................................13
¿A quien se le atribuye el descubrimiento del método de mínimos cuadrados?.........................14
Explique como se realiza un análisis de regresión lineal simple..................................................15
Explique el significado de los coeficientes de regresión en la regresión lineal simple................15
Investigue las medidas de variación que se presentan en un modelo de regresión lineal simple
............................................................................................................................................................18
Investigue que es el coeficiente de determinación y explique su significado...............................18
Investigue que es el coeficiente de correlación y explique su significado....................................19
Investigue que es el error estadar y que mide este estadístico......................................................20
Conclusiones:....................................................................................................................................21
Referencias bibliográficas:..............................................................................................................22
2
INTRODUCCION
La regresión lineal es una técnica estadística esencial utilizada para modelar y
analizar la relación entre una variable dependiente y una o más variables
independientes. Esta metodología es ampliamente empleada en diversos campos
como la economía, la biología, la ingeniería y las ciencias sociales para hacer
predicciones y entender las interrelaciones entre variables.
3
Investiga el origen de los términos regresión lineal y
regresión múltiple
Regresión lineal:
El término regresión fue introducido por Francis Galton en su libro Natural
inheritance (1889) y fue confirmada por su amigo Karl Pearson. Su trabajo se
centró en la descripción de los rasgos físicos de los descendientes (variable A) a
partir de los de sus padres (variable B). Estudiando la altura de padres e hijos a
partir de más de mil registros de grupos familiares, se llegó a la conclusión de que
los padres muy altos tenían una tendencia a tener hijos que heredaban parte de
esta altura, pero que revelaban también una tendencia a regresar a la media.
Galton generalizó esta tendencia bajo la "ley de la regresión universal": Cada
peculiaridad en un hombre es compartida por sus descendientes, pero en media,
en un grado menor.
La primera forma de regresiones lineales documentada fue el método de los
mínimos cuadrados, el cual fue publicado por Legendre en 1805,1 y en dónde se
incluía una versión del teorema de Gauss-Márkov.
4
Qué es el análisis de regresión?
El análisis de regresión es un método estadístico que permite examinar la relación
entre dos o más variables e identificar cuáles son las que tienen mayor impacto en
un tema de interés.
El proceso de realizar una regresión permite determinar con confianza cuáles son
los factores más importantes, cuáles se pueden ignorar y cómo influyen
entre sí. Dichos factores se denominan variables las cuales se clasifican en:
5
En el análisis de regresión ¿Qué es una ecuación de
estimación?
El procedimiento ecuaciones de estimación generalizadas amplía el modelo
lineal generalizado para permitir el análisis de mediciones repetidas y otras
observaciones correlacionadas, como datos clústeres.
El modelo de regresión y la ecuación de regresión:
La ecuación que describe cómo se relaciona y con x y con un término de error
se llama modelo de regresión. Éste usado en la regresión lineal simple es el
siguiente:
Modelo de regresión lineal simple: y = β0 + β1 x + ε β0 y β1 son los
parámetros del modelo.
La correlación lineal:
relaciona una variable independiente con otra dependiente de manera lineal es
decir el incremento en la diferencia de uno y otra variable es constante. La relación
puede ser inversa o directa:
Ejemplo:
6
En el grafico 1 se puede observar correlación lineal directo (ambas variables
aumentan), en el segundo se observa correlación línea inversa (en x aumenta y en
Y disminuye). Enel tercer grafico se observa que los datos no siguen ninguna
distribución, en el cuarto grafico se observa que los datos se acercan a la curva.
Correlación curvilínea:
Se tiene cuando una variable independiente relación a otra dependiente de
manera que siguen la tendencia de una curva dada. Las curvas mas comunes son
las polinómicas, exponenciales, logarítmicas y potencial. Ejemplo:
7
o una correlación negativa (los valores de una variable aumentan mientras que
los de la otra disminuyen).
8
5) Incluya un título en la parte superior del diagrama y proporcione las anotaciones
necesarias para describir lo que se muestra.
6) Estudie el patrón que crean los puntos de datos trazados para identificar lo que
ha aprendido y decida sus próximos pasos. Si hay una asociación entre las dos
variables, el patrón se parecerá a una forma elíptica o una línea recta. o Si los
puntos para ambos valores están aumentando (líneas inclinadas desde la parte
inferior izquierda a la superior derecha): La correlación es positiva. o Si una
variable aumenta mientras que la otra disminuye (líneas inclinadas desde la parte
superior izquierda a la inferior derecha): La correlación es negativa. o Si los puntos
forman una forma circular: Hay poca o ninguna correlación.
E(Y/x) = 0 + β1 x
9
Debes tener cuidado al seleccionar las variables con las que se construyen
las ecuaciones de regresión y determinar la forma del modelo.
Las relaciones de regresión sólo son válidas para los valores del regresor
que están dentro del rango de los datos originales.
Este método permite identificar cuáles son las variables independientes son las
que pueden explicar una variable independiente, comprobar las causas y predecir
de forma aproximada los valores
10
Modelo de regresión no lineal
La regresión no lineal es un proceso más complicado donde puede ocurrir que en
el número de parámetros no coincida con el de variables explicativas.
Υ= αΧβ
11
¿En que consiste el método de mínimos cuadrados?
El método de mínimos cuadrados se aplica para ajustar rectas a una serie de
datos presentados como punto en el plano.
Supongamos que se tienen los siguientes datos para las variables:
12
¿A quien se le atribuye el descubrimiento del
método de mínimos cuadrados?
El método de mínimos cuadrados tiene una larga historia que se remonta a los
principios del siglo XIX. En Junio de 1801, Zach, un astrónomo que Gauss
había conocido dos años antes, publicaba las posiciones orbitales del cuerpo
celeste Ceres, un nuevo “pequeño planeta” descubierto por el astrónomo
italiano G. Piazzi en ese mismo año. Desafortunadamente, Piazzi sólo había
podido observar 9 grados de su órbita antes de que este cuerpo desapareciese
tras de el sol. Zach publicó varias predicciones de su posición incluyendo una
de Gauss que difería notablemente de las demás. Cuando Ceres fue
redescubierto por Zach en Diciembre de 1801 estaba casi exactamente en
donde Gauss había predicho. Aunque todavía no había revelado su método,
Gauss había descubierto el método de mínimos cuadrados. En un trabajo
brillante logró calcular la órbita de Ceres a partir de un número reducido de
observaciones, de hecho, el método de Gauss requiere sólo un mínimo de 3
observaciones y todavía es, en esencia, el utilizado en la actualidad para
calcular las órbitas.
13
Explique como se realiza un análisis de regresión
lineal simple
El análisis de regresión utiliza un método de estimación elegido, una variable
dependiente y una o varias variables explicativas para crear una ecuación que
estima valores para la variable dependiente.
14
b: pendiente de la recta
ŷ es la estimación respectiva del valor y. Esto significa que para cada valor x se
estima el valor y correspondiente. En nuestro ejemplo, esto significa que la altura
de las personas se utiliza para estimar su peso.
Si todos los puntos (valores medidos) estuvieran exactamente en una línea recta,
la estimación sería perfecta. Sin embargo, casi nunca es así y, por tanto, en la
mayoría de los casos hay que encontrar una línea recta que se aproxime lo más
posible a los puntos de datos individuales. Así pues, se intenta que el error en la
estimación sea lo más pequeño posible, de modo que la distancia entre el valor
estimado y el valor real sea lo menor posible. Esta distancia o error se denomina
"residuo", se abrevia como "e" (error) y se puede representar con la letra griega
épsilon (ϵ).
15
Si todos los puntos (valores medidos) estuvieran exactamente en una línea recta,
la estimación sería perfecta. Sin embargo, casi nunca es así y, por tanto, en la
mayoría de los casos hay que encontrar una línea recta que se aproxime lo más
posible a los puntos de datos individuales. Así pues, se intenta que el error en la
estimación sea lo más pequeño posible, de modo que la distancia entre el valor
estimado y el valor real sea lo menor posible. Esta distancia o error se denomina
"residuo", se abrevia como "e" (error) y se puede representar con la letra griega
épsilon (ϵ).
16
Investigue las medidas de variación que se
presentan en un modelo de regresión lineal simple
Modelo de regresión lineal simple: y = β0 + β1 x + ε β0 y β1 son los parámetros
del modelo. ε es una variable aleatoria, llamada error, que explica la variabilidad
en y que no se puede explicar con la relación lineal entre x y y. Los errores, ε, se
consideran variables aleatorias independientes distribuidas normalmente con
media cero y desviación estándar σ. Esto implica que el valor medio o valor
esperado de y, denotado por E(Y/x), es igual a β0 + β1 x.
17
Investigue que es el coeficiente de correlación y
explique su significado
Es una medida descriptiva que mide la intensidad de asociación lineal entre las
dos variables, x y y. Los valores del coeficiente de correlación lineal siempre están
entre –1 y +1. –1 significa una relación lineal negativa perfecta, +1 significa una
relación lineal positiva perfecta. Los valores cercanos a cero indican que las
variables x y y no tiene relación lineal. El coeficiente de correlación lineal se
relaciona con el coeficiente de determinación así:
18
Investigue que es el error estadar y que mide este
estadístico.
Conclusiones:
La regresión lineal es una herramienta estadística fundamental que permite
modelar y analizar las relaciones entre variables, proporcionando un medio
19
para hacer predicciones informadas y comprender mejor los datos. A lo
largo de este trabajo, hemos explorado varios aspectos esenciales de la
regresión lineal, incluyendo el término de regresión lineal, el análisis de
regresión, el modelo de dispersión, los diagramas y los coeficientes de
regresión lineal.
En resumen, la regresión lineal es una técnica versátil y poderosa que
encuentra aplicaciones en diversas disciplinas, desde las ciencias sociales
hasta la ingeniería. Su capacidad para revelar y cuantificar relaciones entre
variables la convierte en una herramienta indispensable para investigadores
y profesionales que buscan tomar decisiones basadas en datos.
20
Referencias bibliográficas:
Regresión lineal. (s/f). Prezi.com. Recuperado el 21 de junio de 2024, de
https://prezi.com/qpxysldecq4u/regresion-lineal/
Análisis de regresión. (s/f). Arcgis.com. Recuperado el 21 de junio de 2024,
de https://doc.arcgis.com/es/insights/latest/analyze/regression-analysis.htm
Coeficiente de correlación. (2021, septiembre 22). Jmp.com.
https://www.jmp.com/es_mx/statistics-knowledge-portal/what-is-correlation/
correlation-coefficient.html
(S/f). Recuperado el 21 de junio de 2024, de
http://file:///C:/Users/anala/Documents/Estadistica%202_4aEd_07.pdf
Regresión lineal. (s/f). Datatab.es. Recuperado el 21 de junio de 2024, de
https://datatab.es/tutorial/linear-regression
(S/f). Edu.sv. Recuperado el 21 de junio de 2024, de
http://www2.uca.edu.sv/matematica/upload_w/file/REGRESION
%20SIMPLE%20Y%20MULTIPLE.pdf
SPSS statistics subscription - classic. (2023, agosto 4). Ibm.com.
https://www.ibm.com/docs/es/spss-statistics/saas?topic=statistics-
generalized-estimating-equations
Cruces Álvarez, S. A. (s/f). El Método de Mínimos Cuadrados.
Personal.us.es. Recuperado el 21 de junio de 2024, de
https://personal.us.es/sergio/PDocente/lectura.pdf
el plano. Suponagamos que se tienen los siguientes datos para las
variables x, E. M. de M. C. se A. P. A. R. a. U. S. de D. P. C. P. en. (s/f). El m
́etodo de m ́ ınimos cuadrados. Unam.mx. Recuperado el 21 de junio de
2024, de
https://sistemas.fciencias.unam.mx/~erhc/calculo3_20171/derivadas_parcial
es_direccionales_2016_12.pdf
21