Investigacion Regresion Lineal

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 21

UNIVERSIDAD: Aztlán plantel Cuautla

mor.

PROFESOR: ing. Dionicio Torres


Morales
ALUMNO: Edgar Ali Javier Ibarra

MATERIA: Estadística aplicada


Tema: investigación 2: REGRESION
LINEAL

Fecha: 10/06/2024

1
INDICE:
INTRODUCCION..............................................................................................................................3
Investiga el origen de los términos regresión lineal y regresión múltiple......................................4
Regresión lineal:.............................................................................................................................4
Regresión lineal multiple:..............................................................................................................4
¿Qué es el análisis de regresión?.......................................................................................................5
En el análisis de regresión ¿Qué es una ecuación de estimación?..................................................6
Explique la diferencia entre las relaciones lineales y curvilíneas...................................................6
La correlación lineal:.....................................................................................................................6
Correlación curvilínea:..................................................................................................................7
¿Qué es un diagrama de dispersión?................................................................................................8
Explique por qué y cómo se construye un diagrama de dispersión...............................................9
Investigue los tipos de modelos de regresión y explique cada uno mostrando cada relación
mediante una gráfica........................................................................................................................10
Modelo de regresión lineal simple...............................................................................................10
Modelo de regresión lineal múltiple............................................................................................11
Modelo de regresión no lineal......................................................................................................12
¿En que consiste el método de mínimos cuadrados?.....................................................................13
¿A quien se le atribuye el descubrimiento del método de mínimos cuadrados?.........................14
Explique como se realiza un análisis de regresión lineal simple..................................................15
Explique el significado de los coeficientes de regresión en la regresión lineal simple................15
Investigue las medidas de variación que se presentan en un modelo de regresión lineal simple
............................................................................................................................................................18
Investigue que es el coeficiente de determinación y explique su significado...............................18
Investigue que es el coeficiente de correlación y explique su significado....................................19
Investigue que es el error estadar y que mide este estadístico......................................................20
Conclusiones:....................................................................................................................................21
Referencias bibliográficas:..............................................................................................................22

2
INTRODUCCION
La regresión lineal es una técnica estadística esencial utilizada para modelar y
analizar la relación entre una variable dependiente y una o más variables
independientes. Esta metodología es ampliamente empleada en diversos campos
como la economía, la biología, la ingeniería y las ciencias sociales para hacer
predicciones y entender las interrelaciones entre variables.

En este trabajo, abordaremos varios subtemas importantes que componen el


estudio de la regresión lineal. Primero, examinaremos el término de regresión
lineal, que es la base de esta técnica y establece cómo se relacionan las variables
a través de una ecuación matemática. Luego, nos adentraremos en el análisis de
regresión, el proceso mediante el cual se determinan los parámetros del modelo
que mejor se ajustan a los datos observados.

Un aspecto clave de la regresión lineal es el modelo de dispersión, una


representación gráfica que muestra la relación entre las variables y permite
visualizar el ajuste del modelo a los datos. También exploraremos diversos
diagramas, herramientas visuales que ayudan a interpretar y validar el modelo,
identificando patrones y posibles anomalías en los datos.

Finalmente, discutiremos los coeficientes de regresión lineal, parámetros que


cuantifican la relación entre las variables independientes y la variable dependiente.
Estos coeficientes son fundamentales para interpretar el impacto de cada variable
independiente en la variable dependiente, proporcionando una comprensión
profunda de la dinámica entre las variables estudiadas.

Esta introducción nos prepara para un análisis detallado de la regresión lineal,


proporcionando las bases para comprender cómo se establecen, interpretan y
utilizan los modelos de regresión en la práctica.

3
Investiga el origen de los términos regresión lineal y
regresión múltiple
Regresión lineal:
El término regresión fue introducido por Francis Galton en su libro Natural
inheritance (1889) y fue confirmada por su amigo Karl Pearson. Su trabajo se
centró en la descripción de los rasgos físicos de los descendientes (variable A) a
partir de los de sus padres (variable B). Estudiando la altura de padres e hijos a
partir de más de mil registros de grupos familiares, se llegó a la conclusión de que
los padres muy altos tenían una tendencia a tener hijos que heredaban parte de
esta altura, pero que revelaban también una tendencia a regresar a la media.
Galton generalizó esta tendencia bajo la "ley de la regresión universal": Cada
peculiaridad en un hombre es compartida por sus descendientes, pero en media,
en un grado menor.
La primera forma de regresiones lineales documentada fue el método de los
mínimos cuadrados, el cual fue publicado por Legendre en 1805,1 y en dónde se
incluía una versión del teorema de Gauss-Márkov.

Regresión lineal multiple:


La regresión lineal múltiple es una técnica estadística que se encarga de analizar
situaciones que involucran más de una variable.
Este método permite identificar cuáles son las variables independientes son las
que pueden explicar una variable independiente, comprobar las causas y predecir
de forma aproximada los valores
El modelo de regresión lineal múltiple puede ser descrito a partir de la siguiente
ecuación:
Y = 0 + β1X1 + β2X2 + … + βnXn + ε
Donde Y es una variable dependiente, β representa sus estimadores y la ε
representa el residuo o error.

4
Qué es el análisis de regresión?
El análisis de regresión es un método estadístico que permite examinar la relación
entre dos o más variables e identificar cuáles son las que tienen mayor impacto en
un tema de interés.

El proceso de realizar una regresión permite determinar con confianza cuáles son
los factores más importantes, cuáles se pueden ignorar y cómo influyen
entre sí. Dichos factores se denominan variables las cuales se clasifican en:

 Variable(s) dependiente(s): Es el factor más importante, el cual se está


tratando de entender o predecir.
 Variable(s) independiente(s): Es el factor que tú crees que puede
impactar en tu variable dependiente.

El análisis de regresión utiliza un método de estimación elegido, una variable


dependiente y una o varias variables explicativas para crear una ecuación que
estima valores para la variable dependiente.

El modelo de regresión incluye salidas, tales como R 2 y valores P, para ofrecer


información de en qué medida el modelo realiza estimaciones fiables de la variable
dependiente.

También es posible utilizar gráficos, tales como matrices de gráficos de


dispersión, histogramas y gráficos de puntos, en el análisis de regresión para
analizar las relaciones y poner a prueba las suposiciones.

El análisis de regresión se puede usar para resolver los siguientes tipos de


problemas:

 Determinar qué variables explicativas están relacionadas con la variable


dependiente.
 Comprender la relación entre las variables dependientes y explicativas.
 Predecir valores desconocidos de la variable dependiente.

5
En el análisis de regresión ¿Qué es una ecuación de
estimación?
El procedimiento ecuaciones de estimación generalizadas amplía el modelo
lineal generalizado para permitir el análisis de mediciones repetidas y otras
observaciones correlacionadas, como datos clústeres.
El modelo de regresión y la ecuación de regresión:
La ecuación que describe cómo se relaciona y con x y con un término de error
se llama modelo de regresión. Éste usado en la regresión lineal simple es el
siguiente:
Modelo de regresión lineal simple: y = β0 + β1 x + ε β0 y β1 son los
parámetros del modelo.

Explique la diferencia entre las relaciones lineales y


curvilíneas

La correlación lineal:
relaciona una variable independiente con otra dependiente de manera lineal es
decir el incremento en la diferencia de uno y otra variable es constante. La relación
puede ser inversa o directa:

Ejemplo:

6
En el grafico 1 se puede observar correlación lineal directo (ambas variables
aumentan), en el segundo se observa correlación línea inversa (en x aumenta y en
Y disminuye). Enel tercer grafico se observa que los datos no siguen ninguna
distribución, en el cuarto grafico se observa que los datos se acercan a la curva.

Correlación curvilínea:
Se tiene cuando una variable independiente relación a otra dependiente de
manera que siguen la tendencia de una curva dada. Las curvas mas comunes son
las polinómicas, exponenciales, logarítmicas y potencial. Ejemplo:

¿Qué es un diagrama de dispersión?


Un diagrama de dispersión, también conocido como “gráfico de dispersión,” es
una representación gráfica de la relación entre dos variables. Los equipos usan
diagramas de dispersión para identificar las relaciones de causa y efecto entre
dos variables. Por ejemplo, después de una tormenta de ideas de múltiples
causas y efectos utilizando un diagrama de espina de pescado (causa y
efecto), el equipo podría usar un diagrama de dispersión para determinar si
una causa y efecto en particular están relacionados. Un diagrama de
dispersión representa gráficamente una variable en el eje X y la otra variable
en el eje Y. Si las dos variables están relacionadas, los puntos de datos caerán
a lo largo de una línea o curva diagonal, es decir, los valores para la variable X
se asociarán con los valores para la variable Y. Esto podría mostrar una
correlación positiva (los valores para ambas variables aumentan o disminuyen)

7
o una correlación negativa (los valores de una variable aumentan mientras que
los de la otra disminuyen).

Explique por qué y cómo se construye un diagrama


de dispersión
1) Reúna los datos para sus dos variables. En la hoja de recopilación de datos,
coloque cada par de datos en sus respectivas columnas. Asegúrese de que los
datos permanezcan emparejados.
2) Decida qué factor trazará y en qué eje. Ponga la causa sospechada en el eje
horizontal (X), y el efecto sospechoso en el eje vertical (Y).
3) Dibuje y etiquete los ejes claramente. o Haga que los ejes tengan
aproximadamente la misma longitud, creando un área de trazado cuadrada. o
Etiquete cada eje con valores crecientes de izquierda a derecha y de abajo hacia
arriba. o Etiquete cada eje para que coincida con el rango completo de valores
para ese factor. En otras palabras, haga la etiqueta numérica más baja
ligeramente inferior al valor de datos más bajos y la etiquete más alta ligeramente
mayor que el valor más alto. Los datos deben llenar toda el área de trazado.
4) Trace los pares de datos X e Y en el diagrama; coloque un punto en el gráfico
donde los dos valores se crucen.

8
5) Incluya un título en la parte superior del diagrama y proporcione las anotaciones
necesarias para describir lo que se muestra.
6) Estudie el patrón que crean los puntos de datos trazados para identificar lo que
ha aprendido y decida sus próximos pasos. Si hay una asociación entre las dos
variables, el patrón se parecerá a una forma elíptica o una línea recta. o Si los
puntos para ambos valores están aumentando (líneas inclinadas desde la parte
inferior izquierda a la superior derecha): La correlación es positiva. o Si una
variable aumenta mientras que la otra disminuye (líneas inclinadas desde la parte
superior izquierda a la inferior derecha): La correlación es negativa. o Si los puntos
forman una forma circular: Hay poca o ninguna correlación.

Investigue los tipos de modelos de regresión y


explique cada uno mostrando cada relación
mediante una gráfica.

Modelo de regresión lineal simple


La regresión lineal simple es la técnica más utilizada, es una forma que permite
modelar una relación entre dos conjuntos de variables. El resultado es una
ecuación que se puede utilizar para hacer proyecciones o estimaciones sobre los
datos.

Este modelo se considera un predictor x y una variable dependiente o


respuesta Y. Imagina que la verdadera relación entre Y y x es una línea recta y
que la observación Y en cada nivel x es una variable aleatoria.

El modelo de regresión lineal simple se caracteriza por predecir la variable


dependiente a través de la siguiente ecuación:

E(Y/x) = 0 + β1 x

Donde la ordenada al origen β0 y la pendiente β1 son coeficientes desconocidos


de la regresión.

Algunos consejos que puedes tomar en cuenta al utilizar el modelo de regresión


lineal simple son:

9
 Debes tener cuidado al seleccionar las variables con las que se construyen
las ecuaciones de regresión y determinar la forma del modelo.
 Las relaciones de regresión sólo son válidas para los valores del regresor
que están dentro del rango de los datos originales.

Modelo de regresión lineal múltiple


La regresión lineal múltiple es una técnica estadística que se encarga de analizar
situaciones que involucran más de una variable.

Este método permite identificar cuáles son las variables independientes son las
que pueden explicar una variable independiente, comprobar las causas y predecir
de forma aproximada los valores

El modelo de regresión lineal múltiple puede ser descrito a partir de la siguiente


ecuación:

Y = 0 + β1X1 + β2X2 + … + βnXn + ε

Donde Y es una variable dependiente, β representa sus estimadores y la ε


representa el residuo o error.

10
Modelo de regresión no lineal
La regresión no lineal es un proceso más complicado donde puede ocurrir que en
el número de parámetros no coincida con el de variables explicativas.

Un ejemplo de un modelo no lineal en los parámetros sería el dado por la siguiente


función exponencial:

Υ= αΧβ

En muchas ocasiones se pueden transformar las variables originales para


convertir la función no lineal en una lineal y así, aplicar dichas técnicas. Por lo
tanto, si la no linealidad afecta solamente a las variables explicativas pero no a los
coeficientes, se pueden definir nuevas variables.

11
¿En que consiste el método de mínimos cuadrados?
El método de mínimos cuadrados se aplica para ajustar rectas a una serie de
datos presentados como punto en el plano.
Supongamos que se tienen los siguientes datos para las variables:

Esta situación se puede presentar en estudios experimentales, donde se estudia la


variación de cierta magnitud x en función de otra magnitud y. Teóricamente es de
esperarse que la relación entre estas variables sea lineal, del tipo y = mx + b
El método de mínimos cuadrados nos proporciona un criterio con el cual podremos
obtener la mejor recta que representa a los puntos dados.
Se desearía tener yi = mxi + b para todos los puntos (xi , yi) de i = 1, ..., n. Sin
embargo, como en general yi = mxi + b se pide que la suma de los cuadrados de
las diferencias (las desviaciones) yi − (mxi + b) sea la menor posible.

12
¿A quien se le atribuye el descubrimiento del
método de mínimos cuadrados?
El método de mínimos cuadrados tiene una larga historia que se remonta a los
principios del siglo XIX. En Junio de 1801, Zach, un astrónomo que Gauss
había conocido dos años antes, publicaba las posiciones orbitales del cuerpo
celeste Ceres, un nuevo “pequeño planeta” descubierto por el astrónomo
italiano G. Piazzi en ese mismo año. Desafortunadamente, Piazzi sólo había
podido observar 9 grados de su órbita antes de que este cuerpo desapareciese
tras de el sol. Zach publicó varias predicciones de su posición incluyendo una
de Gauss que difería notablemente de las demás. Cuando Ceres fue
redescubierto por Zach en Diciembre de 1801 estaba casi exactamente en
donde Gauss había predicho. Aunque todavía no había revelado su método,
Gauss había descubierto el método de mínimos cuadrados. En un trabajo
brillante logró calcular la órbita de Ceres a partir de un número reducido de
observaciones, de hecho, el método de Gauss requiere sólo un mínimo de 3
observaciones y todavía es, en esencia, el utilizado en la actualidad para
calcular las órbitas.

13
Explique como se realiza un análisis de regresión
lineal simple
El análisis de regresión utiliza un método de estimación elegido, una variable
dependiente y una o varias variables explicativas para crear una ecuación que
estima valores para la variable dependiente.

El modelo de regresión incluye salidas, tales como R 2 y valores P, para ofrecer


información de en qué medida el modelo realiza estimaciones fiables de la variable
dependiente.

También es posible utilizar gráficos, tales como matrices de gráficos de


dispersión, histogramas y gráficos de puntos, en el análisis de regresión para
analizar las relaciones y poner a prueba las suposiciones.

El análisis de regresión se puede usar para resolver los siguientes tipos de


problemas:

 Determinar qué variables explicativas están relacionadas con la variable


dependiente.
 Comprender la relación entre las variables dependientes y explicativas.
 Predecir valores desconocidos de la variable dependiente.

Explique el significado de los coeficientes de


regresión en la regresión lineal simple
La tarea de la regresión lineal simple consiste en determinar exactamente la línea
recta que mejor describe la relación lineal entre la variable dependiente y la
independiente. Para determinar esta línea recta, que se trazará en el diagrama de
dispersión, la regresión lineal utiliza el método de los mínimos cuadrados.

La recta de regresión puede describirse mediante la siguiente ecuación:

Definición de los "Coeficientes de regresión":

 a: punto de intersección con el eje y

14
 b: pendiente de la recta

ŷ es la estimación respectiva del valor y. Esto significa que para cada valor x se
estima el valor y correspondiente. En nuestro ejemplo, esto significa que la altura
de las personas se utiliza para estimar su peso.

Si todos los puntos (valores medidos) estuvieran exactamente en una línea recta,
la estimación sería perfecta. Sin embargo, casi nunca es así y, por tanto, en la
mayoría de los casos hay que encontrar una línea recta que se aproxime lo más
posible a los puntos de datos individuales. Así pues, se intenta que el error en la
estimación sea lo más pequeño posible, de modo que la distancia entre el valor
estimado y el valor real sea lo menor posible. Esta distancia o error se denomina
"residuo", se abrevia como "e" (error) y se puede representar con la letra griega
épsilon (ϵ).

Al calcular la recta de regresión, se intenta determinar los coeficientes de


regresión (a y b) de modo que la suma de los residuos al cuadrado sea mínima.
(MCO- "Mínimos cuadrados ordinarios")

El coeficiente de regresión b puede tener ahora distintos signos, que pueden


interpretarse del siguiente modo

 b > 0: existe una correlación positiva entre x e y (a mayor x, mayor y)


 b< 0: existe una correlación negativa entre x e y (cuanto mayor es x, menor
es y)
 b = 0: no hay correlación entre x e y

Los coeficientes de regresión estandarizados suelen designarse con la letra


"beta". Son valores comparables entre sí. Aquí ya no importa la unidad de medida
de la variable. El coeficiente de regresión estandarizado (beta) es emitido
automáticamente por DATAtab.

15
Si todos los puntos (valores medidos) estuvieran exactamente en una línea recta,
la estimación sería perfecta. Sin embargo, casi nunca es así y, por tanto, en la
mayoría de los casos hay que encontrar una línea recta que se aproxime lo más
posible a los puntos de datos individuales. Así pues, se intenta que el error en la
estimación sea lo más pequeño posible, de modo que la distancia entre el valor
estimado y el valor real sea lo menor posible. Esta distancia o error se denomina
"residuo", se abrevia como "e" (error) y se puede representar con la letra griega
épsilon (ϵ).

Al calcular la recta de regresión, se intenta determinar los coeficientes de


regresión (a y b) de modo que la suma de los residuos al cuadrado sea mínima.
(MCO- "Mínimos cuadrados ordinarios")

El coeficiente de regresión b puede tener ahora distintos signos, que pueden


interpretarse del siguiente modo

 b > 0: existe una correlación positiva entre x e y (a mayor x, mayor y)


 b< 0: existe una correlación negativa entre x e y (cuanto mayor es x, menor
es y)
 b = 0: no hay correlación entre x e y

Los coeficientes de regresión estandarizados suelen designarse con la letra


"beta". Son valores comparables entre sí. Aquí ya no importa la unidad de medida
de la variable. El coeficiente de regresión estandarizado (beta) es emitido
automáticamente por DATAtab.

16
Investigue las medidas de variación que se
presentan en un modelo de regresión lineal simple
Modelo de regresión lineal simple: y = β0 + β1 x + ε β0 y β1 son los parámetros
del modelo. ε es una variable aleatoria, llamada error, que explica la variabilidad
en y que no se puede explicar con la relación lineal entre x y y. Los errores, ε, se
consideran variables aleatorias independientes distribuidas normalmente con
media cero y desviación estándar σ. Esto implica que el valor medio o valor
esperado de y, denotado por E(Y/x), es igual a β0 + β1 x.

Investigue que es el coeficiente de determinación y


explique su significado

El coeficiente de determinación (R cuadrado) indica la cantidad proporcional de


variación en la variable de respuesta y, explicada según las variables
independientes X en el modelo de regresión lineal. Cuanto mayor sea el R
cuadrado, mayor será la variabilidad explicada por el modelo de regresión
lineal.

Expresado r 2 en porcentaje, se puede interpretar como el porcentaje de la


variabilidad total de “Y” que se puede explicar aplicando la ecuación de regresión.

17
Investigue que es el coeficiente de correlación y
explique su significado
Es una medida descriptiva que mide la intensidad de asociación lineal entre las
dos variables, x y y. Los valores del coeficiente de correlación lineal siempre están
entre –1 y +1. –1 significa una relación lineal negativa perfecta, +1 significa una
relación lineal positiva perfecta. Los valores cercanos a cero indican que las
variables x y y no tiene relación lineal. El coeficiente de correlación lineal se
relaciona con el coeficiente de determinación así:

b1 es la pendiente la recta de regresión de y en x. El coeficiente de determinación


es más general que el coeficiente de correlación lineal.

18
Investigue que es el error estadar y que mide este
estadístico.

Conclusiones:
La regresión lineal es una herramienta estadística fundamental que permite
modelar y analizar las relaciones entre variables, proporcionando un medio

19
para hacer predicciones informadas y comprender mejor los datos. A lo
largo de este trabajo, hemos explorado varios aspectos esenciales de la
regresión lineal, incluyendo el término de regresión lineal, el análisis de
regresión, el modelo de dispersión, los diagramas y los coeficientes de
regresión lineal.
En resumen, la regresión lineal es una técnica versátil y poderosa que
encuentra aplicaciones en diversas disciplinas, desde las ciencias sociales
hasta la ingeniería. Su capacidad para revelar y cuantificar relaciones entre
variables la convierte en una herramienta indispensable para investigadores
y profesionales que buscan tomar decisiones basadas en datos.

20
Referencias bibliográficas:
 Regresión lineal. (s/f). Prezi.com. Recuperado el 21 de junio de 2024, de
https://prezi.com/qpxysldecq4u/regresion-lineal/
 Análisis de regresión. (s/f). Arcgis.com. Recuperado el 21 de junio de 2024,
de https://doc.arcgis.com/es/insights/latest/analyze/regression-analysis.htm
 Coeficiente de correlación. (2021, septiembre 22). Jmp.com.
https://www.jmp.com/es_mx/statistics-knowledge-portal/what-is-correlation/
correlation-coefficient.html
 (S/f). Recuperado el 21 de junio de 2024, de
http://file:///C:/Users/anala/Documents/Estadistica%202_4aEd_07.pdf
 Regresión lineal. (s/f). Datatab.es. Recuperado el 21 de junio de 2024, de
https://datatab.es/tutorial/linear-regression
 (S/f). Edu.sv. Recuperado el 21 de junio de 2024, de
http://www2.uca.edu.sv/matematica/upload_w/file/REGRESION
%20SIMPLE%20Y%20MULTIPLE.pdf
 SPSS statistics subscription - classic. (2023, agosto 4). Ibm.com.
https://www.ibm.com/docs/es/spss-statistics/saas?topic=statistics-
generalized-estimating-equations
 Cruces Álvarez, S. A. (s/f). El Método de Mínimos Cuadrados.
Personal.us.es. Recuperado el 21 de junio de 2024, de
https://personal.us.es/sergio/PDocente/lectura.pdf
 el plano. Suponagamos que se tienen los siguientes datos para las
variables x, E. M. de M. C. se A. P. A. R. a. U. S. de D. P. C. P. en. (s/f). El m
́etodo de m ́ ınimos cuadrados. Unam.mx. Recuperado el 21 de junio de
2024, de
https://sistemas.fciencias.unam.mx/~erhc/calculo3_20171/derivadas_parcial
es_direccionales_2016_12.pdf

21

También podría gustarte