Regresión Lineal

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 17

Introducción

La regresión lineal involucra en su análisis y desarrollo dos variables y un


término aleatorio. Esto permite que estadísticamente sea posible el ajuste
lineal. Para ello es necesario conocer los tipos de regresión existentes en
la estadística, su asociación con las diferentes variables y los coeficientes
necesarios para calcular su grado de regresión y correlación lineal.
¿Qué es la regresión lineal?

La regresión lineal es una técnica de análisis de datos que


predice un valor de datos desconocido utilizando otro valor de datos
relacionado conocido.
Modelado matemático de variables desconocidas o
dependientes y variables conocidas o independientes como ecuaciones
lineales. Por ejemplo, digamos que tiene datos de gastos e ingresos
del último año.
El método de regresión lineal analiza estos datos y determina que tus
gastos son la mitad de tus ingresos.
Luego calcularon el consumo futuro desconocido dividiendo a la
mitad los ingresos futuros conocidos.

¿Por qué es importante la regresión lineal?

Los modelos de regresión lineal son relativamente simples y


proporcionan una fórmula matemática fácil
de entender para hacer predicciones.

La regresión lineal es una técnica estadística establecida que se puede


aplicar fácilmente al software y la computación.

Las empresas los utilizan para transformar de manera confiable y


predecible datos sin procesar en conocimientos e inteligencia
empresarial procesables. Los científicos de muchos
campos, incluidos la biología, el comportamiento, el medio ambiente y las
ciencias sociales, utilizan la regresión lineal para analizar previamente
los datos y predecir tendencias futuras.

Muchas técnicas de procesamiento de datos, como el aprendizaje


automático y la inteligencia artificial, utilizan la regresión lineal para
resolver problemas complejos.

¿Cómo funciona la regresión lineal?

Básicamente, un método de regresión lineal simple intenta trazar una


gráfica lineal entre dos variables de datos x e y. Como variable
independiente, x se traza en el eje horizontal.
Las variables independientes también se conocen como variables
explicativas o predictivas.
La variable dependiente y se traza en el eje vertical.
También puede tratar el valor de y como una respuesta o una variable
predictiva.
Pasos en la regresión lineal

Para esta visión general, tenga en cuenta la forma más simple de la


ecuación de gráfico de líneas entre y y x; y=c*x+m, donde c y m son
constantes para todos los valores posibles de x e y. Así, por ejemplo,
supongamos que los datos de entrada para (x, y) era (1,5), (2,8) y (3,11).
Para identificar el método de regresión lineal, debe seguir los siguientes
pasos:

1. Trace una línea recta y mida la correlación entre 1 y 5.

2. Siga cambiando la dirección de la línea recta para los nuevos valores


(2,8) y (3,11) hasta que se ajusten todos los valores.
3. Identifique la ecuación de regresión lineal como y = 3*x + 2.

4. Extrapola o predice que y es 14 cuando x es


¿Cuáles son los tipos de regresión lineal?

Algunos tipos de análisis de regresión son más adecuados que otros


para gestionar conjuntos de datos complejos. A continuación se muestran
algunos ejemplos.

Regresión lineal simple

La regresión lineal simple se define mediante la función lineal:

Y= β0*X + β1 + ε

β0 y β1 son dos constantes desconocidas que representan la pendiente


de regresión, mientras que ε (épsilon) es el término de error.

Puede utilizar la regresión lineal simple para modelar la relación entre


dos variables, como las siguientes:

 Lluvia y rendimiento de los cultivos

 Edad y estatura en niños

 Temperatura y expansión del mercurio metálico en un termómetro


Regresión lineal múltiple

En el análisis de regresión lineal múltiple, el conjunto de datos contiene


una variable dependiente y múltiples variables independientes. La
función de línea de regresión lineal cambia para incluir más factores, de
la siguiente manera:

Y = β0*x0 + β1x1 + β2x2+…… βNxN+ ε


A medida que aumenta el número de variables predictivas, las constantes
β también aumentan en consecuencia.

La regresión lineal múltiple modela múltiples variables y su impacto en un


resultado:

 Lluvia, temperatura y uso de fertilizantes en el rendimiento de los cultivos

 Dieta y ejercicio sobre enfermedades cardíacas

 Crecimiento salarial e inflación en las tasas de préstamos hipotecarios


Regresión logística

Los científicos de datos utilizan la regresión logística para medir la


probabilidad de que se produzca un evento. La predicción es un valor
entre 0 y 1, donde 0 indica un evento que es poco probable que ocurra y
1 indica una probabilidad máxima de que suceda. Las ecuaciones
logísticas usan funciones logarítmicas para calcular la línea de regresión.

A continuación, se indican varios ejemplos:

 La probabilidad de ganar o perder en un partido deportivo

 La probabilidad de aprobar o reprobar una prueba

 La probabilidad de que una imagen sea una fruta o un animal

“Ejemplos de Regresión Lineal”

*EJEMPLO: NO. 1*

El primer tipo es la regresión lineal simple, en la que solo se utiliza un


único predictor. Por ejemplo, puede usarse a la hora de predecir
accidentes mortales de tráfico en un país. La variable de respuesta Y
sería el país y se compararía con la población, que sería la variable
predictora X.

*EJEMPLO: NO. 2*

La regresión lineal múltiple permite crear modelos que emplean


diferentes predictores, los cuales se usarán para dar una respuesta a Y.
Podría utilizarse para predecir cuántos litros de gasolina consumirán
varios coches, variable de respuesta Y, en función del peso y la potencia
que tengan, variable predictiva X.
*EJEMPLO: NO. 3*

Con la regresión lineal multivariante es posible generar modelos para dar


respuesta a diferentes variables. En este caso, se cuenta con múltiples Y.
Se aplican varias fórmulas a la hora de expresarla. Así, se podría estimar
la incidencia de la gripe en nueve regiones de Estados Unidos, variables
de respuesta Y basadas en la semana del año, variable predictora X.

Por último, la regresión lineal múltiple multivariante se utiliza en modelos


que cuentan con varios predictores para múltiples variables de respuesta.
Se podría emplear para calcular los kilómetros por litro de gasolina que
se usan en ciudad y autopista a partir de tres variables: distancia entre
ejes, peso en vacío y tipo de combustible.

En cuanto a las aplicaciones de la regresión lineal, estas se dividen en


dos.

1. Creación de pronósticos. Se establecen modelos para un


conjunto de datos específicos, con la intención de predecir
los valores de respuesta donde solo se conocen los
predictores.
2. Empleo en determinar si existe una relación entre una
variable y un predictor, así como la fuerza de la misma.
*EJEMPLO: NO. 4*

Una inteligencia artificial basada en machine learning. Esta podrá


manejar una mayor cantidad de datos con más facilidad, algo que va a
necesitar a la hora de pilotar un vehículo. La carretera supone un reto, ya
que existe una alta cantidad de variables que debe tener en cuenta y
predecir para, por ejemplo, evitar un choque.

Se puede utilizar una progresión lineal para encontrar los parámetros que
minimicen el error de un grupo de datos, para lo que se utilizará el error
cuadrático medio.

El proceso de aprendizaje que realiza la inteligencia artificial consistirá en


analizar los parámetros w y b. Así, se obtienen los mejores valores para
ellos:

w= 0,0918 y b= 1,2859.

El resultado sería el siguiente:

y=0,0918x+1,2859.

Este modelo puede destinarse a estimar cuáles van a ser los resultados
para otros valores x. Si se quisiera conocer el de x= 5, se utilizaría el
anterior modelo y el resultado que se obtendría es 1,7449.

Este valor se alcanzaría de la siguiente manera:

y=0.0918⋅5+1.2859=1.7449.
Pese a que este es un ejemplo sencillo, el machine learning suele
manejar una cantidad elevada de variables. Al fin y al cabo, deben
gestionar una ingente cantidad de datos en los que encontrarán los
patrones especificados en su programación. Sin embargo, para poder
comprender las capacidades de la regresión lineal, es suficiente con un
modelo simple.

En función del número de variables que se vayan a incluir, se utilizará un


tipo u otro de regresión. Esta es la forma de gestionar de manera
eficiente y exitosa los datos que necesita la inteligencia artificial. Así,
cumplirá con su cometido sin problemas y ajustándose al objetivo final
que se persigue, sea cual sea la programación.

Ilustración del ejemplo en una gráfica:


En definitiva, la regresión lineal es un modelo matemático que puede
utilizarse en diferentes aplicaciones, entre las que destaca la informática.
Ayuda a proyectar valores futuros o a establecer predicciones, las cuales
aprovechan las inteligencias artificiales basadas en machine learning.
Así, pueden realizar sus funciones de forma sencilla y ágil, sin que su
programación tenga que complicarse en exceso. En Structuralia
apostamos por la formación de calidad. Disponemos de un
amplio catálogo de másteres para mejorar las capacidades profesionales
en gestión de empresas y otros ámbitos.

*EJEMPLO: NO. 5*

Las ventas de la empresa SUPER COCINAS DE GUATEMALA durante


los últimos 10 trimestres son las siguientes:
¿Cómo pronosticar la demanda de los trimestres 13, 14 y 15 a través de
un análisis de regresión lineal?

Lo primero es estimar los parámetros. Lo podemos lograr con el método


de mínimos cuadrados, que nos permite encontrar la recta que mejor se
ajusta a un conjunto de datos dados. En nuestro caso, este conjunto está
dado por las ventas trimestrales (variable dependiente). La variable
independiente es el tiempo. Vamos entonces a la siguiente fórmula para
determinar a y b:

 La y “minúscula”
es el valor y de cada punto de datos.
 La n es el número de punto de datos.
Conocidas las ecuaciones y el papel de las variables, vamos a calcular el
pronóstico con regresión lineal:

En la siguiente se encuentran los cálculos realizados para los 12


trimestres según lo requerido por las ecuaciones:

Con los valores de la última fila de la tabla, podemos calcular a y b, con


los cuales logramos calcular los valores de la última columna (Y) que es
la recta que más se ajusta a la demanda y.

Veamos entonces:
Fíjate que el valor de «b» varía de 63,64 a 63,657 siendo este último el
resultado si se toman todos los decimales de las variables que participan
en su cálculo. Para tener resultados más fiables usamos el valor de «b»
calculado con todos los decimales, tal como lo aprecias cuando hallamos
«a». Fíjate además que pasa lo mismo con el valor calculado de «a» y el
valor que se obtiene cuando en la operación están todos los decimales.

Con esta aclaración, puedes ver cómo se realiza el pronóstico de


producción del trimestre 13. Procedemos igual para los demás trimestres.

Y=63,657(14)+72,894=964.09

Y=63,657(15)+72,894=1027.75

Eso tiene el siguiente aspecto:


“Conclusión”
La regresión lineal describe la relación entre varias variables: la variable
dependiente y una o varias variables independientes. Por su rapidez de
creación y su facilidad de interpretación, los modelos de regresión lineal
se han utilizado con éxito en diversos ámbitos, desde la medicina hasta
la agronomía, tanto para hacer previsiones como para describir sistemas.
Existen programas gratuitos que explican cómo hacer para que aplicar el
análisis de regresión sea fácil y eficaz.

También podría gustarte