Regresión Lineal

Introducción
La regresión lineal involucra en su análisis y desarrollo dos variables y un

término aleatorio. Esto permite que estadísticamente sea posible el ajuste
lineal. Para ello es necesario conocer los tipos de regresión existentes en
la estadística, su asociación con las diferentes variables y los coeficientes
necesarios para calcular su grado de regresión y correlación lineal.
¿Qué es la regresión lineal?
La regresión lineal es una técnica de análisis de datos que

predice un valor de datos desconocido utilizando otro valor de datos
relacionado conocido.
Modelado matemático de variables desconocidas o
dependientes y variables conocidas o independientes como ecuaciones
lineales. Por ejemplo, digamos que tiene datos de gastos e ingresos
del último año.
El método de regresión lineal analiza estos datos y determina que tus
gastos son la mitad de tus ingresos.
Luego calcularon el consumo futuro desconocido dividiendo a la
mitad los ingresos futuros conocidos.
¿Por qué es importante la regresión lineal?
Los modelos de regresión lineal son relativamente simples y

proporcionan una fórmula matemática fácil
de entender para hacer predicciones.
La regresión lineal es una técnica estadística establecida que se puede

aplicar fácilmente al software y la computación.
Las empresas los utilizan para transformar de manera confiable y

predecible datos sin procesar en conocimientos e inteligencia
empresarial procesables. Los científicos de muchos
campos, incluidos la biología, el comportamiento, el medio ambiente y las
ciencias sociales, utilizan la regresión lineal para analizar previamente
los datos y predecir tendencias futuras.
Muchas técnicas de procesamiento de datos, como el aprendizaje

automático y la inteligencia artificial, utilizan la regresión lineal para
resolver problemas complejos.
¿Cómo funciona la regresión lineal?
Básicamente, un método de regresión lineal simple intenta trazar una

gráfica lineal entre dos variables de datos x e y. Como variable
independiente, x se traza en el eje horizontal.
Las variables independientes también se conocen como variables
explicativas o predictivas.
La variable dependiente y se traza en el eje vertical.
También puede tratar el valor de y como una respuesta o una variable
predictiva.
Pasos en la regresión lineal
Para esta visión general, tenga en cuenta la forma más simple de la

ecuación de gráfico de líneas entre y y x; y=c*x+m, donde c y m son
constantes para todos los valores posibles de x e y. Así, por ejemplo,
supongamos que los datos de entrada para (x, y) era (1,5), (2,8) y (3,11).
Para identificar el método de regresión lineal, debe seguir los siguientes
pasos:
1. Trace una línea recta y mida la correlación entre 1 y 5.
2. Siga cambiando la dirección de la línea recta para los nuevos valores

(2,8) y (3,11) hasta que se ajusten todos los valores.
3. Identifique la ecuación de regresión lineal como y = 3*x + 2.
4. Extrapola o predice que y es 14 cuando x es

¿Cuáles son los tipos de regresión lineal?
Algunos tipos de análisis de regresión son más adecuados que otros

para gestionar conjuntos de datos complejos. A continuación se muestran
algunos ejemplos.
Regresión lineal simple
La regresión lineal simple se define mediante la función lineal:
Y= β0*X + β1 + ε
β0 y β1 son dos constantes desconocidas que representan la pendiente

de regresión, mientras que ε (épsilon) es el término de error.
Puede utilizar la regresión lineal simple para modelar la relación entre

dos variables, como las siguientes:
 Lluvia y rendimiento de los cultivos
 Edad y estatura en niños
 Temperatura y expansión del mercurio metálico en un termómetro

Regresión lineal múltiple
En el análisis de regresión lineal múltiple, el conjunto de datos contiene

una variable dependiente y múltiples variables independientes. La
función de línea de regresión lineal cambia para incluir más factores, de
la siguiente manera:
Y = β0*x0 + β1x1 + β2x2+…… βNxN+ ε

A medida que aumenta el número de variables predictivas, las constantes
β también aumentan en consecuencia.
La regresión lineal múltiple modela múltiples variables y su impacto en un

resultado:
 Lluvia, temperatura y uso de fertilizantes en el rendimiento de los cultivos
 Dieta y ejercicio sobre enfermedades cardíacas
 Crecimiento salarial e inflación en las tasas de préstamos hipotecarios

Regresión logística
Los científicos de datos utilizan la regresión logística para medir la

probabilidad de que se produzca un evento. La predicción es un valor
entre 0 y 1, donde 0 indica un evento que es poco probable que ocurra y
1 indica una probabilidad máxima de que suceda. Las ecuaciones
logísticas usan funciones logarítmicas para calcular la línea de regresión.
A continuación, se indican varios ejemplos:
 La probabilidad de ganar o perder en un partido deportivo
 La probabilidad de aprobar o reprobar una prueba
 La probabilidad de que una imagen sea una fruta o un animal
“Ejemplos de Regresión Lineal”
*EJEMPLO: NO. 1*
El primer tipo es la regresión lineal simple, en la que solo se utiliza un

único predictor. Por ejemplo, puede usarse a la hora de predecir
accidentes mortales de tráfico en un país. La variable de respuesta Y
sería el país y se compararía con la población, que sería la variable
predictora X.
*EJEMPLO: NO. 2*
La regresión lineal múltiple permite crear modelos que emplean

diferentes predictores, los cuales se usarán para dar una respuesta a Y.
Podría utilizarse para predecir cuántos litros de gasolina consumirán
varios coches, variable de respuesta Y, en función del peso y la potencia
que tengan, variable predictiva X.
*EJEMPLO: NO. 3*
Con la regresión lineal multivariante es posible generar modelos para dar

respuesta a diferentes variables. En este caso, se cuenta con múltiples Y.
Se aplican varias fórmulas a la hora de expresarla. Así, se podría estimar
la incidencia de la gripe en nueve regiones de Estados Unidos, variables
de respuesta Y basadas en la semana del año, variable predictora X.
Por último, la regresión lineal múltiple multivariante se utiliza en modelos

que cuentan con varios predictores para múltiples variables de respuesta.
Se podría emplear para calcular los kilómetros por litro de gasolina que
se usan en ciudad y autopista a partir de tres variables: distancia entre
ejes, peso en vacío y tipo de combustible.
En cuanto a las aplicaciones de la regresión lineal, estas se dividen en

dos.
1. Creación de pronósticos. Se establecen modelos para un

conjunto de datos específicos, con la intención de predecir
los valores de respuesta donde solo se conocen los
predictores.
2. Empleo en determinar si existe una relación entre una
variable y un predictor, así como la fuerza de la misma.
*EJEMPLO: NO. 4*
Una inteligencia artificial basada en machine learning. Esta podrá

manejar una mayor cantidad de datos con más facilidad, algo que va a
necesitar a la hora de pilotar un vehículo. La carretera supone un reto, ya
que existe una alta cantidad de variables que debe tener en cuenta y
predecir para, por ejemplo, evitar un choque.
Se puede utilizar una progresión lineal para encontrar los parámetros que
minimicen el error de un grupo de datos, para lo que se utilizará el error
cuadrático medio.
El proceso de aprendizaje que realiza la inteligencia artificial consistirá en

analizar los parámetros w y b. Así, se obtienen los mejores valores para
ellos:
w= 0,0918 y b= 1,2859.
El resultado sería el siguiente:
y=0,0918x+1,2859.
Este modelo puede destinarse a estimar cuáles van a ser los resultados
para otros valores x. Si se quisiera conocer el de x= 5, se utilizaría el
anterior modelo y el resultado que se obtendría es 1,7449.
Este valor se alcanzaría de la siguiente manera:
y=0.0918⋅5+1.2859=1.7449.
Pese a que este es un ejemplo sencillo, el machine learning suele
manejar una cantidad elevada de variables. Al fin y al cabo, deben
gestionar una ingente cantidad de datos en los que encontrarán los
patrones especificados en su programación. Sin embargo, para poder
comprender las capacidades de la regresión lineal, es suficiente con un
modelo simple.
En función del número de variables que se vayan a incluir, se utilizará un

tipo u otro de regresión. Esta es la forma de gestionar de manera
eficiente y exitosa los datos que necesita la inteligencia artificial. Así,
cumplirá con su cometido sin problemas y ajustándose al objetivo final
que se persigue, sea cual sea la programación.
Ilustración del ejemplo en una gráfica:

En definitiva, la regresión lineal es un modelo matemático que puede
utilizarse en diferentes aplicaciones, entre las que destaca la informática.
Ayuda a proyectar valores futuros o a establecer predicciones, las cuales
aprovechan las inteligencias artificiales basadas en machine learning.
Así, pueden realizar sus funciones de forma sencilla y ágil, sin que su
programación tenga que complicarse en exceso. En Structuralia
apostamos por la formación de calidad. Disponemos de un
amplio catálogo de másteres para mejorar las capacidades profesionales
en gestión de empresas y otros ámbitos.
*EJEMPLO: NO. 5*
Las ventas de la empresa SUPER COCINAS DE GUATEMALA durante

los últimos 10 trimestres son las siguientes:
¿Cómo pronosticar la demanda de los trimestres 13, 14 y 15 a través de
un análisis de regresión lineal?
Lo primero es estimar los parámetros. Lo podemos lograr con el método

de mínimos cuadrados, que nos permite encontrar la recta que mejor se
ajusta a un conjunto de datos dados. En nuestro caso, este conjunto está
dado por las ventas trimestrales (variable dependiente). La variable
independiente es el tiempo. Vamos entonces a la siguiente fórmula para
determinar a y b:
 La y “minúscula”
es el valor y de cada punto de datos.
 La n es el número de punto de datos.
Conocidas las ecuaciones y el papel de las variables, vamos a calcular el
pronóstico con regresión lineal:
En la siguiente se encuentran los cálculos realizados para los 12

trimestres según lo requerido por las ecuaciones:
Con los valores de la última fila de la tabla, podemos calcular a y b, con

los cuales logramos calcular los valores de la última columna (Y) que es
la recta que más se ajusta a la demanda y.
Veamos entonces:
Fíjate que el valor de «b» varía de 63,64 a 63,657 siendo este último el
resultado si se toman todos los decimales de las variables que participan
en su cálculo. Para tener resultados más fiables usamos el valor de «b»
calculado con todos los decimales, tal como lo aprecias cuando hallamos
«a». Fíjate además que pasa lo mismo con el valor calculado de «a» y el
valor que se obtiene cuando en la operación están todos los decimales.
Con esta aclaración, puedes ver cómo se realiza el pronóstico de

producción del trimestre 13. Procedemos igual para los demás trimestres.
Y=63,657(14)+72,894=964.09
Y=63,657(15)+72,894=1027.75
Eso tiene el siguiente aspecto:

“Conclusión”
La regresión lineal describe la relación entre varias variables: la variable
dependiente y una o varias variables independientes. Por su rapidez de
creación y su facilidad de interpretación, los modelos de regresión lineal
se han utilizado con éxito en diversos ámbitos, desde la medicina hasta
la agronomía, tanto para hacer previsiones como para describir sistemas.
Existen programas gratuitos que explican cómo hacer para que aplicar el
análisis de regresión sea fácil y eficaz.

Regresión Lineal

Cargado por

Copyright:

Formatos disponibles

Regresión Lineal

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Regresión Lineal

Cargado por

Copyright:

Formatos disponibles

Introducción

La regresión lineal involucra en su análisis y desarrollo dos variables y un

La regresión lineal es una técnica de análisis de datos que

¿Por qué es importante la regresión lineal?

Los modelos de regresión lineal son relativamente simples y

La regresión lineal es una técnica estadística establecida que se puede

Las empresas los utilizan para transformar de manera confiable y

Muchas técnicas de procesamiento de datos, como el aprendizaje

¿Cómo funciona la regresión lineal?

Básicamente, un método de regresión lineal simple intenta trazar una

Para esta visión general, tenga en cuenta la forma más simple de la

1. Trace una línea recta y mida la correlación entre 1 y 5.

2. Siga cambiando la dirección de la línea recta para los nuevos valores

4. Extrapola o predice que y es 14 cuando x es

Algunos tipos de análisis de regresión son más adecuados que otros

Regresión lineal simple

La regresión lineal simple se define mediante la función lineal:

β0 y β1 son dos constantes desconocidas que representan la pendiente

Puede utilizar la regresión lineal simple para modelar la relación entre

 Lluvia y rendimiento de los cultivos

 Edad y estatura en niños

 Temperatura y expansión del mercurio metálico en un termómetro

En el análisis de regresión lineal múltiple, el conjunto de datos contiene

Y = β0*x0 + β1x1 + β2x2+…… βNxN+ ε

La regresión lineal múltiple modela múltiples variables y su impacto en un

 Lluvia, temperatura y uso de fertilizantes en el rendimiento de los cultivos

 Dieta y ejercicio sobre enfermedades cardíacas

 Crecimiento salarial e inflación en las tasas de préstamos hipotecarios

Los científicos de datos utilizan la regresión logística para medir la

A continuación, se indican varios ejemplos:

 La probabilidad de ganar o perder en un partido deportivo

 La probabilidad de aprobar o reprobar una prueba

 La probabilidad de que una imagen sea una fruta o un animal

“Ejemplos de Regresión Lineal”

El primer tipo es la regresión lineal simple, en la que solo se utiliza un

La regresión lineal múltiple permite crear modelos que emplean

Con la regresión lineal multivariante es posible generar modelos para dar

Por último, la regresión lineal múltiple multivariante se utiliza en modelos

En cuanto a las aplicaciones de la regresión lineal, estas se dividen en

1. Creación de pronósticos. Se establecen modelos para un

Una inteligencia artificial basada en machine learning. Esta podrá

El proceso de aprendizaje que realiza la inteligencia artificial consistirá en

El resultado sería el siguiente:

Este valor se alcanzaría de la siguiente manera:

En función del número de variables que se vayan a incluir, se utilizará un

Ilustración del ejemplo en una gráfica:

Las ventas de la empresa SUPER COCINAS DE GUATEMALA durante

Lo primero es estimar los parámetros. Lo podemos lograr con el método

En la siguiente se encuentran los cálculos realizados para los 12

Con los valores de la última fila de la tabla, podemos calcular a y b, con

Con esta aclaración, puedes ver cómo se realiza el pronóstico de

Eso tiene el siguiente aspecto:

También podría gustarte