Regresión Lineal Simple (Jenniffer Rodriguez Solis)

Universidad Técnica De Esmeraldas
Luis Vargas Torres
Facultad De Ciencias Agropecuarias y Ambientales
Carrera
4ro “B” de Ing. Forestal
Materia
Modelos Matemáticos
Profesor
Ing. Andrés Ballesteros

Tema
Regresión Lineal Para Predicción
Estudiante:
Rodríguez Solis Jenniffer Jacqueline

ESMERALDAS – ECUADOR
2020-2
REGRESIÓN LINEAL SIMPLE
(PARA PREDICCIÓN)
INTRODUCCION
El análisis de regresión es una técnica estadística para estudiar la relación entre variables. El
término regresión fue introducido por Francis Galton [Galton, 1886]. Su trabajo se centró en
la descripción de los rasgos físicos de los descendientes (variable A) a partir de los de sus
padres (variable B). Estudiando la altura de padres e hijos a partir de más de mil registros de
grupos familiares, se llegó a la conclusión de que los padres muy altos tenían una tendencia
a tener hijos que heredaban parte de esta altura, pero que revelaban también una tendencia a
regresar a la media. Galton generalizó esta tendencia bajo la "ley de la regresión universal":
«Cada peculiaridad en un hombre es compartida por sus descendientes, pero en media, en un
grado menor.». En problemas de regresión se dispone de una serie de datos de entrenamiento
que representan las entradas y las correspondientes salidas de un sistema lineal o no lineal.
El objetivo de la regresión es descubrir la relación funcional entre la entrada y la salida de
este sistema, para poder así predecir la salida del sistema cuando se le presenta un dato de
entrada nuevo. Tradicionalmente se emplea la técnica de mínimos cuadrados ordinarios
(MCO) como método básico de regresión, la cual encuentra problemas cuando las variables
independientes presentan multicolinealidad (cuando una variable independiente puede ser
explicada como una combinación lineal o correlación de una u otras variables
independientes). Este efecto provoca frecuentemente elevados errores puntuales en las
predicciones, lo que conduce a generar modelos predictivos con muy poco poder explicativo
y de difícil interpretación en las salidas correspondientes a entradas similares que deberían
también predecir salidas similares.
1.1. OBJETIVOS
OBJETIVO GENERAL
Investigar y Reconocer aplicaciones de análisis de regresión para situaciones de
predicción.
OBJETIVO ESPECIFICO
Aplicar los conocimientos de Regresión, comprendiendo e interpretando los
diferentes tipos de regresión para aplicarlos en la resolución de los ejercicios.
Describir la relación entre dos o más variables independientes y una variable
dependiente utilizando la ecuación de regresión lineal simple.
Predecir el valor esperado de la variable dependiente Y cuando la variable
independiente X toma un valor particular.
1.2 MARCO TEÓRICO
1.2.1 ¿Qué es una regresión?
Técnica estadística que sirven para cuantificar alguna relación funcional entre 2 o más variables,
donde una variable depende de la otra. Se puede decir que “Y” depende de “X”, en donde “Y” y
“X” son 2 variables cualquiera en un modelo de regresión simple.
1.2.2 ¿Cuál es el objetivo de una regresión?
El objetivo de un modelo de regresión es tratar de explicar la relación que existe entre una
variable dependiente (variable respuesta) Y un conjunto de variables independientes (variables
explicativas) X1,..., Xn.
1.2.3¿Qué es una Regresión Lineal simple?
La regresión lineal simple se basa en estudiar los cambios en una variable, no aleatoria, afectan a
una variable aleatoria, en el caso de existir una relación funcional entre ambas variables que
puede ser establecida por una expresión lineal, es decir, su representación gráfica es una línea
recta. Es decir, se está en presencia de una regresión lineal simple cuando una variable
independiente ejerce influencia sobre otra variable dependiente.
1.2.4 ¿Para qué se utiliza?
El análisis de regresión lineal es una técnica estadística utilizada para estudiar la relación entre
variables cuantitativas. Tanto en el caso de dos variables (regresión simple) como en el de más
de dos variables (regresión múltiple), el análisis regresión lineal puede utilizarse para explorar y
cuantificar la relación entre una variable llamada dependiente o criterio (Y) y una o más
variables llamadas independientes o predictoras (X1, X2, …, Xp), así como para desarrollar una
ecuación lineal con fines predictivos.
1.2.5 ¿Cuál es el objetivo de regresión lineal simple?
El objetivo con Regresión Lineal Simple es minimizar la distancia vertical entre todos los datos y
nuestra línea, por lo tanto, para determinar la mejor línea, debemos minimizar la distancia entre
todos los puntos y la distancia de nuestra línea. Existen muchos métodos para cumplir con este
objetivo, pero todos estos métodos tienen un solo objetivo que es el de minimizar la distancia.
1.2.6 Formula de una regresión lineal simple
β0 y β1 son los parámetros

del modelo. ε es una variable aleatoria, llamada error, que explica la variabilidad en y que no se
puede explicar con la relación lineal entre x y y. Los errores, ε, se consideran variables aleatorias
independientes distribuidas normalmente con media cero y desviación estándar σ. Esto implica
que el valor medio o valor esperado de y, denotado por E(Y/x), es igual a β0 + β1 x.
Una vez que sean conocidos los valores de β0 y β1 del modelo de regresión lineal simple, éste
puede ser utilizado como modelo predictivo, esto es, para realizar predicciones de los valores que
tomará la variable de respuesta para determinados valores de la variable explicativa.
La variable independiente es aquella que produce modificaciones en otra variable con la cual está
relacionada. Suele designársele, por ello, como variable causal. La variable dependiente, por su
lado, experimenta modificaciones siempre que la variable independiente cambia de valor o
modalidad de darse. Por ello, también recibe el nombre de variable efecto.
1.2.7 ¿Qué es predicción?
Denominamos predicción a la estimación de valores futuros de una variable en función del

comportamiento pasado de la serie. Se trata de seguir la evolución de una variable con el fin de
regular su resultado.
1.2.8 ¿Qué es un método de predicción?
Los modelos predictivos son modelos de la relación entre el rendimiento específico de una
unidad en una muestra y uno o más atributos o características conocido de la unidad.
1.2.9 Para que utilizar la regresión lineal para la predicción:
Linealidad: Para usar de una manera eficiente el análisis de regresión con la finalidad
de predecir, se exige que la relación entre las variables sea lineal.
Si se va a utilizar los datos de un grupo de sujetos para hacer predicciones sobre otro
grupo de sujetos, es importante que el grupo de cálculo básico sea representativo del
grupo de predicción.
La ecuación de la recta de predicción se utiliza de manera adecuada, sólo para el
rango de la variable en la cual se basa.
1.2.10 Predicciones en el análisis de regresión:
Interpolación contra extrapolación: cuando se utiliza el análisis de regresión para

predicciones, es importante considerar sólo el rango pertinente de la variable independiente al
hacer predicciones. Este rango abarca todos los valores de x, desde el mínimo hasta el máximo
utilizados para desarrollar la ecuación de regresión. Por ello, al predecir y para un valor dado de
x, se puede interpolar dentro de este rango de los valores de x, pero no se puede extrapolar más
allá del rango de los valores de x.
Error estándar de la estimación: con el propósito de medir la confiabilidad de la ecuación de

estimación, los estadísticos han desarrollado el error estándar de la estimación. Este error se
representa con y se parece a la desviación estándar, en que ambas son medidas de dispersión. El
error estándar de la estimación, mide la variabilidad o dispersión de los valores observados
alrededor de la línea de regresión.
1.3 METODOLOGA
Principales técnicas utilizadas en el análisis de regresión lineal simple
Pasos Regresión Lineal Simple.
Especificar la variable independiente (x) y la dependiente (y)

Desarrollar un gráfico de dispersión
Calcular el coeficiente de correlación
Determinar la ecuación de regresión lineal
Diagrama de dispersión e interpretación
El primer paso para determinar si existe o no una relación entre dos variables es observar la
gráfica de datos observados. Un diagrama nos puede dar dos tipos de información, visualmente
podemos buscar patrones que nos indiquen que las variables están relacionadas. Entonces si esto
sucede, podemos ver qué tipo de línea, o ecuación de estimación, describe esta relación. Primero
tomamos los datos de la tabla que deseamos analizar y dependiendo de que se desea averiguar se
construye la gráfica colocando la variable dependiente en el eje Y y la independiente en el eje X,
Cuando vemos todos estos puntos juntos, podemos visualizar la relación que existe entre estas
dos variables. Como resultado, también podemos trazar, “o ajustar” una línea recta a través de
nuestro diagrama de dispersión para representar la relación. Es común intentar trazar estas líneas
de forma tal que un número igual de puntos caiga a cada lado de la línea.
Diagrama
de dispersión
Estimación mediante la línea de regresión
Hasta el momento las líneas de regresión se colocaron al ajustar las líneas visualmente entre los
puntos de datos, pero para graficar estas líneas de una forma más precisa podemos utilizar una
ecuación que relaciona las dos variables matemáticamente. La ecuación para una línea recta
donde la variable dependiente Y está determinada por la varianza dependiente X es:
Usando esta ecuación podemos tomar un valor dado en X y calcular el valor de Y la ha se
denomina intersección en Y por qué su valor es el punto en el cual la línea de regresión cruza el
eje Y por qué su valor es el punto en el cual la línea de regresión cruza el eje Y, es decir el eje
vertical. La b es la pendiente de la línea, representa que tanto cada cambio de unidad de la
variable independiente X cambia la variable dependiente Y. Tanto a como b son constantes
numéricas, puesto que, para cada recta dada, sus valores no cambian.
El problema al añadir los errores individuales es el efecto de cancelación de los valores positivos
y negativos, por eso usamos valores absolutos en esta diferencia a modo de cancelar la anulación
de los signos positivos y negativos, pero ya que estamos buscando el menor error debemos
buscar un método que nos muestre la magnitud del error, decimos que la suma de los valores
absolutos no pone énfasis en la magnitud del error.
En efecto, deseamos encontrar una forma de “penalizar” errores absolutos grandes, de tal forma
que podamos evitarlos. Puede lograr esto si cuadramos los errores individuales antes de
sumarlos. Con estos se logran dos objetivos:
penaliza los errores más grandes
cancela el efecto de valores positivos y negativos

Como estamos buscando la línea de estimación que minimiza la suma de los cuadrados de los
errores a esto llamamos método de mínimos cuadrados.
Los estadísticos han derivado dos ecuaciones que podemos utilizar para encontrar la pendiente y
la intersección Y de la línea de regresión del mejor ajuste. La primera fórmula calcula la
pendiente.
b = pendiente de la línea de estimación de mejor ajuste
X = valores de la variable independiente
Y = valores de la variable dependiente
= media de los valores de la variable independiente
= media de los valores de la variable dependiente
n = número de puntos de datos
La segunda ecuación calcula la intersección en Y
a = intersection en Y
b = pendiente de la ecuación anterior
= media de los valores de la variable dependiente
= media de los valores de la variable independiente
Error estándar de la estimación
El error estándar nos permite deducir la confiabilidad de la ecuación de regresión que hemos
desarrollado. Este error se simboliza Se y es similar a la desviación estándar en cuanto a que
ambas son medidas de dispersión. El error estándar de la estimación mide la variabilidad, o
dispersión de los valores observados alrededor de la línea de regresión y su fórmula es la
siguiente:
= media de los valores de la variable
dependiente
Método de atajo para calcular el error estándar de la estimación
Dado que utilizar la ecuación anterior requiere una serie de cálculos tediosos, se ha diseñado una
ecuación que puede eliminar unos de estos pasos, la ecuación es la siguiente:
X = valores de la variable independiente
a = intersection en Y
b = pendiente de la ecuación de la estimación
interpretación del error estándar de la estimación
Como se aplicaba en la desviación estándar, mientras más grande sea el error estándar de
estimación, mayor será la dispersión de los puntos alrededor de la línea de regresión. De manera
que inversa, si Se = 0, esperemos que la ecuación de estimación sea un estimador perfecto de la
variable dependiente. En este caso todos los puntos deben caer en la línea de regresión y no
habría puntos dispersos.
Intervalos de confianza utilizando desviación estándar
El intervalo de confianza es el alcance de la estimación que estamos haciendo, pero a menudo

hacemos el intervalo de confianza en términos de errores estándar, para esto debemos calcular el
error estándar de la media así: Donde es el error estándar de la media para una población infinita,
es la desviación estándar de la población. Con frecuencia expresaremos los intervalos de
confianza de esta forma: en la que:
= límite superior del intervalo de confianza
= límite inferior del intervalo de confianza
Intervalos de predicción aproximados: una forma de ver el error estándar de la estimación es

concebirla como la herramienta estadística que podemos usar para hacer un enunciado de
probabilidad sobre el intervalo alrededor del valor estimado de, dentro del cual cae el valor real
de Y.
1.4 CONCLUSIONES
En este trabajo se han descrito diferentes conceptos de una regresión lineal simple para
predicciones. Como podemos ver la regresión lineal es bien útil ya que nos permite hacer
predicciones una vez que hemos encontrado algunos parámetros. Este parámetro resulta muy útil
a la hora de analizar nuestro dato ya que con el podemos encontrar en la solución de cualquier
enunciado o ejercicios. El análisis predictivo de datos es muy útil para estudiar y ajustar de
manera eficiente el comportamiento de un sistema dinámico lineal o no lineal a partir de las
medidas discretas de sus variables. Por tanto, el objetivo principal de un modelo de regresión
generado a partir de un análisis predictivo es obtener una ecuación matemática que nos permita
"predecir" con el mínimo error posible el valor de una variable dependiente.
1.5 RECOMENDACIONES
Es recomendable aplicar regresión lineal simple cuando se tenga variable dependiente y variables
independientes. Cuando se presente un caso de estudio y porque no también de la vida cotidiana
donde los datos no se tenga un coeficiente de determinación apropiado es necesario aplicar y
analizar alguna solución para así poder llegar a tener una resolución satisfactoria.
1.6 BIBLIOGRAFÍA
http://openaccess.uoc.edu/webapps/o2/bitstream/10609/59565/6/caresptimTFG0117mem
%C3%B2ria.pdf
https://es.slideshare.net/JoanFernandoChipia/anlisis-de-correlacin-y-regresin-lineal-simple
https://es.slideshare.net/thomas669/regresin-lineal-multiple-autores-grillet-montao-rodrguez-
48026919
https://html.rincondelvago.com/regresion-lineal-simple.html

Regresión Lineal Simple (Jenniffer Rodriguez Solis)

Cargado por

Copyright:

Formatos disponibles

Regresión Lineal Simple (Jenniffer Rodriguez Solis)

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Regresión Lineal Simple (Jenniffer Rodriguez Solis)

Cargado por

Copyright:

Formatos disponibles

Universidad Técnica De Esmeraldas

Luis Vargas Torres

Facultad De Ciencias Agropecuarias y Ambientales

4ro “B” de Ing. Forestal

Ing. Andrés Ballesteros

Regresión Lineal Para Predicción

Rodríguez Solis Jenniffer Jacqueline

1.2 MARCO TEÓRICO

1.2.1 ¿Qué es una regresión?

1.2.2 ¿Cuál es el objetivo de una regresión?

1.2.3¿Qué es una Regresión Lineal simple?

1.2.5 ¿Cuál es el objetivo de regresión lineal simple?

β0 y β1 son los parámetros

1.2.7 ¿Qué es predicción?

Denominamos predicción a la estimación de valores futuros de una variable en función del

1.2.8 ¿Qué es un método de predicción?

Interpolación contra extrapolación: cuando se utiliza el análisis de regresión para

Error estándar de la estimación: con el propósito de medir la confiabilidad de la ecuación de

Principales técnicas utilizadas en el análisis de regresión lineal simple

Pasos Regresión Lineal Simple.

Especificar la variable independiente (x) y la dependiente (y)

Estimación mediante la línea de regresión

penaliza los errores más grandes

cancela el efecto de valores positivos y negativos

b = pendiente de la línea de estimación de mejor ajuste

X = valores de la variable independiente

Y = valores de la variable dependiente

= media de los valores de la variable independiente

= media de los valores de la variable dependiente

n = número de puntos de datos

La segunda ecuación calcula la intersección en Y

b = pendiente de la ecuación anterior

= media de los valores de la variable dependiente

= media de los valores de la variable independiente

Error estándar de la estimación

Y = valores de la variable dependiente

n = número de puntos de datos

Método de atajo para calcular el error estándar de la estimación

X = valores de la variable independiente

Y = valores de la variable dependiente

b = pendiente de la ecuación de la estimación

n = número de puntos de datos

interpretación del error estándar de la estimación

El intervalo de confianza es el alcance de la estimación que estamos haciendo, pero a menudo

= límite superior del intervalo de confianza

= límite inferior del intervalo de confianza

Intervalos de predicción aproximados: una forma de ver el error estándar de la estimación es

También podría gustarte