Regresión Lineal Simple (Jenniffer Rodriguez Solis)
Regresión Lineal Simple (Jenniffer Rodriguez Solis)
Regresión Lineal Simple (Jenniffer Rodriguez Solis)
Carrera
Materia
Modelos Matemáticos
Profesor
Estudiante:
2020-2
REGRESIÓN LINEAL SIMPLE
(PARA PREDICCIÓN)
INTRODUCCION
El análisis de regresión es una técnica estadística para estudiar la relación entre variables. El
término regresión fue introducido por Francis Galton [Galton, 1886]. Su trabajo se centró en
la descripción de los rasgos físicos de los descendientes (variable A) a partir de los de sus
padres (variable B). Estudiando la altura de padres e hijos a partir de más de mil registros de
grupos familiares, se llegó a la conclusión de que los padres muy altos tenían una tendencia
a tener hijos que heredaban parte de esta altura, pero que revelaban también una tendencia a
regresar a la media. Galton generalizó esta tendencia bajo la "ley de la regresión universal":
«Cada peculiaridad en un hombre es compartida por sus descendientes, pero en media, en un
grado menor.». En problemas de regresión se dispone de una serie de datos de entrenamiento
que representan las entradas y las correspondientes salidas de un sistema lineal o no lineal.
El objetivo de la regresión es descubrir la relación funcional entre la entrada y la salida de
este sistema, para poder así predecir la salida del sistema cuando se le presenta un dato de
entrada nuevo. Tradicionalmente se emplea la técnica de mínimos cuadrados ordinarios
(MCO) como método básico de regresión, la cual encuentra problemas cuando las variables
independientes presentan multicolinealidad (cuando una variable independiente puede ser
explicada como una combinación lineal o correlación de una u otras variables
independientes). Este efecto provoca frecuentemente elevados errores puntuales en las
predicciones, lo que conduce a generar modelos predictivos con muy poco poder explicativo
y de difícil interpretación en las salidas correspondientes a entradas similares que deberían
también predecir salidas similares.
1.1. OBJETIVOS
OBJETIVO GENERAL
Investigar y Reconocer aplicaciones de análisis de regresión para situaciones de
predicción.
OBJETIVO ESPECIFICO
Aplicar los conocimientos de Regresión, comprendiendo e interpretando los
diferentes tipos de regresión para aplicarlos en la resolución de los ejercicios.
Describir la relación entre dos o más variables independientes y una variable
dependiente utilizando la ecuación de regresión lineal simple.
Predecir el valor esperado de la variable dependiente Y cuando la variable
independiente X toma un valor particular.
Técnica estadística que sirven para cuantificar alguna relación funcional entre 2 o más variables,
donde una variable depende de la otra. Se puede decir que “Y” depende de “X”, en donde “Y” y
“X” son 2 variables cualquiera en un modelo de regresión simple.
El objetivo de un modelo de regresión es tratar de explicar la relación que existe entre una
variable dependiente (variable respuesta) Y un conjunto de variables independientes (variables
explicativas) X1,..., Xn.
La regresión lineal simple se basa en estudiar los cambios en una variable, no aleatoria, afectan a
una variable aleatoria, en el caso de existir una relación funcional entre ambas variables que
puede ser establecida por una expresión lineal, es decir, su representación gráfica es una línea
recta. Es decir, se está en presencia de una regresión lineal simple cuando una variable
independiente ejerce influencia sobre otra variable dependiente.
1.2.4 ¿Para qué se utiliza?
El análisis de regresión lineal es una técnica estadística utilizada para estudiar la relación entre
variables cuantitativas. Tanto en el caso de dos variables (regresión simple) como en el de más
de dos variables (regresión múltiple), el análisis regresión lineal puede utilizarse para explorar y
cuantificar la relación entre una variable llamada dependiente o criterio (Y) y una o más
variables llamadas independientes o predictoras (X1, X2, …, Xp), así como para desarrollar una
ecuación lineal con fines predictivos.
El objetivo con Regresión Lineal Simple es minimizar la distancia vertical entre todos los datos y
nuestra línea, por lo tanto, para determinar la mejor línea, debemos minimizar la distancia entre
todos los puntos y la distancia de nuestra línea. Existen muchos métodos para cumplir con este
objetivo, pero todos estos métodos tienen un solo objetivo que es el de minimizar la distancia.
1.2.6 Formula de una regresión lineal simple
Una vez que sean conocidos los valores de β0 y β1 del modelo de regresión lineal simple, éste
puede ser utilizado como modelo predictivo, esto es, para realizar predicciones de los valores que
tomará la variable de respuesta para determinados valores de la variable explicativa.
La variable independiente es aquella que produce modificaciones en otra variable con la cual está
relacionada. Suele designársele, por ello, como variable causal. La variable dependiente, por su
lado, experimenta modificaciones siempre que la variable independiente cambia de valor o
modalidad de darse. Por ello, también recibe el nombre de variable efecto.
Los modelos predictivos son modelos de la relación entre el rendimiento específico de una
unidad en una muestra y uno o más atributos o características conocido de la unidad.
1.2.9 Para que utilizar la regresión lineal para la predicción:
Linealidad: Para usar de una manera eficiente el análisis de regresión con la finalidad
de predecir, se exige que la relación entre las variables sea lineal.
Si se va a utilizar los datos de un grupo de sujetos para hacer predicciones sobre otro
grupo de sujetos, es importante que el grupo de cálculo básico sea representativo del
grupo de predicción.
La ecuación de la recta de predicción se utiliza de manera adecuada, sólo para el
rango de la variable en la cual se basa.
1.2.10 Predicciones en el análisis de regresión:
1.3 METODOLOGA
El primer paso para determinar si existe o no una relación entre dos variables es observar la
gráfica de datos observados. Un diagrama nos puede dar dos tipos de información, visualmente
podemos buscar patrones que nos indiquen que las variables están relacionadas. Entonces si esto
sucede, podemos ver qué tipo de línea, o ecuación de estimación, describe esta relación. Primero
tomamos los datos de la tabla que deseamos analizar y dependiendo de que se desea averiguar se
construye la gráfica colocando la variable dependiente en el eje Y y la independiente en el eje X,
Cuando vemos todos estos puntos juntos, podemos visualizar la relación que existe entre estas
dos variables. Como resultado, también podemos trazar, “o ajustar” una línea recta a través de
nuestro diagrama de dispersión para representar la relación. Es común intentar trazar estas líneas
de forma tal que un número igual de puntos caiga a cada lado de la línea.
Diagrama
de dispersión
Hasta el momento las líneas de regresión se colocaron al ajustar las líneas visualmente entre los
puntos de datos, pero para graficar estas líneas de una forma más precisa podemos utilizar una
ecuación que relaciona las dos variables matemáticamente. La ecuación para una línea recta
donde la variable dependiente Y está determinada por la varianza dependiente X es:
Usando esta ecuación podemos tomar un valor dado en X y calcular el valor de Y la ha se
denomina intersección en Y por qué su valor es el punto en el cual la línea de regresión cruza el
eje Y por qué su valor es el punto en el cual la línea de regresión cruza el eje Y, es decir el eje
vertical. La b es la pendiente de la línea, representa que tanto cada cambio de unidad de la
variable independiente X cambia la variable dependiente Y. Tanto a como b son constantes
numéricas, puesto que, para cada recta dada, sus valores no cambian.
El problema al añadir los errores individuales es el efecto de cancelación de los valores positivos
y negativos, por eso usamos valores absolutos en esta diferencia a modo de cancelar la anulación
de los signos positivos y negativos, pero ya que estamos buscando el menor error debemos
buscar un método que nos muestre la magnitud del error, decimos que la suma de los valores
absolutos no pone énfasis en la magnitud del error.
En efecto, deseamos encontrar una forma de “penalizar” errores absolutos grandes, de tal forma
que podamos evitarlos. Puede lograr esto si cuadramos los errores individuales antes de
sumarlos. Con estos se logran dos objetivos:
Los estadísticos han derivado dos ecuaciones que podemos utilizar para encontrar la pendiente y
la intersección Y de la línea de regresión del mejor ajuste. La primera fórmula calcula la
pendiente.
a = intersection en Y
El error estándar nos permite deducir la confiabilidad de la ecuación de regresión que hemos
desarrollado. Este error se simboliza Se y es similar a la desviación estándar en cuanto a que
ambas son medidas de dispersión. El error estándar de la estimación mide la variabilidad, o
dispersión de los valores observados alrededor de la línea de regresión y su fórmula es la
siguiente:
= media de los valores de la variable
dependiente
Dado que utilizar la ecuación anterior requiere una serie de cálculos tediosos, se ha diseñado una
ecuación que puede eliminar unos de estos pasos, la ecuación es la siguiente:
a = intersection en Y
Como se aplicaba en la desviación estándar, mientras más grande sea el error estándar de
estimación, mayor será la dispersión de los puntos alrededor de la línea de regresión. De manera
que inversa, si Se = 0, esperemos que la ecuación de estimación sea un estimador perfecto de la
variable dependiente. En este caso todos los puntos deben caer en la línea de regresión y no
habría puntos dispersos.
Intervalos de confianza utilizando desviación estándar
1.4 CONCLUSIONES
En este trabajo se han descrito diferentes conceptos de una regresión lineal simple para
predicciones. Como podemos ver la regresión lineal es bien útil ya que nos permite hacer
predicciones una vez que hemos encontrado algunos parámetros. Este parámetro resulta muy útil
a la hora de analizar nuestro dato ya que con el podemos encontrar en la solución de cualquier
enunciado o ejercicios. El análisis predictivo de datos es muy útil para estudiar y ajustar de
manera eficiente el comportamiento de un sistema dinámico lineal o no lineal a partir de las
medidas discretas de sus variables. Por tanto, el objetivo principal de un modelo de regresión
generado a partir de un análisis predictivo es obtener una ecuación matemática que nos permita
"predecir" con el mínimo error posible el valor de una variable dependiente.
1.5 RECOMENDACIONES
Es recomendable aplicar regresión lineal simple cuando se tenga variable dependiente y variables
independientes. Cuando se presente un caso de estudio y porque no también de la vida cotidiana
donde los datos no se tenga un coeficiente de determinación apropiado es necesario aplicar y
analizar alguna solución para así poder llegar a tener una resolución satisfactoria.
1.6 BIBLIOGRAFÍA
http://openaccess.uoc.edu/webapps/o2/bitstream/10609/59565/6/caresptimTFG0117mem
%C3%B2ria.pdf
https://es.slideshare.net/JoanFernandoChipia/anlisis-de-correlacin-y-regresin-lineal-simple
https://es.slideshare.net/thomas669/regresin-lineal-multiple-autores-grillet-montao-rodrguez-
48026919
https://html.rincondelvago.com/regresion-lineal-simple.html