Invst Unidad1 Estadistica

Escuela: Instituto Tecnológico
Superior De Panuco
Carrera: Contador Público
Grupo: “C301”
Materia: Estadística administrativa
Unidad:”1”
Tema: Regresion lineal

simple
Alumna: Brenda Lizeth

Gonzalez Garcia
Docente: José Sahid

Navarro
Fecha: 28 de Agosto del

2022
Contenido
Introducción. ...................................................................................................................................... 3
Contenido........................................................................................................................................... 4
Ecuación de la línea y par ordenado. ............................................................................................ 4
Pendiente y ordenada al origen ..................................................................................................... 7
Modelo de regresión simple ............................................................................................................ 8
Supuestos modelos de regresión .................................................................................................. 9
Diagrama de dispersión................................................................................................................... 9
Coeficiente de correlación............................................................................................................. 11
Coeficiente de determinación ....................................................................................................... 11
Covarianza....................................................................................................................................... 12
Análisis residual en regresión lineal ............................................................................................ 12
Inferencias acerca de la pendiente .............................................................................................. 13
Reflexión .......................................................................................................................................... 14
Bibliografía ....................................................................................................................................... 14
Introducción.
En esta investigación se abordaran temas de mucha relevancia dentro de la

materia, dejando así claros varios puntos que bien pueden ser importantes dentro
de la carrera y la vida laboral.
Contenido
Ecuación de la línea y par ordenado.

Definición:
La línea es uno de los conceptos fundamentales en la comprensión de la

asignatura de la Geometría Analítica, algunos de los más utilizados son:
 Una línea recta es el lugar geométrico en un plano formado por una

sucesión de puntos que tienen la misma dirección. Dados dos puntos
diferentes, sólo una recta pasa por esos dos puntos.
 Es el lugar geométrico de los puntos de un plano, de los cuales al tomar
dos cuales quiera, el valor de la pendiente m, es siempre constante.
 Es el lugar geométrico formado por un polinomio de primer grado de la
forma y= a0 + a1x.
 Es el lugar geométrico obtenido al unir dos puntos, tal que la distancia
recorrida, es la más corta posible.
Fig.1.1.- línea recta dada dos puntos.
Ecuación general de la recta.
De acuerdo a uno de los postulados de la Geometría Euclidiana, para determinar

una línea recta sólo es necesario conocer dos puntos (A y B) de un plano (en un
plano cartesiano) , con abscisas (x) y ordenadas (y) . Ahora bien, conocidos esos
dos puntos, todas las rectas del plano, sin excepción, quedan incluidas en la
ecuación:
𝐴𝑥 + 𝐵𝑦 + 𝐶 = 0
Se conoce la ecuación general de la línea recta, como lo afirma el siguiente:
Teorema: La ecuación general de primer grado 𝐴𝑥 + 𝐵𝑦 + 𝐶 = 0 , donde A, B,

C pertenecen a los números reales (∈ ℝ); y en qué A y B no son simultáneamente
nulos, representa una línea recta.
Ecuación principal de la recta.
Esta es otra de las formas de representar la ecuación de la recta.
Pero antes de entrar en la ecuación principal de la recta conviene recordar lo

siguiente:
Cada punto (x, y) que pertenece a una recta se puede representar en un sistema
de coordenadas, siendo x el valor de la abscisa (horizontal) e y el valor de la
ordenada (vertical).
(𝑥, 𝑦) = (𝐴𝑏𝑠𝑐𝑖𝑠𝑎 , 𝑂𝑟𝑑𝑒𝑛𝑎𝑑𝑎)
Ejemplo: El punto (– 3, 5) tiene por abscisa –3 y por ordenada 5.
Si un par de valores (𝑥, 𝑦) pertenece a la recta, se dice que ese punto satisface la
ecuación.
Ejemplo: El punto ( 7, 2 ) (𝑒𝑙 7 𝑒𝑛 𝑙𝑎 𝑎𝑏𝑠𝑐𝑖𝑠𝑎 𝑥 𝑦 𝑒𝑙 2 𝑒𝑛 𝑙𝑎 𝑜𝑟𝑑𝑒𝑛𝑎𝑑𝑎 𝑦 ) satisface la

ecuación:
𝑦 = 𝑥– 5
Ya que al reemplazar queda
2 = 7– 5
Lo que resulta verdadero.
Recordado lo anterior, veamos ahora la ecuación de la recta que pasa solo por un
punto conocido y cuya pendiente (de la recta) también se conoce, que se obtiene
con la fórmula
𝑦 = 𝑚𝑥 + 𝑛
Que considera las siguientes variables: un punto ( 𝑥, 𝑦 ), la pendiente ( 𝑚 ) y el

punto de intercepción en la ordenada ( 𝑛 ), y es conocida como ecuación principal
de la recta (conocida también como forma simplificada, como veremos luego).
Al representar la ecuación de la recta en su forma principal vemos que

aparecieron dos nuevas variables: la 𝑚 y la 𝑛, esto agrega a nuestra ecuación de
la recta dos nuevos elementos que deben considerase al analizar o representar
una recta: la pendiente (𝑚) y el punto de intercepción (𝑛) (también llamado
intercepto) en el eje de las ordenadas (𝑦).
Par ordenado
Un par ordenado es una pareja de objetos matemáticos, en la que se distingue un

elemento y otro. El par ordenado cuyo primer elemento es a y cuyo segundo
elemento es b se denota como (𝑎, 𝑏).
Un par ordenado (𝑎, 𝑏) no es el conjunto que contiene a los elementos 𝑎 𝑦 𝑏,

denotado por {𝑎, 𝑏}. Un conjunto está definido únicamente por sus elementos,
mientras que en un par ordenado el orden de estos es también parte de su
definición. Por ejemplo, los conjuntos {0, 1} y {1, 0} son idénticos, pero los pares
ordenados (0, 1) y (1, 0) son distintos.
Los pares ordenados también se denominan tuplas o vectores dimensionales. La

noción de una colección finita de objetos ordenada puede generalizarse a más de
dos objetos, dando lugar al concepto de n-tupla.
El producto cartesiano de conjuntos, las relaciones binarias, las coordenadas
cartesianas, las fracciones y las funciones se definen en términos de pares
ordenados.
Fig.1.2.- Ejemplos de ocho puntos localizados en el plano cartesiano mediante

pares ordenados.
Pendiente y ordenada al origen
Pendiente
En matemáticas y ciencias aplicadas se denomina pendiente a la inclinación de un

elemento lineal, natural o constructivo respecto de la horizontal (de 0° o 180°).
En geometría analítica, puede referirse a la pendiente de la ecuación de una recta

(o coeficiente angular) como caso particular de la tangente a una curva, en cuyo
caso representa la derivada de la función en el punto considerado, y es un
parámetro relevante, por ejemplo, en el trazado altimétrico de carreteras, vías
férreas o canales.
La pendiente de una recta en un sistema de representación rectangular (de un

plano cartesiano), suele estar representada por la letra 𝑚, y está definida como la
diferencia en el eje Y dividido por la diferencia en el eje X para dos puntos distintos
en una recta. En la siguiente ecuación se describe:
∆𝑥 𝑦2 − 𝑦1
𝑚= =
∆𝑦 𝑥2 − 𝑥1
Ordenada al origen.
En la ecuación de la recta: El coeficiente de la x es la pendiente, m. El término

independiente, b, se llama ordenada en el origen de una recta, siendo (O, b) el
punto de corte con el eje de ordenadas, es decir el eje x. Mientras que la ordenada
al origen se encuentra pasando las variables al lado izquierdo de la ecuación y
dándole valor a las x. Todas nuestras ecuaciones llevan por gráfica una línea recta
puesto que carecen de exponentes diferentes a 1.
Fig.1.4.- ordenada al origen en el plano
Además de limpia y sencilla, la forma pendiente-ordenada al origen tiene la

ventaja de que exhibe las dos características principales de la recta que
representa.
Modelo de regresión simple
El análisis de regresión lineal simple es el más utilizado y el más sencillo de todos.

Se trata de estudiar el efecto de una variable independiente sobre una única
variable dependiente de la primera o que al menos a nivel teórico hemos
considerado que es dependiente—. Empleando esta ecuación de regresión lineal
simple se puede realizar una estimación basándose en los datos obtenidos.
𝑦 = 𝐵0 + 𝐵1 𝑥 + 𝜀
Donde 𝐵0 es el valor de la variable independiente, 𝐵1 es la variable dependiente y
ε representa el residuo o error. La función de ε es explicar la posible variabilidad
de los datos que no pueden explicarse a través de la relación lineal de la fórmula.
Supuestos modelos de regresión
La regresión lineal asume que los datos deben cumplir los siguientes supuestos,
que se verifican analizando el patron de distribución de los residuos:
 Linealidad: La relación entre la variable dependiente (Y) y la variable

independiente (X) debe ser lineal
 Normalidad de los residuos: Los residuos deben tener una distribución
normal.
 Homogeneidad de la varianza de los residuos: Los residuos deben tener
una varianza constante (homocedasticidad).
 Independencia de los residuos: Los residuos deben ser independientes los
unos de los otros, no deben estar correlacionados entre sí.
Diagrama de dispersión
También conocido como gráfico de dispersión, gráfico de puntos, diagrama de XY,

diagrama de dispersión o Scattergram.
Los diagramas de dispersión usan una colección de puntos colocados usando

coordenadas cartesianas para mostrar valores de dos variables. Al mostrar una
variable en cada eje, se puede detectar si existe una relación o correlación entre
las dos variables.
Se pueden interpretar varios tipos de correlación a través de los patrones

mostrados en los diagramas de dispersión. Estos son: positivo (los valores
aumentan juntos), negativo (un valor disminuye a medida que el otro aumenta),
nulo (sin correlación), lineal, exponencial y en forma de U. La fuerza de la
correlación puede determinarse por la proximidad de los puntos entre sí en el
gráfico. Los puntos que terminan muy lejos del conjunto general de puntos se
conocen como valores atípicos.
Las líneas o curvas se ajustan dentro del gráfico para ayudar en el análisis y se
dibujan tan cerca de todos los puntos como sea posible para mostrar cómo se
condensaron todos los puntos en una sola línea. Esto se conoce normalmente
como «línea de mejor ajuste» un «línea de tendencias» y se puede utilizar para
hacer estimaciones mediante interpolación.
Los diagramas de dispersión son ideales cuando se tienen datos numéricos

emparejados y se desea ver si una variable afecta a la otra. Sin embargo,
recuerde que la correlación no es causal y otra variable inadvertida puede estar
influyendo en los resultados.
Fig.1.5.- Anatomía del diagrama de dispersión.

Coeficiente de correlación
El coeficiente de correlación es la medida específica que cuantifica la intensidad

de la relación lineal entre dos variables en un análisis de correlación. En los
informes de correlación, este coeficiente se simboliza con la r.
¿Cómo se utiliza el coeficiente de correlación?
Para dos variables, la fórmula compara la distancia de cada dato puntual respecto
a la media de la variable y utiliza esta comparación para decirnos hasta qué punto
la relación entre las variables se ajusta a una línea imaginaria trazada entre los
datos. A esto nos referimos cuando decimos que la correlación examina las
relaciones lineales.
El coeficiente de correlación de la muestra puede representarse con una fórmula:
∑[(𝑥𝑖 − 𝑥)(𝑦𝑖 − 𝑦)]

𝑟=
√𝛴(𝑥𝑖 − 𝑥)2 ∗ 𝛴(𝑦𝑖 − 𝑦)2
Coeficiente de determinación
El coeficiente de determinación es la proporción de la varianza total de la variable

explicada por la regresión. El coeficiente de determinación, también llamado R
cuadrado, refleja la bondad del ajuste de un modelo a la variable que pretender
explicar.
Supongamos que queremos explicar la cantidad de goles que anota Cristiano

Ronaldo según la cantidad de partidos que juega. Suponemos que, a mayor
cantidad de partidos jugados, más goles meterá. Los datos pertenecen a las
últimas 8 temporadas. De tal manera, tras extraer los datos, el modelo arroja la
siguiente estimación:
Fig.1.6.- Diagrama de interpretación.
Como hemos dicho anteriormente, el coeficiente de determinación de un modelo

aumenta aunque las variables que incluyamos no sean relevantes. Ya que esto
supone un problema, para intentar solventarlo, el R cuadrado ajustado queda tal
que:
𝑁−1
𝑅2 = 1 [1 − 𝑅 2 ]
𝑁−𝑘−1
Covarianza
En probabilidad y estadística, la covarianza es un valor que indica el grado de

variación conjunta de dos variables aleatorias respecto a sus medias. Es el dato
básico para determinar si existe una dependencia entre ambas variables y además
es el dato necesario para estimar otros parámetros básicos, como el coeficiente de
correlación lineal o la recta de regresión.
La covarianza entre dos variables aleatorias X y Y se definen como:
𝐶𝑜𝑣 = 𝐸[(𝑋 − 𝐸[𝑋])(𝑌 − 𝐸[𝑌])]
Análisis residual en regresión lineal

El análisis de regresión utiliza un método de estimación elegido, una variable
dependiente y una o varias variables explicativas para crear una ecuación que
estima valores para la variable dependiente.
El modelo de regresión incluye salidas, tales como R2 y valores P, para ofrecer

información de en qué medida el modelo realiza estimaciones fiables de la variable
dependiente.
También es posible utilizar gráficos, tales como matrices de gráficos de dispersión,

histogramas y gráficos de puntos, en el análisis de regresión para analizar las
relaciones y poner a prueba las suposiciones.
Los residuales son la diferencia entre los valores observados y los estimados de
un análisis de regresión. Los valores observados que se encuentran por encima
de la curva de regresión tendrán un valor residual positivo, mientras que los
valores observados que se encuentran por debajo de la curva de regresión
tendrán un valor residual negativo. La curva de regresión debe pasar por el centro
de los puntos de datos; por tanto, la suma de los residuales debe ser cero. La
suma de un campo se puede calcular en una tabla de resumen.
Los valores residuales de un análisis de regresión son las diferencias entre los
valores observados del dataset y los valores estimados calculados con la ecuación
de regresión.
Inferencias acerca de la pendiente
A fin de poder utilizar una ecuación de regresión para efectos de estimación o

predicción, primero debemos determinar si en la población parece existir una
relación entre las dos variables o si la relación observada en la muestra pudo
ocurrir por azar.
En ausencia de toda relación en la población, por definición la pendiente de la
línea de regresión de la población seria cero: 𝛽1 = 0. En consecuencia, la
hipótesis nula que se prueba usualmente es 𝐻0 = 𝛽1 = 0 La hipótesis nula
también puede formularse como una prueba de una cola, en cuyo caso la
hipótesis alternativa no es simplemente que existe relación entre las dos variables,
sino además que esta relación es de un tipo específico (directa o inversa).
Un valor hipotético de la pendiente se prueba calculando una estadística t y

usando n-2 grados de libertad. La fórmula estándar es:
𝑏1(𝐵1)
𝑡=
𝑆𝑏1
Reflexión
En esta investigación fue muy sencillo encontrar información pero fue muy difícil s
eran fuentes confiables, se tuvo que recurrir a libros del tema lo cual si fue
verdaderamente complicado ya que estos libros en su mayoría no están
disponibles gratuitamente en internet, sin embargo los que se encontraron fueron
suficientes para satisfacer el contenido de la investigación, desde mi punto de
vista profesional creo que fue muy satisfactoria esta investigación ya que hay
ciertos puntos aplicables a mi carrera.
Bibliografía
Walpole, R. E., Myers, R. H., Myers, S. L., & Cruz, R. (1992). Probabilidad y
estadística (Vol. 624). México: McGraw-Hill.
Walpole, R. E., Myers, R. H., Myers, S. L., & Ye, K. (2012). Probabilidad y
estadística para ingeniería y ciencias. Norma, 162, 157.
Triola, M. F. (2004). Probabilidad y estadística. Pearson educación.
Walpole, R. E., Myers, R. H., & Myers, S. L. (1999). Probabilidad y estadística para
ingenieros. Pearson educación.
Sánchez, E. A. S., Cazares, S. I., & Antuna, R. Á. (2015). Probabilidad y

estadística 1. Grupo Editorial Patria.

Invst Unidad1 Estadistica

Cargado por

Copyright:

Formatos disponibles

Invst Unidad1 Estadistica

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Invst Unidad1 Estadistica

Cargado por

Copyright:

Formatos disponibles

Escuela: Instituto Tecnológico

Materia: Estadística administrativa

Tema: Regresion lineal

Alumna: Brenda Lizeth

Docente: José Sahid

Fecha: 28 de Agosto del

En esta investigación se abordaran temas de mucha relevancia dentro de la

Ecuación de la línea y par ordenado.

La línea es uno de los conceptos fundamentales en la comprensión de la

 Una línea recta es el lugar geométrico en un plano formado por una

Fig.1.1.- línea recta dada dos puntos.

Ecuación general de la recta.

De acuerdo a uno de los postulados de la Geometría Euclidiana, para determinar

Se conoce la ecuación general de la línea recta, como lo afirma el siguiente:

Teorema: La ecuación general de primer grado 𝐴𝑥 + 𝐵𝑦 + 𝐶 = 0 , donde A, B,

Ecuación principal de la recta.

Esta es otra de las formas de representar la ecuación de la recta.

Pero antes de entrar en la ecuación principal de la recta conviene recordar lo

(𝑥, 𝑦) = (𝐴𝑏𝑠𝑐𝑖𝑠𝑎 , 𝑂𝑟𝑑𝑒𝑛𝑎𝑑𝑎)

Ejemplo: El punto (– 3, 5) tiene por abscisa –3 y por ordenada 5.

Ejemplo: El punto ( 7, 2 ) (𝑒𝑙 7 𝑒𝑛 𝑙𝑎 𝑎𝑏𝑠𝑐𝑖𝑠𝑎 𝑥 𝑦 𝑒𝑙 2 𝑒𝑛 𝑙𝑎 𝑜𝑟𝑑𝑒𝑛𝑎𝑑𝑎 𝑦 ) satisface la

Ya que al reemplazar queda

Que considera las siguientes variables: un punto ( 𝑥, 𝑦 ), la pendiente ( 𝑚 ) y el

Al representar la ecuación de la recta en su forma principal vemos que

Un par ordenado es una pareja de objetos matemáticos, en la que se distingue un

Un par ordenado (𝑎, 𝑏) no es el conjunto que contiene a los elementos 𝑎 𝑦 𝑏,

Los pares ordenados también se denominan tuplas o vectores dimensionales. La

Fig.1.2.- Ejemplos de ocho puntos localizados en el plano cartesiano mediante

Pendiente y ordenada al origen

En matemáticas y ciencias aplicadas se denomina pendiente a la inclinación de un

En geometría analítica, puede referirse a la pendiente de la ecuación de una recta

La pendiente de una recta en un sistema de representación rectangular (de un

En la ecuación de la recta: El coeficiente de la x es la pendiente, m. El término

Fig.1.4.- ordenada al origen en el plano

Además de limpia y sencilla, la forma pendiente-ordenada al origen tiene la

Modelo de regresión simple

El análisis de regresión lineal simple es el más utilizado y el más sencillo de todos.

Supuestos modelos de regresión

 Linealidad: La relación entre la variable dependiente (Y) y la variable

También conocido como gráfico de dispersión, gráfico de puntos, diagrama de XY,

Los diagramas de dispersión usan una colección de puntos colocados usando

Se pueden interpretar varios tipos de correlación a través de los patrones

Los diagramas de dispersión son ideales cuando se tienen datos numéricos

Fig.1.5.- Anatomía del diagrama de dispersión.

El coeficiente de correlación es la medida específica que cuantifica la intensidad

¿Cómo se utiliza el coeficiente de correlación?

El coeficiente de correlación de la muestra puede representarse con una fórmula:

∑[(𝑥𝑖 − 𝑥)(𝑦𝑖 − 𝑦)]

El coeficiente de determinación es la proporción de la varianza total de la variable

Supongamos que queremos explicar la cantidad de goles que anota Cristiano

Como hemos dicho anteriormente, el coeficiente de determinación de un modelo

En probabilidad y estadística, la covarianza es un valor que indica el grado de

La covarianza entre dos variables aleatorias X y Y se definen como:

𝐶𝑜𝑣 = 𝐸[(𝑋 − 𝐸[𝑋])(𝑌 − 𝐸[𝑌])]

Análisis residual en regresión lineal

El modelo de regresión incluye salidas, tales como R2 y valores P, para ofrecer

También es posible utilizar gráficos, tales como matrices de gráficos de dispersión,

Inferencias acerca de la pendiente

A fin de poder utilizar una ecuación de regresión para efectos de estimación o