Error Estandar
Error Estandar
Error Estandar
Análisis de regresión,
correlación lineal simple y
ESTÁNDAR DE LA ESTIMACIÓN múltiple
ERROR ESTÁNDAR DE LA ESTIMACIÓN
•El siguiente proceso que se necesita en el análisis de la
regresión lineal simple es cómo medir la confiabilidad de
la ecuación de estimación.
•El error estándar de estimación mide la variabilidad o
dispersión de los valores observados alrededor de la
línea de regresión y se representa como Se.
FORMULA
Se = Error estándar de la estimación
Cuanto mayor sea el error estándar
de la estimación, más grande será la
dispersión (o esparcimiento) de
puntos alrededor de la línea de
regresión. Por el contrario, si Se= 0,
se espera que la ecuación de
estimación sea un estimador
“perfecto” de la variable
dependiente, en este caso todos los
puntos caerían directamente sobre la
línea de regresión y no habría
puntos dispersos, como se muestra en
la siguiente figura:
El error estándar de estimación tiene la misma aplicación que de
la desviación estándar. Esto es, suponiendo que los puntos
observados tienen una distribución normal alrededor de la recta
de regresión, podemos esperar que:
•68% de los puntos están dentro de ± 1se
•95.5% de los puntos están dentro de ± 2se
•99.7% de los puntos están dentro de ± 3se
El error estándar de la estimación se mide a lo largo del eje “Y”, y
no perpendicularmente desde la recta de regresión.
Las suposiciones son:
1. Los valores observados para Y tienen distribución normal
alrededor de cada valor estimado de ŷ
2. La varianza de las distribuciones alrededor de cada valor
posible de ŷ es la misma.
Si esta segunda suposición no fuera cierta, entonces el error
estándar en un punto de la recta de regresión podría diferir del
error estándar en otro punto.
PROCEDIMIENTOS PARA REALIZAR UN ANÁLISIS
DE REGRESIÓN LINEAL SIMPLE
1.- Obtención de los datos muéstrales. 2.- Los datos obtenidos se tabulan.
(tener cuidado en determinar
correctamente quien es la variable
independiente y dependiente)
3.- La información se gráfica en un 4.- Se calcula la pendiente.
diagrama de dispersión,
estableciéndose la posible relación entre
las dos variables.
5.- Se calcula la ordenada al origen. 6.- Se obtiene la ecuación que mejor se
ajusta a la información obtenida.
7.- Se traza la línea estimada en el 8.- Se calcula el error estándar de
diagrama de dispersión. estimación.
EJEMPLO
Una cadena de Pizzerías toma una muestra de diez de sus
sucursales para tratar de encontrar un modelo matemático que le
permita predecir sus ventas y obtuvo los siguientes datos: la
población de personas en miles fue de 2, 6, 8, 8, 12, 16, 20, 20,
22, 26; y las ventas trimestrales en miles de pesos fue de: 58,
105, 88, 118, 117, 137, 157, 169, 169, 149, 202.
Realice una regresión para estimar las ventas de dos sucursales
que tienen 14,000 y 30,000 personas como potenciales clientes
respectivamente.
SOLUCIÓN
Datos: 1.- Tabular los datos obtenidos:
•n=10
•X: Población de personas en
miles
•Y: Ventas trimestrales en miles
de pesos
2.- Graficar los datos en un 3.- Realizar los cálculos
diagrama de dispersión y determinar correspondientes.
la posible relación entre las variables
X Y.
4.- Calculo de la pendiente. 5.- Calculo de la ordenada al origen.
6.- Obtener la ecuación que mejor se 7.- Trazar la línea estimada.
ajuste.
8.- Calcular el error estándar de estimación.