Caracter I Sticas
Caracter I Sticas
Caracter I Sticas
COUNSELING SECCIÓN A
Métodos de Predicción
2019
Métodos de predicción – Caso 01
AUTORES :
CICLO : 2014 – I
2
UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO – ING. DE SISTEMAS
Métodos de predicción – Caso 01
El director ejecutivo, Marv Harnishfeger, concluyó que la variable más importante que
CCC necesitaba pronosticar era el número de nuevos clientes que serían atendidos
durante el resto de 1993. Marv proporcionó a Dorothy Mercer los datos mensuales del
número de clientes nuevos atendidos por CCC en el periodo de enero de 1985 a marzo
de 1993 (véase el caso 3-3). En el caso 3-3, Dorothy utilizó el análisis de
autocorrelación para explorar el patrón de datos. En el caso 4-3 utilizó los métodos de
promedios móviles y de suavización exponencial para pronosticar los meses restantes
de 1993.
3
UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO – ING. DE SISTEMAS
Métodos de predicción – Caso 01
4
UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO – ING. DE SISTEMAS
Métodos de predicción – Caso 01
1.- Determine si existe una relación significativa entre el número de clientes nuevos
atendidos y el número de personas con cupones canjeables por alimentos y/o el
índice de actividad de negocios. No olvide la posibilidad de transformar los datos.
Del resultado podemos decir, que el coeficiente de correlación que existe entre ambas
variables es positivo y fuerte. Positivo porque la pendiente es de manera positiva,
además son directamente proporcionales ambas variables; y fuerte porque es cercano
a 1.
5
UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO – ING. DE SISTEMAS
Métodos de predicción – Caso 01
Realizamos una prueba de hipótesis para probar el nivel de significancia con respecto a
la variable- índice económico (x1)
INTERPRETACIÓN
Si comparamos el valor P = 0.000 con el valor α=0.05, entonces podemos
concluir que P<α, entonces rechazamos H0. Es decir que tenemos evidencia
estadística suficiente para concluir que la variable X1 – índice económico es
significativa con respecto a los nuevos clientes atendidos por CCC.
Observamos también que el valor del coeficiente de determinación es de un
56.5%, nos da una idea que si existe una relación, siendo esta de tipo
moderada, pero aquí no queda todo el trabajo para poder concluir que es
nuestro mejor modelo, más adelante se realizara las pruebas correspondientes.
6
UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO – ING. DE SISTEMAS
Métodos de predicción – Caso 01
Del resultado podemos decir, que el coeficiente de correlación que existe entre ambas
variables es positivo y algo bajo (no están fuertemente correlacionadas). Positivo
porque la pendiente es de manera positiva, además son directamente proporcionales
ambas variables.
7
UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO – ING. DE SISTEMAS
Métodos de predicción – Caso 01
Realizamos una prueba de hipótesis para probar el nivel de significancia con respecto a
la variable- número de personas con cupones canjeables (x2)
INTERPRETACIÓN
Si comparamos el valor P = 0.002 con el valor α=0.05, entonces podemos
concluir que P<α, entonces rechazamos H0. Es decir que tenemos evidencia
estadística suficiente para concluir que la variable X2 (número de personas con
cupones canjeables) es significativa con respecto a los nuevos clientes
atendidos por CCC (Y).
Observamos también que el valor del coeficiente de determinación es de un
18.6%, nos da una idea que si existe una relación, siendo esta de tipo muy
débil, porque a un 18.6% la variabilidad de los nuevos clientes atendidos por
CCC es explicada por la variabilidad del número de personas con cupones
canjeables, de esto decimo que este modelo de regresión no nos permite
asegurar un buen pronostico con esta variable, además un 81.4% de la
variabilidad no viene siendo explicada por el número de personas con cupones.
8
UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO – ING. DE SISTEMAS
Métodos de predicción – Caso 01
Con ayuda de minitab, calculamos la matriz de correlación para las variables Y (número
de clientes nuevos atendidos), la variable X1 (índice económico) y la variable X2
(número de personas con cupones canjeables).
Con esta matriz podemos analizar si existe o no relación entre todas las variables que
tenemos, analizando la imagen podemos observar que los coeficientes de
correlaciones para X1 y X2 con respecto a Y, son las mismas que habíamos encontrado.
Nos permite observar además si existe alguna relación entre variables independientes,
si así fuese el caso, se produciría un problema de multicolienalidad. Es así, que
debemos eliminar una de las variables porque seguro ya viene siendo explicada por
una de ellas.
Para nuestro caso podemos observar claramente una relación muy fuerte entre las
variables independientes X1 y X2, por lo que nos encontramos con el problema de la
multicolienalidad, pasaremos a continuación a escoger la variable que debemos quitar.
9
UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO – ING. DE SISTEMAS
Métodos de predicción – Caso 01
INTERPRETACIÓN
Si comparamos el valor Px1 = 0.000 y Px2= 0.009 con el valor α=0.05, entonces
podemos concluir que tanto Px1 y Px2 <α, entonces rechazamos H0. Es decir que
tenemos evidencia estadística suficiente para concluir que las variables
X1(índice económico) y X2 (número de personas con cupones canjeables) son
significativas con respecto a los nuevos clientes atendidos por CCC (Y).
10
UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO – ING. DE SISTEMAS
Métodos de predicción – Caso 01
Conclusión previa antes de escoger el mejor modelo de regresión seria que la variable
que mejor se relaciona con la variable a pronosticar es el índice económico (x1), por lo
tanto pasamos a proceder solo a trabajar con esta variable.
11
UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO – ING. DE SISTEMAS
Métodos de predicción – Caso 01
INTERPRETACIÓN
Si comparamos el valor P = 0.000 con el valor α=0.05, entonces podemos
concluir que P<α, entonces rechazamos H0. Es decir que tenemos evidencia
estadística suficiente para concluir que la variable 1/X1 – inversa del índice
12
UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO – ING. DE SISTEMAS
Métodos de predicción – Caso 01
Por lo que podríamos decir que esta ecuación de regresión es mejor para poder
pronosticar la cantidad de nuevos clientes de CCC. Pero aquí no acaba todo
debemos analizar si realmente es un mejor modelo de regresión lineal, para
eso se realizara un análisis de los residuos más adelante.
13
UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO – ING. DE SISTEMAS
Métodos de predicción – Caso 01
El valor de la inversa del índice económico es de 0.00800 para ambos caso obtenemos
lo mismo
14
UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO – ING. DE SISTEMAS
Métodos de predicción – Caso 01
3. Compare los resultados de su pronóstico con las observaciones reales para los primeros
tres meses de 1993.
INTERPRETACIÓN:
Como apreciamos en la tabla los valores para los meses de Enero y Febrero, el pronóstico ha
sobreestimado el valor que dio la técnica utilizada, mientras que en el mes de Marzo el
pronóstico ha subestimado el valor real.
Por lo que es una evidencia que el modelo de la regresión lineal, no nos permite hacer un buen
pronóstico de los nuevos clientes atendidos por CCC.
4. ¿El índice de actividad de negocios sería un buen factor de predicción del número de
clientes nuevos?
15
UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO – ING. DE SISTEMAS
Métodos de predicción – Caso 01
ANALISIS DE REGRESION PARA LOS NUEVOS CLIENTES ATENDIDOS Y LA INVERSA DEL INDICE
ECONÓMICO
Además hemos analizado la inversa del índice económico, lo que mejora el modelo de
regresión lineal, por lo que optamos como el mejor modelo hasta ahora para poder
pronosticar, pero más adelante observaremos que este modelo aun siendo significante no nos
permite dar un buen pronóstico del número de clientes nuevos atendidos por CCC.
5. Los datos consisten en una serie de tiempo. ¿Significa esto que se ha violado el supuesto
de la independencia
Realizaremos las siguientes pruebas para saber si los datos son o presentan una serie de
tiempo:
- Primero realizamos una gráfica de auto correlaciones a los datos para verificar si
presentan un patrón:
Para doce desfases a nuestros nuevos clientes que deseamos pronosticar, para el año
de 1993 tenemos la siguiente imagen proporcionada por el minitab:
16
UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO – ING. DE SISTEMAS
Métodos de predicción – Caso 01
Además vemos que el coeficiente de auto correlación para los primeros desfases es
significativamente diferente de cero, por lo tanto podemos evidenciar que los datos no
son aleatorios. Si queremos más precisión realizamos la prueba del chi-cuadrado,
donde el LBQ 121.87 debe ser mayor que el resultado del chi-cuadrado.
Al evidenciar que existe un patrón en los datos, podemos evidenciar que existe una
violación supuesto de independencia porque, es el más importante, ya que la falta de
independencia podría distorsionar en forma drástica en las conclusiones de las
pruebas t. Como pudimos ver es riesgoso porque nuestros datos presentan un patrón
de serie de tiempo (tendencia).
17
UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO – ING. DE SISTEMAS
Métodos de predicción – Caso 01
6. Suponga que usted desarrolló una buena ecuación de regresión. ¿Usaría usted esta
ecuación para hacer un pronóstico del resto de 1993? Explique su respuesta.
La ecuación de regresión, encontrada por nosotros no realiza un buen pronóstico para el resto
de los meses de 1993. Porque está infringiendo el supuesto de independencia, por presentar
un patrón como lo habíamos mencionado antes, para eso hacemos un análisis de los residuos
que hallaremos para esta regresión, de la siguiente manera:
1.- El histograma nos ayuda a ver si se cumple con el supuesto de normalidad. Podemos ver
que el histograma está ligeramente centrado cerca de 0, por lo que diríamos que demuestra
un buen supuesto de normalidad, podríamos incluso decir que se infringe en un porcentaje
muy bajo por así decirlo. Otro motivo que infringe este supuesto es cuando se pueden apreciar
una forma de campana. Aunque este supuesto no es muy significativo con respecto a los otros
supuestos.
2.- En la gráfica de normalidad podemos observar que los residuos en su gran mayoría siguen
una distribución normal, aunque para algunos valores no se ajusta muy bien al modelo, están
ligeramente alejados dela recta.
18
UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO – ING. DE SISTEMAS
Métodos de predicción – Caso 01
3.-
Por lo que diríamos que el modelo de regresión no nos asegura con certeza que podemos
pronosticar el número de clientes nuevos atendidos por CCC para los meses restantes del año
de 1993.
19
UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO – ING. DE SISTEMAS