Asesoria 4 - Solucionario
Asesoria 4 - Solucionario
Asesoria 4 - Solucionario
Caso: Salud.com
El gerente de la empresa Salud.com asegura que el tiempo promedio para que el pedido por delivery
llegue a su destino es de 30 minutos, sin embargo, el área de atención al cliente considera que el
tiempo de llegada del pedido a su destinatario no es el planteado por el gerente. Para comprobar
ese planteamiento, se ha selecciona una muestra aleatoria de 9 pedidos de la última semana, cuyos
tiempos de entrega en minutos, siendo los siguientes:
29 38 31 30 28 32 36 29 31
Con un nivel de significación del 10% ¿Lo afirmado por el gerente de la empresa es lo correcto o
está equivocado?
PROBABILIDAD Y ESTADÍSTICA
PASO 01
H0: µ = 30
H1: µ ≠ 30
PASO 02
El valor de la significancia es del 10%.
PASO 03
Resultado del estadístico de prueba tc = 1,39
PASO 04
Se puede observar que el valor de la probabilidad en la prueba p=0,202 y es mayor al 10%; eso
significa que el valor de tc = 1,39 cae en la zona de aceptación.
PASO 05
Con todo el análisis se concluye que lo afirmado por el gerente es lo correcto; el tiempo promedio
de entrega de los pedidos es de 30 minutos.
PROBABILIDAD Y ESTADÍSTICA
Salud.com cuenta actualmente con dos líneas de negocio “Integral” y “Tradicional”. El gerente desea
abrir un nuevo tipo de restaurante orientado a los clientes que consumen “Integral” porque sospecha
que el consumo promedio de este grupo de clientes es diferente al del “Tradicional”. Selecciona al
azar una muestra de clientes exclusivos de cada línea y registra el número de pedidos que han
realizado el último mes:
Asumiendo que el número de pedidos sigue una distribución normal. Con un nivel de significación
del 1%. ¿Ud. recomendaría al gerente abrir el nuevo restaurante en la línea integral?
PROBABILIDAD Y ESTADÍSTICA
PROBABILIDAD Y ESTADÍSTICA
PASO 01
H0: µ1 - µ2 = 0; H0: µ1 = µ2
H1: µ1 - µ2 = 0; H1: µ1 ≠ µ2
PASO 02
El valor de la significancia es del 1%.
PASO 03
Resultado del estadístico de prueba tc = -1,103; se toma este valor del estadístico dado que como
se puede observar en una celda anterior a su izquierda para ser más preciso tenemos el resultado
de la prueba de levene por lo que se puede apreciar un valor p=0.882 y es superior al 5% lo que
nos indica que tendrían las mismas varianzas. Dado lo anterior entonces se observa el valor de
p=0,283 que es de la prueba de hipótesis para la diferencia de medias.
PASO 04
Se puede observar que el valor de la probabilidad en la prueba p=0,283 es superior al 1% de la
significancia indicada en la situación; eso significa que el valor de tc = -1,103 cae en la zona de
aceptación.
PASO 05
Visto lo anterior podemos llegar a la conclusión que los pedidos en ambas líneas de negocio
presentan el mismo comportamiento, por tanto se indicaría al gerente que no es necesario abrir el
nuevo local con la línea integral.
El área de atención al cliente recibe diariamente las calificaciones otorgadas por los clientes
respecto al servicio delivery. El gerente sospecha que la calificación otorgada está relacionada con
el género de los clientes que solicitan sus pedidos. Selecciona una muestra aleatoria de clientes,
obteniendo la siguiente información:
CALIFICACIÓN
GENERO
Excelente Bueno Regular
Masculino 22 17 16
Femenino 19 25 18
b. Con un nivel de significación del 5%. ¿Se debe enviar cartas de promociones direccionadas por
género?
PROBABILIDAD Y ESTADÍSTICA
PASO 01
H0: El género es independiente de la calificación.
H1: El género no es independiente de la calificación
PASO 02
El valor de la significancia es del 5%.
PASO 03
Resultado del estadístico de prueba en este caso Chi cuadrado = 1,447; además se debe de
observar un valor de probabilidad = 0,485 y es superior al 5%.
PASO 04
Se puede observar que el valor de la probabilidad en la prueba p=0,485 es superior al 5% de la
significancia indicada en el caso; eso significa que el valor de Chi cuadrado = 1,447 cae en la zona
de aceptación.
PASO 05
Visto lo anterior podemos llegar a la conclusión que no se debe de enviar cartas de promociones
direccionadas por género.
Objetivo 4: Determinar el modelo de regresión lineal que explique el tiempo que se demora
en alistar un pedido en función de la cantidad de productos que solicita el cliente.
Para determinar el modelo de regresión lineal que explique el tiempo que se demora en alistar un
pedido en función de la cantidad de productos que solicita el cliente. Se toma una muestra con los
siguientes resultados:
Normalidad
El análisis de normalidad de los residuos lo realizaremos gráficamente (Histograma y gráfico de
probabilidad normal) y analíticamente (Contraste de Kolmogorov-Smirnov)
Histograma
Representaremos los residuos mediante un histograma superponiendo sobre él una curva normal
de media cero. Si los residuos siguen una distribución normal las barras del histograma deberán
representar un aspecto similar al de dicha curva.
Se observa, que los datos no se aproximan razonablemente a una curva de distribución normal,
puede ser consecuencia de que el tamaño muestral considerado es muy pequeño.
Se observa en el Gráfico que representa las funciones de distribución teórica y empírica de los
residuos tipificados. En el eje de ordenadas se representa la función teórica bajo el supuesto de
normalidad y en el eje de abscisas, la función empírica. Desviaciones de los puntos del gráfico
respecto de la diagonal indican alteraciones de la normalidad. Observamos la ubicación de los
puntos del gráfico, estos puntos se aproximan razonablemente bien a la diagonal lo que confirma la
hipótesis de normalidad.
Standardized
Residual
N 12
Mean ,0000000
Normal Parametersa,b
Std. Deviation ,95346259
Absolute ,135
Most Extreme Differences Positive ,122
Negative -,135
Kolmogorov-Smirnov Z ,469
Asymp. Sig. (2-tailed) ,981
p = 0.981
α = 0.01 p> α, entonces no existe suficiente evidencia para rechazar Ho, los datos de
distribuyen normalmente.
Model Summaryb
Si su valor está próximo a 2, entonces los residuos están incorrelados, si se aproxima a 4, estarán
negativamente autocorrelados y si su valor está cercano a 0 estarán positivamente autocorrelados.
En nuestro caso, toma el valor 2.092, próximo a 2 lo que indica la incorrelación de los residuos.
Coeficiente de correlación
La correlación, también conocida como coeficiente de correlación lineal (de Pearson), es una
medida de regresión que pretende cuantificar el grado de variación conjunta entre dos variables.
PROBABILIDAD Y ESTADÍSTICA
Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos variables, es
decir, si se representan en un diagrama de dispersión los valores que toman dos variables, el
coeficiente de correlación lineal señalará lo bien o lo mal que el conjunto de puntos representados
se aproxima a una recta.
Coeficiente de determinación
Cuadrado del coeficiente de correlación que mide qué parte de la variación de una variable viene
explicada, es decir, se puede predecir, por la variación de la otra. Puede tener valores entre 0, que
implica que no hay ninguna relación lineal, y 1, que significa que se trata de una relación lineal
perfecta. El coeficiente de determinación parcial, en investigación cuantitativa, es la proporción de
la varianza que resulta explicada por la introducción de una nueva variable. Es decir, es la diferencia
entre la proporción explicada por las antiguas variables y la que resulta explicada si se añade una
variable más.
Model Summaryb
Esta tabla muestra los resultados del ajuste del modelo de regresión
El valor de R es de 0.887, el cual nos indica que existe una alta correlación entre las variables
estudiadas, es decir una relación positiva.
El valor del R cuadrado nos refleja un valor de 0.765 el cual nos lleva a pensar que es un buen
modelo de regresión lineal, es decir indica que el 76.5.1% de la variabilidad del tiempo que demora
en alistar un pedido es explicada por la relación lineal con el número de pedidos.
Por cada producto que se dé en un pedido el tiempo que se demora en alistar el mismo
asciende en 10,39 minutos. Pero debemos de observar que para que este tiempo se dé
positivo debemos de tener como mínimo 2 pedidos. Dado como se puede observar que el valor
de b0 = -10,732 es decir sería absurdo pensar que en alguna situación el tiempo sea negativo
es por ello que como mínimo debe de haber 2 pedidos.