Asesoria 4 - Solucionario

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 10

PROBABILIDAD Y ESTADÍSTICA

Caso: Salud.com

Salud.com, es una empresa de alimentos dedicada a satisfacer las


necesidades nutricionales diarias de los clientes, ofrece la mejor
comida a domicilio. Su gran calidad y excelente servicio es
reconocido por su fiel clientela. Actualmente atiende pedidos de
desayuno, almuerzo y cena, en las líneas de negocios “Integral” y
“Tradicional”. Su meta es llegar a ser una empresa líder en la
innovación delivery, manteniendo un alto estándar de calidad, con
un servicio A1 en la atención a los clientes.

Objetivo 1: Evaluar la conveniencia del lanzamiento de la promoción de descuento.

El gerente de la empresa Salud.com asegura que el tiempo promedio para que el pedido por delivery
llegue a su destino es de 30 minutos, sin embargo, el área de atención al cliente considera que el
tiempo de llegada del pedido a su destinatario no es el planteado por el gerente. Para comprobar
ese planteamiento, se ha selecciona una muestra aleatoria de 9 pedidos de la última semana, cuyos
tiempos de entrega en minutos, siendo los siguientes:

29 38 31 30 28 32 36 29 31

Con un nivel de significación del 10% ¿Lo afirmado por el gerente de la empresa es lo correcto o
está equivocado?
PROBABILIDAD Y ESTADÍSTICA

PASO 01
H0: µ = 30
H1: µ ≠ 30
PASO 02
El valor de la significancia es del 10%.
PASO 03
Resultado del estadístico de prueba tc = 1,39
PASO 04
Se puede observar que el valor de la probabilidad en la prueba p=0,202 y es mayor al 10%; eso
significa que el valor de tc = 1,39 cae en la zona de aceptación.
PASO 05
Con todo el análisis se concluye que lo afirmado por el gerente es lo correcto; el tiempo promedio
de entrega de los pedidos es de 30 minutos.
PROBABILIDAD Y ESTADÍSTICA

Objetivo 2: Evaluar la apertura del nuevo restaurante “Integral”

Salud.com cuenta actualmente con dos líneas de negocio “Integral” y “Tradicional”. El gerente desea
abrir un nuevo tipo de restaurante orientado a los clientes que consumen “Integral” porque sospecha
que el consumo promedio de este grupo de clientes es diferente al del “Tradicional”. Selecciona al
azar una muestra de clientes exclusivos de cada línea y registra el número de pedidos que han
realizado el último mes:

Línea de negocio Número de pedidos


Tradicional (1) 20 19 18 22 18 28 11 29 13 21 24 26
Integral (2) 15 21 18 35 25 30 23 28 23 21 18

Asumiendo que el número de pedidos sigue una distribución normal. Con un nivel de significación
del 1%. ¿Ud. recomendaría al gerente abrir el nuevo restaurante en la línea integral?
PROBABILIDAD Y ESTADÍSTICA
PROBABILIDAD Y ESTADÍSTICA

PASO 01
H0: µ1 - µ2 = 0; H0: µ1 = µ2
H1: µ1 - µ2 = 0; H1: µ1 ≠ µ2

PASO 02
El valor de la significancia es del 1%.

PASO 03
Resultado del estadístico de prueba tc = -1,103; se toma este valor del estadístico dado que como
se puede observar en una celda anterior a su izquierda para ser más preciso tenemos el resultado
de la prueba de levene por lo que se puede apreciar un valor p=0.882 y es superior al 5% lo que
nos indica que tendrían las mismas varianzas. Dado lo anterior entonces se observa el valor de
p=0,283 que es de la prueba de hipótesis para la diferencia de medias.

PASO 04
Se puede observar que el valor de la probabilidad en la prueba p=0,283 es superior al 1% de la
significancia indicada en la situación; eso significa que el valor de tc = -1,103 cae en la zona de
aceptación.

PASO 05
Visto lo anterior podemos llegar a la conclusión que los pedidos en ambas líneas de negocio
presentan el mismo comportamiento, por tanto se indicaría al gerente que no es necesario abrir el
nuevo local con la línea integral.

Objetivo 3: Mejorar la carta de promociones por gènero.

El área de atención al cliente recibe diariamente las calificaciones otorgadas por los clientes
respecto al servicio delivery. El gerente sospecha que la calificación otorgada está relacionada con
el género de los clientes que solicitan sus pedidos. Selecciona una muestra aleatoria de clientes,
obteniendo la siguiente información:

CALIFICACIÓN
GENERO
Excelente Bueno Regular
Masculino 22 17 16
Femenino 19 25 18

a. Calcule las frecuencias esperadas.


PROBABILIDAD Y ESTADÍSTICA

b. Con un nivel de significación del 5%. ¿Se debe enviar cartas de promociones direccionadas por
género?
PROBABILIDAD Y ESTADÍSTICA

PASO 01
H0: El género es independiente de la calificación.
H1: El género no es independiente de la calificación

PASO 02
El valor de la significancia es del 5%.

PASO 03
Resultado del estadístico de prueba en este caso Chi cuadrado = 1,447; además se debe de
observar un valor de probabilidad = 0,485 y es superior al 5%.

PASO 04
Se puede observar que el valor de la probabilidad en la prueba p=0,485 es superior al 5% de la
significancia indicada en el caso; eso significa que el valor de Chi cuadrado = 1,447 cae en la zona
de aceptación.

PASO 05
Visto lo anterior podemos llegar a la conclusión que no se debe de enviar cartas de promociones
direccionadas por género.

Objetivo 4: Determinar el modelo de regresión lineal que explique el tiempo que se demora
en alistar un pedido en función de la cantidad de productos que solicita el cliente.

Para determinar el modelo de regresión lineal que explique el tiempo que se demora en alistar un
pedido en función de la cantidad de productos que solicita el cliente. Se toma una muestra con los
siguientes resultados:

Tempo (minutos) 20 38 12 55 80 35 15 40 55 100 10 45


Número de
3 7 2 8 7 4 3 5 5 9 2 6
productos
PROBABILIDAD Y ESTADÍSTICA

a. Verifique los supuestos del modelo. Use un alfa=0.01.

Normalidad
El análisis de normalidad de los residuos lo realizaremos gráficamente (Histograma y gráfico de
probabilidad normal) y analíticamente (Contraste de Kolmogorov-Smirnov)

Histograma

Representaremos los residuos mediante un histograma superponiendo sobre él una curva normal
de media cero. Si los residuos siguen una distribución normal las barras del histograma deberán
representar un aspecto similar al de dicha curva.

Se observa, que los datos no se aproximan razonablemente a una curva de distribución normal,
puede ser consecuencia de que el tamaño muestral considerado es muy pequeño.

Gráfico probabilístico normal

Se observa en el Gráfico que representa las funciones de distribución teórica y empírica de los
residuos tipificados. En el eje de ordenadas se representa la función teórica bajo el supuesto de
normalidad y en el eje de abscisas, la función empírica. Desviaciones de los puntos del gráfico
respecto de la diagonal indican alteraciones de la normalidad. Observamos la ubicación de los
puntos del gráfico, estos puntos se aproximan razonablemente bien a la diagonal lo que confirma la
hipótesis de normalidad.

Contraste de normalidad: Prueba de Kolomogorov-Smirnov


PROBABILIDAD Y ESTADÍSTICA

One-Sample Kolmogorov-Smirnov Test

Standardized
Residual

N 12
Mean ,0000000
Normal Parametersa,b
Std. Deviation ,95346259
Absolute ,135
Most Extreme Differences Positive ,122
Negative -,135
Kolmogorov-Smirnov Z ,469
Asymp. Sig. (2-tailed) ,981

a. Test distribution is Normal.


b. Calculated from data.
H0 : Los datos se distribuyen normalmente
H1 : Los datos no se distribuyen normalmente

p = 0.981
α = 0.01 p> α, entonces no existe suficiente evidencia para rechazar Ho, los datos de
distribuyen normalmente.

Independencia de los residuos: Contraste de Durbin-Watson


Use el estadístico de Durbin-Watson para evaluar la presencia de autocorrelación. La
autocorrelación significa que los errores de las observaciones adyacentes están correlacionados.
Si los errores están correlacionados, entonces la regresión de los mínimos cuadrados puede
subestimar el error estándar de los coeficientes. Errores estándar subestimados pueden hacer que
sus predictores parezcan significativos, cuando en realidad no lo son.

Model Summaryb

Model R R Square Adjusted R Std. Error of the Durbin-Watson


Square Estimate

1 ,887a ,787 ,765 13,360 2,092

a. Predictors: (Constant), Num_prod


b. Dependent Variable: Tiempo_min

Si su valor está próximo a 2, entonces los residuos están incorrelados, si se aproxima a 4, estarán
negativamente autocorrelados y si su valor está cercano a 0 estarán positivamente autocorrelados.

En nuestro caso, toma el valor 2.092, próximo a 2 lo que indica la incorrelación de los residuos.

b. Valide el modelo de regresión lineal simple. Use un alfa=0.01.

Coeficiente de correlación

La correlación, también conocida como coeficiente de correlación lineal (de Pearson), es una
medida de regresión que pretende cuantificar el grado de variación conjunta entre dos variables.
PROBABILIDAD Y ESTADÍSTICA

Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos variables, es
decir, si se representan en un diagrama de dispersión los valores que toman dos variables, el
coeficiente de correlación lineal señalará lo bien o lo mal que el conjunto de puntos representados
se aproxima a una recta.

Este coeficiente representa la proporción de variación de y explicada por el modelo de regresión.


Por construcción, es evidente que -1≤ R ≤1

Coeficiente de determinación

Cuadrado del coeficiente de correlación que mide qué parte de la variación de una variable viene
explicada, es decir, se puede predecir, por la variación de la otra. Puede tener valores entre 0, que
implica que no hay ninguna relación lineal, y 1, que significa que se trata de una relación lineal
perfecta. El coeficiente de determinación parcial, en investigación cuantitativa, es la proporción de
la varianza que resulta explicada por la introducción de una nueva variable. Es decir, es la diferencia
entre la proporción explicada por las antiguas variables y la que resulta explicada si se añade una
variable más.

Este coeficiente representa la proporción de variación de y explicada por el modelo de regresión.


Por construcción, es evidente que 0 ≤ R2 ≤1

Model Summaryb

Model R R Square Adjusted R Std. Error of the


Square Estimate

1 ,887a ,787 ,765 13,360

a. Predictors: (Constant), Num_prod


b. Dependent Variable: Tiempo_min

Esta tabla muestra los resultados del ajuste del modelo de regresión

El valor de R es de 0.887, el cual nos indica que existe una alta correlación entre las variables
estudiadas, es decir una relación positiva.

El valor del R cuadrado nos refleja un valor de 0.765 el cual nos lleva a pensar que es un buen
modelo de regresión lineal, es decir indica que el 76.5.1% de la variabilidad del tiempo que demora
en alistar un pedido es explicada por la relación lineal con el número de pedidos.

c. Escriba la ecuación del modelo estimado e interprete el coeficiente de


regresión.
Por tanto, la ecuación de la recta estimada o ajustada es: y =-10.732 + 10.39x.

Por cada producto que se dé en un pedido el tiempo que se demora en alistar el mismo
asciende en 10,39 minutos. Pero debemos de observar que para que este tiempo se dé
positivo debemos de tener como mínimo 2 pedidos. Dado como se puede observar que el valor
de b0 = -10,732 es decir sería absurdo pensar que en alguna situación el tiempo sea negativo
es por ello que como mínimo debe de haber 2 pedidos.

También podría gustarte