EstebanGarces CamiloOñate DaniloBurgos

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 10

Taller #2 ANALISIS EXPLORATORIO DE DATOS

Presentado por:
Jesús Camilo Oñate Játiva
2126305
Esteban Andrés Molina Garcés
2128734
Hanner Danilo Burgos Díaz
1748017

Programa:3748

Universidad del Valle-Facultad de ingeniería


Fundamentos de estadística
Profesora: Claudia Lorena Montes.
SITUACIÓN #1 Fábrica de Chocolates

Gráficos.

Plan de Análisis
¿Cuál es la intención del estudio?
En primera parte se presenta indicios de cambio del peso en la producción de los
chocolates los cuales están fuera de los estándares requeridos para la debida
fabricación, primero se toma una muestra de 50 datos que son de un subconjunto
pertenecientes a una población, cuando el proceso se encuentra en condiciones
regulares de operación para ser analizados.
 ¿Existen hipótesis de investigación?
Si se presenta una hipótesis de investigación donde se estudia el cambio en el peso
de las barras de chocolate, la cual surge a partir de los datos presentados en las
tablas y gráficos, todo esto nos sirven de base, para iniciar la investigación
exploratoria.
 ¿Cuál sería el comportamiento esperado bajo el cumplimiento de la
hipótesis?
A partir de la información de los gráficos podemos decir que:
 Histograma de peso pre: muestra la frecuencia de los valores en este
caso de la muestra de 50 datos tomados de la población. Podemos
decir que tiene mucha variación, pero se encuentra centrada dentro
de los valores correctos.
 Histograma de peso post: podemos decir que tuvo una menor
variación dentro del proceso, pero esta por fuera de los estándares de
medida correctos.
 Gráfico de dispersión de peso: nos muestra de manera gráfica la
relación que hay entre las dos variables cuantitativas sobre un mismo
grupo de individuos podemos decir que tiene una relación lineal
positiva que muestra que a medida que aumenta la densidad de 1.80
a 3.00 el peso pre aumenta.
 Evaluación de cambio en el proceso: podemos visualizar que el
peso pre y post son simétricos respectivamente, pero el peso pre
muestra mayor dispersión y el rango de variabilidad es mayor que el
del peso post ya que los datos se encuentran más concentrados y no
hay mucha variación.

 ¿Cuáles son los indicadores apropiados para diagnosticar la hipótesis?


Existe una diferencia entre la desviación pre y pos del 28 % dándonos a conocer
que existe una variabilidad en la producción de barras de chocolate.
B. ¿Puede contribuir esta información a encontrar una solución al problema?
Densidad del chocolate

Con la densidad de chocolate para cada elemento de la muestra tomada podemos


descubrir factores como:
 La densidad del chocolate tiene variación con esto podemos decir que entre
mayor densa sea la mezcla, da como resultado un cambio de peso, también
se genera mayor gasto de materia prima en la elaboración de las barras ya
que está por fuera de los valores de medida adecuados.
 Loa solución sería estandarizar la densidad del chocolate dentro del
parámetro correcto para evitar que se utilice más de la cuenta.

C. ¿Con estos resultados, a nivel exploratorio, ¿puede usted valorar la


efectividad de la intervención?

Conclusión
Como podemos ver después de realizar el respectivo análisis a la información
suministrada por la tabla de datos y gráficos, estos nos permiten ver el
comportamiento en la producción y con esto reunir datos sobre el tema, organizarlos
para entenderlos mejor y, con ello, tomar mejor nuestras decisiones. Podemos
afirmar que, si se presenta un cambio en el peso a la hora de producir las barras de
chocolate ya que la mezcla varia en densidad.
SITUACION #2 DEMANDA DE UN PRODUCTO
Esto corresponde a la toma de datos por 30 semanas los 7 días a la semana de la
demanda en toneladas de un producto, a partir de los datos y realizando un análisis
exploratorio exhaustivo de los datos:

 Primer análisis (Tendencia central)


Comenzamos viendo que tenemos gran cantidad de datos que mediante un análisis
exploratorio nos brindaran buena información que podemos aprovechar para tomar
decisiones importantes.
En primera instancia realizamos las medidas de tendencia central:
Demanda
promedio 10,702
Moda 12,61
Mediana 10,745

Aquí podemos ver la demanda promedio, la moda y la mediana del total de días de
las 30 semanas. Con esto damos un primer vistazo de cómo está la situación.

 Gráfico de línea.

Comparativo de demanda
11,6
11,4
11,2
DEMANDA (TONELADAS)

11,0
10,8
10,6
10,4
10,2
10,0
9,8
9,6
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
#SEMANA
Haciendo ya un analisis grafico vemos el comportamiento de la demanda a lo largo
de las 30 semanas estudiadas. De aquí podemos concluir que gracias a la linea de
tendencia la demanda se ha mantenido medianamente estable. Podemos ver
tambien como la demanada a lo largo del tiempo; vemos los puntos maximos y
minimos.

-Grafico de barras.

Promedio por días


Día promedio
Lunes 9,611666667
Martes 9,924
Miércoles 11,20366667
Jueves 11,16266667
Viernes 13,11533333
Sábado 13,103
Domingo 6,793666667

Comparacion promedios demanda por dias


14

12

10
Demanda (ton)

0
Lunes Martes Miércoles Jueves Viernes Sábado Domingo

Usando el promedio total por días obtenemos esta grafica de barras de la cual
obtenemos que los días con mayor demanda de producto son los viernes y sábado.
 Tabla de frecuencias

Cálculo de intervalos

Número de datos 210


Valor máximo 14,9
Valor mínimo 3,94
Rango 10,96
Número de intervalos 9 8,66
Amplitud 1 1,22

Frec.
Marca de Frecuencia Frecuencia Frecuencia
Intervalo relativa
clase absoluta acumulada relativa
acumulada
3,94 5,16 4,55 3 3 1,43% 1,43%
5,16 6,38 5,77 13 16 6,19% 7,62%
6,38 7,59 6,98 4 20 1,90% 9,52%
7,59 8,81 8,20 21 41 10,00% 19,52%
8,81 10,03 9,42 33 74 15,71% 35,24%
10,03 11,25 10,64 44 118 20,95% 56,19%
11,25 12,46 11,86 34 152 16,19% 72,38%
12,46 13,68 13,07 43 195 20,48% 92,86%
13,68 14,90 14,29 15 210 7,14% 100,00%
0
Total 210 100,00%

Usando lo enseñado en clase se realizó esta tabla de frecuencias para analizar el


comportamiento de los datos de una manera más minuciosa (en el archivo Excel se
puede ver las fórmulas utilizadas para obtener esta tabla). Con esta tabla podemos
obtener gran variedad de datos dependiendo de nuestro interés, por ejemplo:
El 35.24% (Resalto en rojo el dato en la tabla) de los días hubo una demanda de
entre 3.94 Toneladas a 10.03 Toneladas
 Conclusiones
Como podemos ver dado un conjunto de datos podemos obtener muy buena
información gracias a las herramientas que nos brinda la estadística. En este
ejemplo gracias a estos datos podremos tomar mejores decisiones para la
producción de dicho producto. Por ejemplo, vimos que el viernes y sábado son los
días de mayor demanda entonces sabiendo esto podríamos contratar mayor
personal en estos días, por ejemplo.

SITUACION 3. INDUSTRIA AFECTA LA BIODIVERSIDAD DEL RIO


Con el fin de reducir la contaminación en el rio y así proteger las especies que en
este habitan, realizamos el siguiente estudio estadístico basado en la siguiente
hipótesis. “cierta industria deposita sus efluentes sobre el rio, esto hace que el rio
pierda su nivel de oxígeno disuelto. Perdidas de fauna y flora en consecuencia de
esto”.
Los datos que obtuvimos luego de la medición del nivel de oxígeno disuelto en el
agua (OD) antes y después del efluente fueron:
Lo que refleja el grafico 1.1 es una evidente disminución de OD en el agua
después del efluente, en promedio cada día se reduce aproximadamente el 75%
de OD en el agua.
Además, podemos ilustrar mejor este análisis en el siguiente grafico donde se
refleja esta disminución porcentual del nivel de OD en los días.

El grafico 1.2 muestra que en el 75% de los días hay una reducción del 77,8% de
OD, e incluso hay días donde se reduce el 88% y todos en todos los días presenta
una disminución de OD.
Realizamos, también, un estudio para comparar el nivel de OD de cada día.
Creamos la siguiente tabla para tener una visualización del problema más clara.
 Aquí podemos observar nuestro tipo de variable que es cuantitativa continua
en escala de intervalos.

Tabla 1.1

Tabla 1.2

Fr es lo que en estadística se conoce como frecuencia relativa y nos da el porcentaje que


representa esos días con respecto a los 30 días que tomamos las muestras.
Con ayuda de la tabla 1.1 podemos ver que el 97% de los días presentan un nivel
de OD entre 8.93 y 9.76, en contraste con la tabla 1.2 podemos ver que el 90% de
los días el nivel de OD está entre 6.47 y 7.34
En resumen: hay una disminución de más del 75% de OD después de que la
empresa deposite los residuos en el agua, hay días donde este valor aumenta.Hay
un relevante porcentaje de días donde el OD llega a estar entre 3.85 y 5.59.
Si esto no se soluciona, la tendencia que muestra este estudio estadístico es que
los niveles de oxígeno en el agua estarán entre 6.1 y 6.9.
Aquí podemos confirmar nuestra hipótesis y de no dar solución esto podría causar
una tragedia ambiental.

También podría gustarte