Diagrama de Pareto

Está en la página 1de 13

TALLER #2

CONTROL ESTADISTICO DE CALIDAD

PRESENTADOR POR:
JHON ARENAS BUENDIA
LUIS CARLOS OLIVERO
JUAN PIANETA

PRESENTADO A:
MAURICIO QUINTANA

CARTGANE DE INDIAS D.T. y C.

2020
ENUNCIADO

Imagen 1: Enunciado Taller 1 Fuente: Mauricio Quintana – Control Estadístico de Calidad


Nota: Para la solución de todos los problemas presentados en el Taller #2 se utilizó el software
estadístico R – Studio

PROBLEMA #1

A. Haga un análisis de Pareto e identifique sobre qué equipo(s) se debe enfocar más la acción
de mantenimiento.
Solucion paso a paso:

Paso 1: El análisis de Pareto a realizar en este punto va en función de la frecuencia de cada una
de las líneas. Es decir, esto se realiza con el fin de determinar cuál línea está fallando más veces.

Paso 2: Crear el vector de líneas y tiempo en R – Studio con el comando línea<-c(x),


tiempo<-c(x) respectivamente, donde la x representa los datos separados por coma.

Paso 3: Creamos el diagrama de Pareto con el comando Pareto.chart(x), donde x representa la


frecuencia de cada línea. En este caso para obtener la frecuencia de cada línea se utilizó el comando
Table(x), donde x representa el vector a estudiar. Antes de realizar el Pareto se debe usar el
comando library(qcc). Por último, para darle estilo al diagrama se usan los comandos col=”x”,
main=”x”, ylab=”x”, ylab2=”x” y xlab=”x” donde x representa el texto especificado por el autor.

El comando final es: pareto.chart(table(linea),col="blue",main="Diagrema de pareto por


frecuencia de lineas",ylab="Frecuencia",ylab2="Frecuencia Absoluta",xlab="Lineas")

Imagen 2: Diagrama de Pareto de frecuencia por línea Fuente: Autores

Según el análisis de Pareto presentado en la imagen 2 y utilizando el principio 80/20 se observa


que el 80% de los problemas se encuentran en las líneas: 102, 101, 103, 103.5 y 105 en orden
prioritario.

B. Haga un análisis descriptivo de los cien datos de tiempo caído (media, mediana, desviación
estándar, histograma) y comente los hechos más relevantes.

Solucion paso a paso:


Paso 1: Se utiliza el comando Summary(x), donde x es el vector de estudio, para así obtener
rápidamente los valores de media, y otros.

Paso 2: Para la obtención de la desviación estándar se usó el comando sd(x). Por último, para
la realización del histograma se usó el comando hist(x), donde en ambos comandos x representa
el vector a estudiar.

Los comandos finales utilizados fueron: para los estadísticos básicos summary(tiempo), para la
desviación estándar sd(tiempo) y para el histograma hist(tiempo,main="Histograma de
tiempos",ylab ="Frecuencia",col = "blue")

Imagen 3: Histograma y estadísticos básicos de la variable tiempo Fuente: Autores.

 Histograma: El histograma muestra rápidamente que existen datos atípicos dentro de los
tiempos caídos de las líneas. Además, los tiempos de 0 a 20 son de mayor proporción.
 Promedio: El valor obtenido de 33.32 indica que el tiempo perdió por las líneas es
demasiado grande, sin embargo, el valor máximo de 181 muestra que los datos se
encuentran dispersos de una forma abrupta.
 La desviación estándar: la desviación estándar indica un valor de 34.62, confirmando lo
establecido en el ítem anterior (promedio), donde se indica que los datos tienen una
dispersión bastante grande y no siguen un patrón adecuando.
 Mediana: el valor de la mediana nos dice rápidamente que existen 50% de los valores
entre 0 y 20 de tiempos caídos. No obstante, se puede observar que el otro 50% tiene linea
de tiempos caídos bastante grandes.

C. De acuerdo con el análisis anterior, ¿hay datos que se pueden considerar atípicos?
Argumente. Realice un diagrama de caja y bigotes para la variable tiempo.

Solucion paso a paso:

Paso 1: para determinar los datos atípicos se realiza el diagrama de caja con el comando
boxplot(x=x´). donde x´ representa el vector de estudio.

El comando utilizado fue: boxplot(x= tiempo)

Imagen 5: Diagrama de caja y bigote de la variable tiempo Fuente: Autores.

En el diagrama mostrando en la imagen 5 confirma que existen 8 datos atípicos de tiempo


caídos en las líneas de la empresa, esto, se miraba con menor detalle en el histograma mostrando
en la imagen 3 donde los datos que están en el lado derecho del histograma, no tienen mucha
frecuencia y están muy alejados de la mediana.
D. El tiempo promedio es considerablemente mayor que la mediana. Explique a que se debe.

Solucion: esto se debe a que la mayor parte de los tiempos caídos se encuentran en el rango de 0 a
20 pero al tener 8 datos atípicos grandes aumenta el tiempo total generando así que la media
aumente proporcionalmente y se aleje de la mediana.

E. Aplique la regla empírica e interprete los resultados de los tiempos caídos.

La regla empírica, a la que también se le conoce como la regla 68,5-95-99,7, constituye una
manera útil de analizar datos estadísticos. Sin embargo, solo funciona para una distribución normal
(la campana de Gauss) y solo es posible producir estimaciones. (Grupo Camaleon, 2018, p. 1)

Limites reales: para un análisis más al detalle se calcularon los limites reales para los 100 datos,
obteniendo que.

X +- S = 68% de los datos. Ecuación (1)


X +-(2* S) = 95% de los datos. Ecuación (2)
X +- (3*S) = 99.7% de los datos. Ecuación (3)

Imagen 6: Limite real del 68%, 95%, 99.7% para la variable tiempo Fuente: Autores.

Observando los limites reales obtenidos en la imagen 6, se tienen números negativos, lo cual
no puede ser posible debido a que la variable que estamos estudiando es tiempo. Esto nos lleva
automáticamente a realizar la prueba kormogolov para verificar la normalidad de los datos, ya que,
como se menciona al inicio del texto, la regla emperica es únicamente para distribución normal.

Utilizando el paquete nortest de R – Studio se realizó la prueba de kolmogorov, por medio del
comando lillie.test(x) donde x represente el vector de estudio.
Imagen 7: Prueba de Kolmogorov para los 100 datos.

Para determinar la normalidad de los datos se debe tener en cuenta que:

Si P – Value < α – Se rechaza la Ho


Si P – Value > α – Se acepta la Ho

Asumiendo un nivel de significancia del 5% se tiene que el P – Value es menor que la hipótesis
nula, por lo tanto, los datos no siguen distribución normal, por tal motivo los limites reales están
generando números negativos en el límite inferior.

F. Esta empresa considera que cuando existe una falla en los equipos, el tiempo máximo caído
permitido para resolver la falla es de 30 minutos. ¿Se cumple esto?

Solucion paso a paso:

Paso 1: Utilizando el comando table(x) para x=tiempo obtenemos las cantidades exactas de las
frecuencias de cada tiempo caído.

Imagen 8: Frecuencia por tiempos caídos. Fuente: Autores

En la imagen 8 se observa que los tiempos superiores a 30 minutos tienen una frecuencia total
de 31, es decir, de los 100 tiempos caídos que se detectaron en las líneas, el 31% está pasando el
tiempo permitido por la empresa. Por lo anterior, se puede inferir que no se está cumpliendo con
lo establecido por la empresa. No obstante, los tiempos caídos que se encuentran entre 0 y 20 es
de frecuencia 47, tomando casi la mitad de todos los datos, aunque esto no implica que el trabajo
realizado para solucionar las fallas está siendo eficiente y efectivo, por lo cual la empresa debe
seguir mejorando en este aspecto.
PROBLEMA #2

Para los datos del ejercicio anterior, haga un análisis estratificado de tipo descriptivo para las
maquinas (líneas) que consumen mayor tiempo. ¿Modifica esto de alguna forma sus conclusiones
del ejercicio anterior?

Solucion paso a paso:

Paso 1: Se realiza la estratificación de cada una de las líneas. En este paso, es necesario utilizar
la ayuda del Software Microsoft Excel y el Bloc de Notas de Windows, con el fin de poder
transponer los datos que se encuentran de forma vertical a horizontal.

Paso 2: Se crean los vectores todos los tiempos caídos por linea.

Imagen 9: Vectores de tiempos caídos por linea. Fuente: Autores.

Paso 3: Se crea el diagrama de Pareto de la estratificación realizada con cada uno de los
vectores. Para esto, es necesario crear un vector general que sume cada uno de los tiempos de cada
linea y luego se le da el nombre a cada elemento del vector con el comando names(x). donde x
represente los nombres de las líneas separados por coma y entre comillas.

Imagen 10: Vector sumatoria de cada tiempo con sus nombres respectivos Fuente: Autor.

El comando usado para crear el diagrama de Pareto fue:


pareto.chart(sumatiempos,main="Diagrama de Pareto por líneas").
Imagen 11: Diagrama de Pareto de tiempos caídos por linea Fuente: Autores.

Los resultados mostrados en la imagen 11 cambian las conclusiones a las que se llegó en el
problema #1. Ahora, el orden prioritario de las líneas según el principio 80/20 es: 102, 105, 103,
101 y 103.5.

La linea 105 que anteriormente en orden prioritario se encontraba de ultima debido a que su
frecuencia de tiempos caídos era menor que las demás que se identificaron como problemáticas.
En esta ocasión, analizando la variable tiempo se observa que, aunque la linea tiene menor
frecuencia de tiempos caídos estos son mayores que en las otras líneas, con excepción de la linea
102 que sigue siendo la más problemática para la empresa.

El análisis de la variable tiempo proporciona información más confiable para saber cuáles son
las líneas más problemáticas de la empresa en comparación con la variable frecuencia, esto se debe
a que el problema radica en la eficiencia en cuento al tiempo que se demoran arregla una falla de
determinada linea. En ocasiones, linea puede fallar muchas veces como ocurre con la 101 pero
para arreglar la falla el tiempo requerido es menor que en la linea 105.

Para confirmar lo mencionado anteriormente, se calcularon los estadísticos básicos de las líneas
105 y 101, obteniendo como resultado lo que se muestra en la imagen 12.
Imagen 12: Estadísticos básicos de las líneas 101 y 105 Fuente: Autores.

La varianza de la linea 105 se encuentra en 45.37 lo cual indica que los datos están mas
separados en comparación de con la linea 101 que tiene una varianza de 22.40. El valor máximo
en la linea 105 es de 160, en cambio, para la linea 101 es de 90 lo cual confirma que tiene tiempos
caídos de mayor rango y automáticamente eso se ve reflejado en el promedio de 50.73.

PROBLEMA #3

Imagen 13: Problema #3 Fuente: Mauricio Quintana – Control Estadístico de Calidad


A. Realice un diagrama de Pareto completo.

Solucion paso a paso:

Paso 1: Para realizar el diagrama de Pareto general de los problemas que existen en las válvulas
es necesario realizar la tabla de frecuencia de estos para luego poder obtener dicho diagrama con
el comando pareto.chart(x) donde x representa el vector a estudiar.

Imagen 14: Diagrama de pareto general de los problemas en las valvulas Fuente: Autores.

B. ¿Cuál es el problema más importante?

Utilizando el principio 80/20 se tiene que el problema más importante de las válvulas es el de
Porosidad, el cual tiene una frecuencia de 75 y representa el 48.07% de todas las fallas.

C. ¿Cuáles son las principales pistas para encontrar las causas del problema principal?

Realizando un análisis general podemos encontrar que la porosidad y el llenado son los dos
problemas principales en las válvulas, ya que estos suman el 79.49% de la frecuencia acumulada.
Además, observando la imagen 13 podemos inferir que la porosidad está teniendo su mayor
cantidad de problemas en zona 3 debido a que esta zona suma la mayor cantidad de fallas.

PROBLEMA #4

Para los datos del ejercicio anterior, haga un análisis estratificado teniendo en cuenta que la
importancia de cada problema es: o un 28 %, + 45 %, x 17% y / 10 %. ¿Modifica esto de alguna
forma sus conclusiones del ejercicio anterior?

Solucion paso a paso:

Paso 1: Se realiza la estratificación de cada uno de los problemas por productos y por zonas,
siendo necesario para esto crear tablas de frecuencia que representen las cantidades.

Paso 2: Para cada una de las problemáticas obtenidas en la hoja de verificación, se multiplicará
la frecuencia acumulada por su porcentaje respectivo. Luego, el problema con mayor valor
obtenido se le realizara un estudio por zona y producto para ver donde se encuentra el problema
principal.

Imagen 15: Multiplicacion de las frecuencuencia acumuladas de cada problema por el peso
especifico definido por la empresa. Fuente: Autores.

En primera instancia se consideraba la porosidad como problema principal para la empresa,


luego de definir porcenajes de peso especifico para cada problema, se obtiene que esta debe prestar
mas atencion al llenado, ya que según lo calculos realizados, este tiene una importancia de 22.5 la
cual es mayor de que la de porosidad que fue 21.

Ahora bien, ¿Dónde debe prestar más atención la empresa con respecto al llenado en los
productos y zona? Para resolver esta inquietud se multiplico el porcentaje de llenado por cada uno
de las frecuencias relativas, como se mencionó en el paso 2.
Imagen 16: Analisis de llenado por producto y zona multiplicado por el peso especfico definido
por la empresa Fuente: Autores.

Luego de realizar el analisis presentado en la imagen 16, se puede concluir que la empresa debe
colocar sus esfuerzos principalmente en el problema de llenado (22.5), en el producto B (6.75) y
en la zona 3 (10.8).

También podría gustarte