Distribución Hipergeometrica y Weibull

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 13

INTRODUCCION

En estadística, una distribución discreta es una distribución de probabilidad de los


resultados de variables finitas o valores contables. Si una variable aleatoria sigue el patrón
de una distribución discreta, significa que la variable aleatoria es discreta. En un sentido
amplio, todas las distribuciones de probabilidad se pueden clasificar como distribución de
probabilidad discreta o distribución de probabilidad continua. Mientras que una
distribución continua se basa en valores medibles que son infinitos, la distribución discreta
se ocupa de las probabilidades de los resultados de valores finitos.

A través de la distribución, ya sea discreta o continua, los analistas y estadísticos


identifican los resultados de las variables aleatorias. Los resultados probables a menudo se
presentan en un gráfico utilizando puntos de datos específicos que explican la
probabilidad. La distribución discreta es tanto una distribución estadística como un análisis
matemático de resultados de valores finitos. Mientras que una distribución discreta tiene un
número finito de resultados, la distribución continua tiene un número infinito de resultados
medibles.

Como objeto de estudio nos enfocaremos en la distribución hipergeométrica el cual


es especialmente útil en todos aquellos casos en los que se extraigan muestras o se realicen
experiencias repetidas sin devolución del elemento extraído o sin retornar a la situación
experimental inicial y la distribución de Weibull nos permite estudiar cuál es la distribución
de fallos de un componente clave de seguridad que pretendemos controlar y que a través de
nuestro registro de fallos observamos que éstos varían a lo largo del tiempo y dentro de lo
que se considera tiempo normal de uso. El método no determina cuáles son las variables
que influyen en la tasa de fallos, tarea que quedará en manos del analista, pero al menos la
distribución de Weibull facilitará la identificación de aquellos y su consideración, aparte de
disponer de una herramienta de predicción de comportamientos. Esta metodología es útil
para aquellas empresas que desarrollan programas de mantenimiento preventivo de sus
instalaciones.

DISTRIBUCIÓN HIPERGEOMÉTRICA

La distribución hipergeométrica es una distribución discreta que modela el número


de eventos en una muestra de tamaño fijo cuando se conoce el número total de elementos
en la población de la cual proviene la muestra. Cada elemento de la muestra tiene dos
resultados posibles (es un evento o un no evento). Las muestras no tienen reemplazo, por
lo que cada elemento de la muestra es diferente, cuando se elige un elemento de la
población, no se puede volver a elegir; por lo tanto, la probabilidad de que un elemento sea
seleccionado aumenta con cada ensayo, presuponiendo que aún no haya sido seleccionado.

En general, nos interesa la probabilidad de seleccionar x éxitos de los k artículos


considerados éxitos y n – x fracasos de los N – k artículos que se consideran fracasos
cuando una muestra aleatoria de tamaño n se selecciona de N artículos. Esto se conoce
como un experimento hipergeométrico.

La distribución hipergeométrica es especialmente útil en todos aquellos casos en los


que se extraigan muestras o se realicen experiencias repetidas sin devolución del elemento
extraído o sin retornar a la situación experimental inicial. Es una distribución fundamental
en el estudio de muestras pequeñas de poblaciones pequeñas y en el cálculo de
probabilidades de juegos de azar y tiene grandes aplicaciones en el control de calidad para
procesos experimentales en  los que no es posible retornar a la situación de partida.

Las consideraciones a tener en cuenta en una distribución hipergeométrica:


 El proceso consta de "n" pruebas, separadas o separables de entre un conjunto de
"N" pruebas posibles.
 Cada una de las pruebas puede dar únicamente dos resultados mutuamente
excluyentes.
 El número de individuos que presentan la característica A (éxito) es "k".
 En la primera prueba las probabilidades son: P(A)= p y P(A)= q; con p+q=1.

Por otro lado la tecnología actual permite que los ingenieros diseñen muchos sistemas
complicados cuya operación y seguridad dependen de la confiabilidad de los diversos
componentes que conforman los sistemas. Por ejemplo, un fusible se puede quemar, una
columna de acero se puede torcer o un dispositivo sensor de calor puede fallar.
Componentes idénticos, sujetos a idénticas condiciones ambientales, fallarán en momentos
diferentes e impredecibles.

La distribución hipergeométrica suele aparecer en procesos muestrales sin


reemplazo, en los que se investiga la presencia o ausencia de cierta característica. Piénsese,
por ejemplo, en un procedimiento de control de calidad en una empresa farmacéutica,
durante el cual se extraen muestras de las cápsulas fabricadas y se someten a análisis para
determinar su composición. Durante las pruebas, las cápsulas son destruidas y no pueden
ser devueltas al lote del que provienen. En esta situación, la variable que cuenta el número
de cápsulas que no cumplen los criterios de calidad establecidos sigue una distribución
hipergeométrica. Por tanto, esta distribución es la equivalente a la binomial, pero cuando el
muestreo se hace sin reemplazo, de forma que la probabilidad de éxito no permanece
constante a lo largo de las n pruebas, a diferencia de la distribución binomial. Esta
distribución se puede ilustrar del modo siguiente: se tiene una población finita con N
elementos, de los cuales R tienen una determinada característica que se llama “éxito”
(diabetes, obesidad, hábito de fumar, etc.). El número de “éxitos” en una muestra aleatoria
de tamaño n, extraída sin reemplazo de la población, es una variable aleatoria con
distribución hipergeométrica de parámetros N, R y n. Cuando el tamaño de la población es
grande, los muestreos con y sin reemplazo son equivalentes, por lo que la distribución
hipergeométrica se aproxima en tal caso a la binomial. En el caso de esta distribución,
Epidat 4 limita el cálculo a valores del tamaño de población (N) menores o iguales que
1.000. Valores: k: max{0,n-(N-R)}, ..., min{R,n}, donde max{0,n-(N-R)} indica el valor
máximo entre 0 y n- (N-R) y min{R,n} indica el valor mínimo entre R y n. Parámetros: N:
tamaño de la población, N ≥ 1 entero R: número de éxitos en la población; 1 ≤ R ≤ N, N
entero n: número de pruebas; 1 ≤ n ≤ N, n entero Ejemplo Se sabe que el 7% de los útiles
quirúrgicos en un lote de 100 no cumplen ciertas especificaciones de calidad. Tomada una
muestra al azar de 10 unidades sin reemplazo, interesa conocer la probabilidad de que no
más de dos sean defectuosas. El número de útiles defectuosos en el lote es R = 0,07100 =
7. Para un tamaño muestral de n= 10, la probabilidad buscada es P{número de defectuosos
 2}. Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.
http://dxsp.sergas.es soporte.epidat@sergas.es 9 Resultados con Epidat 4: La probabilidad
de que, a lo sumo, haya dos útiles defectuosos en el lote es aproximadamente 0,98.
Además, puede decirse que la media y la varianza de la distribución hipergeométrica (100,
7, 10) son 0,7 y 0,59, respectivamente; en este caso, la media de útiles quirúrgicos
defectuosos en 10 pruebas es de 0,7 y la varianza de 0,59.

Las consideraciones a tener en cuenta en una distribución hipergeométrica:


El proceso consta de "n" pruebas, separadas o separables de entre un conjunto de "N"
pruebas posibles.

 Cada una de las pruebas puede dar únicamente dos resultados mutuamente
excluyentes.

 El número de individuos que presentan la característica A (éxito) es "k".

 En la primera prueba las probabilidades son: P(A)= p y P(A)= q; con p+q=1.

En estas condiciones, se define la variable aleatoria X = “nº de éxitos obtenidos”. La


función de probabilidad de esta variable sería:

La media, varianza y desviación típica de esta distribución vienen dadas por:


Ejemplo1:

Supongamos la extracción aleatoria de 8 elementos de un conjunto formado por 40


elementos totales (cartas baraja española) de los cuales 10 son del tipo A (salir oro) y 30
son del tipo complementario (no salir oro).

Si realizamos las extracciones sin devolver los elementos extraídos y llamamos X al


número de elementos del tipo A (oros obtenidos) que extraemos en las 8 cartas; X seguirá
una distribución hipergeométrica de parámetros 40, 8, 10/40.H(40,8,0,25).

Para calcular la probabilidad de obtener 4 oros:

Distribuciones continuas

Las distribuciones continuas incluidas en el módulo de “Cálculo de probabilidades”


son:

- Uniforme o rectangular - Normal - Lognormal - Logística - Beta - Gamma -


Exponencial - Ji-cuadrado - t de Student - F de Snedecor - Cauchy - Weibull - Laplace -
Pareto – Triangular

La  distribución de Weibull


En teoría de la probabilidad y estadística, la distribución de Weibull es
una distribución de probabilidad continua. Esta distribución debe su nombre al físico sueco
Waloddi Weibull (1887-1979), que la describió detalladamente en 1951, aunque fue
descubierta inicialmente por Fréchet (1927) y aplicada por primera vez por Rosin y
Rammler (1933) para describir la distribución de los tamaños de determinadas partículas.
Originalmente Waloddi Weibull, propuso la distribución como un modelo para la
resistencia a la rotura del material, pero reconoció el potencial de la distribución en su
artículo de 1951 “Una función de distribución estadística de amplia aplicabilidad”. Hoy en
día, se usa comúnmente para evaluar la confiabilidad del producto , analizar datos de vida
útil y modelar tiempos de falla. El Weibull también puede adaptarse a una amplia gama de
datos de muchos otros campos, incluidos: biología, economía, ciencias de la ingeniería e
hidrología (Rinne, 2008), modelar situaciones del tipo tiempo-fallo, modelar tiempos de
vida o en el análisis de supervivencia, a parte de otros usos como, por ejemplo, caracterizar
el comportamiento climático de la lluvia en un año determinado.

Características
La distribución de Weibull se describe según los parámetros de forma, escala y
valor umbral y también se conoce como la distribución de Weibull de 3 parámetros. El caso
en el que el parámetro de valor umbral es cero se conoce como la distribución de Weibull
de 2 parámetros. La distribución de Weibull de 2 parámetros se define solo para variables
positivas. Una distribución de Weibull de 3 parámetros puede funcionar con ceros y datos
negativos, pero todos los datos para una distribución de Weibull de 2 parámetros deben ser
mayores que cero.

Dependiendo de los valores de sus parámetros, la distribución de Weibull puede adoptar


varias formas.

La distribución de Weibull se utiliza en:


 Análisis de la supervivencia
 En ingeniería, para modelar procesos estocásticos relacionados con el tiempo de
fabricación y distribución de bienes
 Teoría de valores extremos
 Meteorología
 Para modelar la distribución de la velocidad del viento (frecuencia con la que se dan
diferentes velocidades de viento)
 En telecomunicaciones
 En sistemas de radar para simular la dispersión de la señal recibida
 En seguros, para modelar el tamaño de las pérdidas
 En la hidrología, se utiliza la distribución de Weibull para analizar variables
aleatorias como valores máximos de la precipitación y la descarga de ríos,4 y
además para describir épocas de sequía.

Expresión matemática de la distribución Weibull

La función de densidad de la distribución de Weibull para la variable aleatoria t está


dada por la siguiente expresión:

Donde:

t: Variable aleatoria que, para el caso de la confiabilidad, representa el tiempo entre fallas.
β: Parámetro de forma (0<β<∞) θ: Parámetro de escala (0<θ<∞)
δ: Parámetro de localización (-∞δ<∞)
El parámetro beta, como su nombre indica, determina la forma — o perfil— de la
distribución, la cual es función del valor de éste.
El parámetro theta indica la escala de la distribución, es decir, muestra que tan aguda o
plana es la función.
El parámetro delta indica, en el tiempo, el momento a partir del cual se genera la
distribución.
Una distribución biparamétrica está completamente definida por los parámetros de
forma y de escala.
Nota: Se utilizan caracteres griegos cuando las publicaciones tiene un carácter más
marcado de tipo matemático. Por lo tanto se usan preferentemente la nomenclatura más
extendida en publicaciones de mantenimiento que relacionan la variable (x) con el tiempo.

β < 1,0
Representa una rata de fallas tempranas (mortalidad infantil) Mientras más cercano
a cero, más grande el riesgo de este tipo de fallas. Las fallas tempranas tienden a ser
causadas por repuestos de mala calidad o defectuosos y/o por mano de obra deficiente. La
mala calidad de las partes puede ser asociada a problemas de almacenaje que propicien la
contaminación, corrosión y el deterioro. Las deficiencias asociadas con la mano de obra
pueden atribuirse a procedimientos débiles, falta de capacitación o falta de personal
calificado, supervisión insuficiente, falta de controles de calidad o incluso a temas
administrativos como reparaciones apresuradas. La meta es elevar el parámetro β a 1,0
mientras decrece la rata de fallas y se incrementa el TPEF o TPPF.

β ~= 1.0
Representa una rata de fallas constante, no se pueden hacer predicciones en función
del tiempo. En este escenario debe enfocarse en optimizar sus planes de inspección y
monitoreo de condición de manera de detectar las fallas en su etapa incipiente, por otro lado
puede trabajar en mejorar el proceso de análisis de los datos por cada modo de falla.
Cuando se toman un lote de modos de fallas juntos, se presenta un efecto aleatorio que
tiende a elevar β  a 1,0. Hay que enfocarse en prácticas de precisión y proactivas,
especialmente en las actividades de Ajuste, Lubricación, Alineación y Balanceo. La rata de
falla es afectada por las intervenciones proactivas, pero no necesariamente estas afectan el
perfil de riesgo. La meta es mantener el parámetro β en 1,0 mientras decrece la rata de
fallas incrementando el TPEF o el TPPF.

β > 1,0
Indica dependencia del tiempo, lo cual es típicamente indicativo de un modo de falla
dominante. Mientras más alto es β, más fuerte es la relación con el tiempo. En este
escenario el trabajo consiste en identificar los factores mecánicos, eléctricos, operacionales
y humanos que representan las causas que desencadenan la falla. El modo de falla
dominante, es algunos casos, se elimina actualizando componentes, rediseñando,
reduciendo el estrés operacional u otras iniciativas. En algunos casos las partes o
componentes son simplemente reemplazados. Si la forma β es suficientemente alta (por
ejemplo> 5,0) y si no puede controlar las funciones que propician la falla, el mantenimiento
basado en el tiempo PUEDE estar justificado. En otras instancias, se podría incrementar la
veracidad y frecuencia del monitoreo y el perfil de riesgo aumenta. La meta es que β se
mantenga ~1,0 si es posible o instituir el mantenimiento basado en tiempo o incrementar el
monitoreo apropiadamente. El perfil de riesgo debería afectar el proceso de planificación de
repuestos de tal manera que no lo encuentren desprevenido. En todos los casos hay que
mantenerse enfocados en las actividades de mantenimiento proactivas.
Ejemplo de Análisis Weibull aplicado a Fallas de Equipos
La técnica de Análisis Weibull puede ser usada para estimar probabilidad de
muchos casos, por lo que nos enfocaremos en un análisis de confiabilidad asociado a una
estadística de fallas de equipos de una planta fraccionadora de gas, para lo cual tenemos la
siguiente estadística de Tiempo Para Falla (TPF).
Tabla 2. Datos estadísticos de TPF.

Analizando los datos de la tabla No. 2, como primera observación tenemos que hay
un 95.98% que los TPF sean menores a 95.98%, por supuesto que es una información, pero
no nos ayuda mucho ya que tenemos datos desde 240 horas a 13,776 horas, por lo que
debemos analizar la gráfica de Weibull (Fig.3).

Figura 3. Gráfico de Weibull (TPF).

Del análisis tenemos que el Factor de Forma β es 0.6433 lo que indica que tenemos
una tasa de falla descendente, al igual que una t = η (aproximadamente 2,000).
Ya con los datos de forma y escala podemos realizar cualquier estimado de
confiabilidad utilizando la ecuación (7) o el gráfico de Weibull.
R(t) = 1-F(t) (7)
Por ejemplo, si queremos estimar cuál es la confiabilidad o probabilidad para que
los equipos no fallen a t1=500 horas o t2=3000 horas, obtendremos lo siguiente:
 R(t1) = 80%
 R(t2) = 10%

Caso practico
En una empresa que envasa aceite para vehículos se selecciona una muestra de 10
taponadoras de botellas que tienen fallas en el proceso, se dan en el siguiente orden:

BIBLIOGRAFIA

 https://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_Weibull
 https://esp.reliabilityconnect.com/por-que-es-necesario-el-analisis-de-weibull/

 FUNDAMENTOS DEL ANÁLISIS DE WEIBULL – Por Robert B. Abernethy, FL,


USA
 IEC 61649-2008 – Weibull analysis
Dicho trabajo debe contener lo siguiente:
 Portada
 Introducción
 Desarrollo:
a. Origen de la distribución de hipergeometrica y Weibull
b. Concepto, características y aplicaciones
c. Interpretación de la taza de fallas en la distribución de Weibull
Desarrollo de caso práctico (Elaborar un ejercicio de la distribución de Weibull aplicado al
análisis de fallas en un proceso determinado)
 Analisis de las 3 personas.
 Bibliografías Pautas a considerar
 Tres cuartillas (Ensayo teórico)
 Desarrollo de caso práctico:
a. Elaborar tabla de distribución de datos: Número de elementos de fallas (i), tiempo de
falla (ti), logaritmo natural de tiempo de fallas In(ti), logaritmo natural del tiempo de fallas
menos la media (In(ti)-x)2
b. Calcular de parámetros: Media (x), varianza (S2), desviación estándar (S), β: Parámetro
de forma (0<β<θ

También podría gustarte