Distribuciones de Probabilidad - Trabajo Grupal - Estadistica2
Distribuciones de Probabilidad - Trabajo Grupal - Estadistica2
Distribuciones de Probabilidad - Trabajo Grupal - Estadistica2
Valle de Sula.
Catedrático:
Maryi
Tema:
Distribuciones de probabilidad
https://www.youtube.com/watch?v=gIvOzIjybB8
Lugar y fecha:
Página 1 de 15
Introducción
Objetivos
Objetivo General
Investigar las probabilidades y su relación con las distribuciones de frecuencias e
incluso la diferencia entre ambas, para poder obtener modelos útiles para tomar
decisiones de la mejor manera.
Objetivos Específicos
Clasificar las distribuciones de probabilidad para tener en claro el propósito que esta
misma tiene en la resolución de problemas de negocio.
Plantear las fórmulas correctas para calcular las distribuciones, con los datos que en
algún momento se han investigado.
Desarrollo
Distribución de Probabilidad
Conceptualización
Probabilidad
La Probabilidad es una rama de la estadística que nos permite evaluar la confiabilidad de las
conclusiones que tengamos de una población cuando solo tenemos información de las
muestras. Existen 2 tipos de probabilidad, la desconocida y la conocida: La conocida es
cuando sabemos a qué población se refiere, la desconocida, a cuando solo conocemos la
muestra. (Mendenhall, Beaver, & Beaver, 2010)
Página 2 de 15
Distribución de probabilidad
Es una distribución teórica que sirve para representar poblaciones. Las probabilidades de que
suceda un evento se enlistan en una tabla para poder mostrar de una manera ordenada la
distribución de los eventos observados.
En el documento escrito por (Restrepo B & Gonzalez L, 2003)Se puede hablar del comienzo
de la probabilidad como teoría matemática a partir de una correspondencia tenida por Blaise
Pascal con el abogado y aficionado a las matemáticas Pierre Fermant, esta mensajería fue
producto de una conversación que tuvo Pascal con un aficionado al juego de los dados.
Christian Huygens fue el primero en exponer la teoría del juego de dados, en el tratado “sobre
los racionamientos relativos a los juegos de los dados” obra producto de la inspiración de la
correspondencia entre Pascal y Fermat.
El alemán Carl Friedrich Gauss es responsable de crear la teoría de los mínimos cuadrados,
procedimiento usado para resolver problemas esenciales de la teoría de los errores.
Página 3 de 15
Media y varianza de una distribución de probabilidad discreta
Para describir de mejor manera una distribución de probabilidad, se hará uso de parámetros
poblacionales y muestrales (media, varianza, desviación estándar) para explicar de mejor
forma los fenómenos cuantitativos.
La media de una variable aleatoria discreta (valor esperado) se encuentra al multiplicar cada
posible valor de x por su propia probabilidad: 𝜇 = Σ[𝑥𝑃 (𝑥 )]
La varianza de una variable aleatoria discreta se encuentra multiplicando cada posible valor
del cuadrado de la desviación media por su propia probabilidad y luego sumado a todos los
productos: sigma cuadrada = suma de (cuadrado de la desviación por la probabilidad)
(𝜎 2 = Σ [(x − μ)2 𝑃 (𝑥 )]
Sea un experimento aleatorio en el que sólo puedan darse dos posibilidades: que ocurra un
determinado suceso A, que llamaremos éxito, o que no ocurra dicho suceso, o sea que ocurra
su complementario, que llamaremos fracaso, A ¾ Se conoce la probabilidad de ocurrencia
del suceso A, y por lo tanto la de su complementario:
Una distribución binomial es una distribución discreta que modela el número de eventos en
un número de ensayos fijo. Cada ensayo tiene dos resultados posibles, y evento es el resultado
de interés en un ensayo.
Por ejemplo, un elemento pasa o no pasa una inspección o un partido político gana o pierde.
La distribución binomial se usa frecuentemente en control de calidad, sondeos de opinión
pública, investigaciones médicas y seguros.
Página 4 de 15
Por ejemplo, utilice la distribución binomial para calcular la probabilidad de que 3 o más
elementos defectuosos se encuentren en una muestra de 25 elementos si la probabilidad de
un elemento defectuoso en cada ensayo es 0.02. El número de elementos defectuosos (X)
sigue una distribución binomial con n = 25 y p = 0.02.
Distribución hipergeométrica
Página 5 de 15
Por ejemplo, usted recibe un envío de pedido especial de 500 etiquetas. Supongamos que el
2% de las etiquetas es defectuoso. El conteo de eventos en la población es de 10 (0.02 * 500).
Usted toma una muestra de 40 etiquetas y desea determinar la probabilidad de que haya 3 o
más etiquetas defectuosas en esa muestra. La probabilidad de que haya 3 o más etiquetas
defectuosas en la muestra es de 0.0384.
Supongamos que hay diez automóviles disponibles para que usted los pruebe (N = 10) y
cinco de ellos tienen motores turbo (x = 5). Si prueba tres de los vehículos (n = 3), ¿cuál es
la probabilidad de que dos de los tres que probará tengan motores turbo?
La probabilidad de que seleccione exactamente dos automóviles con motores turbo de forma
aleatoria cuando pruebe tres de los diez vehículos es 41.67%.
Utilice la distribución binomial con poblaciones tan grandes que el resultado de una prueba
prácticamente no tiene efecto sobre la probabilidad de que el próximo resultado sea un evento
o un no evento. Por ejemplo, en una población de 100,000 personas, 53,000 tienen sangre
O+. La probabilidad de que la primera persona seleccionada aleatoriamente en una muestra
tenga sangre O+ es 0.530000. Si la primera persona en una muestra tiene sangre O+, entonces
la probabilidad de que la segunda persona tenga sangre O+ es 0.529995. La diferencia entre
Página 6 de 15
estas probabilidades es lo suficientemente pequeña como para ignorarla en la mayoría de las
aplicaciones.
Utilice la distribución hipergeométrica con poblaciones que sean tan pequeñas que el
resultado de un ensayo tiene un gran efecto en la probabilidad de que el próximo resultado
sea un evento o un no evento. Por ejemplo, en una población de 10 personas, 7 personas
tienen sangre O+. La probabilidad de que la primera persona seleccionada aleatoriamente en
una muestra tenga sangre O+ es 0.7000. Si la primera persona en la muestra tiene sangre O+,
entonces la probabilidad de que la segunda persona tenga sangre O+ es 0.66667. La
diferencia puede aumentar a medida que aumenta el tamaño de la muestra. La diferencia
entre estas probabilidades es demasiado grande como para ignorarla en muchas aplicaciones.
DISTRIBUCIÓN UNIFORME
La distribución uniforme se puede imaginar como una línea recta horizontal, por lo que en el
caso de un lanzamiento de moneda que devuelve cara o cola, ambas tienen una probabilidad
de p = 0,50 y se representarían mediante una línea desde el eje y en 0,50.
Hay dos tipos de distribuciones uniformes: discretas y continuas. Los posibles resultados de
una matriz de laminación proporcionan un ejemplo de una distribución uniforme discreta: se
pueden laminar 1, 2, 3, 4, 5 o 6, pero no se pueden laminar 2,3, 4,7 o 5,5. Por tanto, una tirada
de dados genera una distribución aislada con p = 1/6 para cada resultado.
Página 7 de 15
Hay otras distribuciones continuas importantes, como la distribución normal, chi-cuadrado y
la distribución t de Pupila.
𝑥
𝐹(𝑥) = ∫ 𝑓(𝑢)𝑑𝑢
−∞
𝑥
𝑥
𝐹(𝑥) = ∫ 10𝑑𝑢 = 10𝑢|
0.95 0.95
DISTRIBUCIÓN NORMAL
La distribución normal también es importante por su relación con la estimación por mínimos
cuadrados, uno de los métodos de estimación más simples y antiguos.
Página 9 de 15
Ejercicios de distribución de probabilidad normal estándar
1. Una población normal tiene una medida de 80 una desviación estándar de 14.0
𝑥−𝜇
𝜇 = 80 ; 𝜎 = 14 ; 𝑧 =
𝜎
a) Calcule la probabilidad de un valor localizado entre 75.0 y 90.0 p(74≤x≤90)
90 − 80 10
𝑧= = = 0.71 = 0.7611
14 14
75 − 80 −5
𝑧= = = −0.36 = 0.3594
14 14
P(75≤x≤90) = 0.7611-0.3594 = 0.4017
La distribución de Poisson
Página 10 de 15
Se observa la realización de hechos de cierto tipo durante un cierto periodo de tiempo o
a lo largo de un espacio de observación
Los hechos a observar tienen naturaleza aleatoria; pueden producirse o no de una manera
no determinística.
La probabilidad de que se produzcan un número x de éxitos en un intervalo de amplitud
t no depende del origen del intervalo (Aunque, sí de su amplitud)
La probabilidad de que ocurra un hecho en un intervalo infinitésimo es prácticamente
proporcional a la amplitud del intervalo.
La probabilidad de que se produzcan 2 o más hechos en un intervalo infinitésimo es un
infinitésimo de orden superior a dos.
En consecuencia, en un intervalo infinitésimo podrán producirse 0 o 1 hecho, pero nunca
más de uno.
Dada una variable aleatoria discreta X decimos que su frecuencia se puede aproximar
satisfactoriamente a una distribución de Poisson. A diferencia de la distribución normal, la
distribución de Poisson solo depende de un parámetro, mu
Mu informa del número esperado de eventos que ocurrirán en un intervalo de tiempo fijado.
Cuando se habla de algo “esperado” tenemos que redirigirlo a pensar en la media. Por tanto,
mu es la media de la frecuencia de los eventos.
Tanto la media como la varianza de esta distribución son mu, estrictamente positiva.
Ejemplo:
1.
Los inputs necesarios para calcular la función de probabilidad de densidad de la Poisson son
el conjunto de datos y mu:
Página 11 de 15
Conjunto de datos = 100 estaciones de esquí.
Mu = 5% * 100 = 5 es el número de estaciones de esquí esperado dado el conjunto de
datos.
Entonces, la estación más cercana tiene una probabilidad de 14,62% de que abra antes de
diciembre.
2. Ejemplo
Página 12 de 15
Y calculamos lo que nos piden:
Distribución Exponencial
Esta distribución tiene una amplia gama de aplicaciones, que incluyen el análisis de fiabilidad
de productos y sistemas, teorías de colas y cadenas de Markov.
Página 13 de 15
y no pueden ocurrir antes. En la siguiente gráfica, el parámetro de valor umbral, θ, es igual a
5 y desplaza la distribución 5 unidades a la derecha.
Ejemplo:
Ejercicio 1
Hallar la probabilidad de que una persona tarde más de una hora revisando su correo, si la
distribución de probabilidades es exponencial, con parámetro λ = 0.2.
Solución
Se debe calcular P [x ≥ 60], puesto que 1 hora equivale a 60 minutos y se pide la probabilidad
de que la persona tarde 60 minutos o más en revisar el correo. La probabilidad se calcula con
la misma integral presentada al comienzo, solo cambiando los límites de integración:
Página 14 de 15
El valor obtenido es pequeño, por lo que es muy poco probable que una persona se demore
más de una hora en revisar su correo electrónico.
Conclusiones
Página 15 de 15