Distribuciones de Probabilidad - Trabajo Grupal - Estadistica2

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 15

Universidad Nacional Autónoma de Honduras en el

Valle de Sula.

Catedrático:

Lic. José Ricardo Umaña

Integrantes del grupo:

Ammy Cristel Urquia. # 2019-2100-232

Katy Vanessa Erazo. # 2018-2003-020

Kevin Alexander Torres. # 2013-2001-811

Ramón Efraín Mánchame. # 2018-2002-657

Sayda Vanessa Díaz. # 2020-2001-503

Maryi

Tema:

Distribuciones de probabilidad

https://www.youtube.com/watch?v=gIvOzIjybB8

Asignatura: Estadísticas económicas II

Lugar y fecha:

San Pedro Sula, 24 de abril del 2022

Página 1 de 15
Introducción

Es este documento discutiremos de forma práctica los aspectos y conceptos básicos de la


distribuciones de probabilidad. Veremos cómo se pueden simular datos con determinadas
distribuciones y cómo calcular los valores teóricos de estas. Como veremos más adelante el
fundamento de las pruebas estadísticas está en comprender que los estadísticos pueden
entenderse como valores de distribuciones específicas; entender las ideas de distribución de
variables aleatorias es pues un paso previo al estudio de los test estadísticos.

Objetivos
Objetivo General
 Investigar las probabilidades y su relación con las distribuciones de frecuencias e
incluso la diferencia entre ambas, para poder obtener modelos útiles para tomar
decisiones de la mejor manera.

Objetivos Específicos
 Clasificar las distribuciones de probabilidad para tener en claro el propósito que esta
misma tiene en la resolución de problemas de negocio.
 Plantear las fórmulas correctas para calcular las distribuciones, con los datos que en
algún momento se han investigado.

Desarrollo

Distribución de Probabilidad
Conceptualización

Probabilidad
La Probabilidad es una rama de la estadística que nos permite evaluar la confiabilidad de las
conclusiones que tengamos de una población cuando solo tenemos información de las
muestras. Existen 2 tipos de probabilidad, la desconocida y la conocida: La conocida es
cuando sabemos a qué población se refiere, la desconocida, a cuando solo conocemos la
muestra. (Mendenhall, Beaver, & Beaver, 2010)

Página 2 de 15
Distribución de probabilidad
Es una distribución teórica que sirve para representar poblaciones. Las probabilidades de que
suceda un evento se enlistan en una tabla para poder mostrar de una manera ordenada la
distribución de los eventos observados.

Historia de la distribución de probabilidad

En el documento escrito por (Restrepo B & Gonzalez L, 2003)Se puede hablar del comienzo
de la probabilidad como teoría matemática a partir de una correspondencia tenida por Blaise
Pascal con el abogado y aficionado a las matemáticas Pierre Fermant, esta mensajería fue
producto de una conversación que tuvo Pascal con un aficionado al juego de los dados.

Christian Huygens fue el primero en exponer la teoría del juego de dados, en el tratado “sobre
los racionamientos relativos a los juegos de los dados” obra producto de la inspiración de la
correspondencia entre Pascal y Fermat.

Las propuestas de Pascal, Fermet y Huygens comenzaron a aparecer interesantes a muchos


matemáticos, entre ellos Jacob Bernoulli, que a partir de su creación (el teorema de
Bernoulli), a Abraham de Movrie, creador de la “campana de Gauss” producto de la medición
de sus observaciones astronómicas y la forma en la que se distribuían los datos. El inglés
Thomas Bayes, el cual era religioso, también dio su parte con el teorema de las posibilidades
condicionales. El francés, Simón Laplace Recopilo las ideas de los anteriormente
mencionados para poder publicar la obra “teoría analítica de las probabilidades” donde
estudia de manera rigurosa la aplicación estadística a diversas áreas, como la demografía y a
la astronomía.

El alemán Carl Friedrich Gauss es responsable de crear la teoría de los mínimos cuadrados,
procedimiento usado para resolver problemas esenciales de la teoría de los errores.

Otros nombres a los cuales asociamos el desarrollo de la teoría de la probabilística son


Simeón Poisson, Karl Pearson, Andrei Markov. Nobert Wienerm Kolmogorov. Los cuales
permitieron explicar diferentes fenómenos, tanto sociales, demográficos y biológicos que nos
ayudan a entender mejor nuestra realidad.

Página 3 de 15
Media y varianza de una distribución de probabilidad discreta
Para describir de mejor manera una distribución de probabilidad, se hará uso de parámetros
poblacionales y muestrales (media, varianza, desviación estándar) para explicar de mejor
forma los fenómenos cuantitativos.

La media de una variable aleatoria discreta (valor esperado) se encuentra al multiplicar cada
posible valor de x por su propia probabilidad: 𝜇 = Σ[𝑥𝑃 (𝑥 )]

La varianza de una variable aleatoria discreta se encuentra multiplicando cada posible valor
del cuadrado de la desviación media por su propia probabilidad y luego sumado a todos los
productos: sigma cuadrada = suma de (cuadrado de la desviación por la probabilidad)

(𝜎 2 = Σ [(x − μ)2 𝑃 (𝑥 )]

Desviación estándar: Esa la raíz cuadrada positiva de la varianza.

Distribución binomial y Distribución Hipergeométrica

Una distribución binomial es una distribución de probabilidad discreta que describe el


número de éxitos al realizar (n) experimentos independientes entre sí, acerca de una variable
aleatoria.

Sea un experimento aleatorio en el que sólo puedan darse dos posibilidades: que ocurra un
determinado suceso A, que llamaremos éxito, o que no ocurra dicho suceso, o sea que ocurra
su complementario, que llamaremos fracaso, A ¾ Se conoce la probabilidad de ocurrencia
del suceso A, y por lo tanto la de su complementario:

Una distribución binomial es una distribución discreta que modela el número de eventos en
un número de ensayos fijo. Cada ensayo tiene dos resultados posibles, y evento es el resultado
de interés en un ensayo.

Por ejemplo, un elemento pasa o no pasa una inspección o un partido político gana o pierde.
La distribución binomial se usa frecuentemente en control de calidad, sondeos de opinión
pública, investigaciones médicas y seguros.

Página 4 de 15
Por ejemplo, utilice la distribución binomial para calcular la probabilidad de que 3 o más
elementos defectuosos se encuentren en una muestra de 25 elementos si la probabilidad de
un elemento defectuoso en cada ensayo es 0.02. El número de elementos defectuosos (X)
sigue una distribución binomial con n = 25 y p = 0.02.

Una de las propiedades de la distribución binomial es que cuando n es grande, la distribución


binomial puede ser aproximada razonablemente por la distribución normal. Por ejemplo, para
la siguiente distribución binomial, n = 100 y p = 0.5.

Distribución hipergeométrica

La distribución hipergeométrica es una distribución discreta que modela el número de


eventos en una muestra de tamaño fijo cuando usted conoce el número total de elementos en
la población de la cual proviene la muestra. Cada elemento de la muestra tiene dos resultados
posibles (es un evento o un no evento). Las muestras no tienen reemplazo, por lo que cada
elemento de la muestra es diferente. Cuando se elige un elemento de la población, no se
puede volver a elegir. Por lo tanto, la probabilidad de que un elemento sea seleccionado
aumenta con cada ensayo, presuponiendo que aún no haya sido seleccionado.

Utilice la distribución hipergeométrica para muestras obtenidas de poblaciones relativamente


pequeñas, sin reemplazo. Por ejemplo, la distribución hipergeométrica se utiliza en la prueba
exacta de Fisher para probar la diferencia entre dos proporciones y en muestreos de
aceptación por atributos cuando se toman muestras de un lote aislado de tamaño finito.

La distribución hipergeométrica se define por 3 parámetros: tamaño de la población, conteo


de eventos en la población y tamaño de la muestra.

Página 5 de 15
Por ejemplo, usted recibe un envío de pedido especial de 500 etiquetas. Supongamos que el
2% de las etiquetas es defectuoso. El conteo de eventos en la población es de 10 (0.02 * 500).

Usted toma una muestra de 40 etiquetas y desea determinar la probabilidad de que haya 3 o
más etiquetas defectuosas en esa muestra. La probabilidad de que haya 3 o más etiquetas
defectuosas en la muestra es de 0.0384.

Ejemplo de cálculo de las probabilidades hipergeométrica.

Supongamos que hay diez automóviles disponibles para que usted los pruebe (N = 10) y
cinco de ellos tienen motores turbo (x = 5). Si prueba tres de los vehículos (n = 3), ¿cuál es
la probabilidad de que dos de los tres que probará tengan motores turbo?

La probabilidad de que seleccione exactamente dos automóviles con motores turbo de forma
aleatoria cuando pruebe tres de los diez vehículos es 41.67%.

La diferencia entre las distribuciones hipergeométrica y binomial

Tanto la distribución hipergeométrica como la distribución binomial describen el número de


veces que un evento ocurre en un número fijo de ensayos. Para la distribución binomial, la
probabilidad es igual para cada ensayo. Para la distribución hipergeométrica, cada ensayo
cambia la probabilidad de cada ensayo subsiguiente porque no hay reemplazo.

Utilice la distribución binomial con poblaciones tan grandes que el resultado de una prueba
prácticamente no tiene efecto sobre la probabilidad de que el próximo resultado sea un evento
o un no evento. Por ejemplo, en una población de 100,000 personas, 53,000 tienen sangre
O+. La probabilidad de que la primera persona seleccionada aleatoriamente en una muestra
tenga sangre O+ es 0.530000. Si la primera persona en una muestra tiene sangre O+, entonces
la probabilidad de que la segunda persona tenga sangre O+ es 0.529995. La diferencia entre
Página 6 de 15
estas probabilidades es lo suficientemente pequeña como para ignorarla en la mayoría de las
aplicaciones.

Utilice la distribución hipergeométrica con poblaciones que sean tan pequeñas que el
resultado de un ensayo tiene un gran efecto en la probabilidad de que el próximo resultado
sea un evento o un no evento. Por ejemplo, en una población de 10 personas, 7 personas
tienen sangre O+. La probabilidad de que la primera persona seleccionada aleatoriamente en
una muestra tenga sangre O+ es 0.7000. Si la primera persona en la muestra tiene sangre O+,
entonces la probabilidad de que la segunda persona tenga sangre O+ es 0.66667. La
diferencia puede aumentar a medida que aumenta el tamaño de la muestra. La diferencia
entre estas probabilidades es demasiado grande como para ignorarla en muchas aplicaciones.

DISTRIBUCIÓN UNIFORME

En teoría de probabilidad y estadística, la distribución uniforme continua es una familia de


distribuciones de probabilidad para variables aleatorias continuas, tales que para cada
miembro de la familia, todos los intervalos de igual longitud en la distribución en su rango
son igualmente probables. El dominio está definido por dos parámetros, {\displaystyle a}a y
{\displaystyle b}b, que son sus valores mínimo y máximo respectivamente.

La distribución uniforme se puede imaginar como una línea recta horizontal, por lo que en el
caso de un lanzamiento de moneda que devuelve cara o cola, ambas tienen una probabilidad
de p = 0,50 y se representarían mediante una línea desde el eje y en 0,50.

Hay dos tipos de distribuciones uniformes: discretas y continuas. Los posibles resultados de
una matriz de laminación proporcionan un ejemplo de una distribución uniforme discreta: se
pueden laminar 1, 2, 3, 4, 5 o 6, pero no se pueden laminar 2,3, 4,7 o 5,5. Por tanto, una tirada
de dados genera una distribución aislada con p = 1/6 para cada resultado.

Algunas distribuciones uniformes son continuas en lugar de discretas. Un generador de


números aleatorios ideal se consideraría una distribución uniformemente continua. Con este
tipo de distribución, todos los puntos en el rango continuo entre 0.0 y 1.0 tienen la misma
oportunidad de aparecer, pero hay un número infinito de puntos entre 0.0 y 1.0.

Página 7 de 15
Hay otras distribuciones continuas importantes, como la distribución normal, chi-cuadrado y
la distribución t de Pupila.

El espesor del borde de un componente de una aeronave está distribuido de manera


uniforme entre 0.95 y 1.05 milímetros. Obtenga la función de distribución acumulada
del espesor del borde. Calcule la proporción de bordes cuyo espesor es mayor que 1.02
milímetros. ¿Qué espesor está excedido por el 90% de los bordes? Calcule la medida y
la varianza del espesor del borde.
1
𝑓(𝑥) =
𝑏−𝑎
1
𝑓(𝑥) =
1.05 − 0.95
𝑓(𝑥) = 10

𝑥
𝐹(𝑥) = ∫ 𝑓(𝑢)𝑑𝑢
−∞
𝑥
𝑥
𝐹(𝑥) = ∫ 10𝑑𝑢 = 10𝑢|
0.95 0.95

𝐹(𝑥) = 10𝑥 − 10(0.95)

𝐹(𝑥) = 10𝑋 − 9.5

DISTRIBUCIÓN NORMAL

En estadística y probabilidad se llama distribución normal, distribución de


Gauss, distribución gaussiana o distribución de Laplace-Gauss, a una de las distribuciones
de probabilidad de variable continua que con más frecuencia aparece en estadística y en la
teoría de probabilidades.
Página 8 de 15
La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto de
un determinado parámetro estadístico. Esta curva se conoce como campana de Gauss y es el
gráfico de una función gaussiana.

La importancia de esta distribución radica en que permite modelar numerosos fenómenos


naturales, sociales y psicológicos. Mientras que los mecanismos que subyacen a gran parte
de este tipo de fenómenos son desconocidos, por la enorme cantidad de variables
incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse
asumiendo que cada observación se obtiene como la suma de unas pocas causas
independientes.

De hecho, la estadística descriptiva solo permite describir un fenómeno, sin explicación


alguna. Para la explicación causal es preciso el diseño experimental, de ahí que al uso de la
estadística en psicología y sociología sea conocido como método correlacional.

La distribución normal también es importante por su relación con la estimación por mínimos
cuadrados, uno de los métodos de estimación más simples y antiguos.

Página 9 de 15
Ejercicios de distribución de probabilidad normal estándar

1. Una población normal tiene una medida de 80 una desviación estándar de 14.0
𝑥−𝜇
𝜇 = 80 ; 𝜎 = 14 ; 𝑧 =
𝜎
a) Calcule la probabilidad de un valor localizado entre 75.0 y 90.0 p(74≤x≤90)
90 − 80 10
𝑧= = = 0.71 = 0.7611
14 14
75 − 80 −5
𝑧= = = −0.36 = 0.3594
14 14
P(75≤x≤90) = 0.7611-0.3594 = 0.4017

LA DISTRIBUCION DE POISSON Y LA DISTRIBUCION EXPONENCIAL

La distribución de Poisson

La distribución de Poisson es una distribución de probabilidad discreta que modeliza la


frecuencia de eventos determinados durante un intervalo de tiempo fijado a partir de la
frecuencia media de aparición de dichos eventos. En otras palabras, la distribución de Poisson
es una distribución de probabilidad discreta que, tan solo conociendo los eventos y su
frecuencia media de ocurrencia, podemos saber su probabilidad.

Esta distribución se puede hacer derivar de un proceso experimental de observación en el que


tengamos las siguientes características

Página 10 de 15
 Se observa la realización de hechos de cierto tipo durante un cierto periodo de tiempo o
a lo largo de un espacio de observación
 Los hechos a observar tienen naturaleza aleatoria; pueden producirse o no de una manera
no determinística.
 La probabilidad de que se produzcan un número x de éxitos en un intervalo de amplitud
t no depende del origen del intervalo (Aunque, sí de su amplitud)
 La probabilidad de que ocurra un hecho en un intervalo infinitésimo es prácticamente
proporcional a la amplitud del intervalo.
 La probabilidad de que se produzcan 2 o más hechos en un intervalo infinitésimo es un
infinitésimo de orden superior a dos.
 En consecuencia, en un intervalo infinitésimo podrán producirse 0 o 1 hecho, pero nunca
más de uno.

Dada una variable aleatoria discreta X decimos que su frecuencia se puede aproximar
satisfactoriamente a una distribución de Poisson. A diferencia de la distribución normal, la
distribución de Poisson solo depende de un parámetro, mu

Mu informa del número esperado de eventos que ocurrirán en un intervalo de tiempo fijado.
Cuando se habla de algo “esperado” tenemos que redirigirlo a pensar en la media. Por tanto,
mu es la media de la frecuencia de los eventos.

Tanto la media como la varianza de esta distribución son mu, estrictamente positiva.

Ejemplo:

1.

Suponemos que estamos en temporada de invierno y queremos ir a esquiar antes de


diciembre. La probabilidad que abran las estaciones de esquí antes de diciembre es del 5%.
De las 100 estaciones de esquí, queremos saber la probabilidad de que la estación de esquí
más cercana abra antes de diciembre. La valoración de esta estación de esquí es de 6 puntos.

Los inputs necesarios para calcular la función de probabilidad de densidad de la Poisson son
el conjunto de datos y mu:

Página 11 de 15
 Conjunto de datos = 100 estaciones de esquí.
 Mu = 5% * 100 = 5 es el número de estaciones de esquí esperado dado el conjunto de
datos.

Función de densidad de probabilidad de Poisson

Entonces, la estación más cercana tiene una probabilidad de 14,62% de que abra antes de
diciembre.

2. Ejemplo

En los últimos 600 años se han producido 12 grandes terremotos en Argentina,


Determínese la probabilidad de que se produzcan 2 en los próximos 25 años.

El suceso que vamos a estudiar es los grandes terremotos en Argentina. La probabilidad de


que tenga lugar este suceso será:

Por tanto, el valor promedio de dicho suceso será:

Leyendo atentamente el enunciado llegamos a la conclusión de que se trata de una


distribución de Poisson de parámetro Pois(0.5)

Ahora definimos la siguiente variable aleatoria

X= Sería el numero de terremotos en Argentina.

Página 12 de 15
Y calculamos lo que nos piden:

Solución; P (2 terremotos) = 0.0758

Distribución Exponencial

Utilice la distribución exponencial para modelar el tiempo entre eventos en un proceso


continuo de Poisson. Se presupone que eventos independientes ocurren a una tasa constante.

Esta distribución tiene una amplia gama de aplicaciones, que incluyen el análisis de fiabilidad
de productos y sistemas, teorías de colas y cadenas de Markov.

Por ejemplo, la distribución exponencial se puede utilizar para modelar:

 Cuánto tiempo tarda en fallar un componente electrónico

 El intervalo de tiempo entre las llegadas de clientes a una terminal

 El tiempo que esperan los clientes en fila hasta recibir servicio

 El tiempo hasta que se declara el incumplimiento de un pago (modelos de riesgo de


crédito).

 El tiempo para desintegración de un núcleo radiactivo

La distribución exponencial de 2 parámetros se define por sus parámetros de escala y valor


umbral. El parámetro de valor umbral, θ, si es positivo, desplaza la distribución una distancia
θ a la derecha. Por ejemplo, usted está interesado en estudiar la falla de un sistema con θ =
5. Esto significa que las fallas comienzan a ocurrir solo después de 5 horas de funcionamiento

Página 13 de 15
y no pueden ocurrir antes. En la siguiente gráfica, el parámetro de valor umbral, θ, es igual a
5 y desplaza la distribución 5 unidades a la derecha.

Para la distribución exponencial de 1 parámetro, el valor umbral es cero y la distribución se


define por su parámetro de escala. Para la distribución exponencial de 1 parámetro, el
parámetro de escala es igual a la media.

¿A que nos referimos ‘’Sin Memoria’’?

Una propiedad importante de la distribución exponencial es que no tiene memoria. La


probabilidad de un evento no depende de los ensayos anteriores. Por lo tanto, la tasa de
ocurrencia se mantiene constante.

La propiedad de ausencia de memoria indica que la vida útil restante de un componente no


depende de su antigüedad actual. Por ejemplo, ensayos aleatorios de lanzamientos al aire de
una moneda demuestran la propiedad de ausencia de memoria. Un sistema que experimenta
un desgaste natural y, por lo tanto, tiene más probabilidades de fallar más tarde en su vida
útil no es un sistema sin memoria.

Ejemplo:

Ejercicio 1

Hallar la probabilidad de que una persona tarde más de una hora revisando su correo, si la
distribución de probabilidades es exponencial, con parámetro λ = 0.2.

Solución

Se debe calcular P [x ≥ 60], puesto que 1 hora equivale a 60 minutos y se pide la probabilidad
de que la persona tarde 60 minutos o más en revisar el correo. La probabilidad se calcula con
la misma integral presentada al comienzo, solo cambiando los límites de integración:

Página 14 de 15
El valor obtenido es pequeño, por lo que es muy poco probable que una persona se demore
más de una hora en revisar su correo electrónico.

Conclusiones

 Las distribuciones de probabilidad están clasificas en discretas y continuas.

 La probabilidad mide la frecuencia con la que se obtiene un resultado o conjunto de


resultados al llevar a cabo un experimento aleatorio del que se conocen todos los
resultados posibles; en este sentido se recurre a diferentes distribuciones de
probabilidad como Distribución Binomial, Distribución Hipergeométrica,
Distribución de Poisson, Distribución Exponencial y Distribución Normal.

 La distribución hipergeométrica muestra el numero exitosos de una variable aleatoria


que está contenida en un conjunto R de éxito, donde R está contenido en un conjunto
N y que, a su vez, N este contenido en un conjunto N, es decir, el número de eventos
que implican éxito entre el número de eventos simples posibles, donde si este cociente
tiende a ser muy pequeño será una variable aleatoria hipergeométrica.

 Al llevar a cabo el desarrollo de problemas aplicados con su respectiva formula se


observaron cada uno de los resultados de estos mediante las distribuciones de
probabilidad estudiadas.

Página 15 de 15

También podría gustarte