Distribuciones-1 Estadística

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 70

Principales distribuciones

Estela Sánchez Rodríguez


Departamento de Estadística e Investigación Operativa.
Universidad de Vigo
e-mail: esanchez@uvigo.es

Curso 2021/2022
Guía docente:

Variables aleatorias discretas y continuas. Media y varianza.


Principales distribuciones discretas y continuas. Modelo
binomial y multinomial. Otros modelos discretos:
hipergeométrico, poisson,... Modelo normal, lognormal
exponencial, chi-cuadrado, t-student, F Fisher-Snedecor
Contenidos:

Variable aleatoria

Variables aleatorias discretas y continuas

Media y varianza

Modelo binomial

Modelo multinomial

Otros modelos discretos: hipergeométrico y poisson

Modelo normal

Modelo lognormal

Modelo exponencial

Modelo chi-cuadrado, t-student y F Fisher-Snedecor


Motivación: Realizar una transformación sobre los elementos
del espacio muestral para convertirlos en números reales y
aprovechar las propiedades de cálculo de R.

Una variable aleatoria (v.a.) es una aplicación X : Ω −→ R


definida adecuadamente.

Ejemplos:
I Número de caras en 100 lanzamientos
I Suma de puntos en el lanzamiento de dos dados
I Tiempo del ganador en una carrera de 100 metros
I Tiempo que tarda un antibiótico en ser eficaz
Variable aleatoria discreta

Una variable aleatoria X se dice que es Discreta si toma a lo


sumo un conjunto numerable de valores con probabilidad
positiva.

Ejemplos:
I Número de parásitos en una tortuga
I Número de bacterias en 1 mm3 de agua
Variable aleatoria discreta
I Soporte (Sop): conjunto de valores que puede tomar

Sop(X ) = {x1 , . . . , xn , . . .}

I Masa de probabilidad

pi = P(X = xi ) > 0

X
pi = 1
i

I Función de distribución Probabilidad acumulada


(analogía con frecuencias acumuladas del tema de
descriptiva)
X
F (x) = pi
xi ≤x
Lanzamiento de dos monedas: masa de probabilidad

X contabiliza el número de caras. Sop(X ) = {0, 1, 2}

1 1 1
p1 = P(X = 0) = , p2 = P(X = 1) = , p3 = P(X = 2) =
4 2 4

0,5

0,25

0 1 2
Función de distribución


 0 x <0

1/4 0≤x <1
F (x) =

 1/4 + 1/2 1 ≤ x < 2

1 x ≥2

0,75

0,25

0 1 2
I La función de distribución es escalonada.
I Los saltos en la función de distribución: pi .
Variable aleatoria continua

Una v.a. X se dice Continua si el conjunto de valores que toma


con probabilidad no nula es infinito no numerable.

Ejemplos:
I altura de una persona
I medidas antropométricas
I tiempo que tarda un paciente en recuperarse
Variable aleatoria continua

I Función de densidad

f (x) ≥ 0 para todo x ∈ R

Z +∞
f (x)dx = 1
−∞

y = f (x)
Z ∞
f (x)dx = 1
−∞

Figura: Una función de densidad.


Función de distribución
I Función de distribución
Z a
F (a) = f (x)dx para todo a ∈ R
−∞

y = f (x)

F (a)

y = F (x)
Comentarios:

I El teorema fundamental del cálculo relaciona la función de


densidad y la función de distribución:

dF (x)
= F 0 (x) = f (x)
dx
I Sea X v.a. continua, P(X = x) = 0
I La función de densidad no indica probabilidad, la
probabilidad viene dada por el área bajo la curva
I Para calcular probabilidades en intervalos aplicamos la
fórmula
Z b
P(a < X ≤ b) = f (x)dx = F (b) − F (a)
a

que se corresponde con el área bajo la curva de la función


de densidad en el intervalo considerado

F (b) − F (a)
y = f (x)

a b
Ejemplos

I Obtener un número al azar en el intervalo [0, 1]. Todos los


puntos tienen probabilidad 0 y sin embargo la probabilidad
de un subintervalo es la longitud correspondiente.
I Sea X con función de densidad f (x) = kx 2 si 0 < x < 2
I Calcula k ( 38 )
I Representa la función de densidad y observa que f (2) = 3
2
R
I P(0 < X < 1) = 1 83 x 2 dx = 38 x3 ]10 = 81 .
3

1,5

1 y = f (x)

0,5

0 1 2
Media de una variable aleatoria


X
I X discreta: µ = xi pi
i=1

X
si |xi |pi < ∞ (la serie sea absolutamente convergente).
i=1
R∞ R∞
I X continua: µ = −∞ xf (x)dx si −∞ |x|f (x)dx <∞
Ejemplo con variables aleatorias discretas
I Con soporte finito
1
p1 = P(X = 0) =
4
1
p2 = P(X = 1) =
2
1
p3 = P(X = 2) =
4

µ = 0 × 1/4 + 1 × 1/2 + 2 × 1/4 = 1.


I Con soporte infinito numerable

1
P(X = 2n−1 ) = ; n = 1, 2, . . .
2n
Comprueba que es una distribución de probabilidad y que
no tiene media.

X ∞ X1
1
µ= 2n−1 n
= =∞
2 2
i=1
Ejemplos con variables aleatorias continuas

I Distribución uniforme
(
1
b−a sia < x < b,
f (x) =
0 en el resto.

a+b
µ=
2
I Ditribución f (x) = 38 x 2 si 0 < x < 2
Z 2
3 3 3 x4 2 3
µ= x dx = ] =
0 8 8 4 0 2
Propiedades de la media: µX = E[X ]

1. Sea una v.a. constante (P(X = k ) = 1 para algún k ∈ R),


entonces E[X ] = k .
2. Sea X una v.a. entonces E[X + k ] = E[X ] + k y
E[kX ] = kE[X ]
3. Sea X una v.a. y h una transformación continua de X ,
entonces h(X ) es una v.a. y
(P
h(xi )pi si X discreta,
E[h(X )] = R
h(x)f (x)dx si X continua.
Aplicación de las propiedades

Consideremos las v.a. Y = 3X + 8 y Z = X 3 siendo X la v.a.


f (x) = 38 x 2 si 0 < x < 2
I µY = 3µX + 8 = 12.5
I En el caso de Z debemos resolver:
Z 2
3 5 3 x6 2
µZ = x dx = ] =4
0 8 8 6 0
Media y exámenes tipo test

Preguntas tipo test. Un examen tipo test con 4 respuestas por


pregunta dónde sólo una de ellas es válida (y no se penaliza el
no contestar ). ¿Cuánto debe restar cada pregunta mal
contestada para que el procedimiento sea justo (es decir, un
alumno que conteste al azar lleve en media 0 puntos)?
X : nota en la pregunta i
(
1 con probabilidad 14
X =
−a con probabilidad 43

1
Entonces E[X ] = 4 − a 34 = 0. Entonces a = 31 .
I Sino restamos a por cada pregunta mal contestada, en
media el alumno llevaría en un examen con 10 preguntas
2.5 sobre 10 (de media).
I Con dos respuestas por pregunta la penalización debe de
ser -1, y con 3 respuestas por pregunta la penalización
debe de ser 21 . Comprueba que con n respuestas por
1
pregunta la penalización es de n−1 . Obviamente esto
responde al hecho de que a más respuestas por pregunta
más difícil es acertar y la penalización por equivocarnos
debe de ser menor.
Varianza y desviación típica

Varianza:

X
I X discreta: Var [X ] = σ 2 = (xi − µ)2 pi
i=1
R∞
I X continua: Var [X ] = −∞ (x − µ)2 f (x)dx

Desviación típica: σ = σ 2

P ROPIEDADES DE LA VARIANZA:
1. Var [k ] = 0
2. Var [X + k ] = Var (X )
3. Var [kX ] = k 2 Var (X )
4. Var [X ] = E[X 2 ] − µ2
Ejemplos

I Ejemplo v.a. discreta:

1 1 1
p1 = P(X = 0) = , p2 = P(X = 1) = , p3 = P(X = 2) =
4 2 4

Var [X ] = 0.5 + 1 − 12 = 0.5


I Ejemplo v.a. continua: f (x) = 38 x 2 si 0 < x < 2
Z 2
3 4 3
Var [X ] = x dx − (3/2)2 = = 0.15
0 8 20
I Si Y = 3X + 8, f (x) = 83 x 2 si 0 < x < 2

σY2 = 9σX2 = 1.35


Modelo binomial

Consideremos el conocido experimento o proceso de


Bernoulli, que se caracteriza por los siguientes elementos:
1. Hay dos categorías o realizaciones posibles (la de un
suceso y su complementario). Denotaremos por suceso el
tener una característica determinada
2. La proporción de elementos que tienen la característica es
constante. Llamaremos p a la probabilidad de tener la
característica y q = 1 − p a la de no tenerla
Ejemplos:
I Elegir un individuo y mirar si tienen una determinada
característica
I Lanzar una moneda y observar si sale cara
I Observar si un paciente desarrolla una determinada
infección
Modelo Binomial, Bi(n,p)
I X mide el número de elementos con la característica
(éxitos) en n pruebas o experimentos de Bernoulli
independientes
Si consideramos el suceso A como individuo que tiene la
característica que se estudia, ¿cuál es la probabilidad de que
en n pruebas aparezcan exactamente x sucesos A? Tenemos
que calcular la probabilidad de todas las tiras
A . . .x . . . AA . . .n−x . . . A
Claramente la probabilidad de cada una de esas tiras es
px q n−x . ¿Cuántas tiras hay? Se corresponde con las
combinaciones
 de n sobre x, es decir, el número combinatorio
n n!
x = x!(n−x)! .

Masa de probabilidad
 Media Varianza
P(X = x) = xn px q n−x np npq
Masa de probabilidad
Masa de probabilidad
0.00 0.05 0.10 0.15 0.20 0.25 0.30
0.00 0.05 0.10 0.15 0.20 0.25 0.30

0
1
2
3
4
Bi(10, 0.2)

Bi(10, 0.8)
Número de éxitos
5
6
7
Máquina de Galton
quincunx

Figura: Esquema de una máquina de Galton.


Triángulo de Pascal y números combinatorios

 
Ejercicio 1

Calcula la probabilidad de que en una familia de 7 hijos, 5


sean varones y 2 hembras

X : el número de varones en familias de 7 hijos ∼ Bi(7, 0.5)

Nos piden
 
7
P(X = 5) = 0.55 0.52 = 0.164
5

n
 n!
Nota: x = x!(n−x)!
Ejercicio 2
Se elige un número del 1 al 6, y se lanza un dado tres veces.
I Si el número sale en las tres tiradas, ganas 3 euros.
I Si el número sale en sólo dos tiradas, 2 euros.
I Si el número sale sólo en una tirada, 1 euros.
I En otro caso, pierdes 1 euro.
Sea X el número de éxitos en 3 tiradas. X ∼ Bi(3, 16 )
 
3 1 0 5 3
P(X = 0) = ( ) ( ) = 0.5787
0 6 6
 
3 1 1 5 2
P(X = 1) = ( ) ( ) = 0.3472
1 6 6
 
3 1 2 5 1
P(X = 2) = ( ) ( ) = 0.0694
2 6 6
 
3 1 3 5 0
P(X = 3) = ( ) ( ) = 0.00463
3 6 6
Continuación ejercicio:

Variable aleatoria ganancia:




 3 si X =3


2 si X =2
Y =

 1 si X =1


−1 si X =0

E[Y ] = 3P(X = 3) + 2P(X = 2) + P(X = 1) − P(X = 0)


−17
= 3 = −0.0787
6
Ejercicio con Excel

I Programa las distribuciones binomiales Bi(10, p) con p


variando de 0.1 a 0.9
I Genera el soporte de la variable aleatoria en una columna
I En la siguiente columna utiliza la función
=DISTR.BINOM(número de éxito;ensayos;probabilidad de
éxito; acumulado)
I El último parámetro acumulado debe ser 0 al calcular la
masa de probabilidad y 1 en el caso de la función de
distribución.
I Representa los diagramas de barras de las masas de
probabilidad
I Observa la simetría si p = 0.5 y el efecto espejo (por
ejemplo con p = 0.2 y p = 0.8)
Modelo Multinomial M(n; p1 , . . . , pk )

I Supongamos la realización de n pruebas independientes


de un experimento aleatorio con k posibles resultados
(A1 , A2 , . . . , Ak ), siendo
k
X
P(A1 ) = p1 , P(A2 ) = p2 , . . . , P(Ak ) = pk tal que pi = 1.
i=1
I Consideremos la variable Xi que mida el número de veces
que ocurre el suceso Ai en las n pruebas, y el vector
aleatorio X = (X1 , X2 , . . . , Xk ).
k
Y
n!
P(X = (x1 , . . . , xk )) = pi xi
x1 !x2 ! . . . xk !
i=1

k
X
siendo 0 ≤ xi ≤ n para todo i y xi = n
i=1
I Se puede comprobar que Xi ∼ Bi(n, pi )
Ejercicio

Después de un vertido tóxico en un parque natural se clasifica


a las aves según la gravedad de las lesiones sufridas: leve
(A1 ), media (A2 ) o grave (A3 ) y se conoce que las
probabilidades de los correspondientes sucesos son
p1 = P (A1 ) = 0.7, p2 = P (A2 ) = 0.2 y p3 = P (A3 ) = 0.1.
1. ¿Cuál es la probabilidad de que elegidas 7 aves tengan 2
defectos leves, 3 defectos medios y 2 defectos graves?
2. Calcula la probabilidad de que entre las póximas tres aves
elegidas haya exactamente una con un defecto grave.
3. En una muestra de 7 aves se obtienen 5 con lesiones
leves, ¿cuál es la probabilidad de que en dicha muestra
haya una ave con lesión grave?
Resolución ejercicio
Sea X1 : número de aves con lesión leve, X2 : número de aves
con lesión media, X3 : número de aves con lesión grave.
1. X = (X1 , X2 , X3 ) ∼ M(7; 0.7, 0.2, 0.1).
7!
P(X = (2, 3, 2)) = (0.7)2 (0.2)3 (0.1)2 = 0.0082
2!3!2!
2. X = (X1 , X2 , X3 ) ∼ M(3; 0.7, 0.2, 0.1). Además
Xi ∼ Bi(3, pi ) (i = 1, 2, 3).
 
3
P(X = (0, 0, 1)) = P(X3 = 1) = 0.1(0.9)2 = 0.243.
1
3. X = (X1 , X2 , X3 ) ∼ M(7; 0.7, 0.2, 0.3).
P(X1 = 5, X3 = 1)
P(X3 = 1|X1 = 5) =
P(X1 = 5)
7! 5
P(X1 = 5, X2 = 1, X3 = 1) 5! (0.7) × 0.2 × 0.1
= = 7
 = 0.444
P(X1 = 5) 5
5 (0.7) (0.3)
2
D
Modelo Hipergeométrico, H(N, n, p = N)

Se utiliza cuando el muestreo se realiza SIN reemplazamiento.


I N: número de elementos que pueden ser elegidos
(población)
I n: tamaño de la muestra que elegimos
I D: número de elementos en la población que tienen la
característica
X : número de éxitos (individuos con la característica) entre n
individuos que se eligen (sin reemplazamiento) de una
población de tamaño N
Modelo Hipergeométrico

Masa de probabilidad Media Varianza


(D)(N−D)
P(X = x) = x Nn−x np npq N−n
N−1
(n)
max{0, n − N + D} ≤ x ≤ min{D, n}

Aproximación por la binomial:

H(N, n, p) ≈ Bi(n, p) si N ≥ 10n y N ≥ 50.


Ejercicio
Cinco ejemplares de una población animal considerados en vía
de extinción en cierta región han sido atrapados, marcados y
puestos en libertad nuevamente. Después de unos días se
atrapa una nueva muestra, sin reemplazamiento, de 7 de estos
animales.
1. ¿Cuál es la probabilidad de que haya más de cuatro
animales marcados, si hay 25 animales de este tipo en la
región?
2. ¿Cuál es la probabilidad de que haya a lo sumo un animal
marcado, si hay 100 animales de este tipo en la región?

X : n de ejemplares marcados entre 7 elegidos sin


reemplazamiento de una población de tamaño 25

X ∼ H(25, 7, 5/25)

5
 20

5
P(X > 4) = P(X = 5) = 25
2 = 0.00039
Continuación ejercicio

Y : número de ejemplares marcados entre 7 elegidos sin


reemplazamiento de una población de tamaño 100

Y ∼ H(100, 7, 5/100)

I Dado que N ≥ 10n podemos aproximar el modelo


hipergeométrico por el binomial. Así, Y ≈ Bi(7, 5/100).
I P(Y ≤ 1) = P(Y = 0) + P(Y = 1) =
7
 0 7 7
 1 6
0 (5/100) (95/100) + 1 (5/100) (95/100) = 0.9556.
Modelo Poisson P(λ)

X mide el número de sucesos (éxitos) en un intervalo


(temporal o espacial) de longitud fija

X ∼ P(λ)
Si λ representa el número medio de sucesos en el intervalo
(0, 1), λt representa el número medio de sucesos en el
intervalo (0, t).

Masa de probabilidad Media Varianza


x
P(X = x) = e−λ λx! λ λ
x = 0, 1, . . .
Modelo Poisson

1. El proceso de Poisson es estable, es decir, produce a


largo plazo, un número medio de sucesos constante λ por
unidad de observación (tiempo, espacio, área, ...)
2. Los sucesos aparecen de forma independiente
3. Este suceso es una generalización a un soporte continuo
del modelo Binomial
Masa de probabilidad

0.00 0.05 0.10 0.15 0.20

0
2
4
6
8
Masa de probabilidad

0.00 0.05 0.10 0.15

0
4
8
12

Masa de probabilidad

0.00 0.02 0.04 0.06 0.08 0.10 0.12


Masas de probabilidad Poisson con λ igual a 3, 5 y 10

5
10 15 20
Ejercicio

Se supone que el número de bacterias por mm3 de agua en un


estanque es una variable aleatoria X con distribución de
Poisson de parámetro λ = 0.5.
1. ¿Cuál es la probabilidad de que en un mm3 de agua del
estanque no haya ninguna bacteria?
2. En 40 tubos de ensayo se toman muestras de agua del
estanque (1 mm3 de agua en cada tubo). ¿Qué
distribución sigue la variable Y = número de tubos de
ensayo, entre los 40, que no contienen bacterias?
3. Si sabemos que en un tubo hay bacterias, ¿Cuál es la
probabilidad de que haya menos de tres?
4. ¿Cuántas bacterias se espera encontrar en 1 litro?
Continuación ejercicio

I Para calcular la probabilidad de que en 1 mm3 no haya


ninguna bacteria tenemos que calcular

P(X = 0) = e−0.5 = 0.606

Por lo tanto es de esperar que el 60.6 % de las veces no


encontremos ninguna bacteria en 1 mm3 .
I La distribución de la variable Y ∼ Bi(40, p) siendo p la
probabilidad de que en un tubo de ensayo no haya
ninguna bacteria, es decir, p = 0.606.
P(0<Y <3) P(Y =1)+P(Y =2)
I P(Y < 3|Y > 0) = P(Y >0) = 1−P(Y =0)
e−0.5 (0.5+1/2(0.5)2 )
= 1−0.606 = 0.962.
I Dado que 1 dm3 es 1 litro y es
equivalente a 106 mm3 ,
tenemos que se esperarán 5 × 105 bacterias.
Modelo Normal, N(µ, σ)

I La conocida distribución normal o campana de Gauss es


una de las más conocidas entre los modelos continuos.
I Se caracteriza por dos parámetros, la media µ y la
desviación típica σ.
I Sirve para modelar prácticamente la totalidad de medidas
físicas (longitudes, pesos,...), errores en aparatos de
medida, ...
I Pensemos por ejemplo en la talla de un recién nacido,
tomará valores entre 46 y 54 cm, pero no con uniformidad,
dado que la mayor parte de ellos se concentrará en torno
al valor de 50 cm.
Modelo normal

Función de densidad Media Varianza


(x−µ)2

f (x) = √ 1 e 2σ 2 µ σ2
2πσ 2
x ∈R
Densidades de N(0, 1), N(2, 1), N(4, 1)

0.4
N(0,1)
N(2,1)
0.3
0.2 N(4,1)
y

0.1
0.0

-4 -2 0 2 4 6 8

x
Densidades de N(0, 1), N(2, 1.5), N(4, 2)

0.4
N(0,1)
N(2,1.5)
0.3
0.2 N(4,2)
y

0.1
0.0

-4 -2 0 2 4 6 8

x
Propiedades de la Normal y tipificación

I Es simétrica respecto a µ dónde alcanza el máximo y en


µ + σ y µ − σ tiene puntos de inflexión
I Sea Y ∼ N(µ, σ), entonces Z = Y −µ σ ∼ N(0, 1)
I P(a ≤ Y ≤ b) = P( a−µ
σ ≤Z ≤
b−µ
σ ) = FZ ( b−µ a−µ
σ ) − FZ ( σ )
Tabla normal N(0, 1)
Distribución de la Normal Estándar Z ∼ N(0, 1).
Z ∞
1 x2
P(Z ≥ zα ) = √ e− 2 dx = α
zα 2π

P( Z • zĮ )=Į

zα 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641
0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451
0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148
0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611
1 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379
1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985
1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681
1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559
1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455
1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294
1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233
2 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183
2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143
2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110
2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084
2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064
2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048
2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036
Manejo tablas Normal

Si Z ∼ N(0, 1), calcula:


I P(Z ≥ 1.5) = 0.0668.
I P(Z ≤ 1.5) = 1 − P(Z > 1.5) = 1 − 0.0668 = 0.9332.
I P(Z ≤ −1.6) = 0.0548.
I P(−1.3 < Z ≤ 0.2) = 1 − P(Z > 0.2) − P(Z ≥ 1.3) =
1 − 0.4207 − 0.0968 = 0.4825
I El valor a tal que: P(0 < Z < a) = 0.2881, entonces
P(Z > a) = 0.5 − 0.2881 = 0.2119, y por tanto a = 0.8.
I El valor a tal que: P(0 < Z < a) = 0.3, entonces
P(Z > a) = 0.2, y por tanto a = 0.84.
I El valor a tal que: P(Z ≤ a) = 0.7422. Comprueba que
a = 0.65.
I El valor a tal que: P(Z ≥ a) = 0.9. Comprueba que
a = −1.28.
Aproximaciones binomial-normal y poisson-normal


I Bi(n, p) ≈ N(np, npq) si n > 30
p
I P(λ) ≈ N(λ, (λ) si λ > 10
Ejemplo:
SeaY ∼ Bi(40, p) siendo p la probabilidad de que en un tubo
de ensayo no haya ninguna bacteria, con p = 0.606. Calcula la
probabilidad de que al menos 20 tubos de ensayo de entre 40
no tengan bacterias.

Bi(40, p) ≈ N(24.26, 3.089)


P(Y ≥ 20) ≈ P(Z ≥ 20−24.26
3.089 ) = P(Z ≥ −1.379)
= 1 − 0.0839 = 0.916.
Teorema Central del Límite (TCL)
Cuando los resultados de un experimento son debidos a un
conjunto muy grande de causas independientes que actúan
sumando sus efectos siendo cada efecto individual de poca
importancia respecto al conjunto, es esperable que los
resultados sigan una distribución normal.

Sean X1 , X2 , . . . , Xn v.a. (con cualquier distribución)


independientes con media y varianza finitas, entonces
n
X n
X
Xi − µi
i=1 i=1
v ≈ N(0, 1)
uXn
u
t σi2
i=1
Teorema Central del Límite

Si además las variables Xi están idénticamente distribuidas


entonces
n
X
Xi − nµ
i=1
√ ≈ N(0, 1)
σ n
Dividiendo por n tenemos,
n
X
Xi
i=1
n − µ√
n ≈ N(0, 1)
σ
es decir,
σ
x ≈ N(µ, √ )
n
Ilustración del TCL

Consideremos las siguientes v.a. relacionadas con el


lanzamiento de 1, 2, 3 y 4 dados.
1. Suma de puntos obtenidos al lanzar un dado
2. Suma de puntos obtenidos al lanzar dos dados
3. Suma de puntos obtenidos al lanzar tres dados
4. Suma de puntos obtenidos al lanzar cuatro dados
Densidad

0.00 0.06 0.12 0 100 250

5
2
3

10
4
5

15
6

Densidad Densidad

0.00 0.06 0.12 0.00 0.10


2

5
4

10
6

15
8

20
10
12
Ejemplo
Una empresa de sueros envasa su producto en botellas que
contienen un volumen medio de 33 cl. con desviación típica de
5 cl. Si las botellas se distribuyen paquetes de 6 unidades,
queremos calcular la probabilidad de que con 10 paquetes se
superen los 2000 cl. de suero.
Sea Xi la variable aleatoria que nos da el volumen, en cl., de
una botella.
X60
S60 = Xi
i=1

es la variable aleatoria que mide el volumen, en cl., de los 10


paquetes de 6 unidades.
Por el teorema central del límite sabemos que S60 se puede
aproximar por una distribución normal X ∼ N(1980, 38.73). Por
lo tanto,

P(S60 > 2000) ≈ P(X > 2000) = 0.3028.


Modelo lognormal

Se denomina distribución lognormal a la distribución de una


variable cuyo logaritmo se distribuye normalmente.
I Si X = lnY ∼ N(µ, σ) entonces Y ∼ LN(µ, σ)

Es útil para modelar:


I la abundancia de especies
I concentraciones ambientales
I pesos moleculares de polímeros
I período de incubación de una enfermedad
I tiempos de supervivencia de un determinado tipo de
pacientes,...
Modelo exponencial, Exp(λ)

Sirve para modelar el tiempo de vida de individuos (debido a


causas impredecibles ó debidas al azar). La tasa de fallo es
constante.
Función de densidad Media Varianza
1 1
f (x) = λe−λx λ λ2
x ≥0

Los tiempos de vida se modelan con variables Weibull ó


Gamma, generalizaciones del modelo exponencial.
Ejemplo

El tiempo de vida, X (en días) de una bacteria tiene la función


de densidad
 1 −x
10 e
k ;x > 0
f (x) =
0 ; en otro caso
k > 0. Calcula:
1. El valor de k .
2. La esperanza de vida de dicha bacteria.
En este caso es fácil observar que la densidad se corresponde
con una exponencial f (x) = λe−λx , por tanto 1/k = λ = 1/10.
Así k = 10. La media es 1/λ = 10 días.
Modelo chi-cuadrado

Sean X1 , X2 , . . . , Xn v.a. independientes N(0, 1)


n
X
χ2n = Xi2
i=1

A n se le denomina grados de libertad.


I E[χ2n ] = n
I Var [χ2n ] = 2n
I Denotaremos por χ2n,α a la abscisa que deja a la derecha
un área igual a α
I TABLAS:
I χ215,0.025 = 27.488
I P(χ219 > a) = 0.025 (a = 32.852)
I P(37.652 < χ225 < a) = 0.04 (a = 44.314)
I Aproximación (ver tablas)
Densidad Densidad
libertad

0.00 0.02 0.04 0.06 0.08 0.0 0.2 0.4 0.6 0.8

0
5

10
10

20
30
20

40
Densidad Densidad

0.00 0.02 0.04 0.06 0.00 0.05 0.10 0.15


0
5
10

10 20 30 40
20

Densidad Densidad

0.00 0.02 0.04 0.00 0.04 0.08


0

10
5

30
10

50
20
χ2 con 1, 5, 10 (primera fila), 15, 20 y 30 (segunda fila) grados de
Tabla chi-cuadrado
!"#$!%&'!() *+ ,- '.!/'&-*$-*0 X ∼ χ2n 1
P(χ2n ≥ χ2n,α ) = α

n\α 23445 2344 2346 2347 2345 2342 2382 2325 23295 2329 2328
8 ! " ! # ! $ ! $ ! " ! $% #!& % '!("$ )! #" )!"$# %!%')
9 ! $ ! # ! " ! )$ !$ ' !#$$ "!% ) )!**$ &!'&( &!(#" *!#$
: ! &# !$$) !$() !#$% !')# !)(" %!#)$ &!($) *!'"( *!('& $$!'")
; !# & !#*& !"#* !"(" !&$$ $! %" &!&&* *!"(( $$!$"' $$!%%( $'!#&&
5 !"$# !))" !&)# !('$ $!$") $!%$ *!#'% $$! & $#!('' $'!'(( $)! (%
< !%&% !(&# $!$'" $!#'& $!%') #!# " $ !%") $#!)*# $"!""* $)! '' $%!($#
7 !*(* $!#'* $!)%" $!%* #!$%& #!('' $#! $& $"! %& $%! $' $%!%## $(!"&)
6 $!'"" $!%"% #! '# #!$( #!&'' '!"* $'!'%# $)!) & $&!)') $(!$%( # ! *
4 $!&') #! (( #!)'# #!& '!'#) "!$%( $"!%(" $%!*$* $*! #' $*!%&* #$!%%%
82 #!$)% #!))( '! )* '!#"& '!*" "!(%) $)!*(& $(!' & # !"(' #$!$%$ #'!# *
88 #!% ' '! )' '!% * '!($% "!)&) )!)&( $&!#&) $*!%&) #$!*# ##!%$( #"!&#)
89 '! &" '!)&$ "!$&( "!" " )!##% %!' " $(!)"* #$! #% #'!''& #"! )" #%!#$&
8: '!)%) "!$ & "!&%) )! * )!(*# &! "# $*!($# ##!'%# #"!&'% #)!"&# #&!%((
8; "! &) "!%% )!'%( )!%#* %!)&$ &!&* #$! %" #'!%() #%!$$* #%!(&' #*!$"$
85 "!% $ )!##* )!*() %!#%# &!#%$ (!)"& ##!' & #"!**% #&!"(( #(!#)* ' !)&(
8< )!$"# )!($# %!%$" %!* ( &!*%# *!'$# #'!)"# #%!#*% #(!(") #*!%'' '#!
87 )!%*& %!" ( &!#)) &!)%" (!%&# $ ! () #"!&%* #&!)(& ' !$*$ ' !**) ''!" *
86 %!#%) &! $) &!* % (!#'$ *!'* $ !(%) #)!*(* #(!(%* '$!)#% '#!'"% '"!( )
84 %!("" &!%'' (!)%& (!* & $ !$$& $$!%)$ #&!# " ' !$"" '#!()# ''!%(& '%!$*$
92 &!"'" (!#% *!#'& *!)*$ $ !()$ $#!""' #(!"$# '$!"$ '"!$& ')! # '&!)%%
98 (! '" (!(*& *!*$) $ !#(' $$!)*$ $'!#" #*!%$) '#!%&$ ')!"&* '%!'"' '(!*'#
99 (!%"' *!)"# $ !% $ !*(# $#!''( $"! "$ ' !($' ''!*#" '%!&($ '&!%)* " !#(*
9: *!#% $ !$*% $$!#*' $$!%(* $'! *$ $"!("( '#! & ')!$&# '(! &% '(!*%( "$!%'(
9; *!((% $ !()% $$!**# $#!" $ $'!("( $)!%)* ''!$*% '%!"$) '*!'%" " !#& "#!*(
95 $ !)# $$!)#" $#!%*& $'!$# $"!%$$ $%!"&' '"!'(# '&!%)# " !%"% "$!)%% ""!'$"
9< $$!$% $#!$*( $'!" * $'!("" $)!'&* $&!#*# ')!)%' '(!(() "$!*#' "#!()% ")!%"#
97 $$!( ( $#!(&* $"!$#) $"!)&' $%!$)$ $(!$$" '%!&"$ " !$$' "'!$*) ""!$" "%!*%'
96 $#!"%$ $'!)%) $"!("& $)!' ( $%!*#( $(!*'* '&!*$% "$!''& ""!"%$ ")!"$* "(!#&(
94 $'!$#$ $"!#)% $)!)&" $%! "& $&!& ( $*!&%( '*! (& "#!))& ")!&## "%!%*' "*!)((
:2 $'!&(& $"!*)' $%!' % $%!&*$ $(!"*' # !)** " !#)% "'!&&' "%!*&* "&!*%# ) !(*#
Distribución T de Student

Sean X , X1 , X2 , . . . , Xn v.a. independientes N(0, 1)

X
Tn = q
χ2n
n

A n se le denomina grados de libertad.


n
I E[Tn ] = 0(n > 1), Var [Tn ] = n−2 (n > 2)
q
I n > 30, Tn ∼ N(0, n−2 n
)
I Tiene más dispersión que la normal y menos curtosis
I Denotaremos por tn,α al valor de la abscisa que deja a la
derecha un área igual a α
Tabla T de Student

I t14,0.025 = 2.145
I P(T7 < 2.365) = 0.975
I P(T24 > 1.318) = 0.10
I P(−1.356 < T12 < 2.179) = 0.875
I P(T17 > −2.567) = 0.99
I P(−a < T24 < a) = 0,90, a = 1.711
I P(a < T23 < 2.807) = 0.095, a = 1.319
T de Student con 1 y 5 grados de libertad, y N(0, 1) (en azul)

0.4
0.3
0.2
0.1
0.0

-4 -2 0 2 4
Tabla T de Student
!"#$!%&'!() *+ ,- # *+ .#&*+)# X ∼ tn /
P(tn ≥ tn,α ) = α

n\α 0120 0130 0140 0150 0106 01046 0105 01006 01005 010006
5 !"#$ !%#% &!"%' "! %( '!"&) &#!% ' "&!(#& '"!'$% "&(!" * '"'!'&*
4 !#(* !'&% &! '& &!((' #!*# )!" " '!*'$ *!*#$ ##!"#% "&!$**
3 !#%% !$() !*%( &!'"( #!"$" "!&(# )!$)& $!()& & !#&$ &#!*#)
2 !#%& !$'* !*)& &!$"" #!&"# #!%%' "!%)% )!' ) %!&%" (!'&
6 !#'% !$$* !*# &!)%' #! &$ #!$%& "!"'$ )! "# $!(*" '!('*
7 !#'$ !$$" !* ' &!)) &!*)" #!))% "!&)" "!% % $!# ( $!*$*
8 !#'" !$)* !(*' &!)&$ &!(*$ #!"'$ #!**( "!)** )!%($ $!) (
9 !#'# !$)' !((* &!"*% &!(' #!" ' #!(*' "!"$$ )!$ & $! )&
: !#'& !$)" !((" &!"(" &!("" #!#'# #!(#& "!#$ )!#*% )!%(&
50 !#' !$)# !(%* &!"%# &!(&# #!##( #!%') "!&'* )!&)) )!$(%
55 !#' !$) !(%' &!"'" &!%*' #!# & #!%&( "!& ' )! #$ )!)"%
54 !#$* !$"* !(%" &!"$' &!%(# #!&%* #!'(& "! $$ "!*" )!"&(
53 !#$* !$"( !(% &!"$ &!%%& #!&' #!'$ "! &# "!($# )!##&
52 !#$( !$"% !('( &!")$ &!%'& #!&)$ #!'#) #!*%% "!%(% )!&)
56 !#$( !$"' !('' &!")& &!%$" #!&"& #!' # #!*)% "!%"" )! %"
57 !#$( !$"$ !('$ &!""% &!%)' #!&# #!$(" #!*#& "!'(' )! &$
58 !#$% !$") !('" &!""" &!%) #!&& #!$'% #!(*( "!')' "!*'$
59 !#$% !$") !('# &!"" &!%") #!& & #!$$# #!(%( "!'& "!*##
5: !#$% !$"" !('& &!"#( &!%#* #! *" #!$"* #!('& "!$%* "!(("
40 !#$% !$"" !(' &!"#$ &!%#$ #! (' #!$#( #!()$ "!$$# "!($
45 !#$% !$"# !($* &!"#" &!%#& #! ( #!$&( #!("& "!$#% "!(&*
44 !#$' !$"# !($( &!"#& &!%&% #! %) #!$ ( #!(&* "!$ $ "!%*#
43 !#$' !$"# !($( &!"&* &!%&) #! '* #!$ #!( % "!)($ "!%'(
42 !#$' !$"& !($% &!"&( &!%&& #! ') #!)*# #!%*% "!)'% "!%)$
46 !#$' !$"& !($' &!"&' &!% ( #! ' #!)($ #!%(% "!)$ "!%#$
47 !#$' !$"& !($' &!"&$ &!% ' #! $' #!)%* #!%%* "!)"$ "!% %
48 !#$' !$"& !($$ &!"&) &!% " #! $# #!)%" #!%%& "!)#& "!'*
49 !#$' !$" !($$ &!"&" &!% & #! )( #!)'% #!%'" "!) ( "!'%)
4: !#$' !$" !($) &!"&& &!'** #! )$ #!)'# #!%$' "!"*' "!'$*
30 !#$' !$" !($) &!"& &!'*% #! )# #!)$% #!%$ "!"($ "!')'
20 !#$$ !$#* !($& &!" " &!'() #! #& #!)#" #!% ) "!" % "!$$&
60 !#$$ !$#( !()* &!#** &!'%' #! * #!) " #!'%( "!#'& "!)*'
70 !#$) !$#% !()( &!#*' &!'%& #! #!"* #!'' "!#"# "!)'
90 !#$) !$#' !()' &!#*# &!'') &!** #!"%) #!'"* "!&*$ "!)&'
500 !#$) !$#' !()$ &!#* &!'' &!*() #!"') #!'#' "!&%) "!"*
Distribución F de Fisher-Snedecor

X ∼ χ2n e Y ∼ χ2m independientes,


χ2n
n
Fn,m =
χ2m
m

Las distribuciones χ2 , T y F se utilizan, fundamentalmente, en


los temas de inferencia.
Cálculo de probabilidades con Excel

I Si X es discreta:
P(X = a) = DISTR.VARIABLE(a; parametros; 0)
I P(a < X ≤ b) = F (b) − F (a) =
DISTR.VARIABLE(b; parametros; 1) −
DISTR.VARIABLE(a; parametros; 1)
I P(a ≤ X ≤ b) = P(a < X ≤ b) + P(X = a)
I Idem con el resto
I Si X es continua:
P(a < X ≤ b) = P(a ≤ X ≤ b) = P(a < X < b) = P(a ≤
X < b) = DISTR.VARIABLE(b; parametros; 1) −
DISTR.VARIABLE(a; parametros; 1)
VARIABLE y parametros deben ser sustituidos por los valores
correspondientes
App de principales distribuciones para tablet/pc/teléfono

En la página web

http://esanchez.webs.uvigo.es/statsapp/index2.html

se encuentra una sencilla aplicación para calcular


probabilidades y funciones de distribución de algunas de los
modelos aquí estudiados. Es interesante observar como
cambia la forma de la masa de probabilidad y de la densidad al
variar los parámetros del modelo.

También podría gustarte