4 MedAmb-DistNorm-DistProm 2023

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 13

UNIVERSIDAD NACIONAL AGRARIA ESTADISTICA APLICADA

PREMAESTRIA EN CIENCIAS AMBIENTALES

ESTADÍSTICA APLICADA

Distribución Normal y distribuciones muestrales


Al igual que las variables discretas, en el caso de variables continuas definidas sobre
cierto espacio muestral se pueden asociar ciertas funciones de probabilidad que tienen un
comportamiento particular conocido.
Existen varias distribuciones de probabilidad continuas, algunas que se estudiarán son:
Distribución Normal, Distribución Chi cuadrado, Distribución T de Student y
Distribución F de Fisher.

1. Distribución Normal.
La variable aleatoria continua (v.a.c.) X tiene una distribución normal con media  y
varianza  2 si su función de densidad es:
1  x 
2

1   
2  
f ( x)  e   x  
2 

Notación: 
X ~ N  X ,  X2  ó X ~ N , 2  
Teorema.
Si 
X ~ N , 2 , entonces E( X )   y Var( X )   2

1.1. Características de la Distribución Normal.


a. Tiene forma acampanada.
b. Es simétrica respecto a la media  .
c. Es asintótica respecto al eje X.

    
  2   2

1
UNIVERSIDAD NACIONAL AGRARIA ESTADISTICA APLICADA
PREMAESTRIA EN CIENCIAS AMBIENTALES

1.2. Distribución Normal Estándar


Si 
X ~ N , 2 , entonces la v.a.c. Z   X    tiene una distribución normal con
media 0 y varianza 1 y su función de densidad es:

z2
1 
f ( z)  e 2
 z
2

1.3. Uso de la tabla de distribución normal estándar.


El valor puntual “a” se encuentra combinado con el valor lateral derecho o izquierdo
(valor entero con décimo) con otro valor superior (valor con centésimo), la intercepción
de esta combinación brinda la probabilidad buscada asociada a este valor.

Nota:
El valor puntual “a” debe tener a lo más dos decimales, debido a que la tabla permite
ubicar sólo los valores con esa cantidad de decimales. Si este valor tuviera más
decimales se debe utilizar un redondeo simple.

Casos:
Consideremos que la variable aleatoria Z tiene una distribución normal estándar

P( Z  a )  P( Z  a) Este valor puede ser ubicado directamente en la tabla.

P( Z  a)  P( Z  a)

2
UNIVERSIDAD NACIONAL AGRARIA ESTADISTICA APLICADA
PREMAESTRIA EN CIENCIAS AMBIENTALES

P( Z  a)  P( Z  a)  1  P( Z  a)  1  P( Z  a)

P( Z  a)  P(Z  a)

P ( a  Z  b)  P ( a  Z  b)  P ( Z  b)  P ( Z  a )
P (a  Z  b)

a b
Ejemplo:

P( Z  1.31)  0.9049
P( Z  2.15)  1  P( Z  2.15)  1  0.9842  0.0158
P(3.30  Z  2.12)  P( Z  2.12)  P( Z  3.30)  0.9830  0.0005  0.9825
P(1.11  Z  1.11)  P( Z  1.11)  P( Z  1.11)  0.8665  0.1335  0.7330
P( Z  a)  0.9251 a  1.44
P( Z  b)  0.1922  1  P( Z  b)  0.1922  P( Z  b)  0.8078  b  0.87

3
UNIVERSIDAD NACIONAL AGRARIA ESTADISTICA APLICADA
PREMAESTRIA EN CIENCIAS AMBIENTALES

Ejemplo:
La duración de un cierto componente electrónico está normalmente distribuida con media
de 850 días y desviación estándar de 45 días.
a. ¿Cuál es la probabilidad que al seleccionar un componente al azar tenga una duración
menor a los 750 días?

Solución:
X: Duración (en días) de cierto componente electrónico
X ~ N (850, (45) 2 )
 X   750  850 
P( X  750)  P    P( Z  2.22)  0.0132
  45 
b. ¿Cuál es la probabilidad de seleccionar un componente al azar tenga una duración de
por lo menos 900 días?
Solución:
 X   900  850 
P( X  900)  1  P  X  900   1  P     1  P( Z  1.11)
  45 
 1  0.8665  0.1335

c. ¿Cuál es la probabilidad de que un componente electrónico elegido al azar tenga una


duración entre los 700 y 1000 días de duración?

P(700  X  1000)  P( X  1000)  P( X  700)


 X   1000  850   X   700  850 
 P    P    P( Z  3.33)  P( Z  3.33)
  45    45 

 0.9996  0.0004  0.9992

d. Un componente electrónico es considerado de baja calidad si su tiempo de duración


es inferior a los 750 días. Si se eligen al azar e independientemente 5 componentes
electrónicos, hallar la probabilidad de que a lo más uno de esos componentes sea
considerado de baja calidad.

Exito   X  750 P( E )    P( X  750)  0.0132

Sea la variable aleatoria discreta (v.a.d.) Y: Número de componentes electrónicos con


 X  750 . La distribución de Y es: Y ~ Bin(5,0.0132)
5  5
P(Y  1)  P(Y  0)  P(Y  1)   0.0132 (0.9868)5   0.0132 (0.9868) 4
0 1

 0 1 

 0.936  0.063  0.999

4
UNIVERSIDAD NACIONAL AGRARIA ESTADISTICA APLICADA
PREMAESTRIA EN CIENCIAS AMBIENTALES

1.4. Distribuciones muestrales asociadas a la Distribución Normal

1.4.1. Definición de Valor Estadístico.

Un valor estadístico es cualquier cantidad cuyo valor se puede calcular a partir de datos
maestrales. Antes de obtener la información, hay incertidumbre en cuanto a cual será el
resultado del valor estadístico.
Por lo tanto un valor estadístico es una variable aleatoria y estará denotada por una letra
mayúscula; una minúscula se emplea para representar el valor calculado del valor
estadístico.

Ejemplo:
La media muestral X es un valor estadístico (variable aleatoria) y x es un valor
calculado.

La varianza muestral S 2 es un valor estadístico (variable aleatoria) y s 2 es un valor


calculado.

1.4.2. Definición de muestra aleatoria.


Se dice que las variables aleatorias X 1 , X 2 , ..., X n forman una muestra aleatoria de
tamaño n si:
a. Las v.a. X i son variables aleatorias independientes.
b. Toda v.a. X i tienen la misma distribución de probabilidad.

Si el muestreo es con reemplazo o de una población infinita (conceptual), las condiciones


1 y 2 se satisfacen exactamente. Si la selección es sin reemplazo la condición de
independencia no se cumple.

Ejemplo.
Los pesos de un artículo tienen distribución normal con media 2 Kg. Y varianza 1.5 Kg2.
Si se extrae una muestra aleatoria de tamaño 10 ( X 1 , X 2 , ..., X 10 ), entonces
X1 ~ N (2,1.5) , X 2 ~ N (2,1.5) , …, X 10 ~ N (2,1.5) .

1.4.3. Distribución de la media o promedio muestral.


Sea X 1 , X 2 , ..., X n una muestra de tamaño n de una distribución con media  y varianza
 2 , entonces:

 Si el muestreo es con reemplazo de una finita o sin reemplazo de una población


infinita, se cumple que:

 
E X  X   y  
Var X    2
X
2
n

5
UNIVERSIDAD NACIONAL AGRARIA ESTADISTICA APLICADA
PREMAESTRIA EN CIENCIAS AMBIENTALES

 Si el muestreo es sin reemplazo de una población de tamaño N, se cumple que:

 
E X  X   y  
Var X   X2 
2  N n
 
n  N 1 
 N n
El factor   se conoce como factor de corrección de población finita.
 N 1 

NOTA: En este curso se trabajará principalmente considerando que la población es de


tamaño infinito (no se va a trabajar con el factor de corrección de corrección finita).

A) Distribución de la media o promedio muestral cuando la variable en análisis


tiene una Distribución Normal.

Si X 1 , X 2 , ..., X n es una muestra aleatoria de tamaño n, donde X i viene de una


distribución normal con media  y varianza  2 , entonces la variable aleatoria X tiene
una distribución normal con media  X y varianza  X (donde la varianza de X depende
2

del tipo de muestreo para que puede ser multiplicado por el factor de corrección de
población finita)

Es decir, si 
X ~ N  X ,  X2  
X ~ N  X ,  X2 
X 
En cambio si se estandariza X tal que Z  ~ N (0,1)
X

B) Distribución d la media o promedio muestral, cuando la variable en análisis no


tiene una distribución normal.

Teorema de Límite Central: Si X es una variable aleatoria con distribución cualquiera


con media  X y varianza  X2 , entonces la muestra aleatoria X 1 , X 2 , ..., X n , con n
suficientemente grande (n  30) tendría un estimador X con una distribución
aproximadamente normal con media  X y varianza  X (donde la varianza de X
2

depende del tipo de muestreo para que pueda ser multiplicado por el factor de corrección
de población finita) tal que
X ~ ??   X ,  X2 
a
y n  30  X ~ N (  X ,  X )
2
Es decir, si

X  a
En cambio si se estandariza X tal que Z  ~ N (0,1)
X

6
UNIVERSIDAD NACIONAL AGRARIA ESTADISTICA APLICADA
PREMAESTRIA EN CIENCIAS AMBIENTALES

Ejemplo.
Los pesos de conejos criados en una granja es una variable aleatoria (v.a.) con media
  5kg. y varianza  2  0.64kg 2 . Suponga que se seleccionan n conejos y sean
X 1 , X 2 , ..., X n sus pesos.

a. Si el peso de los conejos tienen una distribución normal y X 1 , X 2 , ..., X 9 es una


muestra aleatoria de tamaño 9 que fue obtenida con reemplazo. Calcule la
probabilidad que la media de la muestra sea a lo más 5.5 kg.
E( X )   X    5
2 0.64 2 0.64 0.8
Var ( X )   X2   X     0.267
n 9 n 9 3

 X   5.5  5 
P( X  5.5)  P    P( Z  1.87)  0.9693
  0.267 
 X 

b. Si X 1 , X 2 , ..., X 45 es una muestra aleatoria del peso de 45 conejos con media


poblacional igual a 5 kg. y varianza de 0.64 kg2. Se desconoce el tamaño de la
población. Calcule la probabilidad que el peso promedio de los conejos sea menor a
los 4.7 kg.

E( X )   X    5
2 0.64 2 0.64
Var ( X )   X2   X    0.1193
n 45 n 45

 X   4.7  5 
P( X  4.7)  P    P( Z  2.51)  0.006
  0.1193 
 X 

Distribución de la proporción muestral p  


Considere el caso donde no se trabaja con variables cuantitativas sino nominales, como
por ejemplo si la unidad encuestada es casada o no. En el caso de ser una persona casada
la respuesta es 1, y en caso de no ser casada, la respuesta es 0. Si obtenemos una muestra
de tamaño n, el promedio de casados sería algo parecido a lo siguiente:

1  0  0  1  ...  1 número de casados


p 
n tamaño de la muestra

el valor de p vendría a ser una proporción de personas casadas en la muestra. Por lo tanto
el procedimiento a seguir es parecido al caso anterior, utilizando la distribución normal.

7
UNIVERSIDAD NACIONAL AGRARIA ESTADISTICA APLICADA
PREMAESTRIA EN CIENCIAS AMBIENTALES

Cuando la muestra es pequeña (cuando el tamaño de la muestra es  n  30  . Es necesario


utilizar otros tipos de distribución muestral, a parte de la normal. En este caso se verá la
distribución Binomial para el caso de proporciones con reemplazo o cuando el tamaño de
la población N es infinita o desconocida. Cuando el tamaño de la muestra es mayor o
igual que 30, las proporciones muestrales pueden ser aproximadas a una distribución
 (1   )
normal con media  y varianza . También se puede definir el número de
n
X
personas casadas como X, entonces p  , sería la proporción de personas casadas, por
n
lo tanto es también válido decir np  X .
NOTA: En este curso se ven los casos cuando los tamaños de muestra son mayores que
30  n  30  considerando que N es infinito.

Aproximación Normal a la distribución de proporción muestral.

Cuando n es grande (por lo general, n  30), la variable aleatoria p se aproxima a una


distribución normal.
a
  (1   ) 
Si p ~ f ( p ) y n  30  p ~ N   , 
 n 
Considerando que el tamaño de la población N es desconocido o infinito.

Entonces las probabilidades se definen como:


 p  p  
P [ p1  p  p 2 ]  P  1 Z 2 
  p  p 

La varianza cuando el muestreo es con reemplazo se define como:


 (1   )
 2p 
n
Esta varianza también se utiliza cuando se desconoce N o N se considera de tamaño
infinito

La varianza cuando el muestreo es sin reemplazo se define como:

 (1   )  N  n 
 p2   
n  N 1 
NOTA: En este curso se trabajará principalmente considerando que la población es de
tamaño infinito.

8
UNIVERSIDAD NACIONAL AGRARIA ESTADISTICA APLICADA
PREMAESTRIA EN CIENCIAS AMBIENTALES

Ejemplo
En un cierto distrito de una ciudad usualmente el 20% del los ciudadanos compran la
revista A. Si se elige una muestra aleatoria de 100 personas, hallar la probabilidad de que
la proporción muestral de personas que compran la revista A, sea mayor del 17%,
cuando:

 
 p  0.17  0.20 
P( p  0.17)  P   
  (1   ) 0.20(1  0.20) 
 
 n 100 

 
  0.03 
P( p  0.17)  P  Z    P( Z  0.75) 
 0.20(1  0.20) 
 
 100 
 1  P( Z  0.75)  1  0.2266  0.7734

Obtención del tamaño de muestra a partir del promedio μ

Cuando se desea estimar el tamaño de muestra considerando la diferencia máxima entre


el estimador y parámetro, considerado como error de estimación  d  y un nivel de
confianza de 1  
P  X    d   1  

Experimento Binomial
Se dice que un experimento es Binomial si satisface los siguientes supuestos:
a. El experimento consiste en n ensayos de Bernoulli, donde n es fijado de
antemano.
b. La probabilidad de éxito en un ensayo es constante y se denota por P(E )   ,
por lo tanto la probabilidad de fracaso es P(F )  1   .
c. Los ensayos son independientes, por lo que el resultado de cualquier ensayo
particular no afecta el resultado de cualquier otro ensayo.
d. El experimentador está interesado en el número de éxitos y no en el orden en
que ocurren.

Ejemplo:
Una empresa envasa botellas de gaseosa, se tiene conocimiento que de la
producción el 5% se encuentra en mal envasado. El jefe de calidad desea realizar
una inspección para lo cual se selecciona al azar 10 botellas y se mide su contenido.

9
UNIVERSIDAD NACIONAL AGRARIA ESTADISTICA APLICADA
PREMAESTRIA EN CIENCIAS AMBIENTALES

Distribución de la Distribución Binomial.


Dado un experimento Binomial la v.a.d. X se define como el número de éxitos en n
intentos, y su función de probabilidad está dada por:

 n  x
  (1   )
n x
x  0,1,2 n
f ( x)  P( X  x)   x 
0
 c.c.

Notación: X ~ Bin(n,  ) entonces E ( X )  n Var ( X )  n (1   )

Ejemplo:
Un fabricante de piezas garantiza que una caja de las piezas que él produce
contendrá como máximo un defectuoso. Si la caja contiene 10 piezas, y la
experiencia ha demostrado que ese proceso de fabricación produce 5% de piezas
defectuosas, ¿cuál es la probabilidad de que una caja elegida al azar satisfaga la
garantía?

Solución
Sea X: Número de piezas defectuosas.
X Bin(10,0.05), entonces

10 
P( X  x)  f ( x)     0.05  (0.95) n  x x  0,1, 2, 10
x

x 

Para que se cumpla la garantía debe haber a lo más una pieza defectuosa, entonces se pide
calcular

10  10 
P( X  1)  P( X  0)  P( X  1)     0.05  (0.95)100     0.05  (0.95)101
0 1

0  1 

luego =0.599+0.315=0.914

¿Cuál será el número esperado de piezas defectuosas en una caja?

E ( X )   X  n  10(0.05)  0.5 piezas defectuosas

10
UNIVERSIDAD NACIONAL AGRARIA ESTADISTICA APLICADA
PREMAESTRIA EN CIENCIAS AMBIENTALES

Obtención el tamaño de muestra considerando que se conoce la varianza


poblacional.

a. Si el muestreo es con reemplazo.

 2 Z 21 / 2
n
d2
b. Si el muestreo es sin reemplazo

 2 Z 21 / 2 n
n0
n0  n 1
d2 1 0
N

Obtención el tamaño de muestra partir de la proporción

P  p    d   1  

a. Si el muestreo es con reemplazo.

p (1  p ) Z 21 / 2
n
d2
b. Si el muestreo es sin reemplazo.

p (1  p ) Z 21 / 2  n0
n0  n
n 1
d2 1 0
N
Cuando no se tiene información respecto a la proporción muestral, se recurre a
reemplazar el valor de p por 0.5.

11
UNIVERSIDAD NACIONAL AGRARIA ESTADISTICA APLICADA
PREMAESTRIA EN CIENCIAS AMBIENTALES

Ejemplos:
1. El mantenimiento de cuentas puede resultar demasiado costoso, si el promedio de
compra por cuenta baja a cierto nivel. El gerente de un gran almacén de
departamentos desea estimar el promedio de lo comprado mensualmente por los
clientes que usan la cuenta de crédito, con un error de $1500 y una probabilidad
aproximada de 0.95.
a. ¿Cuántas cuentas deberá seleccionar, si se sabe que la desviación estándar es de
$30000, la cual fue obtenida de los balances mensuales de las cuentas de crédito?
1    0.95 d  1500
α
α=0.05
 2 Z21 / 2 (30000)2 Z20.975 (30000)2 (1.96) 2
n    1536.64  1537
d2 (1500) 2 (1500)2
1537 cuentas de muestra.

b. ¿Cuántas cuentas deberá seleccionar, si se sabe que la desviación estándar es de


$30000, la cual fue obtenida de los balances mensuales de las cuentas de crédito,
conociendo que el total de la cuentas, en el mes, es de 10000?

 2 Z21 / 2 (30000) 2 Z20.975 (30000) 2 (1.96)


n0     1536.64  1537
d2 (1500) 2 (1500) 2

n0 1537
n   1332.35  1333
n0  1 1537  1
1 1
N 10000
1333 cuentas de muestra

2. Un auditor desea saber cual es el tamaño mínimo de muestra necesario, con un


nivel de confianza del 95%, para estimar la verdadera proporción de facturas con
error. Supongan que el auditor quiere tener un error de estimación que no exceda
del 2%.

a. Si la población es muy grande, ¿cuál es el tamaño mínimo de la muestra que


va a tomarse, si el auditor estima que la proporción de facturas erróneas es del
de 5%?
1    0.95 p  0.05 d  0.02

12
UNIVERSIDAD NACIONAL AGRARIA ESTADISTICA APLICADA
PREMAESTRIA EN CIENCIAS AMBIENTALES

p(1  p) Z21 / 2 0.05(1  0.05)(1.96) 2


n   456.19  457
d2 (0.02) 2
b. Si la población es muy grande, ¿qué tamaño de muestra tendrá la muestra que
va a tomarse, si el auditor estima que la proporción de facturas erróneas es del
de 5%?, considerando que en total de facturas es de 5000 durante el período
en evaluación.
p(1  p) Z 21 / 2 0.05(1  0.05)(1.96) 2
n0    456.19  457
d2 (0.02) 2

n0 457
n   418.8  419
n0  1 457  1
1 1
N 5000

13

También podría gustarte