Distribuciones Muestrales

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 59

Distribuciones Muestrales

Msc. Angel Cujia

Universidad del Magdalena


Facultad de Ingeniería
Estadística II

Febrero 2018
Tabla de Contenido

1 Introducción
2 Preliminares
3 Distribuciones Muestrales
4 Distribución Muestral de la Media X̄
5 Distribución Muestral de la Diferencia de Medias X̄1 − X̄2
Caso 1
Caso 2
Caso 3
6 Distribución Muestral de la Proporción p̂
7 Distribución Muestral de la Diferencia de Proporciones p¯1 − p¯2
8 Distribución Muestral de la Varianza s2
9 Bibliografía
Introducción

Las estimaciones en las distribuciones muestrales permiten hacer


inferencia estadística de los parámetros y demás características de
las poblaciones.

Una de las estadísticas mas importantes es la generada por los procesos


de Bernoulli, donde existen dos resultados: éxito y fracaso.
Preliminares

Población: conjunto completo de elementos, con alguna característica


común, objeto de nuestro estudio (personas, objetos, etc.).

Muestra: subconjunto de elementos de la población.

Variable Aleatoria (v.a): es una función que asocia a cada resultado


del espacio muestral un número real.

Parámetro:características o medidas que definen la distribución f (x)


de la población según la v.a. X.

Estadístico: medidas delas v.a. que definen la muestra.


Preliminares

Muestras Aleatorias

Definición
La variable aleatoria X1 ...Xn son una muestra aleatoria de tamaño n
de la población f(x) si X1 ...Xn son variables aleatorias mutuamente
independientes y la función de densidad de probabilidad de cada Xi es
la misma función f (x). Alternativamente X1 ...Xn se llaman variables
aleatorias independientes e idénticamente distribuido con función de
densidad de probabilidad f (x). Esto se abrevia comúnmente como
variables aleatorias iid .
Preliminares

Figura: Inferencia Estadística


Distribuciones Muestrales

Un estadístico de la muestra se podría considerar una variable aleatoria,


al ser una función de variables aleatorias, es decir, podría obtener
diferentes valores dependiendo de la muestra en particular que se elija.
Tendría, por lo tanto, una distribución de probabilidad asociada. A ésta
se le llama distribución muestral del estadístico.

Pero... ¿Qué se estima con una distribución muestral?


Ejemplo Práctico 1

Muestra de pesos (Lb)


Ejemplo Práctico 1

Frecuencias
Ejemplo Práctico 1
Distribución Muestral de la Media X̄

Una de las estadísticas más importantes es la media de un conjunto de


variables aleatorias. Esta estadística tiene un papel muy importante
en problemas de toma de decisiones para medias poblacionales
desconocidas.
Sea X1 , X2 , ..., Xn una muestra aleatoria que consiste de n variables
aleatorias tomadas de una población única con media µ y varianza σ 2 ,
X1 +X2 +...+Xn
entonces, la estadística X̄ = n se define como la media de
las n variables aleatorias o, sencillamente, media muestral.
Distribución Muestral de la Media X̄

Cuando la población es Normal con σ 2 conocida.

E (X) = µX̄ = µ Población Finita Población Infinita

2 σ2 2 σ2
Con Reemplazo σX̄ = n σX̄ = n

  
2 σ2 N −n 2 σ2
Sin Reemplazo σX̄ = n N −1 σX̄ = n
Distribución Muestral de la Media X̄
Población Finita & Muestras Grandes n > 30

Teorema
Sea x̄ la media de una muestra aleatoria de tamaño n tomada de una
población con media µ y varianza σ 2 > 0. Supongamos que se cumple
alguna de las siguientes condiciones:

La población es normal y σ 2 conocida (no importa el tamaño de


n).
La población es normal, σ 2 desconocida y n > 30.
La forma de la población es desconocida (o no normal), σ 2
conocida o desconocida y n > 30.
Distribución Muestral de la Media X̄
Población Finita & Muestras Grandes n > 30

Teorema
Nota: si la varianza es desconocida, se reemplaza la desviación
poblacional σ por la desviación muestral s.

Entonces, la distribución muestral de la media muestral X̄ es normal


con media µX̄ y varianza σX̄ , y la variable aleatoria Z estaría dada
por:

X̄ − µ
Z= q
2
σX̄
Distribución Muestral de la Media X̄
Población Finita & Muestras Grandes n > 30

E (X) = µX̄ = µ σ 2 Conocida σ 2 Desconocida

2 σ2 2 s2
Con Reemplazo σX̄ = n σX̄ = n

     
2 σ2 N −n 2 s2 N −n
Sin Reemplazo σX̄ = n N −1 σX̄ = n N −1

Recuerde que puede obviar el factor de correción de población finita si


n/N < 0, 05.
Distribución Muestral de la Media X̄
Población Finita & Muestras Grandes n > 30

Ejemplo 1

Se fabrica cierto tipo de hilo con una resistencia a la tensión media de


150, 4 libras y una desviación estándar de 11, 5 libras. ¿Cómo cambia
la varianza de la media muestral cuando el tamaño de la muestra

a) aumenta de 121 a 225?


b) disminuye de 784 a 169?

Suponga que el muestreo es aleatorio sin reemplazo de un lote de 1150.


Distribución Muestral de la Media X̄
Población Finita & Muestras Pequeñas n < 30

Teorema
Si el muestreo se hace en una población normal con varianza
desconocida y si las muestras seleccionadas son de tamaño n < 30,
entonces, la distribución muestral de la media muestral X̄ es la t de
Student con n − 1 grados de libertad.

Este teorema implica que la variable aleatoria:

X̄ − µ
t=
σX̄
Tiene distribución t con n − 1 grados de libertad. Aquí, X̄ y σX̄ se
calculan de acuerdo a:
Distribución Muestral de la Media X̄
Población Finita & Muestras Pequeñas n < 30

E (X) = µX̄ = µ σ 2 Desconocida

2 s2
Con Reemplazo σX̄ = n

  
2 s2 N −n
Sin Reemplazo σX̄ = n N −1
Distribución Muestral de la Media X̄
Población Finita & Muestras Pequeñas n < 30

Ejemplo 2

Suponga que de una población normal con media 20 se toma una


muestra de tamaño 16. Si la desviación estándar muestral es 4,
encuentre la probabilidad de que la media muestral sea estrictamente
mayor que 21.753.
Distribución Muestral de la Diferencia de
Medias X̄1 − X̄2 (MI)

En muchas situaciones prácticas el investigador concentra su


investigación en dos poblaciones. A menudo se desea sacar inferencias
acerca de la diferencia entre dos medias poblacionales.
Un ejemplo podría ser el caso de un agricultor que está considerando el
uso de dos fertilizantes alternativos y está interesado en en la diferencia
de las producciones medias por hectáreas resultantes.

Estudiaremos solo el caso de MUESTRAS INDEPENDIENTES.


Distribución Muestral de la Diferencia de
Medias X̄1 − X̄2 (MI)

El objetivo es determinar la distribución muestral de X̄1 − X̄2 . Se


distinguen tres casos:

Caso 1: Las varianzas poblacionales son conocidas o


desconocidas, pero las muestras son grandes.
Caso 2: Las varianzas poblacionales son desconocidas, pero
iguales, y las muestras son pequeñas.
Caso 3: Las varianzas poblacionales son desconocidas, pero
diferentes, y las muestras son pequeñas.
Distribución Muestral de la Diferencia de
Medias X̄1 − X̄2 (MI)
Caso 1: σ12 , σ22 conocidas o desconocidas & n > 30

Teorema
Sean x̄1 y x̄2 las medias de muestras aleatorias independientes de
tamaños n1 y n2 de poblaciones con medias µ1 , µ2 y varianzas σ1 y
σ2 , respectivamente. Supongamos que se cumple alguna de las
siguientes condiciones::

Ambas poblaciones son normales y ambas varianzas poblaciones


σ12 y σ22 son conocidas (no importa el tamaño de n).
Ambas poblaciones son desconocidas o no normales, ambas
varianzas poblacionales son σ12 y σ22 conocidas o desconocidas y
n1 > 30, n2 > 30.
Distribución Muestral de la Diferencia de
Medias X̄1 − X̄2 (MI)
Caso 1: σ12 , σ22 conocidas o desconocidas & n > 30

Teorema
Entonces, la distribución muestral de la diferencia entre dos medias
muestrales estará distribuida normalmente y tendrá una media igual a:

µ1 − µ2

y varianza

σ12 σ2
+ 2
n1 n2
Distribución Muestral de la Diferencia de
Medias X̄1 − X̄2 (MI)
Caso 1: σ12 , σ22 conocidas o desconocidas & n > 30


E X̄1 − X̄2 = µX̄1 − µX̄2 = µ1 − µ2

Población Finita Población Infinita

2 σ12 σ22 2 σ12 σ22


Con Reemplazo σX̄ = n1 + n2 σX̄ = n1 + n2
1 −X̄2 1 −X̄2

σ12 σ22 σ12 σ22


   
2 N1 −n1 N2 −n2 2
Sin Reemplazo σX̄ = N1 −1 × n1 + N2 −1 × n2 σX̄ = n1 + n2
1 −X̄2 1 −X̄2
Distribución Muestral de la Diferencia de
Medias X̄1 − X̄2 (MI)
Caso 1: σ12 , σ22 conocidas o desconocidas & n > 30

La variable aleatoria Z tiene tiene una distribución normal estándar


dada por:

X̄1 − X̄2 − (µ1 − µ2 )
Z= q
2
σX̄ −X̄
1 2
Distribución Muestral de la Diferencia de
Medias X̄1 − X̄2 (MI)
Caso 1: σ12 , σ22 conocidas o desconocidas & n > 30
Ejemplo 3

En un estudio para comparar los pesos promedios de niños y niñas de


sexto grado en una escuela de instrucción media, se usará una muestra
aleatoria de 20 niños y otra igual de 25 niñas. Se sabe que, tanto para
niños y niñas, los pesos siguen una distribución normal.
El promedio de los pesos de todos lo niños de sexto grado de esa escuela
es de 100 libras y su desviación estándar es de 14.142, mientras que el
promedio de los pesos de todas las niñas del sexto grado es de 85 libras
y su desviación estándar es de 12.247. Encuentre la probabilidad de
que el promedio de los pesos de los 20 niños sea al menos 20 libras más
grande que el de los de las 25 niñas.
Distribución Muestral de la Diferencia de
Medias X̄1 − X̄2 (MI)
Caso 2: σ12 , σ22 desconocidas, iguales & n < 30
Teorema
Supongamos que se cumple alguna de las dos condiciones:

Si σ12 = σ22 = σ 2 y desconocidas.


Si las dos poblaciones son normales o no y los tamaños de las
muestras son pequeños n < 30.

Entonces, la distribución muestral tiene media µ1 − µ2 y varianza


estimada igual a:

2
s2p s2p
σX̄ 1 −X̄2
= +
n1 n2
Siendo s2p la varianza muestral combinada.
Distribución Muestral de la Diferencia de
Medias X̄1 − X̄2 (MI)
Caso 2: σ12 , σ22 desconocidas, iguales & n < 30

Teorema
Dicha varianza combinada está dada por:

(n1 − 1) s21 + (n2 − 1) s22


s2p =
υ
Donde υ = n1 + n2 − 2 grados de libertad.
Distribución Muestral de la Diferencia de
Medias X̄1 − X̄2 (MI)
Caso 2: σ12 , σ22 desconocidas, iguales & n < 30

Teorema
Entonces, la variable aleatoria:

X̄1 − X̄2 − (µ1 − µ2 )
t= q
2
σX̄ −X̄
1 2

Está distribuida según la distribución t de Student con υ grados de


libertad (Se aproxima al entero más cercano).
Distribución Muestral de la Diferencia de
Medias X̄1 − X̄2 (MI)
Caso 2: σ12 , σ22 desconocidas, iguales & n < 30

Ejemplo 4

Suponga que se quieren comparar los precios promedios en millones


de pesos de las casas y de los apartamentos en venta en la ciudad de
Santa Marta. Se sabe que el promedio poblacional de las casas excede
al promedio poblacional de los apartamentos, pero, se quiere partir
de que las medias poblacionales y las varianzas son estadísticamente
iguales y que ambas poblaciones son aproximadamente normales. Para
las muestras de 6 casas se tiene X̄1 = 830,83 con S12 = 722864,17; y
para las muestras de 12 apartamentos se obtuvo X̄2 = 449 con S22 =
125888,5. ¿Cuál es la probabilidad de encontrar una diferencia superior
a la observada en muestras similares?
Distribución Muestral de la Diferencia de
Medias X̄1 − X̄2 (MI)
Caso 3: σ12 , σ22 desconocidas, diferentes & n < 30

Teorema
Supongamos que se cumple alguna de las dos condiciones:

Si σ12 6= σ22 y desconocidas.


Si las dos poblaciones son normales y los tamaños de las
muestras son pequeños n < 30.

Entonces, la distribución muestral tiene media µ1 − µ2 y varianza


estimada igual a:

s21 s2
2
σX̄ 1 −X̄2
= + 2
n1 n2
Distribución Muestral de la Diferencia de
Medias X̄1 − X̄2 (MI)
Caso 3: σ12 , σ22 desconocidas, diferentes & n < 30

Teorema
Luego la variaable aleatoria está distribuida según una t de Student
tal que:

X̄1 − X̄1 − (µ1 − µ2 )
t= q
2
σX̄ −X̄ 1 2

y grados de libertad:
2
s21 s22

n1 + n2
υ= 2 2
(s21 /n1 ) (s22 /n2 )
υ1 + υ2
Distribución Muestral de la Diferencia de
Medias X̄1 − X̄2 (MI)
Caso 3: σ12 , σ22 desconocidas, diferentes & n < 30

Teorema
Con reemplazo: υk = nk − 1 ... k = 1, 2
nk (Nk −1)
Sin reemplazo: υk = Nk −nk ... k = 1, 2
Distribución Muestral de la Proporción p̂
Distribución Muestral de la Proporción p̂

Supongamos que tenemos una población sobre la que se experimenta


un proceso de Bernoulli. Es decir, se llevan a cabo n ensayos y el
resultado de cada uno de ellos es un éxito o un fracaso. Llamemos p a
la probabilidad de éxito en cada ensayo y q = (1 − p) a la probabilidad
de fracaso.
Distribución Muestral de la Proporción p̄

Definición
Sean Y1 ,Y2 ,..., Yn una muestra aleatoria de tamaño n extraída de una
población, sea X el número de elementos en la muestra que tienen
una característica de interés, se define media como la proporción
muestral, denotada por p̄ así:

X
p̄ = µ =
n
X: éxitos ≡ X1 + X2 , ..., +Xk .
n: tamaño de la muestra.
Distribución Muestral de la Proporción p̄

¿Cómo podemos deducir la media µp̄ y la varianza σp̄2 de la proporción


muestral a partir de los parámetros de la distribución Binomial?

E (X) = np

V (X) = np (1 − p)
Distribución Muestral de la Proporción p̄

Teorema (Teorema de De Moivre-Laplace)


Sea p̄ la proporción de éxitos en una muestra aleatoria de n
observaciones. Si se cumple alguna de las dos condiciones siguientes:

n > 30
np > 5 y n(1 − p) > 5

Entonces, la distribución muestral de la proporción muestral p̄ se


puede aproximar con una distribución normal.
Este teorema implica que la variable aleatoria Z tiene distribución
normal, tal que:

µp̄ − p̄
Z=
σp̄
Distribución Muestral de la Proporción p̄

µp̄ = E (p̄) = p Población Finita Población Infinita

p(1−p) p(1−p)
Con Reemplazo σp̄2 = n σp̄2 = n

  
N −n p(1−p) p(1−p)
Sin Reemplazo σp̄2 = N −1 n σp̄2 = n
Distribución Muestral de la Proporción p̄

Ejemplo 6

Se toma una muestra de 250 casas de una población de edificios antiguos


para estimar la proporción de casas de este tipo cuya instalación
eléctrica resulta insegura. Supongamos que, de hecho, el 30 % de todos
los edificios de esta población tienen una instalación insegura.Hallar
la probabilidad de que la proporción de edificios de la muestra con
instalación insegura esté entre 0,25 y 0,35.
Distribución Muestral de la Proporción p̄

Ejemplo 7

Una empresa produce artículos de los cuales el 10 % sale defectuoso.


Encuentre la probabilidad de que en una muestra de 40 artículos
tomados sin reemplazamiento de un lote de 150 la proporción de
defectuosos sea más de 15 %.
Distribución Muestral de la Diferencia de
Proporción p¯1 − p¯2

¿Hay diferencia entre los porcentajes de hombres y mujeres en


posiciones gerenciales?

¿Es mayor el porcentaje de bebederos de gaseosa prefieren Coca cola


que el de los que toman Pepsi?

Dado que estamos interesados en la diferncia poblacional p1 −p2 , parece


lógico estudiar el comportamiento de la variable aleatoria p¯1 − p¯2 .
Distribución Muestral de la Diferencia de
Proporción p¯1 − p¯2

Teorema
Sea p1 la proporción de éxitos observada en una muestra aleatoria de
tamaño n1 , procedente de una población con proporción p1 de éxitos, y
sea p2 la proporción de éxitos observada en una muestra aleatoria
independiente de tamaño n2 , procedente de una población con
proporción de éxitos p1 y suponiendo que:

n1 > 30 y n2 > 30
n1 p1 > 5, n1 (1 − p1 ) > 5, n2 p2 > 5 y n2 (1 − p2 ) > 5

Entonces la variable aleatoria Z tiene distribución normal estándar:

(p̄1 − p̄2 ) − (p1 − p2 )


Z= q
σp̄21 −p̄2
Distribución Muestral de la Diferencia de
Proporción p¯1 − p¯2

E (p̄1 − p̄2 ) = p1 − p2 Población Finita Población Infinita

Con Reemplazo σp̄21 −p̄2 = p1 (1−p


n1
1)
+ p2 (1−p
n2
2)
σp̄21 −p̄2 = p1 (1−p
n1
1)
+ p2 (1−p
n2
2)

   
Sin Reemplazo σp̄21 −p̄2 = N1 −n1
N1 −1 × p1 (1−p
n1
1)
+ NN22−n
−1 ×
2 p2 (1−p2 )
n2 σp̄21 −p̄2 = p1 (1−p
n1
1)
+ p2 (1−p
n2
2)
Distribución Muestral de la Diferencia de
Proporción p¯1 − p¯2

Ejemplo 8

Los hombres y mujeres adultos radicados en una ciudad grande del


norte de cierto pais difieren en sus opiniones sobre la promulgación
de la pena de muerte para personas culpables de asesinato. Se cree
que el 12 % de los hombres adultos están a favor de la pena de muerte,
mientras que sólo el 10 % de las mujeres adultas lo están. Si se pregunta
a dos muestras aleatorias, una de 150 hombres y otra de 100 mujeres,
su opinión sobre la promulgación de la pena de muerte para personas
culpables de asesinato, determine la probabilidad de que el porcentaje
de hombres a favor sea al menos 3 % mayor que el de mujeres.
Distribución Muestral de la Varianza s2

Supongamos que se extrae una muestra de n observaciones de una


población con media desconocida µ y varianza desconocida σ 2 .
Representaremos las observaciones muestrales por X1 , X2 , ..., Xn . La
varianza poblacional es la esperanza:

h i
2
σ 2 = E (X − µ)
2
Ahora bien la media que nos interesa es la de los (Xi − µ) para i =
1, 2...n y como µ es desconocida, entonces trabajamos con la media
muestral:

h 2 i
σ2 = E Xi − X̄
Distribución Muestral de la Varianza s2

El supuesto de que la distribución de la población es normal resulta


razonable. En tal caso, puede probarse que la variable aleatoria:

n
P 2
2 Xi − X̄
(n − 1) s
= i=1
σ2 σ2
Sigue una distribución conocida con el nombre de distribución
"ji-cuadrada"(o çhi-cuadrada") χ2 con n − 1 grados de libertad.
Distribución Muestral de la Varianza s2

Teorema
Si s2 es la varianza de una muestra aleatoria de tamaño n de una
población distribuida normalmente con media µ y varianza sigma2 ,
(n−1)s2
entonces, la distribución muestral de σ2 es una distribución χ2
con n − 1 grados de libertad.
Distribución Muestral de la Varianza s2
Distribución Muestral de la Varianza s2
Propiedades de χ2

Esta distribución sólo está definida para valores no negativos de


la variable aleatoria, lo cual resulta adecuado en este contexto, ya
que la varianza muestral no puede ser negativa.
Un miembro concreto de la familia χ2 viene caracterizado por un
único parámetro, al que llamaremos grados de libertad, para el
que habitualmente se usa el símbolo υ. Si una variable aleatoria
sigue una distribución χ2 con υ grados de libertad, se
representará por χ2( υ)
La forma de una distribución χ2 depende del grado de libertad υ.
En consecuencia, hay un número infinito de distribuciones χ2 .
Distribución Muestral de la Varianza s2
Propiedades de χ2

El área total limitada por la curva de una distribución χ2 y los


ejes es igual a 1.
Las distribuciones χ2 no son simétricas. Tienen colas estrechas
que se extienden a la derecha; esto es, están sesgadas a la derecha.
La media y la varianza de esta distribución son, respectivemente,
el número de grados de libertad y el doble del número de grados
de libertad, es decir:

E χ2υ = υ


V χ2υ = 2υ

Distribución Muestral de la Varianza s2

Teorema
Sea s2 la varianza de una muestra aleatoria de tamaño n. Entonces,

La distribución muestral de s2 tiene media:

E s2 = σ 2


La varianza de la distribución muestral de s2 depende de la


distribución de la población. Si dicha distribución es normal,
entonces, será igual a:

2σ 4
V s2 =

n−1
Distribución Muestral de la Varianza s2

Ejemplo 9

Cuando un proceso de producción está funcionando correctamente,


la resistencia en ohmios de los componentes que produce sigue una
distribución normal con desviación típica 3,6. Se toma una muestra
aleatoria de cuatro componentes. ¿Cuál es la probabilidad de que la
varianza muestral sea mayor a 27?
Distribución Muestral de la Razón de Varianzas
s2

Otro método para comparar dos poblaciones es comparar sus varianzas.


En aplicaciones industriales referentes a dos métodos o máquinas para
producir el mismo producto, se utilizan con frecuencia las varianzas y
se las compara con propósitos de control de calidad.
Distribución Muestral de la Razón de Varianzas
s2

Teorema
Si s21 y s22 son las varianzas de muestras aleatorias independientes de
tamaño n1 y n2 tomadas de poblaciones normales con varianzas σ12 y
σ22 , respectivamente, entonces, la variable aleatoria

s21 σ12
F = 2 2
s2 σ2
Tiene una distribución F de Fisher con υ1 = n1 − 1 y υ2 = n2 − 1
grados de libertad.
Distribución Muestral de la Razón de Varianzas
s2

Teorema
Siempre se cumple que:

1
F1−α (υ1 , υ2 ) =
Fα (υ1 , υ2 )
Distribución Muestral de la Razón de Varianzas
s2

La distribución F , al igual que χ2 , tiene una función de densidad


asimétrica, definido sólo para valores no negativos.
Distribución Muestral de la Razón de Varianzas
s2

Ejemplo 10
En una prueba sobre la efectividad de dos tipos de píldoras para
dormir, A y B, se utilizarán dos grupos independientes de personas
con insomnio. A un grupo de tamaño 61 se le administrará la píldora A
y al otro grupo, de tamaño 41, se le administrará la B, registrándose el
número de horas de sueño de cada individuo participante en el estudio.
Suponiendo que el número de hora de sueño de quienes usan cada
2 2
tipo de píldora se distribuye normalemente y que σA = σB , calcule
la probabilidad de que la razón de las varianzas muestrales de A y B
sea mayor que 1.64.
Bibliografía

CANAVOS, George. Probabilidad y Estadística. Virginia


Commonwealth university.

LLINAS, Humberto; Introducción a la estadística matemática.

MENDENHALL, William; SCHEAFFER, Richard; WACKERLY,


Dennis. Estadística matemática con aplicaciones.

TILANO, Jorge. Guía Resumida de Estadística Matemática.

También podría gustarte