Distribuciones Muestrales

Distribuciones Muestrales
Msc. Angel Cujia
Universidad del Magdalena

Facultad de Ingeniería
Estadística II
Febrero 2018
Tabla de Contenido
1 Introducción
2 Preliminares
3 Distribuciones Muestrales
4 Distribución Muestral de la Media X̄
5 Distribución Muestral de la Diferencia de Medias X̄1 − X̄2
Caso 1
Caso 2
Caso 3
6 Distribución Muestral de la Proporción p̂
7 Distribución Muestral de la Diferencia de Proporciones p¯1 − p¯2
8 Distribución Muestral de la Varianza s2
9 Bibliografía
Introducción
Las estimaciones en las distribuciones muestrales permiten hacer

inferencia estadística de los parámetros y demás características de
las poblaciones.
Una de las estadísticas mas importantes es la generada por los procesos

de Bernoulli, donde existen dos resultados: éxito y fracaso.
Preliminares
Población: conjunto completo de elementos, con alguna característica

común, objeto de nuestro estudio (personas, objetos, etc.).
Muestra: subconjunto de elementos de la población.
Variable Aleatoria (v.a): es una función que asocia a cada resultado

del espacio muestral un número real.
Parámetro:características o medidas que definen la distribución f (x)

de la población según la v.a. X.
Estadístico: medidas delas v.a. que definen la muestra.

Preliminares
Muestras Aleatorias
Definición
La variable aleatoria X1 ...Xn son una muestra aleatoria de tamaño n
de la población f(x) si X1 ...Xn son variables aleatorias mutuamente
independientes y la función de densidad de probabilidad de cada Xi es
la misma función f (x). Alternativamente X1 ...Xn se llaman variables
aleatorias independientes e idénticamente distribuido con función de
densidad de probabilidad f (x). Esto se abrevia comúnmente como
variables aleatorias iid .
Preliminares
Figura: Inferencia Estadística

Distribuciones Muestrales
Un estadístico de la muestra se podría considerar una variable aleatoria,

al ser una función de variables aleatorias, es decir, podría obtener
diferentes valores dependiendo de la muestra en particular que se elija.
Tendría, por lo tanto, una distribución de probabilidad asociada. A ésta
se le llama distribución muestral del estadístico.
Pero... ¿Qué se estima con una distribución muestral?

Ejemplo Práctico 1
Muestra de pesos (Lb)

Ejemplo Práctico 1
Frecuencias
Ejemplo Práctico 1
Distribución Muestral de la Media X̄
Una de las estadísticas más importantes es la media de un conjunto de

variables aleatorias. Esta estadística tiene un papel muy importante
en problemas de toma de decisiones para medias poblacionales
desconocidas.
Sea X1 , X2 , ..., Xn una muestra aleatoria que consiste de n variables
aleatorias tomadas de una población única con media µ y varianza σ 2 ,
X1 +X2 +...+Xn
entonces, la estadística X̄ = n se define como la media de
las n variables aleatorias o, sencillamente, media muestral.
Cuando la población es Normal con σ 2 conocida.
E (X) = µX̄ = µ Población Finita Población Infinita
2 σ2 2 σ2
Con Reemplazo σX̄ = n σX̄ = n

2 σ2 N −n 2 σ2
Sin Reemplazo σX̄ = n N −1 σX̄ = n
Población Finita & Muestras Grandes n > 30
Teorema
Sea x̄ la media de una muestra aleatoria de tamaño n tomada de una
población con media µ y varianza σ 2 > 0. Supongamos que se cumple
alguna de las siguientes condiciones:
La población es normal y σ 2 conocida (no importa el tamaño de

n).
La población es normal, σ 2 desconocida y n > 30.
La forma de la población es desconocida (o no normal), σ 2
conocida o desconocida y n > 30.
Teorema
Nota: si la varianza es desconocida, se reemplaza la desviación
poblacional σ por la desviación muestral s.
Entonces, la distribución muestral de la media muestral X̄ es normal

con media µX̄ y varianza σX̄ , y la variable aleatoria Z estaría dada
por:
X̄ − µ
Z= q
2
σX̄
E (X) = µX̄ = µ σ 2 Conocida σ 2 Desconocida
2 σ2 2 s2
Con Reemplazo σX̄ = n σX̄ = n

2 σ2 N −n 2 s2 N −n
Sin Reemplazo σX̄ = n N −1 σX̄ = n N −1
Recuerde que puede obviar el factor de correción de población finita si

n/N < 0, 05.
Ejemplo 1
Se fabrica cierto tipo de hilo con una resistencia a la tensión media de

150, 4 libras y una desviación estándar de 11, 5 libras. ¿Cómo cambia
la varianza de la media muestral cuando el tamaño de la muestra
a) aumenta de 121 a 225?

b) disminuye de 784 a 169?
Suponga que el muestreo es aleatorio sin reemplazo de un lote de 1150.

Población Finita & Muestras Pequeñas n < 30
Teorema
Si el muestreo se hace en una población normal con varianza
desconocida y si las muestras seleccionadas son de tamaño n < 30,
entonces, la distribución muestral de la media muestral X̄ es la t de
Student con n − 1 grados de libertad.
Este teorema implica que la variable aleatoria:
X̄ − µ
t=
σX̄
Tiene distribución t con n − 1 grados de libertad. Aquí, X̄ y σX̄ se
calculan de acuerdo a:
E (X) = µX̄ = µ σ 2 Desconocida
2 s2
Con Reemplazo σX̄ = n

2 s2 N −n
Sin Reemplazo σX̄ = n N −1
Ejemplo 2
Suponga que de una población normal con media 20 se toma una

muestra de tamaño 16. Si la desviación estándar muestral es 4,
encuentre la probabilidad de que la media muestral sea estrictamente
mayor que 21.753.
Distribución Muestral de la Diferencia de
Medias X̄1 − X̄2 (MI)
En muchas situaciones prácticas el investigador concentra su

investigación en dos poblaciones. A menudo se desea sacar inferencias
acerca de la diferencia entre dos medias poblacionales.
Un ejemplo podría ser el caso de un agricultor que está considerando el
uso de dos fertilizantes alternativos y está interesado en en la diferencia
de las producciones medias por hectáreas resultantes.
Estudiaremos solo el caso de MUESTRAS INDEPENDIENTES.

El objetivo es determinar la distribución muestral de X̄1 − X̄2 . Se

distinguen tres casos:
Caso 1: Las varianzas poblacionales son conocidas o

desconocidas, pero las muestras son grandes.
Caso 2: Las varianzas poblacionales son desconocidas, pero
iguales, y las muestras son pequeñas.
Caso 3: Las varianzas poblacionales son desconocidas, pero
diferentes, y las muestras son pequeñas.
Caso 1: σ12 , σ22 conocidas o desconocidas & n > 30
Teorema
Sean x̄1 y x̄2 las medias de muestras aleatorias independientes de
tamaños n1 y n2 de poblaciones con medias µ1 , µ2 y varianzas σ1 y
σ2 , respectivamente. Supongamos que se cumple alguna de las
siguientes condiciones::
Ambas poblaciones son normales y ambas varianzas poblaciones

σ12 y σ22 son conocidas (no importa el tamaño de n).
Ambas poblaciones son desconocidas o no normales, ambas
varianzas poblacionales son σ12 y σ22 conocidas o desconocidas y
n1 > 30, n2 > 30.
Teorema
Entonces, la distribución muestral de la diferencia entre dos medias
muestrales estará distribuida normalmente y tendrá una media igual a:
µ1 − µ2
y varianza
σ12 σ2
+ 2
n1 n2

E X̄1 − X̄2 = µX̄1 − µX̄2 = µ1 − µ2
Población Finita Población Infinita
2 σ12 σ22 2 σ12 σ22

Con Reemplazo σX̄ = n1 + n2 σX̄ = n1 + n2
1 −X̄2 1 −X̄2
σ12 σ22 σ12 σ22

2 N1 −n1 N2 −n2 2
Sin Reemplazo σX̄ = N1 −1 × n1 + N2 −1 × n2 σX̄ = n1 + n2
1 −X̄2 1 −X̄2
La variable aleatoria Z tiene tiene una distribución normal estándar

dada por:

X̄1 − X̄2 − (µ1 − µ2 )
Z= q
2
σX̄ −X̄
1 2
Ejemplo 3
En un estudio para comparar los pesos promedios de niños y niñas de

sexto grado en una escuela de instrucción media, se usará una muestra
aleatoria de 20 niños y otra igual de 25 niñas. Se sabe que, tanto para
niños y niñas, los pesos siguen una distribución normal.
El promedio de los pesos de todos lo niños de sexto grado de esa escuela
es de 100 libras y su desviación estándar es de 14.142, mientras que el
promedio de los pesos de todas las niñas del sexto grado es de 85 libras
y su desviación estándar es de 12.247. Encuentre la probabilidad de
que el promedio de los pesos de los 20 niños sea al menos 20 libras más
grande que el de los de las 25 niñas.
Caso 2: σ12 , σ22 desconocidas, iguales & n < 30
Teorema
Supongamos que se cumple alguna de las dos condiciones:
Si σ12 = σ22 = σ 2 y desconocidas.

Si las dos poblaciones son normales o no y los tamaños de las
muestras son pequeños n < 30.
Entonces, la distribución muestral tiene media µ1 − µ2 y varianza

estimada igual a:
2
s2p s2p
σX̄ 1 −X̄2
= +
n1 n2
Siendo s2p la varianza muestral combinada.
Teorema
Dicha varianza combinada está dada por:
(n1 − 1) s21 + (n2 − 1) s22

s2p =
υ
Donde υ = n1 + n2 − 2 grados de libertad.
Teorema
Entonces, la variable aleatoria:

X̄1 − X̄2 − (µ1 − µ2 )
t= q
2
σX̄ −X̄
1 2
Está distribuida según la distribución t de Student con υ grados de

libertad (Se aproxima al entero más cercano).
Ejemplo 4
Suponga que se quieren comparar los precios promedios en millones

de pesos de las casas y de los apartamentos en venta en la ciudad de
Santa Marta. Se sabe que el promedio poblacional de las casas excede
al promedio poblacional de los apartamentos, pero, se quiere partir
de que las medias poblacionales y las varianzas son estadísticamente
iguales y que ambas poblaciones son aproximadamente normales. Para
las muestras de 6 casas se tiene X̄1 = 830,83 con S12 = 722864,17; y
para las muestras de 12 apartamentos se obtuvo X̄2 = 449 con S22 =
125888,5. ¿Cuál es la probabilidad de encontrar una diferencia superior
a la observada en muestras similares?
Caso 3: σ12 , σ22 desconocidas, diferentes & n < 30
Teorema
Supongamos que se cumple alguna de las dos condiciones:
Si σ12 6= σ22 y desconocidas.

Si las dos poblaciones son normales y los tamaños de las
muestras son pequeños n < 30.
Entonces, la distribución muestral tiene media µ1 − µ2 y varianza

estimada igual a:
s21 s2
2
σX̄ 1 −X̄2
= + 2
n1 n2
Teorema
Luego la variaable aleatoria está distribuida según una t de Student
tal que:

X̄1 − X̄1 − (µ1 − µ2 )
t= q
2
σX̄ −X̄ 1 2
y grados de libertad:
2
s21 s22

n1 + n2
υ= 2 2
(s21 /n1 ) (s22 /n2 )
υ1 + υ2
Teorema
Con reemplazo: υk = nk − 1 ... k = 1, 2
nk (Nk −1)
Sin reemplazo: υk = Nk −nk ... k = 1, 2
Distribución Muestral de la Proporción p̂
Distribución Muestral de la Proporción p̂
Supongamos que tenemos una población sobre la que se experimenta

un proceso de Bernoulli. Es decir, se llevan a cabo n ensayos y el
resultado de cada uno de ellos es un éxito o un fracaso. Llamemos p a
la probabilidad de éxito en cada ensayo y q = (1 − p) a la probabilidad
de fracaso.
Distribución Muestral de la Proporción p̄
Definición
Sean Y1 ,Y2 ,..., Yn una muestra aleatoria de tamaño n extraída de una
población, sea X el número de elementos en la muestra que tienen
una característica de interés, se define media como la proporción
muestral, denotada por p̄ así:
X
p̄ = µ =
n
X: éxitos ≡ X1 + X2 , ..., +Xk .
n: tamaño de la muestra.
¿Cómo podemos deducir la media µp̄ y la varianza σp̄2 de la proporción

muestral a partir de los parámetros de la distribución Binomial?
E (X) = np
V (X) = np (1 − p)
Teorema (Teorema de De Moivre-Laplace)

Sea p̄ la proporción de éxitos en una muestra aleatoria de n
observaciones. Si se cumple alguna de las dos condiciones siguientes:
n > 30
np > 5 y n(1 − p) > 5
Entonces, la distribución muestral de la proporción muestral p̄ se

puede aproximar con una distribución normal.
Este teorema implica que la variable aleatoria Z tiene distribución
normal, tal que:
µp̄ − p̄
Z=
σp̄
µp̄ = E (p̄) = p Población Finita Población Infinita
p(1−p) p(1−p)
Con Reemplazo σp̄2 = n σp̄2 = n

N −n p(1−p) p(1−p)
Sin Reemplazo σp̄2 = N −1 n σp̄2 = n
Ejemplo 6
Se toma una muestra de 250 casas de una población de edificios antiguos

para estimar la proporción de casas de este tipo cuya instalación
eléctrica resulta insegura. Supongamos que, de hecho, el 30 % de todos
los edificios de esta población tienen una instalación insegura.Hallar
la probabilidad de que la proporción de edificios de la muestra con
instalación insegura esté entre 0,25 y 0,35.
Ejemplo 7
Una empresa produce artículos de los cuales el 10 % sale defectuoso.

Encuentre la probabilidad de que en una muestra de 40 artículos
tomados sin reemplazamiento de un lote de 150 la proporción de
defectuosos sea más de 15 %.
Proporción p¯1 − p¯2
¿Hay diferencia entre los porcentajes de hombres y mujeres en

posiciones gerenciales?
¿Es mayor el porcentaje de bebederos de gaseosa prefieren Coca cola

que el de los que toman Pepsi?
Dado que estamos interesados en la diferncia poblacional p1 −p2 , parece

lógico estudiar el comportamiento de la variable aleatoria p¯1 − p¯2 .
Teorema
Sea p1 la proporción de éxitos observada en una muestra aleatoria de
tamaño n1 , procedente de una población con proporción p1 de éxitos, y
sea p2 la proporción de éxitos observada en una muestra aleatoria
independiente de tamaño n2 , procedente de una población con
proporción de éxitos p1 y suponiendo que:
n1 > 30 y n2 > 30
n1 p1 > 5, n1 (1 − p1 ) > 5, n2 p2 > 5 y n2 (1 − p2 ) > 5
Entonces la variable aleatoria Z tiene distribución normal estándar:
(p̄1 − p̄2 ) − (p1 − p2 )

Z= q
σp̄21 −p̄2
E (p̄1 − p̄2 ) = p1 − p2 Población Finita Población Infinita
Con Reemplazo σp̄21 −p̄2 = p1 (1−p

n1
1)
+ p2 (1−p
n2
2)
σp̄21 −p̄2 = p1 (1−p
n1
1)
+ p2 (1−p
n2
2)

Sin Reemplazo σp̄21 −p̄2 = N1 −n1
N1 −1 × p1 (1−p
n1
1)
+ NN22−n
−1 ×
2 p2 (1−p2 )
n2 σp̄21 −p̄2 = p1 (1−p
n1
1)
+ p2 (1−p
n2
2)
Ejemplo 8
Los hombres y mujeres adultos radicados en una ciudad grande del

norte de cierto pais difieren en sus opiniones sobre la promulgación
de la pena de muerte para personas culpables de asesinato. Se cree
que el 12 % de los hombres adultos están a favor de la pena de muerte,
mientras que sólo el 10 % de las mujeres adultas lo están. Si se pregunta
a dos muestras aleatorias, una de 150 hombres y otra de 100 mujeres,
su opinión sobre la promulgación de la pena de muerte para personas
culpables de asesinato, determine la probabilidad de que el porcentaje
de hombres a favor sea al menos 3 % mayor que el de mujeres.
Distribución Muestral de la Varianza s2
Supongamos que se extrae una muestra de n observaciones de una

población con media desconocida µ y varianza desconocida σ 2 .
Representaremos las observaciones muestrales por X1 , X2 , ..., Xn . La
varianza poblacional es la esperanza:
h i
2
σ 2 = E (X − µ)
2
Ahora bien la media que nos interesa es la de los (Xi − µ) para i =
1, 2...n y como µ es desconocida, entonces trabajamos con la media
muestral:
h 2 i
σ2 = E Xi − X̄
El supuesto de que la distribución de la población es normal resulta

razonable. En tal caso, puede probarse que la variable aleatoria:
n
P 2
2 Xi − X̄
(n − 1) s
= i=1
σ2 σ2
Sigue una distribución conocida con el nombre de distribución
"ji-cuadrada"(o çhi-cuadrada") χ2 con n − 1 grados de libertad.
Teorema
Si s2 es la varianza de una muestra aleatoria de tamaño n de una
población distribuida normalmente con media µ y varianza sigma2 ,
(n−1)s2
entonces, la distribución muestral de σ2 es una distribución χ2
con n − 1 grados de libertad.
Propiedades de χ2
Esta distribución sólo está definida para valores no negativos de

la variable aleatoria, lo cual resulta adecuado en este contexto, ya
que la varianza muestral no puede ser negativa.
Un miembro concreto de la familia χ2 viene caracterizado por un
único parámetro, al que llamaremos grados de libertad, para el
que habitualmente se usa el símbolo υ. Si una variable aleatoria
sigue una distribución χ2 con υ grados de libertad, se
representará por χ2( υ)
La forma de una distribución χ2 depende del grado de libertad υ.
En consecuencia, hay un número infinito de distribuciones χ2 .
Propiedades de χ2
El área total limitada por la curva de una distribución χ2 y los

ejes es igual a 1.
Las distribuciones χ2 no son simétricas. Tienen colas estrechas
que se extienden a la derecha; esto es, están sesgadas a la derecha.
La media y la varianza de esta distribución son, respectivemente,
el número de grados de libertad y el doble del número de grados
de libertad, es decir:
E χ2υ = υ

V χ2υ = 2υ

Teorema
Sea s2 la varianza de una muestra aleatoria de tamaño n. Entonces,
La distribución muestral de s2 tiene media:
E s2 = σ 2

La varianza de la distribución muestral de s2 depende de la

distribución de la población. Si dicha distribución es normal,
entonces, será igual a:
2σ 4
V s2 =

n−1
Ejemplo 9
Cuando un proceso de producción está funcionando correctamente,

la resistencia en ohmios de los componentes que produce sigue una
distribución normal con desviación típica 3,6. Se toma una muestra
aleatoria de cuatro componentes. ¿Cuál es la probabilidad de que la
varianza muestral sea mayor a 27?
Distribución Muestral de la Razón de Varianzas
s2
Otro método para comparar dos poblaciones es comparar sus varianzas.

En aplicaciones industriales referentes a dos métodos o máquinas para
producir el mismo producto, se utilizan con frecuencia las varianzas y
se las compara con propósitos de control de calidad.
s2
Teorema
Si s21 y s22 son las varianzas de muestras aleatorias independientes de
tamaño n1 y n2 tomadas de poblaciones normales con varianzas σ12 y
σ22 , respectivamente, entonces, la variable aleatoria

s21 σ12
F = 2 2
s2 σ2
Tiene una distribución F de Fisher con υ1 = n1 − 1 y υ2 = n2 − 1
grados de libertad.
s2
Teorema
Siempre se cumple que:
1
F1−α (υ1 , υ2 ) =
Fα (υ1 , υ2 )
s2
La distribución F , al igual que χ2 , tiene una función de densidad

asimétrica, definido sólo para valores no negativos.
s2
Ejemplo 10
En una prueba sobre la efectividad de dos tipos de píldoras para
dormir, A y B, se utilizarán dos grupos independientes de personas
con insomnio. A un grupo de tamaño 61 se le administrará la píldora A
y al otro grupo, de tamaño 41, se le administrará la B, registrándose el
número de horas de sueño de cada individuo participante en el estudio.
Suponiendo que el número de hora de sueño de quienes usan cada
2 2
tipo de píldora se distribuye normalemente y que σA = σB , calcule
la probabilidad de que la razón de las varianzas muestrales de A y B
sea mayor que 1.64.
Bibliografía
CANAVOS, George. Probabilidad y Estadística. Virginia

Commonwealth university.
LLINAS, Humberto; Introducción a la estadística matemática.
MENDENHALL, William; SCHEAFFER, Richard; WACKERLY,

Dennis. Estadística matemática con aplicaciones.
TILANO, Jorge. Guía Resumida de Estadística Matemática.

Distribuciones Muestrales

Cargado por

Copyright:

Formatos disponibles

Distribuciones Muestrales

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Distribuciones Muestrales

Cargado por

Copyright:

Formatos disponibles

Distribuciones Muestrales

Msc. Angel Cujia

Universidad del Magdalena

Las estimaciones en las distribuciones muestrales permiten hacer

Una de las estadísticas mas importantes es la generada por los procesos

Población: conjunto completo de elementos, con alguna característica

Muestra: subconjunto de elementos de la población.

Variable Aleatoria (v.a): es una función que asocia a cada resultado

Parámetro:características o medidas que definen la distribución f (x)

Estadístico: medidas delas v.a. que definen la muestra.

Figura: Inferencia Estadística

Un estadístico de la muestra se podría considerar una variable aleatoria,

Pero... ¿Qué se estima con una distribución muestral?

Muestra de pesos (Lb)

Una de las estadísticas más importantes es la media de un conjunto de

Cuando la población es Normal con σ 2 conocida.

E (X) = µX̄ = µ Población Finita Población Infinita

La población es normal y σ 2 conocida (no importa el tamaño de

Entonces, la distribución muestral de la media muestral X̄ es normal

E (X) = µX̄ = µ σ 2 Conocida σ 2 Desconocida

Recuerde que puede obviar el factor de correción de población finita si

Se fabrica cierto tipo de hilo con una resistencia a la tensión media de

a) aumenta de 121 a 225?

Suponga que el muestreo es aleatorio sin reemplazo de un lote de 1150.

Este teorema implica que la variable aleatoria:

E (X) = µX̄ = µ σ 2 Desconocida

Suponga que de una población normal con media 20 se toma una

En muchas situaciones prácticas el investigador concentra su

Estudiaremos solo el caso de MUESTRAS INDEPENDIENTES.

El objetivo es determinar la distribución muestral de X̄1 − X̄2 . Se

Caso 1: Las varianzas poblacionales son conocidas o

Ambas poblaciones son normales y ambas varianzas poblaciones

Población Finita Población Infinita

2 σ12 σ22 2 σ12 σ22

σ12 σ22 σ12 σ22

La variable aleatoria Z tiene tiene una distribución normal estándar

En un estudio para comparar los pesos promedios de niños y niñas de

Si σ12 = σ22 = σ 2 y desconocidas.

Entonces, la distribución muestral tiene media µ1 − µ2 y varianza

(n1 − 1) s21 + (n2 − 1) s22

Está distribuida según la distribución t de Student con υ grados de

Suponga que se quieren comparar los precios promedios en millones

Si σ12 6= σ22 y desconocidas.

Entonces, la distribución muestral tiene media µ1 − µ2 y varianza

Supongamos que tenemos una población sobre la que se experimenta

¿Cómo podemos deducir la media µp̄ y la varianza σp̄2 de la proporción

Teorema (Teorema de De Moivre-Laplace)

Entonces, la distribución muestral de la proporción muestral p̄ se

µp̄ = E (p̄) = p Población Finita Población Infinita

Se toma una muestra de 250 casas de una población de edificios antiguos

Una empresa produce artículos de los cuales el 10 % sale defectuoso.

¿Hay diferencia entre los porcentajes de hombres y mujeres en

¿Es mayor el porcentaje de bebederos de gaseosa prefieren Coca cola

Dado que estamos interesados en la diferncia poblacional p1 −p2 , parece

Entonces la variable aleatoria Z tiene distribución normal estándar:

(p̄1 − p̄2 ) − (p1 − p2 )

E (p̄1 − p̄2 ) = p1 − p2 Población Finita Población Infinita

Con Reemplazo σp̄21 −p̄2 = p1 (1−p