DISTRIBUCIONES MUESTRALES Semifinal
DISTRIBUCIONES MUESTRALES Semifinal
DISTRIBUCIONES MUESTRALES Semifinal
DISTRIBUCIONES MUESTRALES
1. MUESTREO ALEATORIO
1.1. Población y Parámetros
POBLACIÓN: Se denomina población o universo a la totalidad de personas u objetos que
tienen una o más características medibles o contables de naturaleza cualitativa o
cuantitativa.
PARÁMETROS: Se denominan parámetros a las medidas descriptivas que caracterizan a
la distribución de la población.
Entre otros, los parámetros poblacionales son:
Media : µ
Proporción : π o р
Varianza : σ2
Desviación estándar: σ
2. DISTRIBUCIONES MUESTRALES
Se denomina distribución muestral de una estadística a su distribución de probabilidad.
(𝑋̅ 1 − 𝑋̅ 2 ) − 𝜇𝑋̅ − 𝑋̅
1 2
𝑍= ~ 𝑁(0.1)
√ 𝜎2𝑋̅ − 𝑋̅
1 2
NOTA:
1) Muestras grandes. Ocurre cuando 𝑛1 ≥ 30 y 𝑛2 ≥ 30. En este caso, la
aproximación de 𝑋̅1 − 𝑋̅2 a la normal es muy buena, sin importar si las poblaciones
son discretas o continuas y sin importar sus formas simétricas o asimétricas. Si son
las muestras pequeñas 𝑛1 < 30 y 𝑛2 < 30, no se aplica el TLC en este caso.
2) Si son las dos poblaciones normales, entonces, 𝑋̅1 ~ 𝑁(𝜇1 , 𝜎12 ⁄𝑛1 ) y
𝑋̅2 ~ 𝑁(𝜇2 , 𝜎22 ⁄𝑛2 ) para 𝑛1 ≥ 2 y 𝑛2 ≥ 2. Por lo tanto, se tiene que:
(𝑋̅ 1 − 𝑋̅ 2 ) − (𝜇1 − 𝜇2 )
𝑍= ~ 𝑁(0.1)
√ 𝜎2𝑋̅ − 𝑋̅
1 2
EJEMPLO:
En un estudio para comparar los pesos promedio de jóvenes y señoritas de IV ciclo de la
universidad nacional de Piura, se usará una muestra aleatoria de 20 jóvenes y otras de 25
señoritas. Se sabe que en ambos casos se sigue una distribución normal. El peso promedio
de los jóvenes es de 167 libras y presentan una desviación estándar de 25, mientras que el
peso promedio de las señoritas es de 128 libras y su desviación estándar es de 23 libras.
Encuentre la probabilidad de que el promedio de los pesos de los 20 jóvenes sea al menos
30 libras más grande que el de las 25 señoritas.
SOLUCIÓN:
Datos:
𝜇1 = 167 𝑙𝑖𝑏𝑟𝑎𝑠 𝜎12 = 25 𝑙𝑖𝑏𝑟𝑎𝑠 𝑛1 = 20 𝑗𝑜𝑣𝑒𝑛𝑒𝑠
𝜇2 = 128 𝑙𝑖𝑏𝑟𝑎𝑠 𝜎22 = 23 𝑙𝑖𝑏𝑟𝑎𝑠 𝑛2 = 25 𝑠𝑒ñ𝑜𝑟𝑖𝑡𝑎𝑠
Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de los jóvenes
sea al menos 30 libras mas grande que el de la muestra de las señoritas es:
𝑃(𝑍 ≥ −1.24) = 0.5 + 𝑃 (0 ≤ 𝑍 ≤ 1.24) = 0.5 + 0.3925 = 0.8925
1.5
0.5
0
27 29 31 33 35 37 39 41 43 45 47 49 51
EJEMPLO:
Se han extraído dos muestras aleatorias del mismo tamaño 𝑛, una de la línea 1 y la otra de
la línea 2 de un proceso automático que empaqueta un producto en bolsas cuya
característica medible es el peso en gramos. Se sabe que los pesos de las bolsas de cada
línea se contribuyen según el modelo de probabilidad normal con medias iguales a 120
gramos y con varianzas, también, iguales a 18 gramos2. Obtenga el valor de 𝑛 de manera
que la probabilidad de que las 2 medias muestrales difieran en menos de 2 gramos, sea
0.95.
SOLUCIÓN:
En efecto, la variable aleatoria 𝑋̅1 − 𝑋̅2 tiene las siguientes propiedades:
Media: 𝜇𝑋̅1 − 𝑋̅2 = 𝜇1 − 𝜇2 = 180 − 180 = 0
𝜎12 𝜎2 18 18 36
Varianza: 𝜎𝑋2̅1 − 𝑋̅2 = + 𝑛2 = + =
𝑛1 2 𝑛 𝑛 𝑛
Se debe hallar el valor de 𝑛 de manera que 𝑃[|𝑋̅1 − 𝑋̅2 | < 2] = 0.95. Entonces,
0.95 = 𝑃[|𝑋̅1 − 𝑋̅2 | < 2] =
𝑋̅1 − 𝑋̅2 − 0 2 − 0 2 − 0 √𝑛 √𝑛
= 𝑃 [| |< ] = 𝑃 [𝑍 < ] = 𝑃 [− <𝑍< ],
√36⁄𝑛 √36⁄𝑛 √36⁄𝑛 3 3
√𝑛
𝑖𝑚𝑝𝑙𝑖𝑐𝑎, 𝑃 [𝑍 < ] < 0.975
3
√𝑛
𝑑𝑒 𝑑𝑜𝑛𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎, = 1.96 → √𝑛 = 5.88 → 𝑛 = 34.5744 ≅ 35
3
𝜎21 𝜎22
̅1 − 𝑋̅2 ~𝑁(𝜇1 − 𝜇2 ,
En efecto, la variable aleatoria, 𝑋 + ) y en consecuencia la
𝑛1 𝑛2
𝑝(1−𝑝)
El error estándar o típico de 𝑃̅ es: ET o 𝜎𝑃̅ = √ 𝑛
Si la población es finita de tamaño N y el muestreo es sin reposición el error
estándar (desviación estándar de la distribución hipergeométrica) es:
𝑝(1 − 𝑝) 𝑁 − 𝑛
ET o 𝜎𝑃̅ = √ √
𝑛 𝑁−1
𝑁−𝑛
Observe que si N es grande con respecto a n el factor de corrección 𝑁−1 se aproxima
a la unidad
𝑐−𝑝
Si n es suficientemente grande (𝑛 ≥ 30) 𝑃[𝑃̅ ≤ 𝑐] ≅ 𝑃 [𝑍 ≤ 𝐸𝑇 ]
Sin embargo aproximadamente satisfactorias se obtienen si se introduce el factor de
1
corrección por continuidad 2𝑛. Luego,
1
(𝑐 + 2𝑛) − 𝑝
𝑃[𝑃̅ ≤ 𝑐] ≅ 𝑃 [𝑍 ≤ ]
𝐸𝑇
Observe que las dos expresiones se Z
𝑋 − 𝑛𝑝 𝑃̅ − 𝑝
𝑍= =
√𝑛𝑝(1 − 𝑝) √𝑝(1 − 𝑝)
𝑋 9
𝑃[𝑃̅ = 0.06] = 𝑃 [ = ]
150 150
150
= 𝑃[𝑋 = 9] = ( ) (0.04)9 (0.96)141 = 0.068799
9
1 1
𝑃[𝑃̅ = 0.06] = 𝑃 [0.06 − ≤ 𝑃̅ ≤ 0.06 + ]
2(150) 2(150)
= 𝑃[0.0567 ≤ 𝑃̅ ≤ 0.0633]
8.5 − 6 9.5 − 6
𝑃[𝑃̅ = 0.06] ≅ 𝑃 [ ≤𝑍≤ ]
2.4 2.4
0.05
𝑃 [𝑃̅ < = 0.06]
𝑝
= 1 − 0.6628 = 0.3372
0.05 − 0.06
𝑃[𝑃̅ ≤ 0.05/𝑝 = 0.06] ≅ 𝑃 [𝑍 ≥ ]
0.0237
≅ 𝑃[𝑍 ≥ −0.42] = 0.6628
Solución:
𝑋
Sea 𝑃̅ = 100, la proporción de pacientes que se recuperan en la muestra de 100, donde
X, es el número de pacientes que se recuperan en la muestra de 100. Debido a que el
muestreo es sin reposición, X tiene distribución de probabilidad hipergeométrica
𝐻(𝑁 = 1000, 𝑟 = 400, 𝑛 = 100)
0.3−04
Donde, 𝑃[𝑃̅ ≤ 0.3] ≅ 𝑃 [𝑍 ≤ ] = 𝑃[𝑍 ≤ −2.15] = 0.0158
0.0465
𝑋 − 𝑛𝑝 𝑋 − 100𝑥0.4 𝑋 − 40
𝑍= = =
4.6499
√𝑛𝑝(1 − 𝑝)(𝑁 − 𝑛) √100𝑥0.4𝑥0.6𝑥(1000 − 100)
𝑁−1 1000 − 1
Definición
𝑛1
∑ 𝑋 𝑋𝑖
̅̅̅
𝑃1 = 𝑖=1 = y
𝑛1 𝑛1
Sean 𝑥1 , 𝑥2 , 𝑥𝑛 𝑒 𝑦1 𝑦2 𝑦𝑛
dos muestras aleatorias independientes de 𝑛2
tamaño n1 y n2 seleccionadas ̅̅̅2 = ∑𝑖=1 𝑌 =
𝑃
𝑌𝑖
respectivamente de dos poblaciones 𝑛2 𝑛2
independientes de Bernoulli B(1, p1)y B(1, DONDE :
p2); donde p1 y p2 son las proporciones de X, ~ B (𝑛1 , 𝑝1 ) y Y ~ (𝑛2 , 𝑝2).
éxito en las poblaciones respectivas , sean Entonces , la variable aleatoria ̅̅̅̅
𝑃1 − ̅̅̅̅
𝑃2 𝑡
además las proporciones muestrales : Tienen las propiedades siguientes :
a) Su media es :
b) Su varianza es :
𝑃1 (1 − 𝑃1 ) 𝑝2 (1 − 𝑝2 )
𝜎 2 𝑃̅1−𝑃̅2 = 𝑉(𝑃̅1 − 𝑃̅2 ) = 𝑉(𝑃̅1 ) − 𝑉(𝑃̅2 ) = +
𝑛1 𝑛2
EJEMPLO
Dos amigos Ay B juegan “cara”o “sello” con una moneda. Suponga que en este juego,
cada uno lanza la moneda 35 veces y que uno de ellos gana si obtiene 7 caras más que el
otro. Calcule la probabilidad de que B gane el juego.
Solución:
Sea X el número de caras que saca el jugador A en las 35 tiradas y sea Y el número de
caras que saca el jugador B en las 35 tiradas .
Entonces, cada variable tiene distribución B (35, 0.5); donde p=0.5 es la probabilidad de
obtener cara en cada tirada de los jugadores.
𝑜. 2 − ( 0.5 − 0.5 )
𝑃[ 𝑃̅2 − 𝑃̅1 ≤ 0.2] ≅ 𝑝 𝑍 ≤ = 𝑝[ 𝑍 ≤ 1.67] = 0,9525 .
√0.5𝑥0.5 + 0.5𝑥0.5
[ 35 35 ]
EJEMPLO:
Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren en sus
opiniones sobre la promulgación de la pena de muerte para personas culpables de asesinato.
Se cree que el 12% de los hombres adultos están a favor de la pena de muerte, mientras que
sólo 10% de las mujeres adultas lo están. Si se pregunta a dos muestras aleatorias de 100
hombres y 100 mujeres su opinión sobre la promulgación de la pena de muerte, determine la
probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de las
mujeres.
Solución:
Datos:
𝑃𝐻 = 0.12
𝑃𝑀 = 0.10
𝑛𝐻 = 100
𝑛𝑀 = 100
P (𝑃𝐻 − 𝑃𝑀 ≥ 0.03) =
Se recuerda que se está incluyendo el factor de corrección de 0.5 por ser una distribución
binomial y se está utilizando la distribución normal.
2
(𝑋1 − 𝑋̅)2 + (𝑋2 − 𝑋̅)2 + ⋯ + (𝑋𝑛 − 𝑋̅)2
𝑆 =
𝑛
Ahora en el Teorema de Distribución muestral de la media (𝑋̅) se encontró que 𝐸(𝑋̅) = 𝜇 ,
por lo cual sería bueno también si pudiéramos tener 𝐸(𝑆 2 ) = 𝜎 2 . Siempre que el valor
esperado de un estadístico sea igual al parámetro poblacional correspondiente, decimos que
el estadístico es un estimulador insesgado y que el valor es un estímulo insesgado de este
parámetro. Sin embargo resulta que
𝑛−1 2
𝐸(𝑆 2 ) = 𝜇𝑆2 = 𝜎
𝑛
lo cual es muy cercano a 𝜎 2 sólo para valores grandes de n (𝑛 ≥ 30). Por lo tanto el
estimador insesgado se define por:
2
𝑛−1 2 (𝑋1 − 𝑋̅)2 + (𝑋2 − 𝑋̅)2 + ⋯ + (𝑋𝑛 − 𝑋̅)2
𝑆 = 𝑆 =
𝑛 𝑛−1
𝑆2
𝑋
2 𝜎2
𝑆𝑋
Definimos a como una variable aleatoria muestral de forma que si 𝑇 = 𝑋
𝑆2
𝑆𝑌2 𝑌
𝜎2
𝑌
libertad:
𝑆𝑋2 𝜎𝑌2
𝐹= × 𝑒𝑠𝑡𝑜 𝑒𝑠 𝑓(𝑛𝑋−1,𝑛𝑌−1)
𝑆𝑌2 𝜎𝑋2
Nota 1: Toda vez que se necesite resolver probabilidades, deberemos realizar una
transformación de variables hasta conseguir la forma cómo se define a T para luego utilizar
muestral: cociente de varianzas muestrales debe tomar la forma Tpara tener una
denominador, respectivamente.
Ejemplo
POBLACIÓN X POBLACIÓN Y
𝑛 = 12 𝑛𝑌 = 16
N( 𝜇𝑋 ; 𝜎𝑋 ) N( 𝜇𝑌 ; 𝜎𝑌 )
𝜇𝑋 = 50 𝜇𝑌 = 60
𝜎𝑋2 = 15 𝜎𝑌2 = 20
𝑆𝑋2
𝑃(𝑆𝑋2 > 1,5 × 𝑆𝑌2 ) = 𝑃 ( 2 > 1,5) = ?
𝑆𝑌
Ejemplo 2:
Se está comparando la variabilidad de los I.B-D de dos ríos A y B, que suponemos siguen
estándar muestral de 9.52. Obtener la probabilidad de que la varianza en el río A sea como
POBLACIÓN Y
𝑛𝑌 = 18
POBLACIÓN X
𝑛 = 16
N( 𝜇𝑋 ; 𝜎𝑋 )
𝜎𝑋2 = 9.52
𝑆𝑋2
𝑃(𝑆𝑋2 > 2 𝑆𝑌2 ) = 𝑃 ( 2 > 2) = ?
𝑆𝑌
Propuesto
Una compañía fabrica propulsores para uso en motores de tractores para fines agrícolas.
Una de las operaciones consiste en esmerilar el terminado de una superficie particular con
una aleación de titanio. Pueden emplearse dos métodos de esmerilado y ambos pueden
rugosidad de la superficie. Para ello toma una muestra de 12 partes del primer proceso, la
cual tiene una desviación estándar muestral de 6.52 micropulgadas y una muestra aleatoria
de 15 partes del segundo proceso, la cual tiene una desviación estándar muestral de 4.7
5ta edición,2009.