MAE
MAE
MAE
I.A.
Título: MUESTREO ALEATORIO
ESTRATIFICADO.
Ciclo: V
Profesor: Leyva Haro, Sergio.
Alumna:
Chavez Torres, Fernando Jesus. 1519510025
Mateo Tagle, Diego Alberto. 1519510097
Mori Gamarra, Coraima Diane. 1519510034
Rayme Caballero, Evelyn Maylil. 1519520226
Tejeda Berrios, Cynthia Julissa. 1519530015
Vega Rojas, Judith Jaquelyn. 1519520109
CONTENIDO:
2
I. DEFINICIÓN............................................................................................................................. 3
II. CARACTERÍSTICAS .............................................................................................................. 3
III. PASOS DE SELECCIÓN PARA UN MUESTREO ESTRATIFICADO .............................. 3
IV. NOTACIÓN ADICIONAL PARA MUESTREO ALEATORIO ESTATIFICADO ............. 4
V. FÓRMULAS ............................................................................................................................ 4
VI. PROBLEMAS......................................................................................................................... 8
VII. VENTAJAS Y DESVENTAJAS DEL MUESTREO ALEATORIO ESTRATIFICADO
(MAE) EN COMPARACION CON EL MIA ............................................................................ 20
VIII. BIBLIOGRAFÍA ................................................................................................................ 21
I. DEFINICIÓN
El muestreo estratificado es un procedimiento de muestreo en el que el objetivo de la población
se separa en segmentos exclusivos, homogéneos (estratos), y luego una muestra irrestricta
aleatoria simple se selecciona de cada segmento (estrato). Las muestras seleccionadas de los
diversos estratos se combinan en una sola muestra.
3
El uso del muestreo aleatorio estratificado reduce el error muestral, mejorando la precisión de
nuestros resultados al realizar un estudio sobre la muestra. Requiere información auxiliar de una
o varias variables o atributos para estratificar las unidades poblacionales (Género).
II. CARACTERÍSTICAS
Es eficiente para poblaciones heterogéneas.
Reduce el costo del muestreo al reducir los tamaños de la muestra sin que ello haga
perder precisión.
Forma parte de los diseños muestrales más complejos.
Existe independencia en la selección de la muestra en cada estrato.
Es más costoso que el MAS.
Bien usado éste método produce errores de muestreo más bajos.
Estimador de la 1
media 𝑦ത𝑠𝑡 = 𝑁𝑖 𝑦ത𝑖
𝑁
ESTIMADOR DE LA MEDIA
poblacional 𝜇:
Varianza 1 𝑁𝑖 − 𝑛𝑖 𝑠𝑖2
estimada de 𝑦ത𝑠𝑡 ) =
𝑉( 𝑁𝑖2
𝑁 2 𝑁𝑖 𝑛𝑖
𝑦ത𝑠𝑡 :
Límite para el
1 𝑁𝑖 − 𝑛𝑖 𝑠𝑖2
error de 𝑦ത𝑠𝑡 ) = 2
2 𝑉( 𝑁𝑖2
estimación: 𝑁 2 𝑁𝑖 𝑛𝑖
Estimador de la 1
ESTIMADOR DE LA PROPORCIÓN
media 𝑃𝑠𝑡 = 𝑁𝑖 𝑃𝑖
poblacional P: 𝑁
Varianza 1
𝑠𝑡 ) = 2 𝑁𝑖 − 𝑛𝑖 𝑃𝑖 𝑄𝑖
estimada de 𝑉(𝑃 𝑁𝑖
𝑃𝑠𝑡 : 𝑁2 𝑁𝑖 𝑛𝑖 − 1
Límite para el
1 𝑁𝑖 − 𝑛𝑖 𝑃𝑖 𝑄𝑖
error de 𝑠𝑡 ) = 2
2 𝑉(𝑃 𝑁𝑖2
estimación: 𝑁 2 𝑁𝑖 𝑛𝑖 − 1
Estimador del 𝑙
total 𝜏: 𝜏𝑠𝑡 = 𝑁𝑦ത𝑠𝑡 = 𝑁𝑖 𝑦𝑖
1
Varianza 𝑁𝑖 − 𝑛𝑖 𝑠𝑖2
ESTIMADOR TOTAL
estimada de 𝑉 𝑁 𝑦ത𝑠𝑡 = 𝑁 2 𝑉(
𝑦ത𝑠𝑡 ) = 𝑁𝑖2
𝑁𝑦ത𝑠𝑡 : 𝑁𝑖 𝑛𝑖
Límite para el
𝑁𝑖 − 𝑛𝑖 𝑠𝑖2
error de 𝑦ത𝑠𝑡 ) = 2 𝑁𝑖2
2 𝑉(𝑁
estimación: 𝑁𝑖 𝑛𝑖
𝑛𝑖 = 𝑛𝑤𝑖
TAMAÑO DE
MUESTRA n
ESTRATOS
donde: i = 1, 2, 3, …, L
A LOS
𝑛=
𝑁 2 𝐷 + σ 𝑁𝑖 𝜎𝑖2 𝐵2
𝑃𝑎𝑟𝑎 𝑒𝑠𝑡𝑖𝑚𝑎𝑟 𝜇 ∶ 𝐷 =
TAMAÑO DE MUESTRA
4
APROXIMADA PARA
𝐵2
LÍMITE DE ERROR
𝑃𝑎𝑟𝑎 𝑒𝑠𝑡𝑖𝑚𝑎𝑟 𝜏 ∶ 𝐷 =
4𝑁 2
σ 𝑁𝑖2 𝑃𝑖 𝑄𝑖 /𝑤𝑖 Donde:
𝑛=
𝑁 2 𝐷 + σ 𝑁𝑖 𝑃𝑖 𝑄𝑖 𝐵2
𝑃𝑎𝑟𝑎 𝑒𝑠𝑡𝑖𝑚𝑎𝑟 𝑃: 𝐷 =
4
ASIGNACIONES:
Según la cantidad de elementos de la muestra que se han de elegir de cada uno de los estratos,
cada división puede originar una varianza diferente para la media muestral. El objetivo del
diseño de encuesta por muestreo es proporcionar estimadores con varianzas pequeñas al
menor costo posible. El mejor esquema de asignación está influido por tres factores:
1. El número total de elementos en cada estrato
2. La variabilidad de las observaciones dentro de cada estrato
3. El costo por obtener una observación de cada estrato.
N i
2
i
2
/ wi
Tamaño de muestra requerida para estimar µ o n
con un límite B para el error de estimación:
N 2 D N i i2
B2 6
D ; Para estimar
4
B2
D ; Para estimar
4N 2
N / c
n n
Asignación que minimiza el costo para el valor fijo
i i i
de V(𝑦ത𝑠𝑡 ) o que minimiza V(𝑦ത𝑠𝑡 ) =para un costo
fijo:
i
N / c
k k k
Donde:
Ni denota el tamaño del estrato i-th,
σi denota la desviación estándar poblacional pare el estrato i-th y
ci denota el costo para obtener una observación individual del i-th estrato.
L L
( N k k / ck )( N i i ci )
n k 1
L
i 1
N 2 D N i i2
i 1
L
( N i i ) 2
En la asignación de Neyman, la ecuación: n i 1
L
N 2 D N i i2
i 1
𝒄𝟏 = 𝒄𝟐 = ⋯ = 𝒄𝑳 ; 𝝈𝟏 = 𝝈𝟐 = ⋯ = 𝝈𝑳
N
ni n L i n i
En la asignación Proporcional: N
N
Ni
i 1
N i Pi Qi / ci
Asignación aproximada que minimiza el costo: ni n L
N
K 1
k Pk Qk / ck
𝑁1 𝑁2
𝑦ത𝑠𝑡 = 𝑦ത1 + 𝑦ത
𝑁 𝑁 2
2 2
𝑁1 𝑁2
𝑉 𝑦ത𝑠𝑡 = 𝑉 𝑦ത1 + 𝑉 𝑦ത2
𝑁 𝑁
VI. PROBLEMAS
Datos:
Solución:
La empresa publicitaria puede desear producir estimaciones, por separado, del número
promedio de horas que se ve televisión en los hogares del municipio. (ℎ𝑜𝑟𝑎𝑠⁄𝑠𝑒𝑚𝑎𝑛𝑎)
1° Se calculan las medias y varianzas muestrales en cada estrato:
A partir de estos valores calculamos las varianzas de los estimadores de la media en cada
estrato y los límites para los errores de dichas estimaciones:
126 − 9 19,28
𝑉 (𝑦ത3 ) = ( )( ) = 1,99
126 9
2. Las granjas de una cierta región se dividen en cuatro categorías según su superficie. El
número de granjas en cada categoría es 72, 37, 50 y 11. Un estudio para estimar el total
de vacas productoras de leche en la región produce una muestra estratificada de 28
granjas. El total de vacas productoras de leche en estas 28 granjas viene dado en la
siguiente tabla:
Estimar el total de vacas productoras de leche, así como el error estándar del
estimador.
Datos:
En este estudio se utiliza la estratificación para clasificar la categoría de las granjas,
dividiendo las granjas en 4 categorías o estratos con tamaños:
Solución:
Las fracciones de muestreo para cada uno de los estratos vienen dadas por:
𝑛1 12
𝑓2 = = = 0,166
𝑁1 72
𝑛2 6
𝑓3 = = = 0,16
𝑁2 37
𝑛3 8
𝑓3 = = = 0,16
𝑁3 50
𝑛4 2
𝑓4 = = = 0,18
𝑁4 11
Las medias muestrales correspondientes a las muestras seleccionadas de cada estrato
vienen dadas por:
1 𝑛1
𝑥1
തതത= σ 𝑋 = 55,5833
𝑛1 𝑖=1 1
1 𝑛2 160+148+89+139+142+93
𝑥2
തതത= σ 𝑋 = = 128,5
𝑛2 𝑖=1 2 6
1 𝑛3 26+19+21+34+28+15+20+24
𝑥3
തതത= σ 𝑋 = = 23,3750
𝑛3 𝑖=1 3 8
1 𝑛4 17+11
𝑥4
തതത= σ 𝑋 = = 14
𝑛4 𝑖=1 4 2
En este caso, el estimador del total de vacas productoras de leche viene dado por:
𝐿
Calculamos el error del estimador, para ello consideramos la varianza de dicho estimador:
𝐿
𝑆ℎ2
𝑉(𝑋𝑠𝑡 ) = 𝑁ℎ2 (1 − 𝑓ℎ ) 11
𝑛ℎ
ℎ=1
Como no tenemos datos suficientes para calcular 𝑆ℎ2 , estimamos la varianza anterior
como:
𝐿
𝑆̂ℎ2
𝑉 (𝑋𝑠𝑡 ) = 𝑁ℎ2 (1 − 𝑓ℎ )
𝑛ℎ
ℎ=1
Hallando 𝑆̂ℎ2 :
1 𝑛1 1 3860,91667
𝑆̂12 = 𝑛 −1 σ𝑖=1 (𝑋1 − 𝑋ത1 ) = 11 σ12 2
𝑖=1(𝑋1 − 55.5833) = 11
= 350,99 ≅ 351
1
1 𝑛2 1 4485,5
𝑆̂22 = 𝑛 −1 σ𝑖=1 (𝑋2 − 𝑋ത2 ) = 5 σ6𝑖=1(𝑋2 − 128,5)2 = 5 = 8970,1
2
1 𝑛3 1 247,875
𝑆̂32 = 𝑛 −1 σ𝑖=1 (𝑋3 − 𝑋ത3 ) = 7 σ8𝑖=1(𝑋3 − 23,375)2 = 7 = 35,4107
3
1 𝑛4 1
𝑆̂42 = 𝑛 −1 σ𝑖=1 (𝑋4 − 𝑋ത4 ) = 1 σ2𝑖=1(𝑋4 − 14)2 = (17 − 14)2 + (11 − 14)2 = 18
4
Por lo tanto, la estimación de la varianza del estimador para el total de la población viene
dado por:
𝐿
𝑆̂ℎ2
𝑉 (𝑋𝑠𝑡 ) = 𝑁ℎ2 (1 − 𝑓ℎ ) = 309500
𝑛ℎ
ℎ=1
𝑁𝑖 − 𝑛𝑖 𝑠𝑖2
2√𝑉 (𝑁𝑦ത𝑠𝑡 ) = 2√ 𝑁𝑖2 ( )( ) =
𝑁𝑖 𝑛𝑖
110 − 20 168 − 30
= 2√{[1102 ( ) (5263157,895)] + [1682 ( ) (4482758,621)]} = 𝟕𝟗𝟎𝟎𝟐𝟏, 𝟔𝟏𝟕𝟓
110 168
𝒄𝟏 = $𝟗 𝑐2 = $25 𝑐3 = $36
𝝈𝟏 = 𝟐, 𝟐𝟓 𝜎2 = 3,24 𝜎3 = 3,24
𝑵𝟏 = 𝟏𝟏𝟐 𝑁2 = 68 𝑁3 = 39
Datos:
- 𝑉 (𝑦ത𝑠𝑡 ) = 0,1
- 𝑁 = 𝑁1 + 𝑁2 + 𝑁3
𝑁 = 219
Solución:
Debemos hallar el tamaño de la muestra usando la siguiente formula:
σ 𝑁𝑘 𝜎𝑘
( )(σ 𝑁𝑘 𝜎𝑘 √𝑐𝑘 )
√𝑐𝑘
𝑛=
𝑁 2 𝐷 + σ 𝑁𝑘 𝜎𝑖2
𝐵 = 2√𝑉 (𝑦ത𝑠𝑡 )
𝐵 = 2√0,1
𝐵 = 0,6325
Ahora hallamos D:
B2
D=
4
0,63252
D=
4
D = 0,1
𝑛 ≈ 27
Ahora usamos la ecuación de tamaño de muestra para los estratos, tenemos lo siguiente:
𝑁𝑖 𝜎𝑖 ⁄√𝑐𝑖
𝑛𝑖 = 𝑛( )
𝑁𝑘 𝜎𝑘 ⁄√𝑐𝑘
56
𝑛1 = 27 ( ) = 16,4 ≈ 16
92,18
24,48
𝑛2 = 27 ( ) = 7,1703 ≈ 7
92,18
11,7
𝑛3 = 27 ( ) = 3,42 ≈ 4
92,18
Datos:
Solución:
De la tabla se tiene:
σ 𝑦𝑖 887
𝑦1 =
തതത = = 63,36 ; σ 𝑦(𝐼) = 885
𝑛𝑖 14
σ 𝑦𝑖 2196
𝑦2 =
തതത = = 183 ; σ 𝑦(𝐼𝐼) = 2196
𝑛𝑖 12
σ 𝑦𝑖 3065
𝑦3 =
തതത = = 340,56 ; σ 𝑦(𝐼𝐼𝐼) = 3065
𝑛𝑖 9
σ 𝑦𝑖 2362
𝑦̅4 = 𝑛𝑖
= 5
= 472,4 ; σ 𝑦(𝐼𝑉) = 2362
𝑦𝑖 2 (𝐼) = 70131
𝑦𝑖 2 (𝐼𝐼) = 501464
𝑦𝑖 2 (𝐼) = 1178157 16
𝑦𝑖 2 (𝐼) = 1405314
1 (σ 𝑦𝑖 )2
Sabemos: 𝑠𝑖 2 = [σ 𝑦𝑖 2 − ]
𝑛−1 𝑛𝑖
2
1 8872
𝑠𝐼 = [70131 − ] = 1071,786
14 − 1 14
1 21962
𝑠𝐼𝐼 2 = [501464 − ] = 9054,18
12 − 1 12
1 30652
𝑠𝐼𝐼𝐼 2 = [1178157 − ] = 16794,28
9−1 9
2
1 23622
𝑠𝐼𝑉 = [1405314 − ] = 72376,3
5−1 4
Hallamos el error de estimación:
𝑁𝑖 −𝑛𝑖 𝑠𝑖 2
തതതത
2√𝑣̂(𝑦𝑛 ) = 2√σ( 𝑁 )( 𝑛 )
𝑖 𝑖
Estimamos que el valor promedio total de acres plantados de árboles en los ranchos
es 50505,6. Con un error de estimación de ±790021,6175 con una confianza de 95%.
𝑁𝑖 𝜎𝑖 2 = 𝟑𝟕𝟖𝟖𝟔𝟔𝟔, 𝟎𝟏𝟐
𝐵2 50002
𝐷= =
4𝑁 2 4(240)2
50002
En 𝑁 2 𝐷 = 2402 . 4,2402 = 6250000
Reemplazando:
(24475,06)2
𝑛= = 59.67 = 𝟔𝟎
6270000 + 3788666,012
Un tamaño de muestra aproximado para adquirir este límite si se usa la asignación de
Neyman es de 60.
7. El transporte urbano destinado al servicio público en una gran ciudad está compuesto por
3000 taxis y 2000 buses. La secretaría de Tránsito y Transporte de dicha ciudad desea
estimar la proporción de vehículos de servicio público que son conducidos por sus dueños
exclusivamente. Se cree que el porcentaje puede ser del 20% para buses y del 40% para
taxis. El costo por obtener una observación es de $ 5 para los taxis y B y $ 2,5 para el
área rural.
Determine el número de buses y de taxis que se deben revisar para encontrar tal
estimación con un nivel de confianza del 95% y un margen de error máximo
tolerable del 6%. Use un tipo de asignación proporcional.
Estime la proporción de vehículos de transporte público que es conducido por
su dueño en toda la población estudiada y encuentre la varianza del estimador.
Datos:
ESTRATO I ESTRATO II COSTO (𝑪𝒊 )
(TAXIS) (BUSES)
3000 2000 $5
𝑃1 = 0,4 𝑃2 = 0,2 $ 2,5
𝑄1 = 0,6 𝑄2 = 0,8
Solución:
1° Usamos la ecuación:
(0,4)(0,6) (0,2)(0,8)
N i Pi Qi / ci 3000
5
2000
2,5
657,267 505,964 1163,23
𝐵2 0,062
𝐷= = = 9 × 10−4
4 4
𝑛𝑖 = 𝑤𝑖 × 𝑛
ESTRATO I ESTRATO II
(TAXIS) (BUSES)
𝒏𝟏 = 𝟎, 𝟓𝟔𝟓 × 𝟐𝟐𝟒, 𝟗 𝑛2 = 0,435 × 224,9
𝒏𝟏 = 𝟏𝟐𝟕 𝑛2 = 98
8. En una ciudad se sabe que el 30% de los hogares tienen calefacción eléctrica. Al realizar
una encuesta sobre el consumo de energía (valor en euros de la factura bimensual) se
obtuvieron los siguientes resultados:
Datos:
Ya que la proporción observada de facturas de hogares con calefacción eléctrica
(0,60≡60/100) está muy alejada de la proporción verdadera (0,30≡30/100), es
conveniente la estratificación después de que se ha seleccionado la muestra aleatoria
simple. Además el procedimiento se justifica pues tanto 𝑛1 como 𝑛2 superan 20.
Solución:
1° Se calculan las medias y la varianza en cada estrato:
σ 𝑦1 5730
𝑦ത1 = = = 95,5 𝑒𝑢𝑟𝑜𝑠
𝑛 60
σ 𝑦2 2080
𝑦ത2 = = = 52 𝑒𝑢𝑟𝑜𝑠
𝑛 40
El estimador de la media es:
𝑁1 𝑁2 30 70
𝑦ത𝑠𝑡 = ( ) 𝑦ത1 + ( ) 𝑦ത2 = ( ) 95.5 + ( ) 52 = 65,05 𝑒𝑢𝑟𝑜𝑠
𝑁 𝑁 100 100
Y la varianza de este estimador la podemos calcular basándonos en las varianzas de los
estimadores de la media en cada estrato mediante:
A veces este método de estimación se utiliza para ajustar por no respuesta. Por ejemplo,
si muchos de quienes no respondieron a una muestra aleatoria simple son varones,
entonces la proporción de varones en la muestra va a ser pequeña, y se podría conseguir
una estimadora proporción de varones en la muestra va a ser pequeña, y se podría
conseguir un estimador ajustado mediante la estratificación después del muestreo.
Así, en este ejemplo la baja representación en la muestra de facturas sin calefacción
eléctrica y el alta de facturas con calefacción eléctrica conducen a una sobreestimación
del valor medio de las facturas si se utiliza M.A.S. y no se ajusta la estimación de la media
con la estraficación después de seleccionar la muestra:
5730 + 2080
𝑦ത = = 78,10 𝑒𝑢𝑟𝑜𝑠
60 + 40
FORTALEZAS DEBILIDADES
A diferencia del muestreo aleatorio simple, A diferencia del muestreo aleatorio simple,
el muestreo estratificado: el muestreo estratificado:
Tiene una mayor capacidad de hacer Requiere información sobre la proporción de
20
inferencia dentro de un estrato la población total que pertenece a cada
y comparaciones entre los estratos. estrato.
Tiene errores de muestreo al azar un poco más La información sobre las variables de
pequeños para la muestras de mismo tamaño, estratificación es requerida para cada
por lo que requiere tamaños de muestra más elemento de la población. Si dicha
pequeños para el mismo margen de error. información no está disponible, puede ser
costosa su compilación.
Obtiene una muestra más representativa Es más caro, consume tiempo, y es más
porque se asegura de que los elementos de complicado que el muestreo aleatorio simple.
cada estrato son representados en la muestra.
Saca mayor provecho de los conocimientos La selección de las variables de
que el investigador tiene sobre la población. estratificación puede ser difícil si un estudio
implica un gran número de variables.
Permite diferentes métodos de investigación y El análisis de los datos recogidos es más
procedimientos que se utilizarán en diferentes complejo que el análisis de los datos
estratos. recogidos a través del muestreo aleatorio
simple.
Permite el análisis de los patrones dentro del Si se utiliza la asignación desproporcionada,
estrato y la notificación separada de los se requiere la ponderación para hacer
resultados para cada uno de los estratos. estimaciones precisas de los parámetros de la
población.
VIII. BIBLIOGRAFÍA
http://virtual.uptc.edu.co/ova/estadistica/docs/libros/ftp.bioestadistica.uma.es/libro/node
89.htm
https://www.questionpro.com/blog/es/muestreo-estratificado/
https://www.netquest.com/blog/es/blog/es/muestreo-probabilistico-muestreo-
estratificado
https://es.wikipedia.org/wiki/Muestreo_estratificado
file:///C:/Users/Fernando/Documents/Clase_11_de_Metodos_Estadisticos_- 21
_campus.pdf
https://muestreohg.files.wordpress.com/2014/07/tc3a9cnicas_para_anc3a1lisis_de_merc
ados.pdf