Unidad 4. Estadistica Administrativa
Unidad 4. Estadistica Administrativa
Unidad 4. Estadistica Administrativa
INTRODUCCION
4. MUESTREO
El muestreo es un proceso o conjunto de métodos para obtener una muestra finita de una
población finita o infinita, con el fin de estimar valores de parámetros o corroborar
hipótesis sobre la forma de una distribución de probabilidades o sobre el valor de un
qparámetro de una o más poblaciones.
Los métodos de muestreo probabilístico buscan que todos los elementos que conforman
la población tengan igual probabilidad al ser seleccionados en la muestra. Es decir, todas
las muestras de un tamaño determinado que se puedan sacar de una población tendrán la
misma probabilidad de ser elegidas. Este método de muestreo es el más recomendable,
dado que aseguran de alguna manera la representatividad de la muestra que se extrae;
se dice de alguna manera porque pueden emplearse técnicas para determinar el tamaño
representativo de la muestra para poblaciones finitas e infinitas, a partir del nivel de
confianza, error de muestreo y tamaño de la población. A continuación, se describen los
principales métodos de muestreo probabilístico.
FORMULA: K=N/n
N es el tamaño de la población
N es el tamaño de la muestra
EJEMPLO:
Se acercan las navidades y cierta empresa de turrones cree que no va a poder entregar
todos los pedidos a tiempo, a no ser que aumente la plantilla. La empresa dispone de un
listado ordenado alfabéticamente de 20 personas con las mismas características para el
puesto y que actualmente están en paro. Puesto que el tiempo apremia y no es posible
hacer una entrevista para seleccionar al personal, si decide elegir a 5 trabajadores de
forma aleatoria usando el muestreo sistemático.
DONDE:
K= es un valor fijo que indica la separación entre los elementos sucesivos de la muestra
de la población.
SOLUCION:
EJEMPLO 2:
Una empresa publicitaria esta iniciando una campaña de promoción para un nuevo
producto. La empresa quiere muestrear clientes potenciales en una pequeña comunidad
para determinar la aceptación del producto. Para eliminar algo de los costos asociados
con las entrevistas personales, el investigador decide seleccionar una muestra sistemática
entre N=5000 nombres listados en un registro de la comunidad y recolectar los datos
mediante entrevistas por teléfono. Determinar el tamaño de la muestra requerido para
estimar p. la proporción de personas que consideran aceptable, con un límite para el error
de estimación de 3%.
Muestreo estratificado
FORMULA: nh= Nh x n
n
nh= tamaño de la muestra del estrato h
EJEMPLO:
Supongamos que queremos realizar un muestreo en una población de 1000 personas dividiendo la
población en estratos A (con 300 personas) y B (con 700 personas). Si queremos que el estrato A
represente el 40% y el B el 70% podemos calcular el tamaño de la siguiente manera.
Para el estrato A
(tamaño total de la muestra × tamaño de la población del estrato A)
tamaño total de la población
Para el estrato B
FORMULA:
𝑁ⅈ
𝑛𝑖 = 𝑛 ⋅
𝑁
EJEMPLO:
Suponemos que se esta haciendo un estudio sobre la toma de pastillas para dormir en una ciudad
de 100.000 habitantes. La variable edad se considera adecuada para obtener resultados en esta
investigación. Se incluye solamente los mayores de 40 años en el estudio. Se distribuyen en tres
grupos o estratos, resultando una agrupación, según el censo:
De 40 a 55 años………..25.000
De 56 a 70 años……….18.000
Mayores de 70 años………7.000
Total …………………………50.000
Por el procedimiento de muestreo elegido obtenemos una muestra de 750 sujetos. Para asignar el
numero de componentes a los tres estratos de edad, aplicaremos la formula anterior:
25.000
𝑛𝑖 = 750 ⋅ = 375
50.000
18.000
𝑛𝑖 = 750 ⋅ = 270
50.000
7.000
𝑛𝑖 = 𝑛 ⋅ = 105
50.000
Donde n/N es una constante llamada razón de muestreo, que en este caso es de 0,015.
Resulta una distribución muestral por estratos tal que asi:
1 25.000 375
2 18.000 270
3 7.000 105
n = Tamaño de la muestra
Es el mismo para todos los estratos. Si los costos son desconocidos, podríamos
suponer que los costos por observación son iguales. Si c₁=₂=…=C, entonces los
términos de costo se cancelan en la Ecuación (5.9) y
EJEMPLO
Que se usaron en los ejemplos previos son erróneas y que las de los estratos son
iguales. El valor común de o, fue aproximado por 10 en un estudio preliminar. Se
van a efectuar entrevistas por teléfono, por lo que los costos serán iguales en todos
los estratos. La empresa desea estimar el número promedio de horas por semana
que se ve la televisión en los hogares del municipio, con un límite para el error de
estimación igual a 2 horas.
Solución:
Tenemos que:
Consiste en crear grupos más pequeños que la población, los cuales reflejen o compartan
todas las características de esta. Luego, elegimos alguno de los conglomerados como
muestra y lo analizamos de forma detallada.
Solución:
FORMULA:
• n: Tamaño de la muestra
EJEMPLO: Supongamos que tenemos una población de 100 personas con una altura
media de 170 cm y una desviación estándar de 10 cm. Si extraemos una muestra
aleatoria de 30 personas:
Aplicaciones:
CORRECCION:
EJEMPLO:
Cada muestra de tamaño n que podemos extraer de una población proporciona una
media. Si consideramos cada una de estas medias como valores de una variable aleatoria
podemos estudiar su distribución que llamaremos distribución muestral de medias. Si
tenemos una población normal N(m,s) y extraemos de ella muestras de tamaño n, la
distribución muestral de medias sigue también una distribución normal.
Para saber si el nivel promedio de plomo es diferente entre niños de la 2ªRegión y niños
de la R.M., es preciso conocer la distribución de la diferencia de medias muestrales que
se designa:
La distribución muestral de las diferencias de medias se puede construir con el siguiente
procedimiento: Obtener todas las muestras posibles de tamaño n de la Población 1 y
calcular la media para cada muestra.
EJEMPLO:
Tenemos dos poblaciones de alumnos de último año de un colegio que han sido
evaluados en puntaje en Matemáticas
Supuesto: Los puntajes de las dos poblaciones se distribuyen normalmente con las
siguientes medias y varianzas:
μ1= 50 μ2= 40
σ21= 40 σ22= 60
Una m. a. de n = 10 se saca de la población 1 y una m. a. de tamaño n= 12 se saca de la
población 2. ¿Cuál es la probabilidad de que la diferencia entre las medias esté entre 5 y
15?
CORRECCION:
a) Distribución de la diferencia entre dos medias cuando las varianzas son conocidas.
b) Distribución de la diferencia entre dos medias cuando las varianzas son conocidas y
diferentes
c) Distribución de la diferencia entre dos medias cuando las varianzas son desconocidas
pero iguales.
d) Distribución de la diferencia entre dos medias cuando las varianzas son desconocidas y
diferentes
EJEMPLO:
Cuando las varianzas son conocidas: En un estudio para comparar los pesos promedio de
niños y niñas de sexto grado en una escuela primaria se usará una muestra aleatoria de
n1 = 20 niños y otra de n2 = 25 niñas. Se sabe que tanto para niños como para niñas los
pesos siguen una distribución normal. El promedio de los pesos de todos los niños de
sexto grado de esa escuela es de μ1 = 100 libras y su desviación estándar es de σ1 =
14.142, mientras que el promedio de los pesos de todas las niñas del sexto grado de esa
escuela es de μ2 = 85 libras y su desviación estándar es de σ2 = 12.247 libras. Si 𝑥̅ 1
representa el promedio de los pesos de 20 niños y 𝑥̅ 2 es el promedio de los pesos de una
muestra de 25 niñas, encuentre la probabilidad de que el promedio de los pesos de los 20
niños sea al menos 20 libras más grande que el de las 25 niñas.
e cuando las varianzas poblacionales son conocidas e iguales. De una población se toma
una muestra de n1 = 40 observaciones. La media muestral es de x1 = 102 y la desviación
estándar de σ1 = 5. De otra población se toma una muestra de n2 =50 observaciones y la
media muestral es ahora x2 = 99 y la desviación estándar es 6. Calcule el valor
estadístico de la prueba. Se debe suponer que las medias poblacionales son iguales.
4.3 TEOREMA DE LIMITE CENTRAL
El teorema central del límite (TCL) es una teoría estadística que establece que, dada una
muestra aleatoria suficientemente grande de la población, la distribución de las medias
muestrales seguirá una distribución normal. Además, el TCL afirma que a medida que el
tamaño de la muestra se incrementa, la media muestral se acercara a la media de la
población. Por tanto, mediante el TCL podemos definir la distribución de la media muestral
de una determinada población con una varianza conocida. De manera que la distribución
seguirá una distribución normal si el tamaño de la muestra es lo suficientemente grande.
Fórmula:
μm = μ
• • La desviación estándar de la distribución de muestreo de la media, también
conocida como error estándar de la media (σm), se calcula como:
σm = σ / √n
Donde:
• • σ: Desviación estándar de la población
• • n: Tamaño de la muestra
CONSECUENCIAS:
1.
Permite averiguar la probabilidad de que la media de una muestra concreta esté en un
cierto intervalo.
2.
Permite calcular la probabilidad de que la suma de los elementos de una muestra esté, a
priori, en un cierto intervalo.
3.
Inferir la media de la población a partir de una muestra.
EJEMPLO:
Las bolsas de sal envasadas por una máquina tienen μ = 500 g y σ = 35 g. Las bolsas se
empaquetaron en cajas de 100 unidades.
1.
Calcular la probabilidad de que la media de los pesos de las bolsas de un paquete sea
menor que 495 g.
2.
Calcular la probabilidad de que una caja 100 de bolsas pese más de 51 kg.
Ejemplo:
Supongamos que tenemos una población con una distribución no normal (por
ejemplo, sesgada a la derecha) con una media (μ) de 10 y una desviación estándar
(σ) de 4. Si extraemos muestras aleatorias de tamaño 50 de esta población:
• • El Teorema del Límite Central nos dice que, a medida que tomemos muchas
muestras grandes (n = 50), la distribución de las medias muestrales se aproximará a
una distribución normal.
El tamaño de la muestra de una encuesta es muy importante para poder realizar una
investigación de manera correcta, por lo que hay que tener en cuenta los objetivos y las
circunstancias en que se desarrolle la investigación. Recuerda que la finalidad es que las
personas completen la encuesta y te otorguen los datos que estás buscando. Una
muestra demasiado grande dará lugar a la perdida de valiosos recursos como tiempo y
dinero, mientras que una muestra pequeña puede no proporcionar información confiable.
FORMULAS:
EJEMPLO:
Una empresa que comercializa aparatos electrónicos desea estimar el numero promedio
de aparatos que adquieren anualmente sus principales clientes. Se conoce que la
desviación estándar es de 90 aparatos. Es necesario calcular el tamaño de muestra que
garantice un nivel de confianza de 99% con un error permitido de 10 piezas.
Se desea conocer cual es el grado de satisfacción de los 3582 alumnos de primer ingreso
de la facultad de contaduría y administración de la UNAM, respecto al servicio de las
ventanillas. En las últimas tres generaciones, esta aceptación fue del 40%. Es necesario
determinar a cuantos alumnos hay que entrevistar para garantizar un error máximo de 0
puntos porcentuales con un nivel de significancia del 90%.
Dado que el parámetro que se busca estimar es una proporción, el tamaño de muestra se
determina con la siguiente formula:
Tipos de distribuciones:
Para calcular el intervalo de confianza de dos medias se debe saber si las varianzas
poblacionales son conocidas o desconocidas, y en caso de que sean desconocida, se
debe probar si son iguales o diferentes. Cada uno de estos 3 casos se analizarán por
separado.
Sean x11, x12,.. x1n1, una muestra aleatoria de n1 observaciones tomadas de una primera
población con valor esperado σ 1, y varianza σ 2 1; y x21, x22,.. x2n2, una muestra aleatoria de
n2 observaciones tomada de la segunda población con valor esperado σ 2, y varianza σ 22.
IC = p ± Z * √(p(1-p) / n)
Donde:
• p: Proporción muestral
• n: Tamaño de la muestra
Ejemplo:
Para el mismo ejemplo anterior, con un nivel de confianza del 95%, se calcula el intervalo
de confianza:
• p: 0.12
Sustituyendo en la fórmula:
Interpretación:
muestral), que es también aproximadamente normal, con error típico dado por
• n1 = 30
• n2 = 40
• μ1 = 150
• μ2 = 160
Cálculo:
Distribución normal:
• Z para un nivel de confianza del 95% = 1.96
• IC ≈ (-10.64, 8.64)
Distribución t de Student:
• df = 30 + 40 - 2 = 68
• IC ≈ (-10.70, 8.70)
Interpretación:
• Con un 95% de confianza, la diferencia real entre las medias de las dos poblaciones
se encuentra entre -10.64 y 8.64 si se utiliza la distribución normal, o entre -10.70 y
8.70 si se utiliza la distribución t de Student.
EJEMPLO 2:
Una empresa comercial que procesa muchos de sus pedidos por teléfono tiene 2 tipos de
clientes: generales y comerciales. Se recogen los pedidos de tiempo telefónico por
artículo requerido, por una muestra aleatoria de 12 llamadas de clientes generales y 10
llamadas de clientes comerciales. Se supone que las cantidades de tiempos para cada
tipo de llamadas tiene una distribución aproximadamente normal. Obtenga el Intervalo de
Confianza de 95% para la diferencia de la cantidad media de tiempo por artículo requerida
para cada llamada.
Interpretación: como el cero se encuentra incluido en el intervalo, se puede decir con un
95% de confianza que no hay diferencia en el tiempo medio de cada llamada requerida
para cada artículo.
4.7 UNA SOLA MUESTRA: ESTIMACION DE LA PROPORCION.
Fórmula:
p=x/n
Donde:
Ejemplo:
Supongamos que se desea estimar la proporción de personas en una ciudad que son
zurdas. Se toma una muestra aleatoria de 100 personas y se observa que 12 de ellas son
zurdas.
Cálculo:
Sustituyendo en la fórmula:
p = 12 / 100 = 0.12
Interpretación:
Intervalos de confianza:
Fórmula:
La fórmula para calcular el tamaño de la muestra para estimar una proporción con un
grado de confianza del 100% (α = 1 - 100%) es:
n = Z^2 * p * q / E^2
Donde:
• n: Tamaño de la muestra
• q: 1 - p
• E: Margen de error
Ejemplo:
Datos:
• q: 1 - 0.1 = 0.9
• E: 0.05
Cálculo:
Redondeo:
n = 1231
Interpretación:
Se desea calcular un intervalo aleatorio que contenga al verdadero valor del parámetro, θ,
con una cierta probabilidad h1(T) ≤θ≤ h2(T)
CORRECCION:
Ejemplo:
Suponga que se especifica que la estimación mediante un intervalo de 95% debe ser ±.05
y que no se hace ninguna suposición previa acerca del posible valor de 𝜋. El tamaño
mínimo de la muestra que debe tomarse es:
Principalmente estos temas los vimos al principio de la unidad pero era un muestro un
poco simple en el cual no eran tantos cálculos, y ahorita durante las clase uno si se
sorprendía con los distintos tipos de muestras que había para diferentes cosas que la
verdad si no le entiendes o no pones atención en el tema cuando ves la formula se te
hace muy complicado pero en realidad al saber bien cuales son los valores que ocupas
veras que la fórmula es muy fácil de resolver y no habrá ningún problema con los
muestreos.