Población y Muestra
Población y Muestra
Población y Muestra
Por otro lado, llamamos “muestra” a la parte de la población que se desea investigar y
es de la cual realmente se obtiene la información. Es sobre la “muestra” en quien se
efectuará la medición y observación de las variables elegidas (Bernal, 2010).
Sabemos que población es el conjunto de todos los elementos (unidades de estudio) que
se desea investigar, en tanto que muestra es el subconjunto de la población que
deseamos estudiar. Ahora bien, al ser la muestra un subconjunto de la población,
significa que las unidades de estudio de la muestra las seleccionaremos de la población,
sin embargo existen ocasiones en que este hecho no se cumple. Veamos un ejemplo.
Supongamos que queremos evaluar el clima laboral de las cafeterías de la región sur,
para lo cual tendríamos que encuestar a los trabajadores de cada cafetería de la región.
Al aplicar una selección aleatoria para elegir a los trabajadores, lo más probable es que
tengamos que acudir a cada una de las cafeterías en busca de ellos, lo que resultaría
sumamente costoso y nada práctico, lo más viable sería seleccionar las cafeterías que
forman parte de nuestro estudio y en ellas realizar la investigación encuestando a los
trabajadores. En ese caso la selección de las cafeterías no son las unidades de estudio
(las cuales serían los trabajadores), sino las unidades de muestreo.
Debemos recordar que una muestra no siempre se construye a partir de las unidades de
estudio, sino de las unidades de muestra, las cuales, se clasifican en cuatro (Supo,
2014):
Primer tipo: unidades de muestreo propias. Este es el caso más frecuente y el caso más
común, donde la unidad de estudio es igual a la unidad de muestreo. Esto quiere decir
que a quienes seleccionamos de la población para construir la muestra son a las
unidades de estudio.
Ejemplo:
Ejemplo:
Retomemos el caso de las cafeterías. En este caso, recurrimos a realizar una selección
de las cafeterías para conformar nuestra muestra, y no una selección de los trabajadores
que laboran allí. La razón de ello es que en toda cafetería, al menos con cierta
regularidad, existe el mismo personal, por lo que seleccionar a las cafeterías, sería lo
más práctico.
Del ejemplo podemos deducir que las cafeterías vendrían a ser una suerte de
minipoblaciones ya que en su interior podemos encontrar las características que definen
a la población. A estos conjuntos se les denominan también conglomerados o clústeres y
son utilizados cuando identificamos a las unidades de muestreo conjuntas.
Ejemplo
Para iniciar el proceso se debe empezar con la selección de los docentes y luego
identificar a 10 de sus alumnos. En caso alguno de los alumnos se niegue a participar en
el estudio, resultaría fácil buscar algún alumno adicional. En tanto, que si nos centramos
en elegir a los alumnos y después al docente, y si este se niega a participar en el estudio,
nuestro trabajo resultaría en vano.
Para precisar la población debe realizarse a partir de los siguientes términos (Bernal,
2010):
Enunciado
Alcance
Tiempo
Unidades de muestreo
Unidades de estudio
Ejemplo
Lo cierto es que no todos los trabajos requieren muestra ya que, por principio, el
investigador debería estar enfocado a estudiar la población. Supo (2013b) presenta tres
casos en los que sí es necesario extraer una muestra:
Estas son las únicas justificaciones para recurrir a una muestra, en todos los demás
casos debemos estudiar a toda la población.
Tamaño de la muestra
Porcentaje de confianza
Un 100% de confianza para generalizar los resultados indicaría que todos los individuos
de la población comparten sin excepción las conclusiones sacadas del estudio de los
individuos de la muestra. Paradójicamente, para tener un 100% de confianza hay que
estudiar a todos los casos de la población, es decir, censar. Como resulta costoso en
tiempo y dinero, lo que se hace es tolerar que algunos de cada 100, no compartan las
conclusiones del estudio de la muestra.
Si se elige un 80% de confianza, tenemos la seguridad, que las conclusiones del estudio
son compartidas por el 80% de la población. Elegir este porcentaje requiere una muestra
cuantitativamente menor que cuando se elige, por ejemplo, 97% de confiabilidad.
Cuanto mayor es el porcentaje de confianza que se desea, mayor es la cantidad de
sujetos necesarios para la muestra. En las investigaciones sociales, por lo general se
busca un 95% de confianza.
Porcentaje de error
Variabilidad
p =70%
q = 30%
Existen varias fórmulas para calcular el tamaño de la muestra. En esta oportunidad solo
veremos dos de ellas, las mismas que son aplicables a poblaciones cuyo tamaño se
conoce.
Primera fórmula
n= Z2 . p.q.N/N.e2 +Z2.p.q
Donde:
n : Tamaño de la muestra.
q : Variabilidad negativa.
Z : Nivel de confianza.
N : Tamaño de la población.
p : Variabilidad positiva.
e : Margen de error.
Para sustituir la fórmula es preciso pasar todos los porcentajes a proporciones. Eso se
logra cuando dividimos los porcentajes entre 100.
Así, si tenemos la máxima variabilidad, los valores para p y q son 0.5 y 0.5
respectivamente.
En el caso del nivel de confianza no solo se divide el porcentaje entre 100, sino que,
además, debe dividirse entre dos y ese resultado buscarlo en la tabla llamada áreas bajo
la curva normal (revisar la última hoja del presente texto). Si el valor de confianza es de
95%, entonces, se divide entre 100 y luego entre dos, obteniendo el resultado: 475
(0,475). Este número se busca en la tabla de valores bajo la curva normal, la cual será
1,96.
Ejercicio
Teniendo en cuenta que la población está constituida por 173 alumnos tendremos los
siguientes datos:
Segunda fórmula
n=p.q/(E2/Z2) +(p.q/N)
Donde:
n= Tamaño de la muestra
q=Variabilidad negativa
Z=Nivel de confianza
N=Tamaño de la población
p= Variabilidad positiva
E=Margen de error
Muestreo
Muestreos Probabilísticos
Muestreo aleatorio sistemático. Es una variable sencilla del aleatorio simple, pero en
lugar de extraer n números aleatorios, solo se extrae uno y, a partir de ahí, se van
seleccionando los demás elementos a intervalos fijos, siendo este intervalos el resultado
del número total de la población entre el tamaño de la muestra.
“Del total de Defensorías del Niño y del Adolescente (DNA´s) ubicadas en el Perú
(N=1,537), fueron seleccionadas aleatoriamente 148 DNA´s. Se usó un muestreo
probabilístico estratificado.
Se quiere realizar una encuesta nacional durante las elecciones de la nueva directiva del
SUTEP. Los conglomerados, en este caso, pueden ser los distritos electorales y, dentro
de ellos, las mesas electorales. Con este muestreo lo que se hace es escoger algunos
distritos electorales y luego, dentro de ellos, algunas mesas electorales al azar y de ahí
se toman todos los votos de las mesas seleccionadas.
Características de los tipos de muestreo probabilísticos
Muestreos No Probabilísticos
Muestreo causal. Este muestreo, también llamado por accidente, es el preferido por los
reporteros de radioemisoras y canales de televisión. Consiste en tomar como elemento
de la muestra a personas que circunstancialmente se presentan a un lugar determinado.
Podría pensarse que este muestreo es aleatorio, pero no es así. La diferencia radica en
que en el aleatorio se cuenta con un marco muestral y eso le da la misma probabilidad
de resultar seleccionando a cada uno de los sujetos de la población, mientras que el
muestreo por accidente se privilegia a las personas que acostumbran a andar por donde
se ubicó el investigador.
Ejemplo
“La muestra elegida fue de tipo accidental compuesta por 138 empleados
administrativos de universidades privadas cuyas edades oscilan de los 22 a 61 años, por
lo que los resultados son exclusivos para este grupo.”
Ejemplo:
En este caso una muestra no probabilística es adecuada pues se trata de un estudio con
un diseño de investigación exploratorio; es decir, no es concluyente, sino que su
objetivo es documentar ciertas experiencias. Este tipo de estudio pretende generar datos
e hipótesis que constituyan la materia prima para investigaciones más precisas.
Los estudios exploratorios y descriptivos buscan la validez interna, esto es, llevar con
éxito los resultados de la muestra a la población, lo que permite que las conclusiones
obtenidas en la muestra se puedan generalizar en la población. La validez interna,
además, permiten el control del error aleatorio (error en la determinación del tamaño de
la muestra) y del error sistemático (error en la determinación de la estrategia de
muestreo). Asimismo, en los estudios de nivel exploratorio, al ser de carácter
cualitativo, no utiliza muestreo probabilístico sino el no probabilístico. Por lo general se
utiliza el muestreo por conveniencia o accidental.
En los niveles relacional, explicativo, predictivo y aplicativo se buscan la validez
externa, esto es, que los resultados de la muestra de una población se pueden generalizar
en otras poblaciones.
Son características que sirven para diferenciar quién participa como población en tu
investigación y quién no. Los criterios de inclusión y exclusión son límites que
discriminan entre los que serán parte del estudio y los que no lo serán.
Ejemplo:
“…La población está constituida por los estudiantes de nivel secundario de las
instituciones educativas de la UGEL X. Los criterios de inclusión y exclusión
considerados para la delimitación poblacional son los siguientes:
Caso 1
Se desea medir el nivel de satisfacción de los alumnos del Centro
Preuniversitario de la UTP, los cuales suman 817. Por sus características, la presente es
una población finita ya que se tiene el número exacto de los alumnos. Para determinar
Donde:
N = Total de la población
usaremos 3%)
Calculamos:
n = 163
Caso 2
Se desea medir la percepción sobre el clima laboral que tienen los trabajadores de la
personal que desempeña diversas funciones en la empresa, que en total suman 269, tal
Población
Por sus características, la presente es una población finita ya que se tiene el número
siguiente:
N Z 2 pq
n= 2 2
d ( N−1 ) + Z pq
Donde:
n=77
manera:
Area de Administración 12
Area de Logística 8
Area de Mantenimiento 4
Area de Producción 51
Area de Sostenibilidad 2
Total de trabajadores: 77
Ejercicio
Una empresa con 500 empleados desea reducir el nivel de ausentismo de los
trabajadores. Reportes de asistencia indican que cerca del 10% de los trabajadores faltan
al trabajo, pero no determinan las causas del ausentismo. Decides investigar las razones
más frecuentes para las faltas, y, por tanto, estimas el nivel de confianza de tu muestra
en el 95% y un error máximo admisible del 3%.
De esta forma:
n = tamaño de muestra
z = nivel de confianza elegido (igual a 2)
p = porcentaje de inasistencia (10)
q = porcentaje complementario (p - q = 90)
N = tamaño de la población (N=500)
e = error máximo permitido (3)
La fórmula utilizada para el cálculo es la siguiente:
Redacción típica del muestreo en la tesis de investigación
Población y Muestra.
Se utilizará un diseño no probabilístico de selección intencional.
Población y muestra
La población está conformada por los distribuidores de artículos de iluminación en el
mercado nacional.