Muestreo RL 7
Muestreo RL 7
Muestreo RL 7
Muestreo
Población: Es todo conjunto de elementos, finito o infinito, definido por una o más características,
de las que gozan todos los elementos que lo componen, y sólo ellos.
En muestreo se entiende por población a la totalidad del universo que interesa considerar (es
necesario que esté bien definido para identificar sin dudas que elementos lo componen). Los
estadísticos utilizan la palabra población para referirse no sólo a individuos si no a todos los
elementos que han sido escogidos para su estudio (población de datos).
Censo: En ocasiones resulta posible estudiar cada uno de los elementos que componen la población,
realizándose lo que se denomina un censo. La realización de un censo no siempre es posible, por
diferentes motivos:
a) economico: el estudio de todos los elementos que componen una población, sobre todo si esta es
grande, suele ser un problema costoso en tiempo, dinero, etc.;
b) que las pruebas a las que hay que someter a los sujetos sean destructivas;
c) que la población sea infinita o tan grande que exceda las posibilidades del investigador.
Muestra: En todas las ocasiones en que no es posible o conveniente realizar un censo, lo que
hacemos es trabajar con una muestra, entendiendo por tal una parte representativa de la población.
Para que una muestra sea representativa, y por lo tanto útil, debe de reflejar las similitudes y
diferencias encontradas en la población, ejemplificar las características de la misma. Cuando
decimos que una muestra es representativa indicamos que reúne aproximadamente las
características de la población que son importantes para la investigación.
Muestra representativa. Es una muestra de un tamaño apropiado que ha sido escogida por
procedimientos aleatorios y se considera que las características observadas “representan” o
corresponden a la población de la cual ella proviene. Lamentablemente no es posible tener la certeza de
su grado “representativo”, sino la probabilidad razonable de su semejanza, la que puede ser
calculada por algún modelo estadístico.
Tipos de muestreo
El tipo es la manera utilizada para seleccionar los elementos incluidos en la muestra. Hay diferentes
criterios de clasificación de los diferentes tipos de muestreo, aunque en general pueden dividirse en
dos grandes grupos: métodos de muestreo probabilísticos y métodos de muestreo no probabilísticos.
Una muestra es probabilística cuando los sujetos o elementos de una población son seleccionados
con una probabilidad conocida y diferente de cero.
Ruben J. Lombardo Estadistica Aplicada Apunte de clase 2/8
Muestras intencionales, por conocimiento (experiencia, “expertisia”), por cuotas u ocasionales (no
casuales en el sentido probabilístico = aleatorias) no son muestras probabilísticas.
La ventaja de la muestra probabilística es que se puede asociar a los resultados obtenidos a partir de
los datos de la muestra, una precisión y una confiabilidad estadística, lo que no ocurre cuando la
muestra no es probabilística
Muestreo aleatorio simple: Cuando cada elemento de la población tiene la misma probabilidad de
ser seleccionado para formar parte de la muestra. Se eligen tantos sujetos como sea necesario para
completar el tamaño de muestra requerido a través de algún medio aleatorio (bolas dentro de una
bolsa, tablas de números aleatorios, números aleatorios generados con una calculadora u ordenador,
etc.).
Este procedimiento es adecuado para ambientes homogéneos o población homogénea a la escala de
interés. Se utiliza para datos de medición ([FSH] en sangre) o de % (%NBI en RMBA).
Un ejemplo: selección de ratas en cajas de laboratorio para evaluar efecto de tratamiento y placebo.
Muestreo aleatorio estratificado: Una población se dice estratificada, según una determinada
característica, cuando esa población puede ser subdividida en distintos grupos o categorías
diferentes entre sí, de tal modo que haya gran homogeneidad dentro de los grupos y gran
heterogeneidad entre los grupos. Cada grupo o categoría constituye un estrato.
Por ejemplo, se puede considerar una población de personas estratificada según la profesión, el
sexo, el estado civil, el municipio de residencia, por grupos socioeconómicos, por grupos de nivel
de escolaridad, por naturaleza del lugar de habitación (medio rural o urbano); una población de
hospitales estratificada por el tipo de mantenedor (privado, filantrópico, o publico); etc.
Exige un conocimiento detallado de la población (tamaño geográfico, sexos, edades, ...).
Se selecciona una muestra aleatoria dentro de cada estrato (cada estrato es homogéneo). Cada
estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formarán parte de la muestra.
Es adecuado cuando el ambiente es heterogéneo. Se pretende asegurarse de que todos los estratos de
interés estarán representados adecuadamente en la muestra.
Para conocer el tamaño de cada estrato en la muestra no tenemos más que multiplicar esa
proporción por el tamaño muestral:
Colegios públicos: 0.60x600 = 360 sujetos
Colegios privados subsidiados: 0.30x600 = 180 sujetos
Colegios privados no subsidiados: 0.10x600 = 60 sujetos
La unidad muestral es un grupo de elementos de la población que forman una unidad, a la que
llamamos conglomerado. Definida la población de conglomerados, se hace, entre los mismos, una
selección aleatoria simple. Se selecciona aleatoriamente un cierto número de conglomerados (el
necesario para alcanzar el tamaño muestral establecido) y se investigan todos los elementos
pertenecientes a los conglomerados elegidos.
Por ejemplo, si se desea investigar el porcentaje de hojas infestadas por hongos o dañadas por
efecto de contaminación aérea de una especie arbórea caducifolia, se podrían considerar las ramas
nuevas como conglomerados, seleccionar n ramas nuevas al azar y revisar todas las hojas de cada
rama seleccionada, o conglomerado, o submuestra (submuestreo con recuento completo de la
submuestra). ( x: % de hojas infestadas por rama )
Cuando el conglomerado se corresponde con un área geográfica o zona territorial concreta, como
por ejemplo las familias de determinados barrios, el muestreo por conglomerados recibe el nombre
de muestreo por áreas.
Ruben J. Lombardo Estadistica Aplicada Apunte de clase 4/8
Una muestra de conglomerados puede producir un mayor error muestral (menor precisión de las
estimaciones acerca de la población) que una muestra aleatoria simple del mismo tamaño, en caso
de que los elementos individuales dentro de cada conglomerado tiendan a ser iguales.
Por ejemplo, si se consideran áreas como conglomerado en caso en que la gente rica viva en el
mismo barrio, mientras que la gente pobre vive en otra área.
Muestreo secuencial o polietápico: Ante lo compleja que puede llegar a ser la situación real de
muestreo con la que nos enfrentemos es posible emplear un muestreo polietápico, consistente en
operar en sucesivas etapas, empleando en cada una de ellas el método de muestreo probabilístico
más adecuado.
Muestreo opinático o intencional: Este tipo de muestreo se caracteriza por un esfuerzo deliberado
de obtener muestras "representativas" mediante la inclusión en la muestra de grupos supuestamente
típicos. Es muy frecuente su utilización en sondeos preelectorales de zonas que en anteriores
votaciones han marcado tendencias de voto.
Bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así
hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen
estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc.
Ruben J. Lombardo Estadistica Aplicada Apunte de clase 5/8
En cualquier circunstancia la determinación del tamaño de la muestra, para cualquiera que sea el
plan de muestreo probabilístico, depende de la existencia de las siguientes informaciones:
El tamaño de muestra necesario para estimar la media poblacional de una variable X con una
confianza del α .100% y un error máximo admisible en la precisión E se puede calcular como:
s s
Intervalo de α .100% de confianza para la media poblacional µ: X − tα ⋅ ; X + tα ⋅
n n
s
El error máximo admisible será entonces: E = tα ⋅ , donde tα = Student´t t n-1;1- α/2
n
2
s
El tamaño mínimo de una muestra (n) viene dado por: n = tα ⋅
E
Como α y E deben ser fijados por el investigador, el tamaño mínimo de muestra dependerá solo de
la variabilidad de la variable de interés en la población (S), la que debe ser estimada mediante un
premuestreo. En síntesis, sin ninguna información previa es muy difícil, hasta mismo en términos
especulativos, fijar un tamaño de muestra en un muestreo probabilístico.
Adicionalmente, dependiendo del plan de muestreo a ser adoptado puede ser necesaria información
sobre los costos del muestreo por unidad de muestra e información sobre correlación entre los
elementos que serán muestreados.
(*) Teorema central del límite: La distribución de las medias muestrales de tamaño n, extraídas de
una población normal N ( µ ,σ ) , se ajusta a una normal N ( µ ,σ / n ) .
También se ajustan a esa distribución de las medias muestrales si las medias muestrales provienen
de una población no normal, pero el tamaño de las mismas es n ≥ 30.
Pero... este teorema es válido para varias muestras de tamaño n, no para una (para la distribución de
las medias muestrales, no de la variable estudiada – distribución de las X , no de las X).
Ruben J. Lombardo Estadistica Aplicada Apunte de clase 6/8
Como vimos, a mayor tamaño de muestra n, mayor precisión, pero debemos destacar que la
precisión se incrementa a mayor número de unidades muestrales, no de elementos.
Un supuesto básico para hacer inferencias es que las unidades de muestreo (datos) deben ser
totalmente independientes entre sí, esto significa que el valor de un dato no es influido ni influye el
valor de otro. Sin embargo este supuesto es frecuentemente violado.
Según Hurlbert (1984) la pseudoreplicación simple ocurre cuando no hay réplicas verdaderas de
las observaciones porque se tratan como independientes múltiples muestras de cada unidad
experimental o medidas repetidas en la misma muestra.
Por ejemplo, si se quiere determinar la cantidad de insectos por hoja de cierta especie de planta, y se
cuenta la cantidad de insectos en 3 hojas de una planta, 5 de otra y 7 de otra, será un error pensar
que se tienen 15 (3+5+7) datos ya que las hojas de una misma planta tienen más en común entre
ellas que con las de otra planta (si una planta esta infectada o ha sido colonizada, es probable que
presente altas densidades en todas sus hojas). Lo correcto sería realizar un promedio por planta y
luego trabajar con esos promedios como dato (o sea 3 datos).
De manera similar, al realizar experimentos, los datos independientes provendrán de cada unidad
experimental. Si se hacen exclusiones de herbívoros para estudiar su efecto en la producción o
supervivencia de cierta especie de plantas, se pueden construir corrales de alambre tejido que
impidan el ingreso de los herbívoros. Dentro de cada corral, se podrían tomar datos de varias
plantas individuales, pero utilizar esto como réplicas reales es incorrecto, ya que la unidad
experimental es el corral. Los valores medidos sobre las plantas de un mismo corral no son
independientes.
Hurlbert también definió una pseudoreplicación sacrificial, que ocurre cuando se hace un pool de
los datos observados previo al análisis estadístico, y por lo tanto, ¨sacrificando¨ parte de la varianza
muestral.
Hurlbert, S.H. 1984. Pseudoreplication and the design of ecological field experiments. Ecological Monographs 54(2):187-211:
*
*
*
● Dispensador de producto
*
● Dispensador de producto
*
Las matrices pueden ser agua, suelo, sedimento, polvo, alimentos, aire, partículas suspendidas,
hojas, etc. Serán seleccionadas aquellas matrices que más interesen de acuerdo al contaminante en
cuestión, considerando sus características fisicoquímicas.
Adicionalmente, es fundamental el considerar las rutas de exposición. Los sitios de muestreo de
mayor importancia son los puntos de exposición de las rutas previamente identificadas.
Además, hay que muestrear áreas no contaminadas a fin de obtener los valores basales.
En estudios que tienen como objetivo el conocer la extensión de la mancha contaminante el
diseño del muestreo debe considerar un modelaje estadístico, donde el número de muestras y los
puntos de muestreo estarán dictados por la precisión definida por el propio investigador.
El tipo de muestra, por ejemplo: simple, compuesta o integrada, de suelo superficial o suelo
profundo, etc., será determinado de acuerdo a los objetivos del trabajo.
La frecuencia de muestreo (diaria, mensual, estacional, etc.) y el momento del muestreo (diurno,
nocturno, inmediatamente luego de una lluvia, etc.) serán determinados por el tipo de matriz
(acuífero, río, suelo,…) y por el conocimiento del sistema en estudio, como la dinámica temporal
del contaminante, su persistencia en el ambiente, etc.
Así, en las zonas palustres, el muestreo podría estar definido por la época de aplicación de los
insecticidas y la frecuencia debería basarse en los parámetros de degradación del insecticida
aplicado. En cualquier caso, el diseño considerará la época de máxima exposición; es decir, el
momento en el tiempo donde sea más probable el contacto del contaminante con los seres vivos.
El transporte de las muestras del sitio al laboratorio debe realizarse de acuerdo a los estándares de
seguridad más indicados. Deben evitarse pérdidas por volatilidad o degradación. En algunos casos
se aconseja el empleo de fijadores, de antimicrobianos y la baja temperatura y oscuridad. Cada tipo
de contaminante requiere un trato particular. Además, es posible que eventualmente se requiera
cadena de custodia al laboratorio donde se realizan los análisis.