Muestreo RL 7

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 8

Ruben J.

Lombardo Estadistica Aplicada Apunte de clase 1/8

Muestreo

En la investigación científica es habitual que se empleen muestras como medio de acercarse al


conocimiento de la realidad. Para que a través de las muestras sea posible reproducir el universo
con la precisión que se requiera en cada caso, es necesario que el diseño muestral se atenga a los
principios establecidos en las técnicas de muestreo.

Población: Es todo conjunto de elementos, finito o infinito, definido por una o más características,
de las que gozan todos los elementos que lo componen, y sólo ellos.
En muestreo se entiende por población a la totalidad del universo que interesa considerar (es
necesario que esté bien definido para identificar sin dudas que elementos lo componen). Los
estadísticos utilizan la palabra población para referirse no sólo a individuos si no a todos los
elementos que han sido escogidos para su estudio (población de datos).

Censo: En ocasiones resulta posible estudiar cada uno de los elementos que componen la población,
realizándose lo que se denomina un censo. La realización de un censo no siempre es posible, por
diferentes motivos:
a) economico: el estudio de todos los elementos que componen una población, sobre todo si esta es
grande, suele ser un problema costoso en tiempo, dinero, etc.;
b) que las pruebas a las que hay que someter a los sujetos sean destructivas;
c) que la población sea infinita o tan grande que exceda las posibilidades del investigador.

Si la numeración de elementos, se realiza sobre una parte de la población estudiada, y no sobre la


población teórica, entonces el proceso recibe el nombre muestreo.

Muestra: En todas las ocasiones en que no es posible o conveniente realizar un censo, lo que
hacemos es trabajar con una muestra, entendiendo por tal una parte representativa de la población.
Para que una muestra sea representativa, y por lo tanto útil, debe de reflejar las similitudes y
diferencias encontradas en la población, ejemplificar las características de la misma. Cuando
decimos que una muestra es representativa indicamos que reúne aproximadamente las
características de la población que son importantes para la investigación.

Muestra representativa. Es una muestra de un tamaño apropiado que ha sido escogida por
procedimientos aleatorios y se considera que las características observadas “representan” o
corresponden a la población de la cual ella proviene. Lamentablemente no es posible tener la certeza de
su grado “representativo”, sino la probabilidad razonable de su semejanza, la que puede ser
calculada por algún modelo estadístico.

Tipos de muestreo

El tipo es la manera utilizada para seleccionar los elementos incluidos en la muestra. Hay diferentes
criterios de clasificación de los diferentes tipos de muestreo, aunque en general pueden dividirse en
dos grandes grupos: métodos de muestreo probabilísticos y métodos de muestreo no probabilísticos.

Una muestra es probabilística cuando los sujetos o elementos de una población son seleccionados
con una probabilidad conocida y diferente de cero.
Ruben J. Lombardo Estadistica Aplicada Apunte de clase 2/8

Muestras intencionales, por conocimiento (experiencia, “expertisia”), por cuotas u ocasionales (no
casuales en el sentido probabilístico = aleatorias) no son muestras probabilísticas.
La ventaja de la muestra probabilística es que se puede asociar a los resultados obtenidos a partir de
los datos de la muestra, una precisión y una confiabilidad estadística, lo que no ocurre cuando la
muestra no es probabilística

Métodos de muestreo probabilísticos

Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de


equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de
ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de
tamaño n tienen la misma probabilidad de ser elegidas. Sólo estos métodos de muestreo
probabilísticos nos aseguran la representatividad de la muestra extraída y son, por tanto, los más
recomendables. Se pueden diferenciar los siguientes tipos:

Muestreo aleatorio simple: Cuando cada elemento de la población tiene la misma probabilidad de
ser seleccionado para formar parte de la muestra. Se eligen tantos sujetos como sea necesario para
completar el tamaño de muestra requerido a través de algún medio aleatorio (bolas dentro de una
bolsa, tablas de números aleatorios, números aleatorios generados con una calculadora u ordenador,
etc.).
Este procedimiento es adecuado para ambientes homogéneos o población homogénea a la escala de
interés. Se utiliza para datos de medición ([FSH] en sangre) o de % (%NBI en RMBA).
Un ejemplo: selección de ratas en cajas de laboratorio para evaluar efecto de tratamiento y placebo.

Muestreo aleatorio estratificado: Una población se dice estratificada, según una determinada
característica, cuando esa población puede ser subdividida en distintos grupos o categorías
diferentes entre sí, de tal modo que haya gran homogeneidad dentro de los grupos y gran
heterogeneidad entre los grupos. Cada grupo o categoría constituye un estrato.
Por ejemplo, se puede considerar una población de personas estratificada según la profesión, el
sexo, el estado civil, el municipio de residencia, por grupos socioeconómicos, por grupos de nivel
de escolaridad, por naturaleza del lugar de habitación (medio rural o urbano); una población de
hospitales estratificada por el tipo de mantenedor (privado, filantrópico, o publico); etc.
Exige un conocimiento detallado de la población (tamaño geográfico, sexos, edades, ...).

Se selecciona una muestra aleatoria dentro de cada estrato (cada estrato es homogéneo). Cada
estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formarán parte de la muestra.
Es adecuado cuando el ambiente es heterogéneo. Se pretende asegurarse de que todos los estratos de
interés estarán representados adecuadamente en la muestra.

La distribución de la muestra en función de los diferentes estratos se denomina afijación, y puede


ser de diferentes tipos:

Afijación Simple: A cada estrato le corresponde igual número de elementos muestrales.


Afijación Proporcional: La distribución de elementos muestrales se hace de acuerdo con el
peso (tamaño) de la población en cada estrato.
Ruben J. Lombardo Estadistica Aplicada Apunte de clase 3/8

Supongamos que estamos interesados en estudiar el grado de aceptación que la implementación de


una reforma educativa sanitaria ha tenido entre los alumnos de una determinada provincia. A tal
efecto seleccionamos una muestra de 600 sujetos.
Conocemos por los datos del ministerio que de los 10.000 niños escolarizados en las edades que nos
interesan, 6.000 acuden a colegios públicos, 3.000 a colegios privados subsidiados y 1.000 a
colegios privados no subsidiados.
Como estamos interesados en que en la muestra estén representados todos los tipos de colegio,
realizamos un muestreo estratificado empleando como variable de estratificación el tipo de colegio.
Si empleamos una afijación simple elegiríamos 200 niños de cada tipo de colegio, pero en este caso
parece más razonable utilizar una afijación proporcional pues hay bastante diferencia en el tamaño
de los estratos. Por consiguiente, calculamos que proporción supone cada uno de los estratos
respecto de la población para poder reflejarlo en la muestra:
Colegios públicos: 6000/10000 = 0.60
Colegios privados subsidiados: 3000/10000 = 0.30
Colegios privados no subsidiados: 1000/10000 = 0.10

Para conocer el tamaño de cada estrato en la muestra no tenemos más que multiplicar esa
proporción por el tamaño muestral:
Colegios públicos: 0.60x600 = 360 sujetos
Colegios privados subsidiados: 0.30x600 = 180 sujetos
Colegios privados no subsidiados: 0.10x600 = 60 sujetos

Muestreo aleatorio por conglomerados o submuestreo: Cuando en lugar de los elementos de la


población se seleccionan como unidades muestrales grupos, bloques o conjuntos de esas unidades,
se dice que el muestreo es por conglomerados. Por ejemplo si en lugar de seleccionar de forma
aleatoria personas para medir su capacidad adquisitiva o de consumo se seleccionan familias.
Algunas veces el interés es el estudio de personas sin que sea posible muestrearlas directamente, por
el alto costo del listado. En ese caso se puede hacer uso de un muestreo de domicilios, o sea, de los
lugares donde viven las personas. Las personas serán las unidades de análisis y los domicilios las
unidades de muestreo; podría ser también barrio, municipio, ciudad, etc. Un barrio en una ciudad es
un conglomerado de manzanas, que a su vez es un conglomerado de casas.

La unidad muestral es un grupo de elementos de la población que forman una unidad, a la que
llamamos conglomerado. Definida la población de conglomerados, se hace, entre los mismos, una
selección aleatoria simple. Se selecciona aleatoriamente un cierto número de conglomerados (el
necesario para alcanzar el tamaño muestral establecido) y se investigan todos los elementos
pertenecientes a los conglomerados elegidos.

Por ejemplo, si se desea investigar el porcentaje de hojas infestadas por hongos o dañadas por
efecto de contaminación aérea de una especie arbórea caducifolia, se podrían considerar las ramas
nuevas como conglomerados, seleccionar n ramas nuevas al azar y revisar todas las hojas de cada
rama seleccionada, o conglomerado, o submuestra (submuestreo con recuento completo de la
submuestra). ( x: % de hojas infestadas por rama )

Cuando el conglomerado se corresponde con un área geográfica o zona territorial concreta, como
por ejemplo las familias de determinados barrios, el muestreo por conglomerados recibe el nombre
de muestreo por áreas.
Ruben J. Lombardo Estadistica Aplicada Apunte de clase 4/8

Una muestra de conglomerados puede producir un mayor error muestral (menor precisión de las
estimaciones acerca de la población) que una muestra aleatoria simple del mismo tamaño, en caso
de que los elementos individuales dentro de cada conglomerado tiendan a ser iguales.
Por ejemplo, si se consideran áreas como conglomerado en caso en que la gente rica viva en el
mismo barrio, mientras que la gente pobre vive en otra área.

Muestreo aleatorio sistemático: Este procedimiento es adecuado cuando la variación ambiental


tiene forma de gradiente (transecta de gradiente ambiental).
Algunas veces considerado como pseudo probabilístico, consiste en seleccionar n elementos de la
población a intervalos iguales. Se parte de un número aleatorio i, que es un número elegido al azar
entre 1 y k, y los elementos que integran la muestra son los que ocupan los lugares i, i+k, i+2k,
i+3k,..., i+(n-1)k, es decir, se toman los individuos de k en k, siendo k el resultado de dividir el
tamaño de la población (N) entre el tamaño de la muestra (n): k=N/n.

Muestreo secuencial o polietápico: Ante lo compleja que puede llegar a ser la situación real de
muestreo con la que nos enfrentemos es posible emplear un muestreo polietápico, consistente en
operar en sucesivas etapas, empleando en cada una de ellas el método de muestreo probabilístico
más adecuado.

Métodos de muestreo no probabilísticos


A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y se
acude a métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar
generalizaciones, pues no se tiene certeza de que la muestra extraída sea representativa, ya que no
todos los sujetos de la población tienen la misma probabilidad de ser elegidos. Se seleccionan a los
sujetos siguiendo determinados criterios procurando que la muestra sea representativa.

Muestreo por cuotas: También denominado en ocasiones "accidental". Se asienta generalmente


sobre la base de un buen conocimiento de los estratos de la población y/o de los individuos más
"representativos" o "adecuados" para los fines de la investigación. Mantiene, por tanto, semejanzas
con el muestreo aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél. En este
tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos que reúnen unas
determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y
residentes en Rosario. Una vez determinada la cuota se eligen los primeros que se encuentren que
cumplan esas características. Este método se utiliza mucho en las encuestas de opinión.

Muestreo opinático o intencional: Este tipo de muestreo se caracteriza por un esfuerzo deliberado
de obtener muestras "representativas" mediante la inclusión en la muestra de grupos supuestamente
típicos. Es muy frecuente su utilización en sondeos preelectorales de zonas que en anteriores
votaciones han marcado tendencias de voto.

Muestreo casual o incidental: Se trata de un proceso en el que el investigador selecciona directa e


intencionadamente los individuos de la población. El caso más frecuente de este procedimiento es
utilizar como muestra los individuos a los que se tiene fácil acceso (los profesores de universidad
emplean con mucha frecuencia a sus propios alumnos). Un caso particular es el de los voluntarios.

Bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así
hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen
estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc.
Ruben J. Lombardo Estadistica Aplicada Apunte de clase 5/8

La cuestión estadística del tamaño de la muestra

¿Cuál es el tamaño que debe tener mi muestra?


¿Treinta (30) es suficiente? ¿Una fracción de 30% es bastante?
Estas son preguntas que se hace con frecuencia a los estadísticos. Hay que considerar:
Primero: que el número 30 fue intencional, porque parece haber un mito con respecto a él
- mito para el cual no existe ninguna justificativa racional o lógicamente basada (* al pie).
Segundo: la respuesta sensata es que depende de lo que se pretende, de cual (o cuales) es (son) el
(los) objetivo (s) del estudio que se propone; y de que es lo que se conoce sobre el fenómeno de
interés y sobre la población a ser estudiada.

En cualquier circunstancia la determinación del tamaño de la muestra, para cualquiera que sea el
plan de muestreo probabilístico, depende de la existencia de las siguientes informaciones:

a. el valor de variación poblacional de la característica a ser estimada o comprobada;


b. el límite de error de estimación, que caracteriza la precisión - sea error absoluto o relativo -
c. el nivel de confianza.

Diferenciar precisión de exactitud:


Exactitud se refiere a que tan cerca del valor real se encuentra el valor medido.
Precisión se refiere a la dispersión del conjunto de valores obtenidos de mediciones
repetidas de una magnitud.

El tamaño de muestra necesario para estimar la media poblacional de una variable X con una
confianza del α .100% y un error máximo admisible en la precisión E se puede calcular como:

 s s 
Intervalo de α .100% de confianza para la media poblacional µ:  X − tα ⋅ ; X + tα ⋅ 
 n n
s
El error máximo admisible será entonces: E = tα ⋅ , donde tα = Student´t t n-1;1- α/2
n
2
 s
El tamaño mínimo de una muestra (n) viene dado por: n =  tα ⋅ 
 E

Como α y E deben ser fijados por el investigador, el tamaño mínimo de muestra dependerá solo de
la variabilidad de la variable de interés en la población (S), la que debe ser estimada mediante un
premuestreo. En síntesis, sin ninguna información previa es muy difícil, hasta mismo en términos
especulativos, fijar un tamaño de muestra en un muestreo probabilístico.
Adicionalmente, dependiendo del plan de muestreo a ser adoptado puede ser necesaria información
sobre los costos del muestreo por unidad de muestra e información sobre correlación entre los
elementos que serán muestreados.

(*) Teorema central del límite: La distribución de las medias muestrales de tamaño n, extraídas de
una población normal N ( µ ,σ ) , se ajusta a una normal N ( µ ,σ / n ) .
También se ajustan a esa distribución de las medias muestrales si las medias muestrales provienen
de una población no normal, pero el tamaño de las mismas es n ≥ 30.
Pero... este teorema es válido para varias muestras de tamaño n, no para una (para la distribución de
las medias muestrales, no de la variable estudiada – distribución de las X , no de las X).
Ruben J. Lombardo Estadistica Aplicada Apunte de clase 6/8

Como vimos, a mayor tamaño de muestra n, mayor precisión, pero debemos destacar que la
precisión se incrementa a mayor número de unidades muestrales, no de elementos.

Elemento de muestreo: El individuo o elemento sobre el cual recae la investigación, se


determina el valor de la variable x (el árbol, la hoja, la célula, etc.).
Unidad de muestreo: El elemento de la población que se usa como base de la aleatorización.
Esta puede ser un elemento de muestreo, pero puede ser también un grupo de elementos.

En una investigación sobre una población humana el elemento es el individuo; la unidad de


muestreo puede ser el individuo, pero puede ser también la familia, el barrio, la ciudad, etc. Por
ejemplo, si se desea evaluar la eficacia porcentual resultante de la implementación de un plan
escolar experimental y para ello se seleccionan 10 escuelas (con algún criterio válido y aleatorio) y
se encuestan los 2000 alumnos de esas 10 escuelas, n = 10.
El tamaño de muestra será 10, el número de unidades muestrales, ya que tendremos 10 valores de
proporción de eficacia del plan, independientemente del número de alumnos encuestados para
obtenerlos, los elementos muestrales.

Réplicas vs. Pseudoréplicas


Tanto cuando se trabaja con muestreos como con experimentos, es muy importante tener en claro
cuáles son las unidades de muestreo ya que de esto dependerá que las inferencias que se hagan sean
correctas o incorrectas.

Un supuesto básico para hacer inferencias es que las unidades de muestreo (datos) deben ser
totalmente independientes entre sí, esto significa que el valor de un dato no es influido ni influye el
valor de otro. Sin embargo este supuesto es frecuentemente violado.

Según Hurlbert (1984) la pseudoreplicación simple ocurre cuando no hay réplicas verdaderas de
las observaciones porque se tratan como independientes múltiples muestras de cada unidad
experimental o medidas repetidas en la misma muestra.

Por ejemplo, si se quiere determinar la cantidad de insectos por hoja de cierta especie de planta, y se
cuenta la cantidad de insectos en 3 hojas de una planta, 5 de otra y 7 de otra, será un error pensar
que se tienen 15 (3+5+7) datos ya que las hojas de una misma planta tienen más en común entre
ellas que con las de otra planta (si una planta esta infectada o ha sido colonizada, es probable que
presente altas densidades en todas sus hojas). Lo correcto sería realizar un promedio por planta y
luego trabajar con esos promedios como dato (o sea 3 datos).

De manera similar, al realizar experimentos, los datos independientes provendrán de cada unidad
experimental. Si se hacen exclusiones de herbívoros para estudiar su efecto en la producción o
supervivencia de cierta especie de plantas, se pueden construir corrales de alambre tejido que
impidan el ingreso de los herbívoros. Dentro de cada corral, se podrían tomar datos de varias
plantas individuales, pero utilizar esto como réplicas reales es incorrecto, ya que la unidad
experimental es el corral. Los valores medidos sobre las plantas de un mismo corral no son
independientes.

La pseudoreplicación temporal es similar a la simple, la diferencia es que múltiples muestras de


cada unidad experimental no se toman simultáneamente, sino durante un período de tiempo. No se
pueden analizar como independientes, si como bloques o medidas repetidas.
Ruben J. Lombardo Estadistica Aplicada Apunte de clase 7/8

Hurlbert también definió una pseudoreplicación sacrificial, que ocurre cuando se hace un pool de
los datos observados previo al análisis estadístico, y por lo tanto, ¨sacrificando¨ parte de la varianza
muestral.

Hurlbert, S.H. 1984. Pseudoreplication and the design of ecological field experiments. Ecological Monographs 54(2):187-211:

*
*
*
● Dispensador de producto

*
● Dispensador de producto
*

* : réplicas no independientes, se pseudoreplica


Ruben J. Lombardo Estadistica Aplicada Apunte de clase 8/8

Plan de Muestreo ambiental


El plan de muestreo ambiental debe contestar las siguientes preguntas:
¿Cuál matriz se va a analizar?
¿En cuál sitio se va a efectuar el muestreo?
¿Que tipo de muestra se va a colectar?
¿Cuándo se realizará la colecta?
¿Cuál será la frecuencia de muestreo?
¿Cómo se tomarán las muestras?
¿Cuidados de transporte y almacenamiento?

Las matrices pueden ser agua, suelo, sedimento, polvo, alimentos, aire, partículas suspendidas,
hojas, etc. Serán seleccionadas aquellas matrices que más interesen de acuerdo al contaminante en
cuestión, considerando sus características fisicoquímicas.
Adicionalmente, es fundamental el considerar las rutas de exposición. Los sitios de muestreo de
mayor importancia son los puntos de exposición de las rutas previamente identificadas.

Además, hay que muestrear áreas no contaminadas a fin de obtener los valores basales.
En estudios que tienen como objetivo el conocer la extensión de la mancha contaminante el
diseño del muestreo debe considerar un modelaje estadístico, donde el número de muestras y los
puntos de muestreo estarán dictados por la precisión definida por el propio investigador.

El tipo de muestra, por ejemplo: simple, compuesta o integrada, de suelo superficial o suelo
profundo, etc., será determinado de acuerdo a los objetivos del trabajo.

La frecuencia de muestreo (diaria, mensual, estacional, etc.) y el momento del muestreo (diurno,
nocturno, inmediatamente luego de una lluvia, etc.) serán determinados por el tipo de matriz
(acuífero, río, suelo,…) y por el conocimiento del sistema en estudio, como la dinámica temporal
del contaminante, su persistencia en el ambiente, etc.
Así, en las zonas palustres, el muestreo podría estar definido por la época de aplicación de los
insecticidas y la frecuencia debería basarse en los parámetros de degradación del insecticida
aplicado. En cualquier caso, el diseño considerará la época de máxima exposición; es decir, el
momento en el tiempo donde sea más probable el contacto del contaminante con los seres vivos.

El muestreo deberá realizarse en condiciones adecuadas.


El investigador debe conocer el material requerido para la toma y el almacenamiento de las
muestras, según la matriz a muestrear y de acuerdo al contaminante. Atención especial merece la
limpieza de los contenedores empleados en los muestreos, a fin de evitar falsos positivos.

El transporte de las muestras del sitio al laboratorio debe realizarse de acuerdo a los estándares de
seguridad más indicados. Deben evitarse pérdidas por volatilidad o degradación. En algunos casos
se aconseja el empleo de fijadores, de antimicrobianos y la baja temperatura y oscuridad. Cada tipo
de contaminante requiere un trato particular. Además, es posible que eventualmente se requiera
cadena de custodia al laboratorio donde se realizan los análisis.

También podría gustarte