Teoria Elementar de Amostragem
Teoria Elementar de Amostragem
Teoria Elementar de Amostragem
Conteúdos
I. INTRODUÇÃO....................................................................................................................................2
II. OBJETIVOS.........................................................................................................................................3
2.1. Geral..............................................................................................................................................3
2.2. Específicos..........................................................................................................................................3
8. CONCLUSÃO........................................................................................................................................15
9. REFERÊNCIA BIBLIOGRÁFICA.....................................................................................................16
1
I. INTRODUÇÃO
2
II. OBJETIVOS
II.1. Geral
Apresentar a Teoria Elementar de Amostragem
2.2. Específicos
Representatividade amostral;
3
I. Teoria Elementar de Amostragem
I.1. Conceito da Teoria de amostragem
A amostragem consiste em observar ou mensurar uma parte de uma população florestal para obter
estimativas representativas de todo o restante desta mesma população. É uma forma de estimar, com
confiança, parâmetros populacionais sem precisar mensurar toda a população.
Deve-se entender a população como uma floresta ou forma de vegetação definida e com limites físicos
conhecidos, ou seja, uma área especificamente determinada no espaço e no tempo, podendo abranger um
país, um estado, uma região, um bioma, um determinado ecossistema ou um habitat específico, como uma
mata de galeria dentro de uma região ou município, por exemplo, e um talhão de um plantio florestal.
A amostra é uma parte da população e a unidade amostral é o espaço físico onde são medidas as
características da floresta. Em geral, as unidades amostrais possuem área fixa, mas também podem ser de
área variável, como no método de Prodan e na amostragem por pontos quadrantes.
As unidades amostrais de área fixa podem variar em tamanho e em forma, sendo comumente
denominadas de Parcelas.
As parcelas circulares apresentam como vantagem em relação às demais, o fato de possuírem maior área
em relação ao perímetro e, deste modo, diminui-se as chances de erro relacionados à inclusão e exclusão
de árvores na amostragem. Erros associados às medições das árvores localizadas próximas às bordas da
unidade amostral, o chamado de efeito de borda. Estas parcelas são mais difíceis de serem instaladas e
medidas no campo e, por este motivo, não são muito utilizadas.
As parcelas retangulares possuem maior efeito de borda, mas captam melhor os efeitos de gradientes
ambientais e facilitam a orientação dos trabalhos dentro das mesmas. Por esses motivos as parcelas
retangulares são as mais usuais.
4
3.3 Representatividade amostral
O número de unidades amostrais a serem mensuradas em uma floresta (ou o número de árvores a serem
cubadas rigorosamente; ou ainda o número de árvores que terão os seus pares de altura e DAP medidos,
para o ajuste de equações hipsométricas), deve ser baseado em um limite de erro estabelecido pelo
pesquisador/mensurador, conforme um determinado nível de probabilidade, para a variável de interesse
(densidade arbórea, DAP, altura, volume, cobertura do solo, etc).
Não existe um número mínimo de parcelas a serem consideradas na amostragem piloto ou pré-
amostragem, mas deve-se observar alguns procedimentos padronizados por pesquisadores e que facilitam
as análises, comparações e interpretação dos resultados. Em vegetação nativa, no Cerrado, para o cálculo
da variância exige-se no mínimo 10 unidades amostrais, enquanto que para análises de regressão exige-se
no mínimo 30 unidades amostrais, como preconizado no Manual de Parcelas Permanentes dos Biomas
Cerrado e Pantanal (FELFILI et al. 2005).
No caso das análises de regressão, há diferentes formas de avaliar se um modelo foi bem ajustado ou não.
Avalia-se as distribuições gráficas dos resíduos, os coeficientes de determinação múltipla, os erros-
padrão, a significância dos coeficientes de regressão parcial, assim como a multicolinearidade das
variáveis, conforme recomendado por Drapper (1981) e Zar (2010). Os seguintes softwares podem ser
utilizados no ajuste das equações: Microsoft Excell®, R® e PAST®.
Se uma amostra não for selecionada aleatoriamente, ela provavelmente será tendenciosa de alguma forma,
e os dados não representarão corretamente a população.
5
3.5.1 Maneiras ruins de selecionar uma amostra
Amostra por conveniência: o pesquisador escolhe uma amostra prontamente disponível de alguma
maneira não aleatória.
Por que esse método pode ser tendencioso: o local e horário do dia, bem como outros fatores, podem
produzir uma amostra parcial de pessoas.
Amostra de resposta voluntária: o pesquisador faz um pedido aos membros de uma população para que
eles entrem na amostra, e as pessoas decidem se entrarão ou não nela.
Exemplo: um apresentador de programa de TV pede que seus telespectadores acessem seu site e
respondam a uma pesquisa on-line.
Por que esse método pode ser tendencioso: as pessoas que resolverem responder tendem a ter opiniões
básicas semelhantes, em comparação ao restante da população.
Amostra aleatória simples: cada membro ou conjunto de membros tem a mesma chance de ser incluído
na amostra. Tecnologia, geradores de números aleatórios ou algum outro tipo de processo aleatório são
necessários para obter uma amostra aleatória simples.
Exemplo: um professor coloca os nomes dos alunos em um boné e seleciona alguns sem olhar, para obter
uma amostra de alunos.
Por que esse método é bom: amostras aleatórias costumam oferecer uma representação verossímil, pois
não favorecem determinados membros.
Amostra aleatória estratificada: primeiro, a população é dividida em grupos. A amostra geral consiste
em alguns membros de cada grupo. Os membros de cada grupo são escolhidos aleatoriamente.
Por que esse método é bom: uma amostra estratificada garante que os membros de cada grupo sejam
representados na amostra, então, este método de amostragem é interessante quando queremos incluir
alguns membros de cada grupo.
Amostra aleatória por agrupamento: primeiro, a população é dividida em grupos. A amostra geral é
formada por todos os membros de alguns dos grupos. Os grupos são selecionados aleatoriamente.
6
Por que esse método é bom: uma amostra por agrupamento envolve todos os membros de alguns dos
grupos, então ele é interessante quando cada grupo reflete a população como um todo.
Geralmente essa conveniência representa uma maior facilidade operacional e baixo custo de amostragem.
Porém, tem como limitação a falta de representatividade e a impossibilidade da realização de declarações
sobre os resultados sem correr nenhum risco devido ao critério de amostragem aplicado. Por exemplo, um
pesquisador poderia abordar pessoas em uma esquina quando elas passam, embora seja extremamente
arriscado. Como pode ser observado, este método não permite que o pesquisador tenha qualquer controle
sobre a representatividade da amostra.
Esse método é amplamente utilizado em diversas áreas do conhecimento, incluindo especialmente tópicos
relacionados à ciência da computação e à combinatória.
Nosso projeto foi a leitura de um livro a esse respeito, chamado "O Método Probabilístico".
7
Com isso, o aluno pôde adquirir aptidão com o uso do método, e também ter contato com áreas diversas
da Ciência da Computação, o que será útil na escolha da área de um futuro mestrado.
Após a leitura, selecionamos três tópicos que o livro apresenta, e os desenvolvemos em maior detalhe. É
esse desenvolvimento que apresentamos aqui.
O primeiro resultado que apresentamos é, historicamente, o primeiro resultado da área de grafos
aleatórios. Serve como introdução a essa área de estudo, e ilustra o uso de ferramentas clássicas para o
uso do método probabilístico.
O segundo resultado que apresentamos é o teorema de Shannon. Esse teorema é um dos teoremas
fundamentais de Teoria da Informação. Ele estabelece qual a mínima perda de velocidade necessária para
se reduzir a probabilidade de erro num determinado meio físico de comunicação.
Quando estamos fazendo pesquisas em uma população grande, normalmente temos interesse no grupo
como um todo, mas não temos como obter respostas de todo mundo. Nessa hora, selecionamos um grupo
aleatório de pessoas para representar essa população.
Definir o tamanho da amostra (ou amostragem) é muito importante para obter resultados precisos e
estatisticamente significativos, uma vez que isso vai ajudar a definir o sucesso da sua pesquisa.
8
Se a amostragem for muito pequena, pode ser que você inclua um número desproporcional de
pessoas que desviam muito da norma. Isso acabará por afetar os resultados, e você não obterá um
retrato justo daquela população.
Se a amostragem for muito grande, a pesquisa se torna muito complexa, cara e extensa. E,
nesse caso, nem os resultados mais precisos compensam o alto custo.
Para escolher o tamanho da amostra, é necessário considerar alguns fatores que afetam a pesquisa e
entender um pouco sobre a estatística envolvida. Depois, você conseguirá usar uma fórmula para reunir
todas essas informações – com a certeza de que existe uma alta probabilidade da pesquisa dar certo.
As etapas abaixo servem para definir uma amostragem para dados contínuos (ou seja, dados numéricos).
Ela não se aplica a dados categóricos (ou seja, categorias como verde, azul, homem, mulher, etc.).
Antes de calcular um tamanho de amostra, é necessário determinar algumas coisas sobre a população e o
nível de precisão que você quer:
De quantas pessoas estamos falando? Para descobrir isso, é importante saber exatamente quem se encaixa
e quem não se encaixa no seu grupo. Por exemplo, se você quiser pesquisar tutores de cães, incluirá todas
as pessoas que em algum momento tiveram pelo menos um cão. (Dependendo do objetivo, pode ser
interessante excluir pessoas que não têm um cão no momento.) Se não for possível calcular o número
exato, tudo bem; é comum ter um número desconhecido ou uma faixa de estimativa.
Erros são inevitáveis. A questão aqui é quanto de erro será tolerado na pesquisa. A margem de erro,
também conhecida como intervalo de confiança, é expressa em média – e é possível definir quanta
9
diferença você permitirá entre a média da sua amostragem e a média da sua população. Se você já prestou
atenção às pesquisas eleitorais, certamente já viu uma representação da margem de erro. É mais ou menos
assim: “68% da população disse sim para a Proposição Z, com uma margem de erro de +/- 5%.”
Esse é um conceito diferente do “intervalo de confiança” que mencionamos na etapa 2. A questão aqui é o
quanto você quer estar confiante de que a média real está dentro da sua margem de erro. Os intervalos de
confiança mais comuns são 90% de confiança, 95% de confiança e 99% de confiança.
Nesta etapa, você deverá estimar o quanto as respostas que você receber variarão umas das outras e da
média. Um desvio padrão baixo significa que todos os valores estarão próximos da média, e um desvio
padrão alto significa que eles estarão mais espalhados em uma faixa mais longa com números bem baixos
e bem altos nas extremidades. Como você ainda não fez a pesquisa, uma escolha mais segura é um desvio
padrão de 0,5, que vai ajudar a garantir que sua amostragem seja suficiente.
A próxima etapa é transformar seu nível de confiança em um escore-z. Veja os escores-z para os níveis de
confiança mais comuns:
10
Se você escolher um nível de confiança diferente, use esta tabela de escore-z (um recurso da SJSU.edu)
para encontrar o seu escore.
Esta equação é para um tamanho de população desconhecido ou muito grande. Se a sua população for
menor e conhecida, basta usar a calculadora de tamanho de amostra.
Isso aumentará as chances de erro na sua amostragem, mas reduzirá bastante o número de respostas
necessárias.
11
7.2 Erro não amostral
O erro amostral pode ser contrastado com o erro não amostral. O erro não amostral é um termo
abrangente para os desvios em relação ao valor real que não são uma função da amostra escolhida,
incluindo vários erros sistemáticos e quaisquer erros aleatórios que não sejam causados pela amostragem.
Erros não amostrais são muito mais difíceis de quantificar que o erro amostral.
De acordo com a teoria e confirmado pelo de simulações conseguimos verificar que a distribuição das
médias amostrais resulta em uma distribuição na forma de uma normal, com os seguintes parâmetros:
Isso significa dizer que se a população do qual são retidas as amostras segue uma distribuição de
probabilidade qualquer a variável aleatória X tenderá à uma distribuição Normal com média μ e desvio
padrão σ/√n a medida que o n (tamanho da amostra) aumenta.
Porém se a variável aleatória X for padronizada para Zn esta tenderá à uma distribuição normal padrão,
com média 0 e desvio padrão 1.
12
Distribuição das proporções amostrais P
Da mesma forma que o exposto para as médias amostrais, a resultante para a variável aleatória proporção
amostral é válida. Porém a v.a. é oriunda da soma de v.a. Bernoulli, ou seja soma de v.a.s X∼Ber(p).
Como resultado teremos uma distribuição normal, P^∼N(p,p(1−p)/n)
Sejam duas populações A e B, para cada uma delas os parâmetros podem ser calculados. Agora suponha
que possam ser calculadas as diferenças entre as médias de todas as combinações possíveis de amostras
de tamanho nA e nB das populações A e B.
13
Assim teremos uma distribuição denominada Distribuição Amostral das Diferenças entre médias (ou
proporções). Da mesma forma se aplicam os resultados para a soma destas. Assim temos que
Agora que temos a distribuição amostral da média da amostra, vamos voltar nossa atenção para encontrar
a distribuição amostral da variância da amostra. O seguinte teorema fará o truque para nós.
14
8. CONCLUSÃO
Ela é útil para a avaliação de grandezas desconhecidas da população (como sua média, sua
variância, etc); denominadas comumente de parâmetros populacionais, através do conhecimento
das grandezas correspondentes das amostras. Essa teoria ajuda, também, a determinar se
diferenças observadas entre duas amostras são realmente devidas uma variação casual ou se são
verdadeiramente significativas.
15
9. REFERÊNCIA BIBLIOGRÁFICA
TRIOLA, Mário F. Introdução à Estatística. 7a. Ed. Rio de Janeiro: LTC, 1999. • LEVINE, D.
M. BERENSON, M. L. / STEPHAN, David. Estatística: Teoria e Aplicações usando Microsoft
Excel em Português. Rio de Janeiro: LTC, 2000.
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/distribuicao_amostral.html, consultado em
10 de Outubro de 2023 as 14:07.
16