Aula 01 - Introdução À Inferência Estatística

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 33

Introdução à Inferência Estatı́stica

Aula 1

Prof. Dr. Jhonnata Carvalho

Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 1 / 32


Introdução

Na primeira unidade do curso, vimos como extrair informações dos da-


dos através de medidas de resumo e dispersão. Na segunda unidade,
vimos a construção de alguns modelos probabilı́sticos e como eles po-
dem ser empregados em diversas situações. Nessa terceira unidade,
vamos conhecer conceitos estatı́sticos que extrapolam resultados obti-
dos na amostra para a população.

Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 2 / 32


Conceitos

Segundo Morettin e Bussab (2017)

Denifição
População é o conjunto de todos os elementos ou resultados sob in-
vestigação.

Denifição
Amostra é qualquer subconjunto da população.

Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 3 / 32


Conceitos

Exemplo retirado de Morettin e Bussab (2017): Consideremos uma


pesquisa para estudar os salários dos 500 funcionários da Companhia
MB. Seleciona-se uma amostra de 36 indivı́duos, e anotam-se os seus
salários. A variável aleatória a ser observada é salário. A população
é formada pelos 500 funcionários da companhia. A amostra é cons-
tituı́da pelos 36 indivı́duos selecionados. Na realidade, estamos inte-
ressados nos salários, portanto, para sermos mais precisos, devemos
considerar como a população os 500 salários correspondentes aos 500
funcionários. Consequentemente, a amostra será formada pelos 36
salários dos indivı́duos selecionados.

Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 4 / 32


Conceitos

Exemplo retirado de Morettin e Bussab (2017): Queremos estudar a


proporção de indivı́duos na cidade A que são favoráveis a certo projeto
governamental. Uma amostra de 200 pessoas é sorteada, e a opinião
de cada uma é registrada como sendo a favor ou contra o projeto. A
população consiste de todos os moradores da cidade, e a amostra é
formada pelas 200 pessoas selecionadas. Podemos, como foi visto na
unidade 2, definir a variável X , que toma o valor 1, se a resposta de um
morador for favorável (sucesso), e o valor 0, se a resposta for contrária
ao projeto. Assim, nossa população pode ser reduzida à distribuição
de X , e a amostra será constituı́da de uma sequência de 200 zeros e
uns.

Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 5 / 32


Conceitos

Poderı́amos supor que a distribuição das alturas dos brasileiros adultos


possa ser representado por um modelo normal, com parâmetros µ e
2
σ . Se pudéssemos medir as alturas de todos os brasileiros adultos,
poderı́amos obter a distribuição exata e, daı́, produzir os correspon-
dentes parâmetros (MORETTIN; BUSSAB, 2017).

Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 6 / 32


Conceitos

Raramente se consegue obter a distribuição exata de alguma variável,


ou porque isso é muito dispendioso, ou muito demorado ou às vezes
porque consiste num processo destrutivo. Por exemplo, se estivéssemos
observando a durabilidade de lâmpadas e testássemos todas até quei-
marem, não restaria nenhuma para ser vendida. Assim, a solução é
selecionar parte dos elementos (amostra), analisá-la e inferir proprie-
dades para o todo (população) (MORETTIN; BUSSAB, 2017).

Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 7 / 32


Como selecionar uma amostra

Segundo Morettin e Bussab (2017), a maneira de se obter a amos-


tra é tão importante, e existem tantos modos de fazê-lo, que esses
procedimentos constituem especialidades dentro da Estatı́stica, sendo
Amostragem e Planejamento de Experimentos as duas mais conheci-
das. Poderı́amos dividir os procedimentos cientı́ficos de obtenção de
dados amostrais em três grandes grupos:
Levantamentos amostrais:
Planejamento de experimentos;
Levantamentos observacionais.

Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 8 / 32


Como selecionar uma amostra

Levantamentos amostrais: nos quais a amostra é obtida de uma


população bem definida, por meio de processos bem protocolados e
controlados pelo pesquisador. Podemos, ainda, subdividi-los em dois
subgrupos: levantamentos probabilı́sticos e não probabilı́sticos. O pri-
meiro reúne todas aquelas técnicas que usam mecanismos aleatórios
de seleção dos elementos de uma amostra, atribuindo a cada um deles
uma probabilidade, conhecida a priori, de pertencer à amostra. No
segundo grupo estão os demais procedimentos, tais como: amostras
intencionais, nas quais os elementos são selecionados com o auxı́lio de
especialistas, e amostras de voluntários, como ocorre em alguns testes
sobre novos medicamentos e vacinas.

Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 9 / 32


Como selecionar uma amostra

Planejamento de experimentos: cujo principal objetivo é o de ana-


lisar o efeito de uma variável sobre outra. Requer, portanto, inter-
ferências do pesquisador sobre o ambiente em estudo (população),
bem como o controle de fatores externos, com o intuito de medir o
efeito desejado. Pode-se citar como exemplo, os ensaios clı́nicos em
medicina, esse tipo de estudo é bastante usado, como por exemplo,
para testar se um novo medicamento é eficaz ou não para curar certa
doença.

Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 10 / 32


Como selecionar uma amostra

Levantamentos observacionais: aqui, os dados são coletados sem


que o pesquisador tenha controle sobre as informações obtidas, exceto
eventualmente sobre possı́veis erros grosseiros. As séries de dados
temporais são exemplos tı́picos desses levantamentos. Por exemplo,
queremos prever as vendas de uma empresa em função de vendas pas-
sadas. O pesquisador não pode selecionar dados, esses são as vendas
efetivamente ocorridas. Nesses casos, a especificação de um modelo
desempenha um papel crucial na ligação entre dados e população.

Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 11 / 32


Amostra aleatória simples

A amostragem pode ser feita de duas maneiras:


Amostragem probabilı́stica: todo o elemento da população possui
uma probabilidade positiva (maior que zero) de ser selecionado. O
cumprimento deste critério é o que torna possı́vel obter resultados
não tendenciosos quando se estuda a amostra.

Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 12 / 32


Amostra aleatória simples

Amostragem não probabilı́stica: a amostra é escolhida por um


processo que não dá a todos elementos da população uma pro-
babilidade (maior que zero) de ser selecionado. Essa abordagem
possui um custo bem menor e, geralmente, as conclusões não re-
fletem bem o comportamento da população.
Z Conveniência: entrevistar pessoas em um local da cidade sobre a
preferência polı́tica. Entrevistas através de ligações telefônicas,
e-mail, redes sociais etc.
Z Cota: classificar a população em classes (sexo, cor, escolari-
dade renda etc), determinar a proporção da população para cada
classe, fixar cotas em observância à proporção das classes consi-
deradas. Ex: pesquisas eleitorais e de mercado.

Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 13 / 32


Amostra aleatória simples

A amostragem aleatória simples (AAS) é a maneira mais fácil (simples)


para selecionar uma amostra probabilı́stica da população. Comecemos
introduzindo o conceito de AAS de uma população finita, para a qual
temos uma listagem de todas as N unidades da população. Pode-
mos obter uma amostra nessas condições, rotulamos os elementos da
população e um sorteio é realizado para selecionar os indivı́duos que
farão parte da amostra. Portanto, todo elemento da população possui
a mesma probabilidade de ser sorteado.
Recomendável quando a população é homogênea.
Caso a população seja muito grande, é inviável realizar esse
procedimento manualmente. Portanto, é necessário utilizar
algum software.

Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 14 / 32


Amostra aleatória simples

Vantagens da AAS
Com o avanço computacional é possı́vel estabelecer os
elementos da amostra aleatória simples de forma rápida e
totalmente confiável.
A obtenção de amostras representativas da população.
Desvantagens da AAS
Custo: contratar pessoal, material etc.
Dificuldade de aplicação em diversas pesquisas, em que não é
possı́vel obter uma lista com todos os elementos da população.

Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 15 / 32


Amostra aleatória simples

A AAS pode ser realizada de duas forma:


Com reposição: após o elemento ser sorteado ele é devolvido à
população e pode ser sorteado novamente.
Sem reposição: após o elemento ser sorteado, ele não é
devolvido à população, consequentemente, não pode ser
sorteado novamente.

Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 16 / 32


Na Figura 1 temos a ilustração de uma população com 10 indivı́duos,
em que os indivı́duos 1, 3, 6 e 10 foram selecionados.

1 2 3 4 5

6 7 8 9 10

Figura 1: Representação gráfica da amostragem. Arte do boneco retirada


de Dreamstime.

Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 17 / 32


Amostra aleatória simples

Vejamos um exemplo: considere que nossa população é formada pelo


conjunto r1, 3, 5, 6, 8x. Nesse caso, o tamanho da nossa população
é N 5. Vamos selecionar uma amostra de tamanho n 2 com
reposição. Note que a probabilidade de sortear qualquer elemento é
igual a 1©N 1©5 0, 2.
Rotulamos os elementos da população de 1 até 5 e realizamos um
sorteio. Alguns possı́veis resultados são:
r1, 1x; r3, 3x; r5, 5x; r6, 6x; r8, 8x;
r1, 3x; r3, 5x; r5, 6x; r6, 8x; r8, 1x

Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 18 / 32


Amostra aleatória simples

Considerando o mesmo problema amos selecionar uma amostra de ta-


manho n 2 sem reposição da população r1, 3, 5, 6, 8x. Note que a
probabilidade de sortear o primeiro elemento, todos possuem a mesma
probabilidade de ser sorteado que é igual a 1©N 1©5 0, 2. Em
relação ao segundo elemento, a probabilidade é igual a 1© N 1 
1©4 0, 25.
Rotulamos os elementos da população de 1 até 5 e realizamos um
sorteio. Alguns possı́veis resultados são:
r1, 3x; r1, 5x; r1, 6x; r1, 8x;
r3, 5x; r6, 8x; r5, 6x;
Vejamos como fazer isso no software R.

Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 19 / 32


Amostra aleatória simples

Vejamos alguns modelos de questionário aplicados em pesquisas elei-


torais no estado do Amazonas em 2018 retirados do Tribunal Superior
Eleitoral (TSE) (https://www.tse.jus.br/eleicoes/pesquisa-eleitorais).

Resultado de uma pesquisa G1.

Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 20 / 32


Amostra aleatória simples

Definição
Uma amostra aleatória simples de tamanho n de uma variável aleatória
X com dada distribuição (densidade ou função de probabilidade), é o
conjunto de n variáveis aleatórias independentes X1 , X2 , . . . , Xn , cada
uma com a mesma distribuição de X (MORETTIN; BUSSAB, 2017).

obs: usaremos letras maiúsculas para representar as variáveis aleatórias


e lestra minúsculas para representar os valores observados da variável
aleatória, ex: X1 é a variável aleatória e x1 é o valor observado.

Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 21 / 32


Amostra aleatória simples

Quando a população em estudo é caracterizada por uma função de den-


sidade (ou função de probabilidade) podemos gerar números aleatórios
(pseudoaleatório) e estudar o comportamento da distribuição.

comentário: o termo pseudo é utilizado na lı́ngua portuguesa para


indicar um teor não verdadeiro, ou seja, algo que finge ser o que não
é.

Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 22 / 32


Amostra aleatória simples
Exemplo retirado de Morettin e Bussab (2017): considere retirar uma
amostra aleatória simples da população de mulheres cujas alturas X
segue uma distribuição N 167; 25. Utilizando o gerador do Excel,
com um tamanho amostral n 5, os valores obtidos foram:

x1 165, x2 161, x3 168, x4 173, x5 173.

Note que, se você for gerar uma tal amostra, poderá obter valores
diferentes desses. Observe, também, que o primeiro elemento a ser
observado pode ser qualquer valor da população simulada N 167; 25.
Desse modo, indicando por X1 o valor observado na primeira extração,
concluı́mos que X1  N 167; 25. Como a geração do segundo número
aleatório é feita independentemente do primeiro, resulta que a X2 ,
valor observado na segunda extração, também segue uma distribuição
N 167; 25, e assim por diante.

Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 23 / 32


Amostra aleatória simples

No software R existe uma função chamada rnorm(n,mu,s), no qual


o usuário deve fornecer o tamanho da amostra n, o parâmetro µ e o
desvio padrão σ. Vejamos como fazer uma simulação do mesmo tipo
utilizando o R.

Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 24 / 32


Estatı́stica e Parâmetros

Quando obtemos uma amostra temos o interesse em extrair informações.


Por exemplo, poderı́amos calcular a média da amostra X1 , X2 , . . . , Xn ,
nesse caso temos

<X
n

 X    X .
i
i 1 1
X n n X1 2 n

Perceba que X também é uma variável aleatória. Portanto, podemos


estar interessados em outras caracterı́sticas da amostra X1 , X2 , . . . , Xn ,
que também resultará em uma variável aleatória.

Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 25 / 32


Estatı́stica e Parâmetros
Definição
Uma estatı́stica é uma caracterı́stica da amostra, ou seja, uma
estatı́stica T é uma função de X1 , X2 , . . . , Xn .
As estatı́sticas mais comuns são:

=X
n
1
X n i (média da amostra)
i 1

= X  X 
n
1
n1
2 2
S i (variância da amostra)
i 1
X 1 min X1 , X2 , . . . , Xn  (mı́nimo da amostra)
X n max X1 , X2 , . . . , Xn  (máximo da amostra)
AT 
X n X 1 (amplitude da amostra)
X i (a i-ésima observação da amostra)
Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 26 / 32
Estatı́stica e Parâmetros

Outras estatı́sticas que já utilizamos são os quartis, decis, percentis e


a moda.

Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 27 / 32


Estatı́stica e Parâmetros

Definição
Segundo Morettin e Bussab (2017), um parâmetro é uma medida
usada para descrever uma caracterı́stica da população.

Exemplos: altura média de adultos da população brasileira; peso médio


de adultos da população brasileira; idade média da população brasileira;
taxa de mortalidade em crianças; percentual de votos válidos para um
candidato na eleição etc.

Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 28 / 32


Exercı́cios
Retirado de Morettin e Bussab (2017): A distribuição do número de
filhos, por famı́lia, de uma zona rural está no quadro abaixo.
Nº de filhos Frequência
0 10
1 20
2 30
3 25
4 15
Total 100

a) Sugira um procedimento para sortear uma observação ao acaso


dessa população.
b) Se fosse escolhida uma amostra de tamanho 4, qual seria a
probabilidade de se observar a amostra na ordem (2, 3, 3, 1)?
Calcule com e sem reposição.
Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 29 / 32
Exercı́cios

a) Colocar em uma urna 100 fichas, sendo 10 com o número zero, 20


com número 1, 30 com o número 2, 25 com o número 3 e 15 com o
número 4. Sortear uma ficha da urna. Esse mecanismo pode ser feito
Com reposição;
Sem reposição.

Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 30 / 32


Exercı́cios
b) ordem (2, 3, 3, 1) com reposição

Nº de filhos Frequência
0 10
1 20
2 30
3 25
4 15
Total 100

Considere os eventos A1 ”1 filho”, A2 ”2 filhos”e A3 ”3 filhos”.

P A2 A3 A3 A1  P A2 P A3 ¶A2 P A3 ¶A2 A3 P A1 ¶A2 A3 A3 


30 25 25 20
0, 00375
100 100 100 100

Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 31 / 32


Exercı́cios
b) ordem (2, 3, 3, 1) sem reposição

Nº de filhos Frequência
0 10
1 20
2 30
3 25
4 15
Total 100

Considere os eventos A1 ”1 filho”, A2 ”2 filhos”e A3 ”3 filhos”.

P A2 A3 A3 A1  P A2 P A3 ¶A2 P A3 ¶A2 A3 P A1 ¶A2 A3 A3 


30 25 24 20
0, 003825
100 99 98 97

Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 32 / 32


MORETTIN, P. A.; BUSSAB, W. O. Estatı́stica básica. [S.l.]:
Editora Saraiva, 2017.

Prof. Dr. Jhonnata Carvalho Introdução à Inferência Estatı́stica Aula 1 32 / 32

Você também pode gostar