UD5 Distribuicao Amostral e Estimacao
UD5 Distribuicao Amostral e Estimacao
UD5 Distribuicao Amostral e Estimacao
Departamento de Estatística
Universidade Federal do Paraná
I População → distribuição de
probabilidade.
I Intuição → Como que a v.a. deve se
comportar na população. Parâmetros:
I Variável → variável aleatória. µ, σ 2 , θ, ρ,
P(Y ≤ y), etc.
P(Y = y) = py (1 − p)1−y .
P(Y = y) = py (1 − p)1−y .
p̂2
I Se o experimento for repetido um
p̂3
número grande de vezes e a cada
realização p̂ for obtido, o que
p̂4
aconteceria? p̂5
p̂6
I p̂ é uma variável aleatória.
p̂7
I Se é variável aleatória, então tem p̂8
Frequência relativa
0.2
0.1
0.0
I Veja que mesmo se o valor verdadeiro for p = 0,8 existe uma probabilidade não
desprezível de observarmos 7 pessoas com anticorpos entre as 10 avaliadas.
I A incerteza associada ao valor de p no caso de apenas 10 observações é grande.
I Como podemos diminuir esta incerteza?
I Veja que mesmo se o valor verdadeiro for p = 0,8 existe uma probabilidade não
desprezível de observarmos 7 pessoas com anticorpos entre as 10 avaliadas.
I A incerteza associada ao valor de p no caso de apenas 10 observações é grande.
I Como podemos diminuir esta incerteza?
I Solução: Aumentar o número de observações.
0
n = 50 n = 100 n = 500
500
400
300
200
100
0
0.25 0.50 0.75 1.00 0.25 0.50 0.75 1.00 0.25 0.50 0.75 1.00
Proporção estimada (p
^)
0.08
I Suponha que uma amostra (AAS) de
Densidade
0.04
tamanho n = 293 foi obtida.
0.00
120 140 160 180 200 220
0.04
x
Log−normal
0.08
0.03
Densidade
0.04
Density
0.02
0.00
0.01
Gama
0.030
150 160 170 180 190
Densidade
quest$altura
0.015
Figura 5. Histograma da altura dos alunos UFPR.
0.000
Qual modelo é o mais provável de ter
120 140 160 180 200 220
I x
0.04
I Modelo Normal
Densidade
I
n 2
o
I f (y) = √ 1 exp − (y−µ) ;
2πσ 2 2σ 2
I E(Y ) = µ e V(Y ) = σ 2 .
0.00
Quais os valores de µ e σ 2 devo usar?
120 140 160 180 200 220
I Altura
1.0
I
amostrais?
0.8
1
Pn 1
Pn
yi e σ̂ 2 = − µ̂)2 .
0.4 0.6
µ̂ = i=1 (yi
Fn(x)
I
n i=1 n
I Como medir a incerteza em µ̂ e σ̂ 2 ,
0.2
sendo que temos apenas uma
0.0
amostra? → Distribuição amostral. 150 160 170 180 190
Altura
I E para os outros modelos? → Métodos
Figura 7. Ajuste da distribuição Normal para a
para estimação de parâmetros. variável altura.
Prof. Wagner Hugo Bonat Inferência estatística · Visão geral 15
Distribuição amostral
I Modelo → comportamento da
natureza.
I Parâmetros do modelo → parâmetros
populacionais de interesse.
I Qual modelo melhor descreve os Parâmetros:
µ, σ 2 , θ, ρ,
dados? P(Y ≤ y), etc.
amostra. Estatísticas:
ȳ, S 2 , θ̂, r,
I Descrever a incerteza → distribuição Amostra Freq(Y ≤ y), etc.
amostral.
Figura 9. Processo de inferência estatística.
Prof. Wagner Hugo Bonat Inferência estatística · Visão geral 17
Distribuição amostral e estimação
Departamento de Estatística
Universidade Federal do Paraná
Métodos de Estimação
Probabilidades
amostragem pontual e intervalar
Distribuições de
Medidas resumo Métodos estatísticos
probabilidade
Departamento de Estatística
Universidade Federal do Paraná
Métodos de Estimação
Probabilidades
amostragem pontual e intervalar
Distribuições de
Medidas resumo Métodos estatísticos
probabilidade
I População → distribuição de
probabilidade.
I Intuição → Como que a v.a. deve se
comportar na população. Parâmetros:
I Variável → variável aleatória. µ, σ 2 , θ, ρ,
P(Y ≤ y), etc.
P(Y = y) = py (1 − p)1−y .
P(Y = y) = py (1 − p)1−y .
p̂2
I Se o experimento for repetido um
p̂3
número grande de vezes e a cada
realização p̂ for obtido, o que
p̂4
aconteceria? p̂5
p̂6
I p̂ é uma variável aleatória.
p̂7
I Se é variável aleatória, então tem p̂8
Frequência relativa
0.2
0.1
0.0
I Veja que mesmo se o valor verdadeiro for p = 0,8 existe uma probabilidade não
desprezível de observarmos 7 pessoas com anticorpos entre as 10 avaliadas.
I A incerteza associada ao valor de p no caso de apenas 10 observações é grande.
I Como podemos diminuir esta incerteza?
I Veja que mesmo se o valor verdadeiro for p = 0,8 existe uma probabilidade não
desprezível de observarmos 7 pessoas com anticorpos entre as 10 avaliadas.
I A incerteza associada ao valor de p no caso de apenas 10 observações é grande.
I Como podemos diminuir esta incerteza?
I Solução: Aumentar o número de observações.
0
n = 50 n = 100 n = 500
500
400
300
200
100
0
0.25 0.50 0.75 1.00 0.25 0.50 0.75 1.00 0.25 0.50 0.75 1.00
Proporção estimada (p
^)
0.08
I Suponha que uma amostra (AAS) de
Densidade
0.04
tamanho n = 293 foi obtida.
0.00
120 140 160 180 200 220
0.04
x
Log−normal
0.08
0.03
Densidade
0.04
Density
0.02
0.00
0.01
Gama
0.030
150 160 170 180 190
Densidade
quest$altura
0.015
Figura 7. Histograma da altura dos alunos UFPR.
0.000
Qual modelo é o mais provável de ter
120 140 160 180 200 220
I x
0.04
I Modelo Normal
Densidade
I
n 2
o
I f (y) = √ 1 exp − (y−µ) ;
2πσ 2 2σ 2
I E(Y ) = µ e V(Y ) = σ 2 .
0.00
Quais os valores de µ e σ 2 devo usar?
120 140 160 180 200 220
I Altura
1.0
I
amostrais?
0.8
1
Pn 1
Pn
yi e σ̂ 2 = − µ̂)2 .
0.4 0.6
µ̂ = i=1 (yi
Fn(x)
I
n i=1 n
I Como medir a incerteza em µ̂ e σ̂ 2 ,
0.2
sendo que temos apenas uma
0.0
amostra? → Distribuição amostral. 150 160 170 180 190
Altura
I E para os outros modelos? → Métodos
Figura 9. Ajuste da distribuição Normal para a
para estimação de parâmetros. variável altura.
Prof. Wagner Hugo Bonat Visão geral da parte III 17
Distribuição amostral
I Modelo → comportamento da
natureza.
I Parâmetros do modelo → parâmetros
populacionais de interesse.
I Qual modelo melhor descreve os Parâmetros:
µ, σ 2 , θ, ρ,
dados? P(Y ≤ y), etc.
amostra. Estatísticas:
ȳ, S 2 , θ̂, r,
I Descrever a incerteza → distribuição Amostra Freq(Y ≤ y), etc.
amostral.
Figura 11. Processo de inferência estatística.
Prof. Wagner Hugo Bonat Visão geral da parte III 19
Distribuição amostral de médias
Departamento de Estatística
Universidade Federal do Paraná
U = {1, 2, . . . , N},
θ(D).
I Idade média
20 + 30 + 40
θ(D) = = 30.
3
I Média das variáveis renda e número de trabalhadores
12+30+18
θ(D) = .
3 20
1+3+2 =
3
2
12 + 30 + 18
θ(D) = = 10.
1+3+2
I Média populacional
N
1 X
θ(D) = µ = Y = Yi .
N
i=1
I Variância populacional,
N
1 X
σ 2 = θ(D) = (Yi − µ)2 ,
N
i=1
ou às vezes
N
1 X
θ(D) = S 2 = (Yi − µ)2 .
N −1
i=1
Prof. Wagner Hugo Bonat Distribuição amostral de médias 5
Amostra
1 2 3 2 1
E(R ) = 9 · + 9,6 · + 10 · + 10,5 · + 12 · ≈ 10,13.
9 9 9 9 9
V(R ) ≈ 0,6289.
E(Y)
0.20
0.15
Probabilidade
I Distribuição amostral de Y .
0.10
Y
0.05
12 15 18 21 24 30
0.00
P(y) 1/9 2/9 1/9 2/9 2/9 1/9
15 20 25 30
y
Distribuição amostral da variância
0.30
^2
E(S )
Probabilidade
0.20
I Distribuição amostral de S 2 .
0.10
S2 0 18 72 162
2
0.00
P(s ) 3/9 2/9 2/9 2/9
0 50 100 150
s2
n
1 X nσ 2 σ2
V(Y ) = 2 V(Yi ) = 2 = .
n n n
i=1
O salário anual médio dos pilotos de avião pode ser modelado por uma distribuição
Normal com média de R$41979,00 e desvio padrão de R$5000,00. Suponha que uma
amostra aleatória simples de 50 pilotos seja selecionada.
I Qual é o desvio padrão da média amostral?
I Qual é a probabilidade da média amostral ser maior que R$41979,00?
I Qual é a probabilidade da média amostral não diferir da média populacional em até
R$1000,00?
I Como a probabilidade do item anterior seria alterada caso a amostra fosse de
tamanho 100?
40979 − 41979 42979 − 41979
P(40979 < Y < 42979) = P √ <Z < √
5000/ 100 5000/ 100
= P(−2 < Z < 2) ≈ 0,954.
Uma pesquisa divulgou que 56% das famílias brasileiras têm acesso à internet. Suponha
que esta seja a verdadeira proporção populacional p = 0,56 e suponha que uma amostra
de 300 famílias seja selecionada.
I Apresente a distribuição amostral de p̂, em que p̂ é a proporção amostral de famílias
com acesso à internet.
I Qual a probabilidade de a proporção amostral não diferir da populacional em mais
de 0,03?
I Responda o item anterior considerando amostras de tamanho 600 e 1000.
n
1X np
E(p̂) = E(Yi ) = = p.
n n
i=1
n
1 X np(1 − p) p(1 − p)
V(p̂) = V(Yi ) = = .
n 2 n 2 n
i=1
√
Y −µ D
n → Z ∼ N(0,1), para n → ∞.
σ
10
7
6
8
5
2 3 4 5
Densidade
Densidade
Densidade
2 3 4
4 2 6
1
1
0
0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
^
p ^
p ^
p
n = 250 n = 500 n = 1000
15
25
20
10 15 20
10
Densidade
Densidade
Densidade
10 15
5
5
0
0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
^
p ^
p ^
p
!
0,53 − 0,56 p̂ − p 0,59 − 0,56
P p <p <p .
0,56(1 − 0,56)/300 p(1 − p)/n 0,56(1 − 0,56)/300
I n = 1000 → P(0,53 < p̂ < 0,59) = P(−1,911 < Z < 1,911) ≈ 0,944.
!
0,53 − 0,56 p̂ − p 0,59 − 0,56
P p <p <p .
0,56(1 − 0,56)/1000 p(1 − p)/n 0,56(1 − 0,56)/1000
Departamento de Estatística
Universidade Federal do Paraná
S2
(n − 1) ∼ χn−1
2
, onde n − 1 são os graus de liberdade.
σ2
0.075
0.050
0.025
Densidade
0.000
n = 50 n = 100
0.100
0.075
0.050
0.025
0.000
0 50 100 150 0 50 100 150
(n − 1)S2 σ2
1.2
k1
k2
1.0
k3
k4
k5
0.8
k6
Densidade
k7
I Muito comum em testes de hipóteses:
0.6
k8
k9
0.4
I Independência em tabelas de
0.2
contingência.
0.0
I Bondade de ajuste. 0 2 4 6 8 10
ys
I Razão de verossimilhanças.
1.0
I Log-rank.
0.8
I Cochran-Mantel-Haenszel.
Probabilidade
0.6
I Soma de quadrados de n − 1 Normais
0.4
padrão independentes.
0.2
I Caso particular da distribuição Gama.
0.0
0 2 4 6 8 10
ys
0
0 5 10 15 20 25 30 X2
Y −µ
t= √ ∼ tn−1 ,
S/ n
0.4
0.3
0.2
0.1
Densidade
0.0
n = 25 n = 50
0.4
0.3
0.2
0.1
0.0
−5 0 5 −5 0 5
t
0.4
k2
k6
k 10
k 14
0.3
k 18
Densidade
I Teste t e suas variações.
0.2
I Intervalo de confiança para a média.
0.1
Simétrica em forma de sino (igual a
0.0
I
−4 −2 0 2 4
Normal). t
1.0
I Caudas mais pesadas que a Normal.
0.8
I Descreve o comportamento da razão
Probabilidade
0.6
de algumas v.a.’s.
0.4
I Desenvolvida por William Sealy Gosset
0.2
(sob o pseudo nome de Student).
0.0
−4 −2 0 2 4
t
0
−4 −2 0 2 4 t
S12
F= ∼ Fn1 −1,n2 −1 ,
S22
1.00
0.75
0.50
0.25
Densidade
0.00
d f 1 = 10 e d f 2 = 25 d f 1 = 20 e d f 2 = 25 d f 1 = 50 e d f 2 = 25
1.25
1.00
0.75
0.50
0.25
0.00
0 2 4 6 8 0 2 4 6 8 0 2 4 6 8
F
2.0
d1
d2
d6
1.5
d 10
d 14
d 18
Densidade
1.0
I Teste F para igualdade de variâncias.
0.5
I ANOVA - Analise de variância.
0.0
I Modelos de regressão. 0 1 2
F
3 4 5
1.0
0.8
I Também conhecida como distribuição
Probabilidade
de Fisher-Snedecor’s.
0.4 0.6
I Se σY21 6= σY22 a estatística F ainda tem
distribuição F , porém não central.
0.2
0.0
0 2 4 6 8 10
F
0
0 1 2 3 4 5 F
Suponha que um experimento foi realizado com dois grupos para avaliar a efetividade
do uso da acumputura para aliviar a dor. A taxa sensorial foi medida para o grupo 1 em 5
pacientes e para o 2 em 8 pacientes. Suponha que as variâncias amostrais foram
s21 = 4,44 e o s22 = 1,5. Assumindo que as variâncias populacionais são iguais, qual a
s21
probabilidade de ocorrer a razão s22
ou uma mais extrema?
s21
P > = P(F5−1,8−1 > 2,96) ≈ 0,1.
4,44
s22 1,5
Departamento de Estatística
Universidade Federal do Paraná
(0.085, , 0.155).
2. Quantos questionários?
Departamento de Estatística
Universidade Federal do Paraná
I Terminologia.
I Intervalo de confiança para a média.
I Intervalo de confiança para a
proporção.
I Intervalo de confiança para a variância.Figura 1. Analogia ao processo de estimação.
Extraído de pixabay.
1X 1X
n n
Y = Yi → y= yi
n n
i=1 i=1
1 X
n
1 X
n
S2 = (Yi − Y )2 → s2 = (yi − y)2 .
n−1 n−1
i=1 i=1
I Distribuições amostrais
σ2 Y −µ
σ 2 conhecido: Y ∼ N µ, ou √ ∼ N (0, 1)
n σ/ n
Y −µ S2
σ 2 desconhecido: √ ∼ tn−1 e (n − 1) 2
∼ χn−1 .
S/ n σ2
Prof. Paulo Justiniano R. Jr Estimação pontual e intervalo de confiança 6
Exemplo: estimadores para distribuição de Bernoulli
1X 1X
n n
p̂ = Yi → p̂ = yi .
n n
i=1 i=1
→ intervalo de confiança.
Figura 2. Processo de inferência na prática.
ȳ
4 √σ
3 √σ
2 √σ
1 √σ
1 √σ
2 √σ
3 √σ
4 √σ
n
n
−
+
ȳ
ȳ
ȳ
ȳ
ȳ
ȳ
ȳ
ȳ
I Vários pares yLI e yLS existem, então
prefere-se aqueles que dão intervalo Figura 3. Intervalo de confiança para a média.
simétrico em relação a µ.
√
e = zα/2 · σ / n
√ √
y − zα/2 · σ / n y y + zα/2 · σ / n
1−α
yLI yLS
Figura 4. Margem de erro do intervalo de confiança.
α/2 α/2
ȳ
4 √σ
3 √σ
2 √σ
1 √σ
1 √σ
2 √σ
3 √σ
4 √σ
Prof. Paulo Justiniano R. Jr Estimação pontual e intervalo de confiança 12
n
−
+
Exemplo: idade média dos frequentadores do restaurante
Y : idade dos frequentadores
Y ∼ N(µ, σ 2 = 42 )
I estimativa: µ̂ = y = 32
I escolha do nível de confiança: 95% (1 − α = 0,95 e α/2 = 0.025)
I valor-z: zα/2 = 1.96
I erro máximo provável: e = zα/2 · √σ = 1.96 · √4 = 3.51
n 5
I intervalo de confiança (95%): y ± zα/2 · √σ = 32 ± 3.51
n
1 2 3 4 5 6 7 8 9 10
Distribuição da média amostral de Y
11 12 13 14 15 16 17 18 19 20
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Número da amostra
Média amostral de Y
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Número da amostra
Suponha que obtivemos um intervalo de 95% de confiança: IC95% (µ) = [yLI , yLS ].
valos de confiança com 90%, 95% e 99% de −z0.05 = −1.645 z0.05 = 1.645
0.2 −z0.025 = −1.960 z0.025 = 1.960
confiança. Discuta as diferenças. −z0.005 = −2.576 z0.005 = 2.576
0
z
−4 −3 −2 −1 0 1 2 3 4
I tα/2 é o valor da distribuição t-Student que produz uma área de α/2 na cauda
superior da distribuição.
0.20
2. Usar p = 0.5 (estimativa
p ⋅ (1 − p)
conservadora). Porque quando
0.10
p = 0.5, o termo p(1 − p) terá valor
máximo.
0.00
0.0 0.2 0.4 0.6 0.8 1.0
1050
I Estimativa pontual: p̂ = 1500 = 0.7
I Intervalo otimista
r r !
0.7(1 − 0.7) 0.7(1 − 0.7)
IC0.95 (p) = 0.7 − 1.96 , 0.7 + 1.96 ≈ (0.677, 0.723).
1500 1500
I Intervalo conservador
r r !
0.5(1 − 0.5) 0.5(1 − 0.5)
IC0.95 (p) = 0.7 − 1.96 , 0.7 + 1.96 ≈ (0.675, 0.725).
1500 1500
S2 2
(n − 1) ∼ χn−1 , em que n − 1 são os graus de liberdade.
σ2
2
em que χα/2,n−1 2
e χ1−α/2,n−1 são os quantis da cauda direita e esquerda da
2
distribuição χ com n − 1 graus de liberdade.
I Note que neste caso o intervalo não é simétrico.
ν = 20 − 1
s2 = 0.0019.
6
y = 2.0095 e 2
χ0.1/2 = 10.117 2
χ1−0.1/2 = 30.143
4
I Quantis da distribuição χ 2 2
2
χ19,0.95 = 30.1435 0
0 10 20 30 40 50
2
χ19,0.05 = 10.117.
Figura 13. Quantis da distribuição χ 2 .
I Assim, o intervalo de confiança é
2 (20 − 1) · 0.0019 (20 − 1) · 0.0019
IC0.9 (σ ) = , = (0.0012, 0.0035) .
30.14353 10.11701
I Terminologia.
I Intervalo de confiança para a média.
I Intervalo de confiança para a
proporção.
I Intervalo de confiança para a variância.
Departamento de Estatística
Universidade Federal do Paraná
I Outros contextos
I Teoria e prática
Figura 2. Foto de Karolina Grabowska no Pexels.
Uma quantidade que permita obter estimativas com uma incerteza aceitável.
2e
√
e = zα/2 · σ / n
√ √
y − zα/2 · σ / n y y + zα/2 · σ / n
↑ σ ⇒↑ AIC(µ)
↑ 1 − α ⇒↑ zα/2 ⇒↑ AIC(µ)
σ
AIC(µ) = 2 · z α/2 · √
n
↑ n ⇒↓ AIC(µ)
1. zα/2 : cada vez que aumentamos a confiança 1 − α, o valor de zα/2 fica maior e,
consequentemente, a amplitude do intervalo aumenta.
2. σ : um grande desvio padrão indica a possibilidade de um considerável
distanciamento dos valores amostrais em relação à média populacional.
3. n: quanto maior for o tamanho da amostra, maior será a quantidade de informação
disponível. Com isso, valores maiores de n produzem intervalos mais informativos
(estreitos).
Prof. Paulo Justiniano Ribeiro Jr Tamanho de amostra 8
Invertendo a equação da margem de erro
↑ 1 − α ⇒↑ zα/2 ⇒↑ n ↑ σ ⇒↑ n
z · σ 2
α/2
n=
e
↑ e ⇒↓ n
e 0.5
−z0.05 = −1.645 z0.05 = 1.645
0.2 −z0.025 = −1.960 z0.025 = 1.960
I Temos σ = 6, e = 2 e z0.025 = 1.96. −z0.005 = −2.576 z0.005 = 2.576
Assim,
0
z 2 z
· σ 2
−4 −3 −2 −1 0 1 2 3 4
α/2 1.96 · 6
n= = ≈ 35.
e 2 Figura 4. Quantis da distribuição Normal Padrão.
µ − 3σ µ − 2σ µ − 1σ µ µ + 1σ µ + 2σ µ + 3σ
3. Use a regra empírica da amplitude
para dados com distribuição Figura 5. Áreas simétricas na distribuição
(aproximadamente) Normal. Normal para a regra empírica.
Define-se como valores usuais aqueles que são típicos (não extremos).
Como sabemos que em uma distribuição (aproximadamente) Normal praticamente 95%
dos valores encontram-se a 2 desvios-padrões acima e abaixo da média, temos que
4σ = (µ + 2σ ) − (µ − 2σ )
4σ = Y(n) − Y(1)
Y(n) − Y(1)
σ̃ =
4
pode ser utilizado como uma estimador para σ . Y(n) é maior valor da amostra e Y(1) é o
menor.
0 (n − 1)s2 (n − 1)s2
σ2
2 2
χα/2,n−1 χ1−α/2,n−1
(n − 1)s2 (n − 1)s2
AIC σ 2 = 2
− 2
≤ ρs2 .
χα/2,n−1 χ1−α/2,n−1
250
2000
100
50
25
0.25 0.50 0.75 1.00 0.1 0.2 0.3 0.4 0.5 0.6 0.70.80.9
Erro relativo (ρ) Erro relativo (log10 ρ)
Departamento de Estatística
Universidade Federal do Paraná
4. Métodos de estimação.
B(θ̂) = E(θ̂) − θ θ^
θ
é chamada de vício (bias) do estimador θ̂.
Figura 5. Exemplo de estimador viciado e não
viciado.
n−1 2 1
B(σ̂ 2 ) = · σ − σ 2 = − · σ 2.
n n
75
Número da amostra
1. Extraiu-se k = 100 amostras de 50
Y ∼ N(µ = 0, σ 2 = 1) e amostras de
tamanho n = 20.
I Os estimadores média 10% aparada
(θ̂1 ) e mediana (θ̂2 ) para µ tem
variâncias
melhor estimador.
Y ~ Normal(0, 1 3)
I O melhor estimador pode depender
da distribuição da v.a.
I Estimadores concorrentes:
Y ~ Uniforme(− 1, 1)
I Média amostral
1X
n
θ̂1 = Y = Yi .
n
i=1
−0.8 −0.4 0.0 0.4
Valor das estimativas pontuais de cada estimador
I Valor médio
Figura 10. Simulação computacional para a
Y(1) + Y(n) variância de estimadores da média.
θ̂2 = .
2
A média amostral
Se Y1 , Y2 , . . . , Yn for uma amostra aleatória de tamanho n, proveniente
P de uma v.a.
aleatória de distribuição Normal, então a média amostral Y = ni=1 Yi /n é um ENVVM
para µ.
I O erro quadrático médio (EQM) é uma medida que concilia vício e variância.
I O EQM de um estimador θ̂ do parâmetro θ é definido como
×
θ̂i
×
ˆ
E(θ) P
Variância: V(θ̂) = 1/n (θ̂i − E(θ̂))2
θ
× ×
× ×
P
EQM(θ̂) = 1/n (θ̂i − θ)2
×
×
Figura 13. Analogia do tiro ao alvo para o erro quadrático médio e sua decomposição.
θ θ E(θ̂)
θ̂i
EQM(θ̂1 )
Efr(θ̂1 , θ̂2 ) = .
EQM(θ̂2 )
I Se a Efr(θ̂1 , θ̂2 ) < 1, conclui-se que θ̂1 é um estimador superior à θ̂2 e vice-versa.
mais gerais.
I O viés de um estimador pode n
θ̂2
“sumir” quando a amostra
aumenta de tamanho.
I Consistência é uma propriedade
θ
mais geral.
I Verifica o que acontece com o
estimador quando a amostra n
aumenta de tamanho.
Figura 15. Consistência para dois estimadores.
3
S2
Figura 16. Ilustração por simulação computacional da consistência para o estimador σ̂ 2 da variância.
2.0
1.5
σ
~
1.0
0.5
Departamento de Estatística
Universidade Federal do Paraná
I População: as raízes.
I Parâmetro: comprimento total das
raízes.
I Amostra: a forma como as raízes
ficaram dispostas na malha.
I Estatística: o número de intersecções.
I Estimador: a fórmula Ĉ = π
4 ·l·n
I Estimativa: o resultado de aplicar o
estimador aos dados observados na
amostra, no caso ĉ = 6.597.
1.0
crever o tempo de atendimento de clientes
0.8
Frequência relativa
no caixa de um supermercado. Uma amos-
0.6
tra aleatória de n = 20 atendimentos foi ob-
0.4
tida. Os tempos são os seguintes.
0.2
0.0
2.34 4.03 4.85 5.68 7.41
2.39 4.04 4.90 5.76 7.48
2 4 6 8
2.96 4.17 5.20 5.88 7.64
3.30 4.61 5.24 6.62 8.62 Tempo de atendimento (min)
1.0
0.8
Frequência relativa
0.6
Aplicando as expressões, obtém-se
0.4
0.2
I r̂ = 8.9.
0.0
I λ̂ = 1.73.
2 4 6 8
I Configuração: Sejam dados y uma realização de um v.a. Y com fp ou fdp f (y; θ).
I Função de verossimilhança
L(θ) ≡ f (y; θ),
em que f (y; θ) é a função de distribuição conjunta de Y.
I Supondo que as observações são independentes
n
Y
L(θ) ≡ f (yi ; θ).
i=1
L(θ|y).
0.20
m n
y · r−y
L(n|y) = m+n
0.15
r
n
·
L(m|y)
21
0.10
5 49−5
= 21+n
49
0.05
0.00 100 150 200 250 300
0.20
0.15
f(y, θ)
0.10
0.05
240 15
220
200 10 Figura 14. Função de verossimilhança com o eixo
m + n 180 5
y para y (função de probabilidade) e um eixo para
160
0 m + n (função de verossimilhança).
θ̂ = θ̂(y)
I Se Yi ∼ P(λ), então a fp
λy exp{−λ}
f (y; λ) = .
y!
I Assumindo observações independentes, a verosssimilhança
n
Y λyi exp{−λ}
L(λ) = .
yi !
i=1
I Resolvendo em λ, temos
n
X yi
λ̂ = .
n
i=1
f (y; λ) = λ exp{−λy}
Yn
L(λ) = λ exp{−λyi }
i=1
n
X
l(λ) = n ln(λ) − λ yi
i=1
n
n X
U(λ) = − yi = 0
λ
i=1
n
λ̂ = Pn .
1
i=1 yi y
=
i=1 2πσ 2 2σ
I Log-verossimilhança
n
n n 1 X
l(θ) = − ln(2π) − ln(σ ) − 2
2
(yi − µ)2 .
2 2 2σ
i=1
λr r−1
f (y; θ = (r, λ)) = y exp {−λy} .
Γ(r)
I Log-verossimilhança
n
X n
X
l(θ) = nr ln(λ) − n ln(Γ(r)) − λ yi + (r − 1) ln(yi ).
i=1 i=1
1.0
crever o tempo de atendimento de clientes
0.8
Frequência relativa
no caixa de um supermercado. Uma amos-
tra aleatória de n = 20 atendimentos foi ob-
0.6
tida. Os tempos são os seguintes:
0.4
0.2
2.34 4.03 4.85 5.68 7.41
0.0
2.39 4.04 4.90 5.76 7.48
2.96 4.17 5.20 5.88 7.64 2 4 6 8
3.30 4.61 5.24 6.62 8.62 Tempo de atendimento (min)
1.0
0.8
Frequência relativa
0.6
Usando um algorítio numérico ou software
0.4
estatístico, obtém-se
0.2
I r̂ = 8.288015.
0.0
I λ̂ = 1.61. 2 4 6 8
Vantagens Desvantagens
m + n = 205
0.30
164 268
m n m + n
p(y) = ⋅ , y ∈ {0, 1, ..., r}
y r − y r
0.20
L(m|y)
0.10
0.00