Teste Hipoteseb
Teste Hipoteseb
Teste Hipoteseb
Estatı́sticas e Parâmetros
Definição
Qualquer função de variáveis aleatórias que tenham sido observadas,
digamos tn (X1 , . . . , Xn ), é chamada uma estatı́stica. Se as variáveis
dependem de um parâmetro θ desconhecido, então uma estatı́stica
também é dita ser um estimador de θ. Como X1 , . . . , Xn são variáveis
aleatórias, temos que tn também é uma variável aleatória . Um valor de
um estimador, digamos tn (x1 , . . . , xn ), é chamado uma estimativa de θ.
Definição
Estimadores não-viciados Dizemos que tn (X1 , . . . , Xm ) é um estimador
não-viciado de θ se
Estimadores
Definição
Um estimador é dito ser consistente se sua variância tende a zero,
quando o número de variáveis aleatórias observadas, ou seja, o
tamanho da amostra, cresce consideravelmente. Isso garante que nosso
estimador está próximo do seu valor esperado, escolhendo um tamanho
de amostra suficientemente grande.
Exemplo
a média amostral, x = (x1 + · · · + xn )/n, é um estimador não
viciado e consistente para a média populacional, µ.
a variância amostral, S 2 (X) = (xi − x)2 /(n − 1), é um estimador
P
não viciado e consistente para a variância populacional, σ 2 .
Teste de Hipóteses
Teste de Hipóteses
Testes paramétricos
Afirmação
Hipóteses
Definição
Suponha que a afirmação 1 seja válida. Qualquer H ⊆ Θ é chamada
uma hipótese. Duas classes de hipóteses serão distinguidas: hipóteses
nulas e hipótese alternativas. As hipóteses nulas, denotadas por H0 são
aquelas que não têm efeito sobre a questão (por exemplo, fumar não
aumenta os ı́ndices de câncer, a ordem de café e leite não altera o
sabor da bebida,etc). As hipótese alternativas formam o complementar
das nulas.
Definição
Uma hipótese H ⊆ Θ é chamada simples se conhecendo θ ∈ H
especifica completamente F (x|θ). Caso contrário, H é chamada de
hipótese composta.
O teste
Definição
Suponha que X é uma variável aleatória com função de distribuição
F (x|θ), com θ ∈ Θ desconhecido e que H0 e H1 sejam especificadas. O
problema de decidir (após observar X) que θ ∈ H0 (chamado aceitação
da hipótese nula), ou que θ ∈ H1 (chamado rejeição da hipótese nula) é
chamado problema de teste de hipótese. H0 é chamado verdadeiro, se
θ ∈ H0 , e falso caso contrário, ou seja, θ ∈
/ H0 .
H0 versus H1
Se o conjunto de possı́veis resultados de X é denotado por X, então
uma divisão de X e, dois subconjuntos disjuntos e exaustivos A (região
de aceitação de H0 ) e R (região de rejeição de H0 ), tal que se
encontrarmos X ∈ A aceitamos H0 e se encontrarmos X ∈ R,
rejeitamos H0 é chamado teste de H0 versus H1 .
Um exemplo
A questão
Fumar causa câncer?
As hipóteses
H0 : fumar não aumenta as taxas de incidência de câncer
(numa determinada população)
H1 : fumar aumenta as taxas de incidência de câncer.
As hipóteses (matemáticas)
H0 : µ = µ0 , em que µ0 é a incidência média de câncer
(numa determinada população) e µ é a incidência
média de câncer, quando introduzimos o fator fumar
H1 : µ > µ0 .
Um exemplo (continuação)
Observações
A região crı́tica (região de rejeição de H0 ) é {x : x > µ0 }.
Como podemos obter µ? Veremos que a partir de uma amostra,
devemos usar um estimador para o parâmetro que estamos
investigando (neste caso é a média ou esperança da incidência de
câncer, que pode ser modelado por uma variável aleatória
binomial). Qual é o “melhor” estimador?
x x
Região crítica x0
Região crítica
Erros do Tipo I e II
Exemplo (continuação)
Desejamos testar se um certo tratamento proposto para a doença é
eficaz. Uma amostra aleatória de tamanho n = 30 é selecionada entre
os indivı́duos doentes que foram submetidos ao tratamento.
Representamos as concentrações dos indivı́duos da amostra por
X1 , X2 , . . . , X30 . Sabe-se que para i = 1, 2, . . . , 30, tem-se
Xi ∼ N (µ, 36), sendo µ = 14 ou µ = 18 dependendo se o tratamento é
eficaz ou não.
Neste caso,
Probabilidades de erros
14 xc 18
Região Crítica Região de Aceitação
Resumo
25 46 76 49 69 19 80 16 80 62
33 86 49 93 67 10 89 33 4 76
37 72 96 84 90 2 15 75 42 83
10 17 29 37 65 31 20 9 70 72
75 57 71 9 32 11 70 89 96 69
73 77 15 74 24 16 85 6 67 30
15 82 56 100 97 54 88 68 73 33
29 66 12 75 29 67 44 30 52 82
80 73 28 53 43 46 82 47 77 25
Exemplo – Continuação
Como o modelo do número de consultas é considerado como Uniforme
entre 1 e 100. Sua média é µ = 50, 5. Neste caso, poderı́amos promover
uma comparação entre a média do número de chamadas dos últimos 3
meses e verificar se ela está “próxima” da média usual.
Temos que:
n
1X 25 + 46 + 76 + 49 + · · · + 47 + 77 + 25
X= Xi = = 53.
n 90
i=1
Como a média dos últimos 3 meses é 53, poderı́amos dizer que houve
uma pequena alteração no número de consultas. Mas esta alteração
viria do fato de estamos trabalhando como uma variável aleatória ou
por que de fato há uma alteração? Vamos fixar o nı́vel de significância
em 5%. Neste caso,
Exemplo – Continuação
Região crítica
©
rejeitamos H0 a um nı́vel de significância de 5%, ou seja não houve
alteração no número de atendimentos ao Serasa-Experience .
X −µ
T =p ,
S 2 /n
Um grande cientista
A distribuição t-Student
Distribuição t de Student - tn
Os valores tabelados correspondem aos pontos x tais que: P(tn≤x)
P(tn≤x)
n 0,600 0,750 0,900 0,950 0,975 0,990 0,995 0,9995
1 0,325 1,000 3,078 6,314 12,706 31,821 63,657 636,619
2 0,289 0,816 1,886 2,920 4,303 6,965 9,925 31,598
3 0,277 0,765 1,638 2,353 3,182 4,541 5,841 12,924
4 0,271 0,741 1,533 2,132 2,776 3,747 4,604 8,610
5 0,267 0,727 1,476 2,015 2,571 3,365 4,032 6,869
6 0,265 0,718 1,440 1,943 2,447 3,143 3,707 5,959
7 0,263 0,711 1,415 1,895 2,365 2,998 3,499 5,408
8 0,262 0,706 1,397 1,860 2,306 2,896 3,355 5,041
9 0,261 0,703 1,383 1,833 2,262 2,821 3,250 4,781
10 0,260 0,700 1,372 1,812 2,228 2,764 3,169 4,587
11 0,260 0,697 1,363 1,796 2,201 2,718 3,106 4,437
12 0,259 0,695 1,356 1,782 2,179 2,681 3,055 4,318
Exemplo
Exemplo (cont.)
RC = {t ∈ R : t > t1 }.
Exemplo (cont.)
X − 12
T = √ ∼ t(4) .
S/ n
Logo,
tab.
P (T > t1 ) = 0, 01 ⇒ t1 = 3, 747.
Exemplo (conclusão)
RC = {t ∈ R : t > 3, 747}.
Exemplo
Considerando o exemplo anterior, poderı́amos ter rejeitado a hipótese
nula. Nesse caso uma pergunta natural seria qual é o intervalo de
confiança para a média populacional. Naquele exemplo, tı́nhamos
xobs = 218 e s2obs = 89, 355. Com γ = 90% da tabela t-Student com 4
graus de liberdade, tγ/2 = 2, 132. Logo,
9, 4527 9, 4527
I.C.(µ, 90%) = 218 − 2, 132 − √ ; 218 + 2, 132 − √
5 5
= [208, 98; 227, 01].
Nı́vel Descritivo
A distribuição qui-quadrado
A distribuição qui-quadrado
A distribuição qui-quadrado
P (Q2 ≥ qc | H0 ) = α.
Exemplo
A partir da observação das faltas dos alunos durante 300 dias letivos, o
diretor de uma escola quer saber se para uma turma de 15 alunos o
número de faltas no mesmo dia pode ser modelado pela distribuição
4
Binomial, com p = 15 ≈ 0, 2667. Os dados observados foram:
Faltas 0 1 2 3 4 5 6 7
Dias 4 16 36 66 72 50 31 12
Faltas 8 9 10 11 12 13 14 15
Dias 7 2 2 0 0 0 1 1
Exemplo - Continuação
H0 : X e Y são independentes.
H1 : X e Y são dependentes.
Lembre-se que um critério para se verificar se duas variáveis aleatórias
são independentes é que sua distribuição conjunta é igual ao produto
de suas distribuições marginais. Aqui, como estamos trabalhando com
observações, a ideia será a de se verificar se a conjunta é
aproximadamente igual ao produto das marginais.
RC = {w : w ≥ qc },
Exemplo
Deseja-se saber se há para os alunos do curso de Economia alguma
relação com o desempenho nas disciplinas de Cálculo e Estatı́stica.
Uma amostra foi coletada e após sua classificação obtivemos a seguinte
tabela:
Estatística
Alta Média Baixa Total
Alta 56 71 12 139
Cálculo
Exemplo – Continuação
Com base nos cálculos (CLIQUE AQUI), temos que qobs = 145, 781.
Para um nı́vel de significância de 10% temos que:
tab.
α = P (erro tipo I) = P (Q2 > qc | H0 verd.) = 0, 10 ⇒ qc = 7, 779.
total da coluna j
eij = ni ×
total geral
O total da linha i, ni , indica o tamanho da amostra da subpopulação i,
ao passo que o quociente, total da coluna j dividido pelo total geral,
representa a proporção de ocorrência da valor da variável
correspondente à coluna j. Caso haja homogeneidade de
comportamento da variável, espera-se que essa proporção seja a mesma,
em todas as subpopulações. O teste segue como o de independência.
Exemplo – Continuação