Introdução Aos Testes de Hipóteses
Introdução Aos Testes de Hipóteses
Introdução Aos Testes de Hipóteses
Julienne Borges
Introdução aos testes de hipóteses
Um teste de hipóteses é um procedimento em que
utilizamos resultados experimentais provenientes de
uma amostra para verificar se, uma afirmação sobre
uma população, mais especificamente sobre um
parâmetro dessa população, é contrariada ou não.
Vamos entender alguns conceitos básicos sobre os
testes de hipóteses que serão utilizados em todos os
testes ao longo dessa unidade.
Hipóteses Estatísticas
Hipótese nula (denotada por H0) é uma hipótese estatística que contém uma afirmativa
de igualdade e deve escrever como =, < ou >.
Para uma média, temos as três formas possíveis para a hipótese nula:
Onde, 0 é algum valor que você deseja testar.
H0: = 0
H0: > 0
H0: < 0
Para uma proporção, temos as três formas possíveis para a hipótese nula:
Onde, p0 é algum valor que você deseja testar.
H 0: p = p 0
H 0: p > p 0
H 0: p < p 0
Hipóteses Estatísticas
Hipótese alternativa (denotada por Ha) é o complemento da hipótese nula. É uma
afirmativa que deve ser verdadeira se H0 for falsa e contém uma afirmativa de
desigualdade, tal como <, ou >.
Para uma média, a hipótese alternativa comporta apenas uma das três formas:
Ha: 0
Ha: < 0
Ha: > 0
Para uma proporção, a hipótese alternativa comporta apenas uma das três formas:
Ha: p p0
Ha: p < p0
Ha: p > p0
Tipos de Hipóteses Estatísticas
A verdade real de H0
Decisão do
H0 é
teste H0 é falsa
verdadeira
Não rejeitar Decisão
Erro do tipo II
H0 correta
(1 - )
Rejeitar H0 Decisão
Erro do tipo I
correta
(1 - )
Tipos de erros
Seria ótimo se pudéssemos ter sempre =0 e =0, mas, na realidade, isto não é possível,
então devemos tentar administrar as probabilidades de erro e .
• Hipóteses estatísticas:
H0: = 0
Ha: 0 → Denominada hipótese bilateral.
H0: > 0
Ha: < 0 → Denominada hipótese unilateral à esquerda.
H0: < 0
Ha: > 0 → Denominada hipótese unilateral à direita.
Teste de hipóteses para uma média
• Estatísticas de teste:
x − 0 x − 0
z teste = t teste =
s
n n
(Adaptado de Levine et al.) Uma das principais medidas de qualidade dos serviços
oferecidos por qualquer organização corresponde à velocidade através da qual ela
responde a uma reclamação feita pelos clientes. Uma grande loja de departamentos,
de controle familiar passou por uma grande expansão nos últimos anos. Foi
selecionada uma amostra de 50 reclamações com relação à instalação de pisos deste
ano, ou seja, correspondem ao tempo de espera (em dias) entre o recebimento da
reclamação e a solução do problema relacionado com a reclamação. Nesta amostra o
tempo médio de espera foi de 29 dias. Sabe-se que o desvio padrão da população é de
21 dias. O gerente afirma que o tempo médio de espera é de no máximo 20 dias. Com
um nível de 5% de significância há evidências que comprovem a alegação do gerente?
Parâmetro: Tempo médio de espera (em dias) entre o recebimento da reclamação e a
solução do problema relacionado com a reclamação.
Dados disponíveis:
Tamanho da amostra (n) = 50
Média da amostra (𝑥)ҧ = 29
Desvio padrão da população (σ) = 21 → Distribuição Normal
Nível de significância () = 5% = 0,05 → Erro máximo tolerado no teste.
Conclusão teste:
Conclui-se com 5% de significância
que NÃO há evidências que
comprovem a alegação do gerente,
ou seja, o tempo médio de espera
(em dias) entre o recebimento da
reclamação e a solução do
problema relacionado com a
reclamação NÃO é de no máximo
20 dias.
Exercício 1
(Adaptado de Stevenson, 2001) Suponha que queiramos avaliar a afirmação de um
fabricante, de que seus pneus radiais suportam uma quilometragem de 40000 milhas,
no mínimo. Para uma amostra aleatória de 49 pneus observou-se uma média de duração
de 38000 milhas. Sabe-se que o desvio padrão populacional da duração dos pneus é de
3500 milhas. Utilize um nível de significância de 0,03. O que você pode concluir?
Valor p = 0,00003 → Se
rejeitarmos a H0, cometemos
um erro de 0,00003.
Conclusão do teste:
Conclui-se com 3% de
significância que o tempo
médio de duração dos pneus
NÃO é de 40000 milhas no
mínimo, ou seja, não há
evidências para comprovar a
alegação do fabricante.
Exercício 2 – Agora é a sua vez!
Um estudante de direito quer conferir a alegação de sua professora de que fraudadores
condenados passam, em média 12,3 meses na cadeia. Uma amostra aleatória de 35 casos
do arquivo judiciário indicou uma média de 11,5 meses. Suponha que o desvio padrão seja
= 3,8 meses. Adote um nível de 4% de significância. O que o estudante pode concluir a partir
dos dados da amostra? Utilize o valor p e o intervalo de confiança.
Valor p =0,21295 →
Representa um erro de
21,295% ao rejeitar H0.
Conclusão do teste:
Podemos concluir com 4% de
significância que o tempo
médio que os fraudadores
condenados passam na cadeia
é igual a 12,3 meses, ou seja, a
afirmação da professora é
válida.
Interpretação do intervalo de
confiança:
Podemos afirmar com 96% de
confiança que o tempo médio
que os fraudadores
condenados passam na cadeia
pode variar de 10,18 a 12,82
meses.
H0: =12,3
Ha: ≠12,3 → Bilateral
Dados disponíveis:
Tamanho da amostra (n) = 9
Média da amostra (𝑥)ҧ = 50
Desvio padrão da amostra (s) = 20
Nível de significância () = 5% = 0,05
Conclusão teste:
Conclui-se com 5% de significância
que NÃO houve alteração no
tempo médio perdido com
acidentes de trabalho, ou seja, o
tempo médio é igual a 60
horas/homem indicando que o
programa de prevenção de
acidentes implementado não foi
eficaz!
Exercício 3 – Tente fazer!
(Adaptado de Morettin & Bussab) Um escritório de investimentos acredita que o
rendimento médio das diversas ações que movimenta é de 20%. Uma nova estratégia foi
definida com o objetivo de aumentar o rendimento médio das diversas ações que
movimenta. Para verificar esta hipótese, tomaram-se 18 empresas ao acaso obtendo-se
um rendimento médio de 24,56% e um desvio padrão de 5%. Suponha que a população
tenha distribuição aproximadamente normal. Faça o teste estatístico para comprovar que a
nova estratégia é realmente eficiente para aumentar o rendimento médio das diversas
ações. Use um nível de significância de 1%.
Valor p = 0,00062 → Se
rejeitarmos H0, cometemos
um erro de 0,00062.
Conclusão do teste:
Conclui-se com 1% de
significância que o
rendimento médio das ações
é superior a 20%, ou seja, a
estratégia implementada foi
eficaz!
Teste de hipóteses para uma amostra utilizando o R
x<-c(x1,x2,...,xn)
t.test(x, alternative = c("two.sided", "less", "greater"), mu = m0, conf.level = 0.95)
Onde:
x → representa o vetor de valores observados na amostra.
alternative = c("two.sided", "less", "greater") → representa o tipo de hipótese que será testado:
"two.sided“ → bilateral
“less” → Unilateral à esquerda
“greater” → Unilateral à direita
m0 → você deve indica a média que está sendo testada por meio das hipóteses
conf.level → você deve especificar o nível de confiança para o teste de hipóteses
Exercício 4
Uma amostra aleatória de oito pedidos dos arquivos de uma companhia mostra que os
pedidos de certa peça de uma máquina forma despachados em: 12 10 17 14 13 18
11 9 dias. Ao nível de 5% de significância , podemos concluir que, em média, tais
pedidos são despachados em menos de 10 dias?
H0: >10
Ha: <10 → Unilateral à esquerda
Parâmetro: Tempo médio para despachar os pedidos.
Dados disponíveis:
Tamanho da amostra (n) = 8
Média da amostra (𝑥)ҧ = 13 ➔ Obtida utilizando a função =media do Excel.
Desvio padrão da amostra (s) = 3,2071 ➔ Obtido por meio da função =desvpad.a do
Excel.
Nível de significância () = 5% = 0,05
Conclusão teste:
Conclui-se com 5% de significância
que o tempo médio para despachar
os pedidos é superior ou igual a 10
dias.
Utilizando o R:
> x<-c(12,10,17,14,13,18,11,9)
> t.test(x,alternative=c("less"),mu=10,conf.level=0.95)
data: x
t = 2.6458, df = 7, p-value = 0.9834
alternative hypothesis: true mean is less than 10
95 percent confidence interval:
-Inf 15.14825
sample estimates:
mean of x
13
Curiosidade
Para o exemplo anterior em que a média é o parâmetro a ser estimado, não conhecemos
o desvio padrão populacional (σ) e temos a amostra de valores observados no estudo,
podemos utilizar o mesmo comandos t.test para encontrar um intervalo de confiança.
Observe: One Sample t-test
> t.test(x,conf.level=0.95)
data: x
t = 11.465, df = 7, p-value = 8.631e-06
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
10.31877 15.68123
sample estimates:
mean of x
13
Teste de hipóteses para uma proporção
• Hipóteses estatísticas:
H0: p = p0
Ha: p p0 → Denominada hipótese bilateral.
H0: p > p0
Ha: p < p0 → Denominada hipótese unilateral à esquerda.
H0: p < p0
Ha: p > p0 → Denominada hipótese unilateral à direita.
Teste de hipóteses para uma proporção
• Estatística de teste:
n p0 5
pˆ − p0
z teste =
p0 (1 − p0 )
e
n (1 − p0 ) 5
n
Teste de hipóteses para uma proporção
• Valor p:
Dados disponíveis:
Tamanho da amostra (n) = 821
Número de motoristas hospitalizados (x) = 46 ➔ 𝑝Ƹ = 46/821=0,056 (proporção amostral)
Nível de significância () = 1% = 0,01
Hipóteses estatísticas: H0: p > 0,078 vs Ha: p < 0,078 → Hipótese unilateral à esquerda.
Qual teste estatístico devo utilizar?
✓ n.p0 =821.0,078=64,038>5
✓ n.(1-p0) =821.0,922=756,962>5
Conclusão teste:
Conclui-se com 1% de significância que
a taxa de hospitalização dos motoristas,
nos casos de carros equipados com
airbag, é inferior à taxa de 7,8% para
colisões de carros de tamanho médio
equipados somente com cintos
automáticos de segurança, ou seja, o
airbag parece ser um item eficaz na
segurança dos motoristas.
Teste de hipóteses para uma proporção utilizando o R
IMPORTANTE: O R utiliza a distribuição qui-quadrado e não a distribuição Normal para a realização do teste!
Utilizando o R:
> prop.test(46, 821, p = 0.078, alternative = c("less"), conf.level = 0.99, correct = FALSE)
Conclusão do teste:
Podemos concluir com 10%
de significância que o
tratamento NÃO é eficaz
visto que mais de 25% dos
indivíduos voltam a fumar
um ano após o tratamento.
> prop.test(39,71,p=0.25,alternative=c("greater"),conf.level=0.9,correct=FALSE)
No Python:
https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_ind.html
Como vou saber se as variâncias são iguais? Testando! Faça o teste para igualdade de
variâncias. Algumas opções: Teste F, teste de Levene, teste de Bartlett (3 ou mais
grupos), teste de Cochram, etc.
Além do básico!
Teste para duas médias com variâncias iguais
Exemplo 4
Foram avaliadas duas amostras de computadores selecionadas de duas empresas (A e
B) concorrentes, especializadas em serviços computacionais a terceiros. A empresa A
apresentou, em uma amostra de 26 computadores, média de MIPS (milhões de
instruções executadas por segundo) de 5000, com desvio padrão de 2500, e a empresa
B, em uma amostra de 16 computadores, apresentou média de MIPS de 4000, com
desvio padrão de 2400. Supondo que as variâncias são iguais, teste a hipótese de que a
média de desempenho dos computadores das empresas A e B seja diferente. Utilize um
nível de significância de 3%.
Além do básico!
Teste para duas médias com variâncias iguais
Dados do enunciado:
Empresa Tamanho Média da Desvio padrão
amostral amostra da amostra
A 26 5000 2500
B 16 4000 2400
Hipóteses estatísticas:
H0: µA=µB
HA: µA≠µB
Além do básico!
Teste para duas médias com variâncias iguais
Hipóteses estatísticas:
H0: µA=µB
HA: µA≠µB
Exemplo 5
Um analista de sistemas deseja comparar o desempenho de duas amostras de
programas na solução de um problema. Na amostra 1, os programas foram feitos na
linguagem de programação A, em 40 diferentes algoritmos. Na amostra 2, os programas
foram feitos na linguagem de programação B, em 60 diferentes algoritmos. Na amostra
1, a proporção de acerto da resposta do problema foi de 65% e na B, 90%.
Considerando um nível de 1% de significância, há evidência suficiente para dizer que
existe diferença na proporção de acerto da resposta entre as duas linguagens de
programação?
Além do básico!
Teste para duas proporções
Dados do enunciado:
Programação Tamanho Proporção de
amostral acerto
A 40 0,65
B 60 0,90
Hipóteses estatísticas:
H0: pA=pB
HA: pA≠pB
Além do básico!
Teste para duas proporções
Hipóteses estatísticas:
H0: pA=pB
HA: pA≠pB
Método Valor-Z Valor-p
O que você pode concluir? Aproximação normal -3,06 0,002
Considerando um nível de 1% de
significância, há evidência O teste baseado na aproximação normal usa a
suficiente para dizer que existe estimativa combinada da taxa (0,8).
diferença na proporção de acerto
da resposta entre as duas
linguagens de programação?
Além do básico!
Teste para duas proporções
Alguns testes de normalidade que podem ser utilizados: Teste de Shapiro-Wilk, Teste
de Kolmogorov-Smirnov, Teste de Anderson-Darling, etc.
Além do básico!
Teste de normalidade para uma variável quantitativa
No Python:
https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.shapiro.html
https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.kstest.html
Além do básico!
Teste de normalidade para uma variável quantitativa
Percentual de
Exemplo 6 Gordura
O engenheiro de alimentos em uma empresa 15,2 18,5
fabricante de alimentos processados deseja avaliar o 12,4 16,3
15,4 20
percentual de gordura nos molhos engarrafados da 16,5 19,2
empresa. O percentual anunciado é 15%. O 15,9 12,3
engenheiro mede o percentual de gordura em 20 17,1 12,8
amostras aleatórias. 16,9 17,9
14,3 16,3
Deseja-se verificar a suposição de normalidade antes 19,1 18,7
de realizar o teste de hipótese. 18,2 16,2
Além do básico!
Teste de normalidade para uma variável quantitativa
Algumas opções de teste de igualdade de variâncias que podem ser utilizados: Teste F,
teste de Levene, teste de Bartlett (3 ou mais grupos), teste de Cochram, etc.
Além do básico!
Teste para igualdade de variâncias
No Python:
https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.bartlett.html#scipy.s
tats.bartlett
Além do básico!
Teste para igualdade de variâncias
Máquina A Máquina B
145 138 133 135
142 131 123 139
Exemplo 7
136 139 133 151
Queremos verificar se 2 máquinas produzem peças com a
133 140 130 136
131 123 129 141
mesma homogeneidade quanto ao diâmetro (em mm). Para
131 137 129 147 isso, sorteamos vinte amostras de peças de cada máquina e
132 128 133 145 obtivemos as seguintes medidas do diâmetro (em mm):
127 137 137 139
138 133 142 151
139 132 151 139
Além do básico!
Teste para igualdade de variâncias
Hipóteses estatísticas:
Ho: A2 = B2 → Amostras homocedásticas
(variâncias iguais)
HA: A2 ≠ B2 → Amostras heterocedásticas
(variâncias diferentes)
prof.julienne@gmail.com