Distribuição T de Student: Descarregar PDF

Fazer download em docx, pdf ou txt
Fazer download em docx, pdf ou txt
Você está na página 1de 11

Distribuição t de Student

 Língua
 Descarregar PDF
 Vigiar
 Editar
A distribuição t de Student é uma distribuição de probabilidade, publicada
por William Sealy Gosset sob o pseudônimo Student que não podia usar seu nome
verdadeiro para publicar trabalhos enquanto trabalhasse para a cervejaria Guinness.[1][2]

A função densidade da distribuição de Student para alguns valores de v e da distribuição normal
(a preto).

Parâmetros  graus de liberdade

Densidade

Acumulada

Média 0 se , caso contrário é indefinida

Moda 0

Mediana 0

Variância

A distribuição  é uma distribuição de probabilidade absolutamente contínua, simétrica e


campaniforme, o único parâmetro  que a caracteriza esta família é o número de graus de
liberdade. A função densidade de probabilidade da  detém caudas mais pesadas que
a distribuição normal quando  é pequeno e a medida que  cresce, a distribuição t de
Student se aproxima da normal.
Definição
Função densidade de probabilidade
A função densidade de probabilidade é:
em que Γ é a função gama. Usando-se a função beta B, a função densidade de
probabilidade pode ser escrita como:
Aplicações

A distribuição t de Student aparece naturalmente no problema de se determinar a média


de uma população (que segue a distribuição normal) a partir de uma amostra. Neste
problema, não se sabe qual é a média ou o desvio padrão da população, mas ela deve ser
normal.

Supondo que o tamanho da amostra n seja muito menor que o tamanho da população,


temos que a amostra é dada por n variáveis aleatórias normais independentes X1, ..., Xn,
cuja média  é o melhor estimador para a média da população.
Considerando  como a variância amostral, temos o seguinte resultado:
A variável aleatória t dada por:
ou : segue uma distribuição t de Student com  graus de liberdade.
Tabela com alguns valores selecionados
Grande parte dos livros estatísticos trazem uma tabela com valores para a distribuição t
de Student. Essas tabelas apresentam valores arredondados e esses arredondamentos
podem ser grosseiros demais, dependendo do tipo de análise que está sendo feita.
Softwares estatísticos e planilhas como Microsoft Excel e OpenOffice Calc possuem
técnicas mais precisas para a estimação desses valores.
A tabela abaixo lista alguns valores selecionados para a distribuição t de Student
com  graus de liberdade (números no início de cada linha) para as regiões críticas com
uma ou duas caudas (unicaudal ou bicaudal). Por exemplo, se estamos fazendo uma
análise em que a distribuição t de Student apresenta 4 graus de liberdade e queremos
usar um nível de confiança de 95% unicaudal, consultamos a tabela e percebemos
que  deve ser de 2,132. Isso quer dizer que a probabilidade de  é de 95%.
Uni 7 8 8 9 9 97, 9 99, 99, 99, 99,
cau 5 0 5 0 5 5 9 5 75 9 95
dal % % % % % % % % % % %

5 6 7 8 9 9 99,
Bica 95 99 99, 99,
0 0 0 0 0 8 8
udal % % 5% 9%
%%%%% % %

1, 1, 1, 3, 6, 3
12 63 31
0 3 9 0 3 1, 127 636
1 ,7 ,6 8,
0 7 6 7 1 8 ,3 ,6
1 6 3
0 6 3 8 4 2

0, 1, 1, 1, 2, 6,
4, 9, 22
8 0 3 8 9 9 14, 31,
2 30 92 ,3
1 6 8 8 2 6 09 60
3 5 3
6 1 6 6 0 5
0, 0, 1, 1, 2, 4,
3, 5, 10
7 9 2 6 3 5 7,4 12,
3 18 84 ,2
6 7 5 3 5 4 53 92
2 1 1
5 8 0 8 3 1

0, 0, 1, 1, 2, 3,
2, 4, 7,
7 9 1 5 1 7 5,5 8,6
4 77 60 17
4 4 9 3 3 4 98 10
6 4 3
1 1 0 3 2 7

0, 0, 1, 1, 2, 3,
2, 4, 5,
7 9 1 4 0 3 4,7 6,8
5 57 03 89
2 2 5 7 1 6 73 69
1 2 3
7 0 6 6 5 5

0, 0, 1, 1, 1, 3,
2, 3, 5,
7 9 1 4 9 1 4,3 5,9
6 44 70 20
1 0 3 4 4 4 17 59
7 7 8
8 6 4 0 3 3

0, 0, 1, 1, 1, 2,
2, 3, 4,
7 8 1 4 8 9 4,0 5,4
7 36 49 78
1 9 1 1 9 9 29 08
5 9 5
1 6 9 5 5 8

0, 0, 1, 1, 1, 2,
2, 3, 4,
7 8 1 3 8 8 3,8 5,0
8 30 35 50
0 8 0 9 6 9 33 41
6 5 1
6 9 8 7 0 6

0, 0, 1, 1, 1, 2,
2, 3, 4,
7 8 1 3 8 8 3,6 4,7
9 26 25 29
0 8 0 8 3 2 90 81
2 0 7
3 3 0 3 3 1

0, 0, 1, 1, 1, 2,
2, 3, 4,
7 8 0 3 8 7 3,5 4,5
10 22 16 14
0 7 9 7 1 6 81 87
8 9 4
0 9 3 2 2 4

0, 0, 1, 1, 1, 2,
2, 3, 4,
6 8 0 3 7 7 3,4 4,4
11 20 10 02
9 7 8 6 9 1 97 37
1 6 5
7 6 8 3 6 8
0, 0, 1, 1, 1, 2,
2, 3, 3,
6 8 0 3 7 6 3,4 4,3
12 17 05 93
9 7 8 5 8 8 28 18
9 5 0
5 3 3 6 2 1

0, 0, 1, 1, 1, 2,
2, 3, 3,
6 8 0 3 7 6 3,3 4,2
13 16 01 85
9 7 7 5 7 5 72 21
0 2 2
4 0 9 0 1 0

0, 0, 1, 1, 1, 2,
2, 2, 3,
6 8 0 3 7 6 3,3 4,1
14 14 97 78
9 6 7 4 6 2 26 40
5 7 7
2 8 6 5 1 4

0, 0, 1, 1, 1, 2,
2, 2, 3,
6 8 0 3 7 6 3,2 4,0
15 13 94 73
9 6 7 4 5 0 86 73
1 7 3
1 6 4 1 3 2

0, 0, 1, 1, 1, 2,
2, 2, 3,
6 8 0 3 7 5 3,2 4,0
16 12 92 68
9 6 7 3 4 8 52 15
0 1 6
0 5 1 7 6 3

0, 0, 1, 1, 1, 2,
2, 2, 3,
6 8 0 3 7 5 3,2 3,9
17 11 89 64
8 6 6 3 4 6 22 65
0 8 6
9 3 9 3 0 7

0, 0, 1, 1, 1, 2,
2, 2, 3,
6 8 0 3 7 5 3,1 3,9
18 10 87 61
8 6 6 3 3 5 97 22
1 8 0
8 2 7 0 4 2

0, 0, 1, 1, 1, 2,
2, 2, 3,
6 8 0 3 7 5 3,1 3,8
19 09 86 57
8 6 6 2 2 3 74 83
3 1 9
8 1 6 8 9 9

0, 0, 1, 1, 1, 2,
2, 2, 3,
6 8 0 3 7 5 3,1 3,8
20 08 84 55
8 6 6 2 2 2 53 50
6 5 2
7 0 4 5 5 8
0, 0, 1, 1, 1, 2,
2, 2, 3,
6 8 0 3 7 5 3,1 3,8
21 08 83 52
8 5 6 2 2 1 35 19
0 1 7
6 9 3 3 1 8

0, 0, 1, 1, 1, 2,
2, 2, 3,
6 8 0 3 7 5 3,1 3,7
22 07 81 50
8 5 6 2 1 0 19 92
4 9 5
6 8 1 1 7 8

0, 0, 1, 1, 1, 2,
2, 2, 3,
6 8 0 3 7 5 3,1 3,7
23 06 80 48
8 5 6 1 1 0 04 67
9 7 5
5 8 0 9 4 0

0, 0, 1, 1, 1, 2,
2, 2, 3,
6 8 0 3 7 4 3,0 3,7
24 06 79 46
8 5 5 1 1 9 91 45
4 7 7
5 7 9 8 1 2

0, 0, 1, 1, 1, 2,
2, 2, 3,
6 8 0 3 7 4 3,0 3,7
25 06 78 45
8 5 5 1 0 8 78 25
0 7 0
4 6 8 6 8 5

0, 0, 1, 1, 1, 2,
2, 2, 3,
6 8 0 3 7 4 3,0 3,7
26 05 77 43
8 5 5 1 0 7 67 07
6 9 5
4 6 8 5 6 9

0, 0, 1, 1, 1, 2,
2, 2, 3,
6 8 0 3 7 4 3,0 3,6
27 05 77 42
8 5 5 1 0 7 57 90
2 1 1
4 5 7 4 3 3

0, 0, 1, 1, 1, 2,
2, 2, 3,
6 8 0 3 7 4 3,0 3,6
28 04 76 40
8 5 5 1 0 6 47 74
8 3 8
3 5 6 3 1 7

0, 0, 1, 1, 1, 2,
2, 2, 3,
6 8 0 3 6 4 3,0 3,6
29 04 75 39
8 5 5 1 9 6 38 59
5 6 6
3 4 5 1 9 2
0, 0, 1, 1, 1, 2,
2, 2, 3,
6 8 0 3 6 4 3,0 3,6
30 04 75 38
8 5 5 1 9 5 30 46
2 0 5
3 4 5 0 7 7

0, 0, 1, 1, 1, 2,
2, 2, 3,
6 8 0 3 6 4 2,9 3,5
40 02 70 30
8 5 5 0 8 2 71 51
1 4 7
1 1 0 3 4 3

0, 0, 1, 1, 1, 2,
2, 2, 3,
6 8 0 2 6 4 2,9 3,4
50 00 67 26
7 4 4 9 7 0 37 96
9 8 1
9 9 7 9 6 3

0, 0, 1, 1, 1, 2,
2, 2, 3,
6 8 0 2 6 3 2,9 3,4
60 00 66 23
7 4 4 9 7 9 15 60
0 0 2
9 8 5 6 1 0

0, 0, 1, 1, 1, 2,
1, 2, 3,
6 8 0 2 6 3 2,8 3,4
80 99 63 19
7 4 4 9 6 7 87 16
0 9 5
8 6 3 2 4 4

0, 0, 1, 1, 1, 2,
1, 2, 3,
6 8 0 2 6 3 2,8 3,3
100 98 62 17
7 4 4 9 6 6 71 90
4 6 4
7 5 2 0 0 4

0, 0, 1, 1, 1, 2,
1, 2, 3,
6 8 0 2 6 3 2,8 3,3
120 98 61 16
7 4 4 8 5 5 60 73
0 7 0
7 5 1 9 8 8

0, 0, 1, 1, 1, 2,
1, 2, 3,
6 8 0 2 6 3 2,8 3,2
96 57 09
7 4 3 8 4 2 07 91
0 6 0
4 2 6 2 5 6

Exemplo

Um fabricante de aparelhos celulares afirma que a duração média da bateria desses


aparelhos nos primeiros 6 meses de uso é de 120 horas, ou seja, 5 dias. Analisando uma
amostra de 25 aparelhos, obteve-se uma média de duração de 116 horas, com desvio
padrão de 12 horas. Verifique se a afirmação é verdadeira, utilizando um nível de
confiança de 95% bicaudal.

Resolução:
1º Utilizando a tabela de distribuição t student, definem-se os pontos críticos através do
grau de liberdade (24) e o nível de confiança (95%).
Nesse caso, os pontos críticos são ± 2,064, ou seja, P(-2,064 < t < 2,064). Se o valor de
t estiver dentro desses limites a afirmação é verdadeira.
2º Na sequência calcula-se o valor de t para a amostra:
Dados:

Fórmula: 
3º Conclusão: Como t = - 1,667, encontra-se dentro dos limites críticos, P(-2,064 < t <
2,064), a afirmação do fabricante de celular que a duração média da sua bateria é de 120
horas, a um nível de confiança de 95%, é verdadeira.
Importante:
Esse exemplo não serve para alegar que a bateria dura, pelo menos, 120 horas. Para
determinar o desempenho esperado, a abordagem que tem mais correlação com a
experiência dos consumidores é a do teste unicaudal. Analisando os dados de teste com
a distribuição unicaudal, a média de 116 horas e desvio-padrão de 12 horas, para 24
graus de liberdade e um nível de confiança de 95%, vemos que a duração esperada para
as baterias seria equivalente a . Nesse caso, a duração esperada para 95% das baterias
seria de:
Ver também
Referências
1. ↑ William Gosset, site da Acção Local Estatística Aplicada
2. ↑ História da Estatística no mundo, site da UFRN
3. ↑ Myers, Raymond H. (2009). Probabilidade e estatística para engenharia e ciências
(8a Edição). São Paulo: Pearson Education do Brasil. pp. 162–163. ISBN 978-85-430-
1440-1

Teste t de Student
Método estatístico

 Língua
 Descarregar PDF
 Vigiar
 Editar
Saiba mais
Esta página cita fontes, mas estas não cobrem todo o conteúdo.

O teste t de Student ou somente teste t é um teste de hipótese que usa


conceitos estatísticos para rejeitar ou não uma hipótese nula quando a estatística de
teste () segue uma distribuição t de Student.
Essa premissa é normalmente usada quando a estatística de teste, na verdade, segue
uma distribuição normal, mas a variância da população 2 é desconhecida. Nesse caso, é
usada a variância amostral 2 e, com esse ajuste, a estatística de teste passa a seguir uma
distribuição t de Student.
História
Conceito

Função Densidade de Probabilidade para t de Student, indicando o p-valor unicaudal para


determinado t

Função Densidade de Probabilidade para t de Student, indicando o nível de confiança  e


o p-valor bicaudal para determinado t

Se forem feitas inúmeras amostras de tamanho  a partir da mesma população e se


fossem tiradas as médias de uma variável dessa população que possui
uma distribuição normal, a distribuição dessas inúmeras médias seguiria
uma distribuição t de Student. Por exemplo, imaginemos que a altura das pessoas
segue uma distribuição normal. Se selecionarmos diversas amostras aleatórias de
100 pessoas e calculássemos a média da altura das pessoas de cada amostra, essa
média da altura das pessoas seguirá uma distribuição t de Student.
Perceba que, na distribuição t de Student, valores muito baixos ou muito altos tem
menor probabilidade de ocorrer, indicando que é menos provável que a média de
uma amostra apresente valores muito distantes da média da população.

O formato da distribuição t de Student depende do número de graus de liberdade.


Quanto maior o número de graus de liberdade, mais "concentrada" é a distribuição.
Para valores muito grandes de graus de liberdade, a distribuição t de Student se
aproxima da distribuição normal.

O Teste t consiste em formular uma hipótese nula e consequentemente uma


hipótese alternativa, calcular o valor de  conforme a fórmula apropriada (abaixo) e
aplicá-lo à função densidade de probabilidade da distribuição t de Student medindo
o tamanho da área abaixo dessa função para valores maiores ou iguais a . Essa área
representa a probabilidade da média dessa(s) amostra(s) em questão ter(em)
apresentado o(s) valor(es) observado(s) ou algo mais extremo. Se a probabilidade
desse resultado ter ocorrido for muito pequena, podemos concluir que o resultado
observado é estatisticamente relevante. Essa probabilidade também é chamada
de p-valor ou valor p. Consequentemente, o nível de confiança  é igual a 1 - p-
valor.
Normalmente é usado um "ponto de corte" para o p-valor ou para o nível de
confiança para definir se a hipótese nula deve ser rejeitada ou não. Se o p-valor for
menor que esse "ponto de corte", a hipótese nula é rejeitada. Caso contrário, a
hipótese nula não é rejeitada.
É comum que sejam usados os "pontos de corte" para p-valor 0,1%, 0,5%, 1%, 2%
ou 5%, fazendo com que os níveis de confiança sejam, respectivamente, 99,9%,
99,5%, 99%, 98% ou 95%. Caso seja usado o p-valor 5% como "ponto de corte" e
a área abaixo da função densidade de probabilidade da distribuição t de Student
seja menor do que 5%, pode-se afirmar que a hipótese nula é rejeitada com nível de
confiança de 95%.
Note que não rejeitar a hipótese nula não é a mesma coisa que afirmar que a
hipótese alternativa é válida com o mesmo nível de confiança. Isso seria uma
interpretação incorreta do teste.

Unicaudal vs. Bicaudal


Dependendo da definição da hipótese nula, deve ser usado uma ou duas caudas da
distribuição t de Student na avaliação do teste. Por exemplo, se a hipótese nula
for  e a hipótese alternativa , o teste deve ser feito somente para valores maiores do
que   e, portanto, ao consultar a função densidade de probabilidade da distribuição t
de Student, deve-se considerar somente a área superior a  , ou seja, somente uma
das "caudas" da distribuição.
Por outro lado, se a hipótese nula for  e, consequentemente, a hipótese alternativa ,
teríamos que avaliar ao mesmo tempo a possibilidade de  e de . Para isso, ao
consultar a função densidade de probabilidade da distribuição t de Student, devem
ser consideradas as áreas abaixo da curva para valores superiores a  e inferiores a ,
ou seja, as duas "caudas" da distribuição. Como a distribuição é simétrica, os
tamanhos dessas áreas são iguais.
Teste t para média de uma amostra
O teste t para média de uma amostra consiste em medir a probabilidade da média
da amostra em questão ter apresentado o valor observado  ou algo mais extremo,
dada a média da população .
Para fazer isso, estipulamos, por exemplo, que a hipótese nula é  e que, por
consequência, a hipótese alternativa é . Usamos a seguinte fórmula para o cálculo
da estatística t:
Em que:

 : Média da amostra;
 : Valor fixo usado para comparação com a média da amostra;
 : Desvio padrão amostral;
 : Tamanho da amostra.

Quanto maior , mais confiança temos ao rejeitar a hipótese nula, ou seja, mais
certeza temos ao afirmar que  não é verdadeiro.
Note que, na fórmula acima, quanto maior , maior será . Ou seja, quanto maior a
distância dos valores observados ao valor que estamos comparando, mais certeza
teremos em afirmar que eles são diferentes. Do mesmo modo,  aumenta quando o
tamanho da amostra  é maior ou quando o desvio padrão  é menor. Teoricamente, o
desvio padrão a ser usado deveria ser o da população (normalmente identificado
com o símbolo ), mas em muitos casos práticos esse valor é desconhecido, sendo
necessário aproximá-lo pelo desvio padrão amostral :
Exemplo prático
Determinado carro consegue percorrer 15 km a cada litro de combustível gasto em
uma estrada plana e de boas condições, mas essa distância pode variar devido a
diversos fatores. Digamos que a distância percorrida por litro de combustível tenha
uma distribuição normal com média 15 km e desvio padrão de 2 km.

Suponhamos que seja feita uma modificação no motor desse carro com o objetivo
de aumentar a distância percorrida por litro de combustível. Depois da
modificação, foram realizados 10 testes. Nesses testes, a média das distâncias
percorridas por litro de combustível foi de 16,6 km.

A princípio, como 16,6 km é uma distância superior a 15 km, parece que a


modificação no motor aumentou a distância percorrida por litro de combustível.
Mas, para comprovar esse efeito de forma estatística, definimos a hipótese nula  e
calculamos o valor de .
Neste caso, temos:

Assim,

Conforme a função de densidade de probabilidade da distribuição t de Student com


9 (10-1) graus de liberdade, existe 1,61% de probabilidade de valores superiores a
2,53 terem sido obtidos caso a distância percorrida por litro de combustível não ter
sido alterada. Se estivermos usando nível de confiança de 95%, rejeitaríamos a
hipótese nula . Isso pode ser explicado de duas formas:
 A probabilidade obtida com o t calculado (1,61%) é inferior ao "ponto de corte"
do p-valor (5%), ou
 O valor t do "ponto de corte" escolhido (95% de confiança, que corresponde ao t de
1,833), é inferior ao t calculado (2,53).

Na primeira explicação, é necessário calcular a área abaixo da função densidade de


probabilidade da distribuição t de Student com 9 graus de liberdade para valores
superiores a 2,53 usando algum software estatístico ou planilha de cálculo. Na
segunda explicação, além dos softwares estatísticos ou planilhas de cálculo,
também poderia-se chegar no valor 1,833 usando uma tabela de valores para
distribuição t de Student, que normalmente constam em livros de estatística.

Perceba que, se usássemos nível de confiança de 99%, ao invés de 95%, não


rejeitaríamos a hipótese nula porque:
 A probabilidade obtida com o t calculado (1,61%) é superior ao "ponto de corte"
do p-valor (1%), ou
 O valor t do "ponto de corte" escolhido (99% de confiança, que corresponde ao t de
2,821), é superior ao t calculado (2,53).
Teste t para médias de duas amostras
Tamanhos iguais, variâncias iguais
Este teste só deve ser usado quando:

 o tamanho das amostras (n) dos dois grupos são iguais;


 Podemos assumir que as duas distribuições possuem a mesma variância.

A estatística t é calculada conforme a fórmula:

,onde

A quantidade de graus de liberdade a ser usado nesse teste é .


Tamanhos diferentes, variâncias iguais
Este teste só deve ser usado quando podemos assumir que as duas distribuições
possuem a mesma variância.

A estatística t é calculada conforme a fórmula:

,onde

A quantidade de graus de liberdade a ser usado nesse teste é .


Tamanhos diferentes, variâncias diferentes
Este teste é usado quando as amostras possuem variâncias diferentes. Para
confirmar se as variâncias são realmente diferentes, é recomendável realizar um
teste de variâncias.

A estatística t é calculada conforme a fórmula:

,onde

A quantidade de graus de liberdade a ser usado nesse teste é:

Essa equação é chamada de Equação Welch–Satterthwaite.


Teste t para coeficiente de regressões
Ver também
Referências
1. ↑ Richard Mankiewicz, The Story of Mathematics (Princeton University Press),
p.158.
2. ↑ a b John J. O’Connor, Edmund F. Robertson: Teste t de Student. In: MacTutor
History of Mathematics archive.
3. ↑ Fisher Box, Joan (1987). «Guinness, Gosset, Fisher, and Small
Samples». Statistical Science. 2 (1): 45–52. doi:10.1214/ss/1177013437
4. ↑ Raju TN (2005). «William Sealy Gosset and William A. Silverman: two "students" of
science». Pediatrics. 116 (3): 732–5. PMID 16140715. doi:10.1542/peds.2005-1134

Você também pode gostar