PE_Lição3 estatistica i

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 26

PROBABILIDADES

E
ESTATÍSTICA
Aula Teórica n.º 3

1
HISTOGRAMAS
2
HISTOGRAMAS – QUANTAS
COLUNAS?

(𝑛 = 474)
O número de classes
que um histograma
relativo a uma
amostra com n
elementos deve ter,
de acordo com a regra
de Sturges, é

REGRA DE 𝐿 = log 2 𝑛 + 1

STURGES log 𝑛
= log 2
+ 1,

onde 𝑥 denota a


parte inteira de x (por
exemplo, 3.99 = 3).
Se 𝑛 = 474,
REGRA DE 𝐿 = log 2 𝑛 + 1
STURGES
= log 2 4 74 + 1

EXEMPLO
log 4 74
= +1
log 2

= 8.88 + 1

= 9.
REGRA DE Alternativamente, se 𝑛 = 474,

STURGES 256 < 474 < 512 

28 < 474 < 29 


EXEMPLO log2 474 = 8 

𝐿 = 9.
𝑘 2𝑘
0 1
1 2
2 4
3 8
4 16
5 32
6 64
7 128
REGRA DE 8 256
STURGES 9
10
512
1024
11 2048
12 4096
NOTA 13
14
8192
16384
15 32768
16 65536
17 131072
18 262144
19 524288
⋮ ⋮
HISTOGRAMA
NÚMERO IDEAL DE CLASSES SEGUNDO STURGES
0,57 0,55 0,56 0,57 0,58 0,61 0,62 0,64
0,54 0,55 0,57 0,58 0,58 0,61 0,63 0,66
0,54 0,55 0,57 0,58 0,58 0,61 0,63 0,66
0,54 0,55 0,57 0,58 0,59 0,61 0,63 0,66
0,55 0,55 0,57 0,58 0,59 0,62 0,64 0,66
0,55 0,56 0,57 0,58 0,59 0,62 0,64 0,68
0,55 0,56 0,57 0,58 0,59 0,62 0,64 0,69

Largura (polegadas) do
HISTOGRAMA - EXEMPLO siso superior direito
(amostra ordenada)
𝑛 = 56

𝑥1:𝑛 = 0.54

𝑥𝑛:𝑛 = 0.69

𝐴 = 𝑥𝑛:𝑛 − 𝑥1:𝑛 = 0.69 − 0.54 = 0.15


HISTOGRAMA 𝐴 0.15
- EXEMPLO 𝐴𝐶 =
𝐿
=
6
= 0.025

0,57 0,55 0,56 0,57 0,58 0,61 0,62 0,64


0,54 0,55 0,57 0,58 0,58 0,61 0,63 0,66
0,54 0,55 0,57 0,58 0,58 0,61 0,63 0,66
0,54 0,55 0,57 0,58 0,59 0,61 0,63 0,66
0,55 0,55 0,57 0,58 0,59 0,62 0,64 0,66
0,55 0,56 0,57 0,58 0,59 0,62 0,64 0,68
0,55 0,56 0,57 0,58 0,59 0,62 0,64 0,69
Classe Frequência
[0.540,0.565] 14
(0.565,0.590] 21
(0.590, 0.615] 4
(0.615,0.640] 11
(0.640,0.665] 4
HISTOGRAMA (0.665,0.690] 2
- EXEMPLO 56
0|0122245688
1|01124559
2|28
3|26
4|34
5|
6|1

CAULE E FOLHAS
12
CAULE E FOLHAS

O diagrama de caule e folhas é uma forma eficiente de organizar um conjunto de dados de


dimensão pequena/moderada.

O diagrama de caule e folhas é obtido através da divisão de cada observação em duas partes
– o caule e a folha. Por exemplo, se todas as observações tiverem dois dígitos, podemos
considerar como caule o valor das dezenas e como folhas as unidades. Por exemplo, o valor
62 é representado da seguinte forma:
Caule Folha
6 2

e os valores 62 e 67 são representados da seguinte forma:


6 | 27

13
CAULE E FOLHAS - EXEMPLO

0,57 0,66 0,55 0,61 0,55 0,66 0,55 0,58


𝑥1:𝑛 = 0 . 5 4
0,59 0,64 0,56 0,55 0,66 0,58 0,61 0,55
𝑥𝑛:𝑛 . = 0 . 6 9
0,57 0,57 0,63 0,58 0,64 0,62 0,56 0,62

0,61 0,58 0,55 0,62 0,59 0,58 0,66 0,54

0,62 0,58 0,58 0,58 0,54 0,64 0,57 0,63

0,57 0,57 0,59 0,55 0,69 0,59 0,58 0,64

0,61 0,57 0,55 0,68 0,54 0,56 0,63 0,57

0. 5 7 9 7 7 7 8 8 7 7 5 6 5 8 9 5 5 8 8 5 5 9 4 4 8 8 9 6 5 6 7 8 8 5 4 7
0. 6 1 2 1 6 4 3 1 2 8 6 4 9 6 2 4 1 6 3 2 3 4

(folhas não ordenadas)

14
CAULE E FOLHAS - EXEMPLO

0. 5 7 9 7 7 7 8 8 7 7 5 6 5 8 9 5 5 8 8 5 5 9 4 4 8 8 9 6 5 6 7 8 8 5 4 7
0. 6 1 2 1 6 4 3 1 2 8 6 4 9 6 2 4 1 6 3 2 3 4

-1
56, 10 (dimensão da amostral, unidade do caule) (folhas não ordenadas)

(35) 5 4 4 4 5 5 5 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 7 8 8 8 8 8 8 8 8 8 9 9 9 9
21 6 1 1 1 1 2 2 2 2 3 3 3 4 4 4 4 6 6 6 6 8 9

Profundidade máxima atingida na linha ou, se a linha contêm a mediana, o


número de folhas que compõem a linha entre parênteses.

15
CAULE E FOLHAS - NOTA

Podemos aumentar o número de linhas de um caule e folhas (para nos aproximarmos do


número dado pela regra de Sturges) dividindo os dígitos de cada linha em duas partes,
separando os dígitos 0,1,2,3,4 dos dígitos 5,6,7,8,9:

0 1 2 3 4 5 6 7 8 9

ou dividindo os dígitos de cada linha em cinco partes:

* t f s

0 1 2 3 4 5 6 7 8 9

16
CAULE E FOLHAS - EXEMPLO

O número ideal de linhas, de acordo com a regra de Sturges, para uma amostra de
tamanho 56 é 6. Subdividindo cada linha em duas obtemos:

1
56; × 10−1
2

3 5* 4 4 4
(32) 5 5 5 5 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 7 8 8 8 8 8 8 8 8 8 9 9 9 9
21 6* 1 1 1 1 2 2 2 2 3 3 3 4 4 4 4
6 6 6 6 6 6 8 9

17
CAULE E FOLHAS -
EXEMPLO

Subdividindo cada linha em cinco partes obtemos:


Compare-o com o
dimensão histograma!
unidade
da amostra do caule
1 folhas
caule 56; × 10−1
profundidades 5
máximas da
11 4 4 4 5 5 5 5 5 5 5 5
linha 5f
22 5s 6 6 6 7 7 7 7 7 7 7 7
(13) 5 8 8 8 8 8 8 8 8 8 9 9 9 9
21 6* 1 1 1 1
n.º de elementos 17 6t 2 2 2 2 3 3 3
da linha da 10
6f 4 4 4 4
mediana 6
6s 6 6 6 6
2 8 9
6

18
CAIXAS COM BIGODES
19
Outliers não severos
Elementos da amostra que não
pertencem ao intervalo

[𝐹𝐿 − 1.5𝑑𝐹 , 𝐹𝑈 + 1.5𝑑𝐹 ]

OUTLIERS Outliers severos


Elementos da amostra que não
pertencem ao intervalo

[𝐹𝐿 − 3𝑑𝐹 , 𝐹𝑈 + 3𝑑𝐹 ]


CAIXAS COM BIGODES

Outliers não Outliers


severos severos

xxx oo

Menor valor que Quarto Quarto Maior valor que não é


não é outlier Inferior Superior outlier

Mediana
21
CAIXAS COM BIGODES
EXEMPLO
x1:7 x2:7 x3:7 x4:7 x5:7 x6:7 x7:7
0.42 0.48 0.73 1.10 1.10 1.75 5.40

𝑴 = 1.10; 𝑭𝑳 = 0.605; 𝑭𝑼 = 1.425

dF = FU – FL = 1.425 – 0.605 = 0.82

1.5 dF = 1.5  0.82 = 1. 23 3 dF = 3  0.82 = 2.46

FL – 1.5 dF = 0.605 – 1.23 = - 0.625 FU + 3 dF = 1.425 + 2.46 = 3.885

FU + 1.5 dF = 1.425 +1.23 = 2.655


Oulier severo

0 1 2 3 4 5
22
CAIXAS COM BIGODES

Distribuição

Em forma de sino Uniforme Assimétrica

23
CAIXAS COM BIGODES
EXERCÍCIO

A investigadora S. Quintal[1] estudou a dissimilaridade genética de 46 genótipos de mamoeiro


(carica papaya) e agrupou-os em sete grupos. Na imagem encontra sete caixas-com-bigodes
que mostram as distribuições dos pesos (em gramas) dos frutos das plantas de cada grupo.

Descreva as principais caraterísticas das


referidas distribuições (não esquecendo de
mencionar a localização, dispersão e simetria
dos pesos dos frutos de cada grupo, de
comparar os frutos oriundos dos vários grupos e
de mencionar a escala dos dados).

(Exame de Recurso – 04/02/2015)


[1]
QUINTAL S. (2009), Caracterização e avaliação de um Banco de Germoplasma de mamoeiro para estudos dos parâmetros genéticos e diversidade genética. Dissertação
(Mestrado em Genética e Melhoramento de Plantas)- Universidade Estadual do Norte Fluminense Darcy Ribeiro, UENF. (http://uenf.br/pos-
graduacao/gmp/files/2012/01/Tese-MS-Silvana-Silva-Red-Quintal.pdf). 24
THE JOY OF STATS
com Hans Rosling

https://www.youtube.com/watch?v=jbkSRLYSojo
VÍDEO http://www.gapminder.org/
RECOMENDADO

(1948-2017)

25
Capítulo II de Introdução à Probabilidade e à
Estatística, de D. Pestana e S. Velosa:
LEITURA
Análise inicial de dados: estatística descritiva e
RECOMENDADA análise exploratória

26

Você também pode gostar