Estatistica Geral

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 91

INSTITUTO COMERCIAL DE MAPUTO

Texto de Apoio

ESTATÍSTICA GERAL

Castro Lidaia & Francisco Nhongo


INDICE
INTRODUÇÃO ........................................................................................................................................ 4
DEFINIÇÃO ............................................................................................................................................. 5
DIVISÃO DA ESTATÍSTICA ................................................................................................................. 6
POPULAÇÃO ........................................................................................................................................... 7
DIVISÃO DA POPULAÇÃO ........................................................................................................................ 7
AMOSTRA ................................................................................................................................................... 8
CÁLCULO DO TAMANHO DA AMOSTRA ..................................................................................... 8
CARACTERÍSTICA ....................................................................................................................................... 8
ATRIBUTO .................................................................................................................................................. 8
CLASSIFICAÇÃO DO ATRIBUTO ............................................................................................................... 9
VARIÁVEL .................................................................................................................................................. 9
TIPOS DE VARIÁVEIS ....................................................................................................................... 9
CENSO ...................................................................................................................................................... 10
AMOSTRAGEM..................................................................................................................................... 10
DESCRIÇÃO DOS DADOS ................................................................................................................... 12
APRESENTAÇÃO TABULAR ................................................................................................................... 12
SÉRIE ESTATÍSTICA .......................................................................................................................... 12
SÉRIE TEMPORAL, HISTÓRICA OU CRONOLÓGICA ............................................................ 13
SÉRIE GEOGRÁFICA, TERRITORIAL OU DE LOCALIDADE ................................................ 13
SÉRIE ESPECÍFICA OU CATEGÓRICA...................................................................................... 14
SÉRIES MISTAS ............................................................................................................................ 14
SÉRIE HOMÓGRADA ................................................................................................................... 14
SÉRIE HETERÓGRADA ............................................................................................................... 15
DISTRIBUIÇÃO DE FREQUÊNCIAS .......................................................................................... 15
APRESENTAÇÃO GRÁFICA .................................................................................................................... 21
HISTOGRAMA E POLÍGONO DE FREQUÊNCIAS ....................................................................... 25
HISTOGRAMA .............................................................................................................................. 25
POLÍGONO DE FREQUÊNCIAS .................................................................................................. 27
RAMO-E-FOLHAS.............................................................................................................................. 30
MEDIDAS ESTATÍSTICAS ........................................................................................................................... 31
MEDIDAS DE POSIÇÃO ................................................................................................................... 31
SEPARATRIZES ............................................................................................................................ 31
MEDIANA (Me) ......................................................................................................................... 31
QUARTIS .................................................................................................................................... 33
DECIS ......................................................................................................................................... 36
PERCENTIL ou CENTIL ........................................................................................................... 39
Outliers: ....................................................................................................................................... 40
Gráfico de Box-Plot..................................................................................................................... 42
PROMÉDIAS .................................................................................................................................. 43
MODA (Mo)................................................................................................................................ 43
Média aritmética .......................................................................................................................... 45
MEDIDAS DE DISPERSÃO .................................................................................................................. 46
MEDIDAS ABSOLUTAS DE VARIAÇÃO ............................................................................................... 47
MEDIDA RELATIVA DE VARIAÇÃO ................................................................................................... 48
MEDIDAS DE ASSIMETRIA ........................................................................................................................ 49

Professor: Lidaia & Nhongo 1


MEDIDAS DE CURTOSE ............................................................................................................................. 49
PRINCIPIOS DE CONTAGEM ............................................................................................................. 52
REGRA DA ADIÇÃO ............................................................................................................................... 52
REGRA DA MULTIPLICAÇÃO ................................................................................................................. 52
FACTORIAL ........................................................................................................................................... 53
PERMUTAÇÕES E ARRANJOS ................................................................................................................. 53
COMBINAÇÕES ..................................................................................................................................... 55
PROBABILIDADE ................................................................................................................................. 56
INTRODUÇÃO................................................................................................................................... 56
MODELOS .......................................................................................................................................... 56
O ESPAÇO AMOSTRAL ............................................................................................................. 57
EVENTOS ...................................................................................................................................... 58
COMBINAÇÃO DE EVENTOS ................................................................................................... 58
EVENTOS MUTUAMENTE EXCLUDENTES .......................................................................... 58
DEFINIÇÃO CLÁSSICA DE PROBABILIDADE ....................................................................... 58
CRÍTICA À DEFINIÇÃO CLÁSSICA ...................................................................................................... 59
A DEFINIÇÃO DE PROBABILIDADE COMO FREQUÊNCIA RELATIVA ........................... 59
DEFINIÇÃO AXIOMATICA DE PROBABILIDADE .................................................................. 60
TEOREMA DA MULTIPLICAÇÃO .............................................................................................. 61
INDEPENDÊNCIA DE DOIS EVENTOS ................................................................................... 62
TEOREMAS DA PROBABILIDADE TOTAL E DE BAYES ..................................................... 62
TEOREMA DA PROBABILIDADE TOTAL .............................................................................................. 63
TEOREMA DE BAYES........................................................................................................................ 63
Variável aleatória .................................................................................................................................... 65
Tipos de Variáveis Aleatórias ............................................................................................................. 66
Variável Aleatória Discreta ............................................................................................................. 66
Função de Distribuição de Probabilidade Acumulada .................................................................... 67
Variável aleatória Contínua ............................................................................................................. 68
Função de Distribuição de Probabilidade Acumulada .................................................................... 68
Esperança......................................................................................................................................... 69
Variância ......................................................................................................................................... 70
Distribuições de Probabilidade de variáveis aleatórias ........................................................................... 71
Distribuições de probabilidade de variáveis aleatórias discretas ........................................................ 71
Distribuição Uniforme Discreta ...................................................................................................... 71
Parâmetros ................................................................................................................................... 72
Medidas descritivas ..................................................................................................................... 72
Distribuição Hipergeométrica ......................................................................................................... 72
Função de Probabilidade ............................................................................................................. 72
Parâmetros ................................................................................................................................... 73
Medidas descritivas ..................................................................................................................... 73
Distribuição de Bernoulli ................................................................................................................ 74
Função de Probabilidade ............................................................................................................. 74
Parâmetros ................................................................................................................................... 74
Medidas descritivas ..................................................................................................................... 74
Distribuição Geométrica.................................................................................................................. 75
Parâmetros ................................................................................................................................... 75
Medidas descritivas ..................................................................................................................... 75
Distribuição de Pascal ..................................................................................................................... 76
Parâmetros ................................................................................................................................... 76

Estatística Geral 2018 – Texto de Apoio 2


Medidas descritivas ..................................................................................................................... 76
Distribuição Binomial ..................................................................................................................... 76
Parâmetros ................................................................................................................................... 76
Medidas descritivas ..................................................................................................................... 77
Distribuição Multinomial ................................................................................................................ 77
Parâmetros ................................................................................................................................... 77
Medidas descritivas ..................................................................................................................... 77
Distribuição de Poisson ................................................................................................................... 78
Parâmetros ................................................................................................................................... 78
Medidas descritivas ..................................................................................................................... 78
Exercícios ........................................................................................................................................ 80
Distribuições de probabilidade de Variáveis aleatórias contínuas ...................................................... 81
Distribuição Uniforme ..................................................................................................................... 81
Função de densidade de probabilidade ........................................................................................ 81
Parâmetros ................................................................................................................................... 81
Medidas descritivas ..................................................................................................................... 82
Função de distribuição acumulada .............................................................................................. 82
Distribuição Exponencial ................................................................................................................ 83
Função densidade de probabilidade ............................................................................................ 84
Parâmetros ................................................................................................................................... 84
Medidas descritivas ..................................................................................................................... 84
Função de distribuição acumulada .............................................................................................. 84
Propriedade da distribuição exponencial ..................................................................................... 84
Distribuição Normal ........................................................................................................................ 85
Função densidade de probabilidade ............................................................................................ 86
Parâmetros ................................................................................................................................... 86
Medidas descritivas ..................................................................................................................... 86
Propriedades da distribuição normal ........................................................................................... 86
Distribuição normal padrão ............................................................................................................. 87
Regras de consulta da tabela da distribuição normal padrão ....................................................... 88
Exercícios ........................................................................................................................................ 89

Professor: Lidaia & Nhongo 3


INTRODUÇÃO
O mundo está repleto de dados. Sua capacidade em lidar com eles, transformando-os em
informações importantes, é o que vai diferenciar você das demais pessoas no mundo contemporâneo.
Da leitura crítica das notícias de um jornal até a decisão de fazer um determinado investimento,
passando por situações críticas no seu local de trabalho, a capacidade de se obter, organizar,
representar, descrever e analisar dados requer o conhecimento de métodos e técnicas que permitam
extrair o máximo que eles podem oferecer.

O conjunto dos métodos e técnicas estão descritas na estatística. Se entendermos Estatística como a
Ciência dos Dados, será de grande valia o domínio que seu corpo de conhecimento pode nos
oferecer.

Algumas ciências usam a estatística aplicada tão extensivamente que elas tem uma terminologia
especializada. Estas disciplinas incluem:
 Bioestatística
 Estatística Comercial
 Estatística Económica
 Estatística Engenharia
 Estatística Física
 Estatística Populacional
 Estatística Psicológica
 Estatística Social (para todas as ciências sociais)
 Análise de Processo e Quimiometria (para análise de dados da química analítica e da
engenharia química)

Estatística forma uma ferramenta chave nos negócios e na industrialização como um todo. É utilizada
a fim de entender sistemas variáveis, controle de processos (chamado de "controle estatístico de
processo" ou CEP), para sumarização de dados, e para tomada de decisão baseada em dados.
Nessas funções ela é uma ferramenta chave, e é a única ferramenta segura.

Estatística Geral 2018 – Texto de Apoio 4


DEFINIÇÃO
O termo estatística surge da expressão em Latim statisticum collegium palestra sobre os assuntos do
Estado, de onde surgiu a palavra em língua italiana statista, que significa "homem de estado", ou
político, e a palavra alemã Statistik, designando a análise de dados sobre o Estado. A palavra foi
proposta pela primeira vez no século XVII, em latim, por Schmeitzel na Universidade de Lena e
adoptada pelo académico alemão Godofredo Achenwall. Aparece como vocabulário na Enciclopédia
Britânica em 1797, e adquiriu um significado de colecta e classificação de dados, no início do século
19.

Nós descrevemos o nosso conhecimento (e ignorância) de forma matemática e tentamos aprender


mais sobre aquilo que podemos observar. Isto requer:
 O planeamento das observações por forma a controlar a sua variabilidade (concepção do
experimento)
 Sumarização da colecção de observações
 Inferência estatística - obter um consenso sobre o que as observações nos dizem sobre o
mundo que observamos

A Estatística é uma ferramenta matemática que nos informa sobre o quanto os nossos erros das
nossas observações apresentam sobre a realidade pesquisada. A estatística baseia-se na medição
do erro que existe entre a estimativa de quanto um pequeno conjunto representa adequadamente ao
todo (conjunto maior) da qual foi extraído. Assim o conhecimento de teoria de conjuntos, análise
combinatória e cálculo são indispensáveis para compreender como o erro se comporta e a magnitude
do mesmo. É o erro (erro amostral) que define a qualidade da observação e do delineamento
experimental. A faceta dessa ferramenta mais palpável é a Estatística Descritiva. A descrição dos
dados colectados é comumente apresentado em gráficos ou relatórios e serve tanto a prospecção de
uma ou mais variáveis para posterior aplicação ou não de testes estatísticos bem como a
apresentação de resultados de delineamentos experimentais.

A bioestatística é a aplicação de estatística ao campo biológico e médico,. Ela é essencial ao


planeamento, colecta, avaliação e interpretação de todos os dados obtidos em pesquisa na área
biológica e médica. É fundamental à epidemiologia, à ecologia e à medicina baseada em evidência.

Qualquer ciência experimental não pode prescindir das técnicas proporcionadas pela Estatística,
como por exemplo a Medicina, a Física, a Biologia, a Administração, a Economia, etc. Todos esses
ramos de actividade profissional têm necessidade de um instrumental que se preocupa com o
tratamento quantitativo dos fenómenos de massa ou colectivos, cuja medição e análise requerem um
conjunto de observações de fenómeno ou particulares.

ESTATÍSTICA é a ciência que se preocupa com a colecta, a organização, descrição (apresentação),


análise e interpretação de dados experimentais e tem como objectivo fundamental o estudo de uma
população. Este estudo pode ser feito de duas maneiras:
 Investigando todos os elementos da população ou
 Por amostragem, ou seja, seleccionando alguns elementos da população.

Professor: Lidaia & Nhongo 5


DIVISÃO DA ESTATÍSTICA
Primeiramente, como ponto de partida, podemos dividir a Estatística em duas áreas: a Descritiva e a
Inferencial.

Estatística Descritiva: é aquela que se preocupa com a colecta, organização, classificação,


apresentação, interpretação e analise de dados referentes ao fenómeno
através de gráficos e tabelas além de calcular medidas que permita
descrever o fenómeno.

A Estatística Descritiva postula os métodos e técnicas relacionadas à obtenção, representação,


mensuração, análise e conclusões a partir de um conjunto de dados oriundos de uma população ou
de uma amostra. Quando os dados são oriundos de uma população, podemos descrevê-la através de
medidas estatísticas adequadas vis a vis o nível de mensuração das características estudadas.
Nesse caso dizemos que o conhecimento da população em apreço é, por extensão, o conhecimento
das medidas a ela associadas. Não há erro no processo, a não ser aqueles devidos à informação
quando da obtenção dos dados. A aritmética, através de suas operações básicas, é suficiente para os
cálculos necessários à obtenção das medidas estatísticas. No entanto, quando os dados são
extraídos de uma amostra sua descrição segue as mesmas técnicas e métodos utilizados para dados
populacionais. A análise, entretanto, já passa a ser feita com base nos métodos inferenciais.

Estatística Indutiva (Amostral ou Inferêncial): é a aquela que partindo de uma amostra, estabelece
hipóteses, tira conclusões sobre a população de origem e que formula previsões fundamentando-se
na teoria das probabilidades. A estatística indutiva cuida da análise e interpretação dos dados.

O processo de generalização do método indutivo está associado a uma margem de incerteza. Isto se
deve ao facto de que a conclusão que se pretende obter para o conjunto de todos os indivíduos
analisados quanto a determinadas características comuns baseia-se em uma parcela do total de
observações.

A Estatística Inferencial postula um conjunto de técnicas que permitem utilizar dados oriundos de
uma amostra para generalizações sobre a população. Constitui esse conjunto de técnicas: a
determinação do número de observações (tamanho da amostra); o esquema de seleção das
unidades observacionais; o cálculo das medidas estatísticas; a determinação da confiança nas
estimativas; a significância dos testes estatísticos; a precisão das estimativas; dentre outras. Essa
generalização é feita a partir do processo de estimação das medidas estatísticas que podem ser
calculadas, porém não sem antes se antecipar um grau de certeza de que a amostra esteja
fornecendo os dados que seriam de se esperar caso toda a população fosse estudada. Nesse caso, o
ramo da matemática que será utilizado para se avaliar tal grau de certeza é a probabilidade. Com ela
teremos condições de mensurar a fidedignidade de cada inferência feita com base na amostra.

Antes de começarmos a estudar os métodos estatísticos que nos permitirão analisar dados, sejam
eles qualitativos ou quantitativos, é importante introduzirmos alguns conceitos preliminares a fim não
apenas de dar nomes aos instrumentos, mas também adequar e eqüalizar a terminologia a ser
utilizada ao longo do curso. Você verá que uma nova linguagem será desenvolvida ao longo desse
curso e o seu domínio é fundamental para um melhor aproveitamento.

Estatística Geral 2018 – Texto de Apoio 6


POPULAÇÃO
CONCEITO: é o conjunto, finito ou infinito, de indivíduos ou objectos que apresentam em comum
determinadas características definidas, cujo comportamento interessa analisar.

A população é estudada em termos de observações de características que sejam relevantes para o


estudo, e não em termos de pessoas ou objectos em si. O objectivo é tirar conclusões sobre o
fenómeno em estudo, a partir dos dados observados.

Como em qualquer estudo estatístico temos em mente estudar uma ou mais características dos
elementos de uma população, é importante definir bem essas características de interesse para que
seja delimitado os elementos que pertencem à população e quais os que não pertencem.

Exemplos:
1 Conjunto dos 5507 municípios moçambicanos.
2 Conjunto constituído pelos estudantes deste curso.
3 Conjunto dos discursos do presidente da república desde a sua posse.
4 Todos os pacientes do Hospital Central de Maputo.
5 Conjunto das informações colectadas pela Estação Pluviométrica, durante o ano.

DIVISÃO DA POPULAÇÃO
podemos dividir a população quanto ao tamanho em Finita e Infinita

População Finita: apresenta um número limitado de elementos. É possível enumerar todos os


elementos componentes.

Exemplo
Idade dos estudantes Universitários da Cidade de Maputo.
População: Todos os universitários da Cidade de Maputo.

População Infinita: apresenta um número ilimitado de elementos. Não é possível enumerar todos os
elementos componentes. Entretanto, tal definição existe apenas no campo teórico, uma vez que, na
prática, nunca encontraremos populações com infinitos elementos, mas sim, populações com grande
número de componentes; e nessas circunstâncias, tais populações são tratadas como se fossem
infinitas.

Exemplo
Tipos de bactérias no corpo humano
População: Todas as bactérias existentes no corpo humano.

Unidade Observável: É a portadora da(s) característica(s), ou propriedade(s), que se deseja


investigar.
Exemplos:
1 Cada um dos 5507 municípios moçambicano.
2 Cada estudante deste curso.
3 Cada discurso presidencial.

Professor: Lidaia & Nhongo 7


AMOSTRA
É uma parte (um subconjunto finito) representativa de uma população seleccionada segundo métodos
adequados.

O objectivo é fazer inferências, tirar conclusões sobre populações com base nos resultados da
amostra, para isso é necessário garantir que amostra seja representativa, ou seja, a amostra deve
conter as mesmas características básicas da população, no que diz respeito ao fenómeno que
desejamos pesquisar.

O termo indução é um processo de raciocínio em que, partindo-se do conhecimento de uma parte,


procura-se tirar conclusões sobre a realidade no todo.

Ao induzir estamos sujeitos a erros. Entretanto, a Estatística Indutiva, que obtém resultados sobre
populações a partir das amostras, diz qual a precisão dos resultados e com que probabilidade se
pode confiar nas conclusões obtidas.

Exemplos:
1 Conjunto dos municípios da Região Norte.
2 Estudantes da cidade de Maputo.
3 Discursos proferidos em recintos abertos.

CÁLCULO DO TAMANHO DA AMOSTRA


Para o cálculo do tamanho da amostra usa-se uma das seguintes fórmulas que dependerá do
tamanho da população.
1
n

Para população finita temos: 2 , onde Ɛ é o erro amostral; para população infinita

N
n

temos a fórmula original:
 N 1
2

CARACTERÍSTICA
É preciso definir qual(is) a(s) característica(s) de interesse que será(ão) analisada(s). A característica
de interesse pode ser de natureza qualitativa ou quantitativa.

ATRIBUTO
São todas as características de uma população que não podem ser medidas. Os indivíduos ou
objectos são colocados em categorias ou tipos e conta-se a frequência com que ocorrem.

Exemplos: género (masculino e feminino); estado civil (solteiro, casado, viúvo, etc.); tipo de moradia
(madeira, tijolo), situação do aluno (aprovado, reprovado), religião.

Estatística Geral 2018 – Texto de Apoio 8


CLASSIFICAÇÃO DO ATRIBUTO
Dicotomia: quando a classe em que o atributo é considerado admite apenas duas categorias.
Exemplos: Sexo (masc. e fem.); Existência ou ausência de certo produto agrícola (existência,
ausência), resposta a uma pergunta: (concorda, não concorda), (sim, não).

Classificação Policotômica ou policotomia: quando a classe em que o atributo é considerado


admite mais de duas categorias.
Exemplos: Estado civil (solteiro, casado, viúvo), classe social (alta, média ou baixa).

VARIÁVEL
é o conjunto de resultados possíveis de um fenómeno (ou observação, ou característica). É a
representação simbólica da característica ou propriedade que se deseja investigar.

Exemplos:
1 Receita tributária municipal arrecadada no ano passado.
2 Gênero dos alunos.
3 Número de filhos tidos de um grupo de casais
4 Peso de pessoas adultas
5 velocidade máxima de tilápia fugido de um prepador

TIPOS DE VARIÁVEIS
Cada uma das características de interesse observadas ou medidas durante o estudo é denominada
de variável. As variáveis que assumem valores numéricos são denominadas quantitativas, enquanto
que as não numéricas, qualitativas.

Variável Qualitativa: quando seus valores são expressos pôr atributos ou qualidade.

Exemplos:
. População: Estudantes universitários da Província de Nampula.
Variáveis: sexo, profissão, escolaridade, religião, meio onde vivem (rural, urbano).

. População: População dos bairros periféricos do município do Maputo


Variáveis: tipo de casa, existência de água canalizada (sim, não), bairro de origem.

Variáveis qualitativas que não são ordenáveis recebem o nome de nominais.


Exemplo: religião, sexo, raça, cor.

Variáveis qualitativas que são ordenáveis recebem o nome de ordinais.


Exemplo: nível de instrução, classe social.

Variável Quantitativa: quando seus valores são expressos pôr números. Esses números podem ser
obtidos pôr um processo de contagem ou medição.

Exemplos:
População: Todos os pacientes do Hospital Central de Maputo

Professor: Lidaia & Nhongo 9


Variáveis: número de filhos tidos, extensão da área plantada, altura, idade.

População: População dos bairros periféricos do município do Maputo


Variáveis: número de quartos, área da casa em m2, número de moradores da casa.

A VARIÁVEL QUANTITATIVA DIVIDI-SE EM:

1. Variável Discreta: são aquelas que podem assumir apenas valores inteiros em pontos da recta
real. É possível enumerar todos os possíveis valores da variável.

Exemplos:
População: Universitários da Cidade de Maputo
Variáveis: número de filhos, número de quartos da casa, número de moradores, número de irmãos.

2. Variável Contínua: são aquelas que podem assumir qualquer valor num certo intervalo
(contínuo) da recta real. Não é possível enumerar todos os possíveis valores. Essa variáveis,
geralmente, provém de medições.

Exemplos:
População: Todos os agricultores da Província de Manica.
Variáveis: idade, renda familiar; extensão da área plantada (em m2 ) , peso e altura das crianças
agricultoras.

CENSO
É o exame completo de toda população. Quanto maior a amostra mais precisas e confiáveis deverão
ser as induções feitas sobre a população. Logo, os resultados mais perfeitos são obtidos pelo Censo.
Na prática, esta conclusão muitas vezes não acontece, pois, o emprego de amostras, com certo rigor
técnico, pode levar a resultados mais confiáveis ou até mesmo melhores do que os que seriam
obtidos através de um Censo.

As razões de se recorrer a amostras são: menor custo e tempo para colectar dados e melhor
investigação dos elementos observados.

PARÂMETRO: valor (usualmente desconhecido) que caracteriza uma população (por exemplo, a
média populacional “μ” e o desvio-padrão populacional “σ”).

AMOSTRAGEM
É a colecta das informações de parte da população, chamada amostra (representada por pela letra
“n”), mediante métodos adequados de selecção destas unidades.

A estatística indutiva busca tira conclusões sobre a população baseado em resultados retirados das
amostras. Porém o processo não é tão simples, porque precisamos garantir que a amostras sejam
representativas da população, ou seja, a amostra deve ter as mesmas características básicas da
população em relação à variável em estudo.

Estatística Geral 2018 – Texto de Apoio 10


Existem basicamente dois tipos de amostragem, a probabilística e a não-probabilística. A
amostragem probabilística é aquela em que todos os elementos da amostra tem probabilidade
conhecida, e diferente de zero, de pertencer à amostra. Caso contrário, a amostragem será não-
probabilística.

Exemplificando, a amostragem probabilística mais simples é justamente denominada amostragem


casual simples, e é equivalente a um sorteio lotérico, em que todos os elementos têm igual
probabilidade de pertencer à amostra.

Numeramos a população de 1 a n e sorteamos por meio de qualquer dispositivo k números.


Podemos numerar alunos de 1 a 40 e colocar os números dentro de uma caixa e retirar um a um, 10
números. A amostra aleatória simples terá, neste caso, 25% da população.
Se o número de elementos da mostra for muito grande, o sorteio pode ser inviável. Neste caso
podemos utilizar uma tabela de números aleatórios para realizar a amostragem. Procure uma tabela
de números aleatórios. Se tiver acesso à planilhas Excel, pode gerar as tabelas de números
aleatórios.

Um outro tipo de amostragem probabilística é a amostragem sistemática, em que os elementos da


população já se acham ordenados e a retirada de elementos para composição da amostra é feita
periodicamente. Em uma linha de produção, se retirarmos um item a cada 10 produzidos para
controle de qualidade, estaremos utilizando a abordagem sistemática.

Poderíamos utilizar o mesmo método para retirar uma amostra de uma população de determinada
rua. Se a rua contêm 500 prédios, e queremos que a amostra contenha 10% da população (50
prédios), podemos escolher aleatoriamente o 1º prédio e ir “pulando” de 10 em 10 prédios até chegar
ao 50º elemento.

Se por acaso nossa população contiver subpopulações ou estratos, é importante utilizar uma
amostragem estratificada, em que os elementos da amostra são proporcionais aos elementos dos
estratos da população. Um bom exemplo é uma turma com 60 alunos, contendo 40 meninos e 20
meninas. Temos uma proporção 2:1. É importante que a amostra contenha esta mesma proporção.
Assim, se tivermos uma amostra com 15 elementos, 10 deverão ser meninos e 5 meninas. Mantendo
a proporção 2:1.

Amostras nãoprobabilísticas são também empregadas em trabalhos de estatística por simplicidade ou


inviabilidade de fazermos amostras probabilísticas. Os casos mais importantes são:

a) A inacessibilidade de toda a população (e neste caso seremos forçados a colher a amostra


somente na parte da população que está acessível);
b) Amostragem a esmo, em que o selecionador procura ser aleatório na amostragem, mas não
utiliza nenhum método confiável de sorteio;
c) Amostragens intencionais, em que o amostrador delibaradamente escolhe alguns elementos
para pertencer à amostra, julgandoos representativos;
d) Amostragens por voluntários, no caso de por exemplo aplicações experimentais de novos
medicamentos.

Professor: Lidaia & Nhongo 11


DESCRIÇÃO DOS DADOS
É importante conhecer e saber construir os principais tipos de tabelas, gráficos e medidas resumo
para realizar uma boa análise descritiva dos dados. Vamos tentar entender como os dados se
distribuem, onde estão centrados, quais observações são mais freqüentes, como é a variabilidade
etc., tendo em vista responder às principais questões do estudo. Cada ferramenta fornece um tipo de
informação e o seu uso depende, em geral, do tipo de variável que está sendo investigada.

variável qualitativa* variável quantitativa


tabela de freqüências tabela de freqüências
gráfico de barras gráfico de barras
diagrama circular diagrama circular
medidas de posição: mediana, moda histograma
gráfico de linha ou seqüência
polígono de freqüências
boxplot
medidas de posição: separatrizes, média, mediana, moda
medidas de dispersão: variância, desvio-padrão,
amplitude, coeficiente de variação

APRESENTAÇÃO TABULAR
É uma apresentação numérica dos dados. Consiste em dispor os dados em linhas e colunas
distribuídos de modo ordenado. As tabelas têm a vantagem de conseguir expor, sistematicamente em
um só local, os resultados sobre determinado assunto, de modo a se obter um visão global mais
rápida daquilo que se pretende analisar. Grosso modo, utilizaremos as duas abordagens sugeridas no
quadro:

SÉRIE ESTATÍSTICA
Um dos objectivos da Estatística é sintetizar os valores que uma ou mais variáveis podem assumir,
para que se tenha uma visão global dessa ou dessas variáveis. Isto é possível apresentando esses
valores em tabelas e gráficos, que irão fornecer rápidas e seguras informações a respeito das
variáveis em estudo, permitindo determinações mais coerentes.

TABELA é um quadro que resume um conjunto de observações.


Tabela 1
Pacientes atendidos num certo Hospital entre 1978-1983
Anos Pacientes
1978 2535
1979 2666
1980 2122
1981 3760
1982 2007
1983 2500

Denomina-se SÉRIE ESTATÍSTICA toda tabela que apresenta a distribuição de um conjunto de


dados estatísticos em função da ÉPOCA, do LOCAL, ou da ESPÉCIE (fenómeno).

Estatística Geral 2018 – Texto de Apoio 12


Numa série estatística observa-se a existência de três elementos ou factores: o TEMPO, o ESPAÇO
e a ESPÉCIE.

Conforme varie um desses elementos, a série estatística classifica-se em TEMPORAL,


GEOGRÁFICA e ESPECÍFICA.

SÉRIE TEMPORAL, HISTÓRICA OU CRONOLÓGICA


É a série cujos dados estão em correspondência com o tempo, ou seja, variam com o tempo.
Tabela 2
Produção moçambicana de Tilapias
1988-1993
Quantidade
Anos
(1000 ton.)
1988 2345
1989 2451
1990 2501
1991 2204
1992 2306
1993 2560
Fonte: Fictícia

. Elemento variável: tempo (factor cronológico)


. Elemento fixo: local (factor geográfico) e o fenómeno (espécie)

SÉRIE GEOGRÁFICA, TERRITORIAL OU DE LOCALIDADE


É a série cujos dados estão em correspondência com a região geográfica, ou seja, o elemento
variável é o factor geográfico (a região).
Tabela 3
Produção moçambina de Tilapias, por Unidade da província - 1994
Quantidade
Províncias
(1000 ton.)
Gaza 306
Maputo 451
Nampula 550
Sofala 420
Tete 670
Zambézia 560
Fonte: Fictícia
. Elemento variável: localidade (factor geográfico)
. Elemento fixo: tempo e o fenómeno

Professor: Lidaia & Nhongo 13


SÉRIE ESPECÍFICA OU CATEGÓRICA
É a série cujos dados estão em correspondência com a espécie, ou seja, variam com o fenómeno.
Tabela 4
Rebanhos moçambicanos
Quantidade
Espécie
(1000 cabeças)
Bovinos 140 000
Suínos 1 181
Caprino 5 491
Coelhos 11 200
Fonte: Fictícia
. Elemento variável: fenómeno (espécie)
. Elemento fixo: local e o tempo

SÉRIES MISTAS
As combinações entre as séries anteriores constituem novas séries que são denominadas séries
compostas ou mistas e são apresentadas em tabelas de dupla entrada.
Tabela 5
Exportação Moçambina de alguns produtos agrícolas - 1990 - 1992
Quantidade
Produto
(1000 ton.)
1990 1991 1992
Feijão 5600 6200 7300
Arroz 8600 9600 10210
Soja 4000 5000 6000
Fonte: Ministério XYZ
Nota: Produtos mais exportados no período.

Este exemplo se constitui numa Série Temporal-Específica


. Elemento variável: tempo e a espécie
. Elemento fixo: local
Obs.: uma tabela nem sempre representa uma série estatística, pode ser um aglomerado de
informações úteis sobre certo assunto.

SÉRIE HOMÓGRADA
A Série homógrada é aquela em que a variável descrita apresenta variação discreta ou descontínua.
São séries homógradas a série temporal, a geográfica e a específica.
Tabela 6
Situação dos espectáculos cinematográficos no Brasil - 1967
Especificação Quantidade
Número de cinemas 2.488
Lotação dos cinemas 1.722.348
Sessões pôr dia 3.933
Filme de longa metragem 131.330.488
Meia entrada 89.581.234
Fonte: Anuário Estatístico XYTK

Estatística Geral 2018 – Texto de Apoio 14


SÉRIE HETERÓGRADA
A série heterógrada é aquela na qual o fenómeno ou facto apresenta graduações ou subdivisões.
Embora fixo, o fenómeno varia em intensidade. A distribuição de frequências ou seriação é uma série
heterógrada

DISTRIBUIÇÃO DE FREQUÊNCIAS
INTRODUÇÃO
As tabelas estatísticas, geralmente, condensam informações de fenómenos que necessitam da
colecta de grande quantidade de dados numéricos. No caso das distribuições de frequências que é
um tipo de série estatística, os dados referentes ao fenómeno objecto de estudo se repetem na
maioria das vezes sugerindo a apresentação em tabela onde apareçam valores distinto um dos
outros.

DISTRIBUIÇÃO DE FREQUÊNCIA PARA DADOS AGRUPADOS


É a série estatística que condensa um conjunto de dados conforme as frequências ou repetições de
seus valores. Os dados encontram-se dispostos em classes ou categorias junto com as frequências
correspondentes. Os elementos época, local e fenómeno são fixos. O fenómeno apresenta-se através
de gradações, ou seja, os dados estão agrupados de acordo com a intensidade ou variação
quantitativa gradual do fenómeno.

REPRESENTAÇÃO DOS DADOS (AMOSTRAIS OU POPULACIONAIS)

a. Dados brutos: são aqueles que não foram numericamente organizados, ou seja, estão na forma
com que foram colectados.

Tabela 7 - Número de filhos de um grupo de 50 casais


2 3 0 2 1 1 1 3 2 5
6 1 1 4 0 1 5 6 0 2
1 4 1 3 1 7 6 2 0 1
3 1 3 5 7 1 3 1 1 0
3 0 4 1 2 2 1 2 3 2

b. Rol: é a organização dos dados brutos em ordem de grandeza crescente ou decrescente.

Tabela 8 - Número de filhos de um grupo de 50 casais


0 0 0 0 0 0 1 1 1 1
1 1 1 1 1 1 1 1 1 1
1 1 2 2 2 2 2 2 2 2
2 3 3 3 3 3 3 3 3 4
4 4 5 5 5 6 6 6 7 7

c. Distribuição de frequências: é a disposição dos valores com as respectivas frequências. O


número de observações ou repetições de um valor ou de uma modalidade, em um levantamento
qualquer, é chamado frequência desse valor ou dessa modalidade. Uma tabela de frequências é uma
tabela onde se procura fazer corresponder os valores observados da variável em estudo e as
respectivas frequências.

Professor: Lidaia & Nhongo 15


c.2. Distribuição de frequências para variável contínua
Os dados da variável são agrupados em classe (grupo de valores).

1. Dados brutos
Tabela 9 – Percentagem de doentes curados durante o I Semestre - 1970
8 24 46 13 38 54 44 20 17 14
18 15 30 24 20 8 24 18 9 10
38 79 15 62 23 13 62 18 8 22
11 17 9 35 23 22 37 36 8 13
10 6 92 16 15 23 37 36 8 13
44 17 9 30 26 18 37 43 14 9
28 41 42 35 35 42 71 50 52 17
19 7 28 23 29 29 58 77 72 34
12 40 25 7 32 34 22 7 44 15
9 16 31 30

2. Rol

Tabela 10 - Rol de percentagem de doentes curados durante o I Semestre - 1970.


6 7 7 7 8 8 8 8 8 9
9 9 9 9 10 10 11 12 13 13
13 13 14 14 15 15 15 15 16 16
17 17 17 17 18 18 18 18 19 20
20 22 22 22 23 23 23 23 24 24
24 25 26 28 28 29 29 30 30 30
31 32 34 34 35 35 35 36 36 37
37 37 38 38 40 41 42 42 43 44
44 44 46 50 52 54 58 62 62 71
72 77 79 92

3. Distribuição de frequências para dados agrupados em classes

Tabela 11 – Percentagem de doentes curados durante o I Semestre - 1970.


Número de
Taxas (em %) Centros de Saúde
(fi)
6 --- 16 28
16 --- 26 24
26 --- 36 15
36 --- 46 15
46 --- 56 4
56 --- 66 3
66 --- 76 2
76 --- 86 2
86 --- 96 1
Total () 94

Estatística Geral 2018 – Texto de Apoio 16


ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA
a. Amplitude total (λ): é a diferença entre o maior e o menor valor observado.
No exemplo, tabela 17 - λ = 92 - 6 = 86

b. Frequência simples absoluta (fi ): é o número de vezes que o elemento aparece na amostra, ou
o número de elementos pertencentes a uma classe ( grupo de valores).
Ex.: f 13 = 4 , f 1ª classe = 28

Tabela 12
Número de
Taxas (em %) Centros de Saúde
(fi)
6 --- 16 28
16 --- 26 24
26 --- 36 15
36 --- 46 15
46 --- 56 4
56 --- 66 3
66 --- 76 2
76 --- 86 2
86 --- 96 1
Total () 94

c. Classe: é cada um dos grupos de valores do conjunto de valores observados, ou seja, são os
intervalos de variação da variável.
Identifica-se uma classe pêlos seus extremos ou pela ordem em que se encontra na
tabela.
6 --- 16 (1ª classe); 86 --- 96 (9ª classe)

DETERMINAÇÃO DO NÚMERO DE CLASSES (K)


É importante que a distribuição conte com um número adequado de classes. Se o número de classes
for excessivamente pequeno acarretará perda de detalhe e pouca informação se poderá extrair da
tabela. Pôr outro lado, se forem utilizadas um número excessivo de classes, haverá alguma classe
com frequência nula ou muito pequena, não atingindo o objectivo de classificação que é tornar o
conjunto de dados supervisionáveis.
Não há uma fórmula exacta para determinar o número de classes. Três soluções são apresentadas
abaixo:

Fórmula de Sturges: K  1 + 3,3 . log n


No Exemplo: n = 94, log 94 = 1,97313  K  1 + 3,3 . log 94  K  1 + 3,3 . 1,97313
 K  7,51  K  8

A fórmula de Sturges revela um inconveniente: propõem um número demasiado de classes para um


número pequeno de observações e relativamente poucas classes, quando o total de observações for
muito grande.

d. Intervalo de classe ou amplitude do intervalo de classe ( h ): é o comprimento da classe.


h  λ
K
Obs.: convém arredondar o número correspondente à amplitude do intervalo de classe para facilitar
os cálculos (arredondamento arbitrário).
Obs. 2: Intervalo de classe: h = Li - li

Professor: Lidaia & Nhongo 17


e. Limites de classes (limite inferior e limite superior): são os valores extremos de cada classe.
Seja a classe 6  16 - limite inferior ( li ) = 6 e limite superior ( Li) = 16.
Os valores 6 e 96, que representam, respectivamente, o limite inferior da 1ª e o superior da última
classe, são denominados também limite inferior e limite superior da distribuição de frequência.

Ponto médio das classes ( xi ): é o valor representativo da classe para efeito de cálculo de certas
medidas. Para qualquer representação tabular, basta acrescentar ao seu limite inferior a metade da
amplitude do intervalo de classe.
x i = h/2 + li
Exemplo: 6  16, h = 10  h/2 = 10/2 = 5  x i = 5 + 6 = 11
Quando o limite superior de uma classe for igual ao inferior da seguinte, o intervalo de classe poderá
ser calculado através da média aritmética dos limites do intervalo.
Exemplo: 6  16 : x i = 6 + 16 = 11
2
Para obter os pontos médios das classes seguintes, basta acrescentar ao ponto médio da classe
precedente a amplitude do intervalo de classe (se for constante).

Tabela 13
Xi (Ponto Médio)
Número de
Taxas (em %)
Centros de Saúde ( f i )
6 --- 16 28 11
16 --- 26 24 21
26 --- 36 15 31
36 --- 46 15 41
46 --- 56 4 51
56 --- 66 3 61
66 --- 76 2 71
76 --- 86 2 81
86 --- 96 1 91
Total () 94

TIPOS DE FREQUÊNCIAS
a. Frequência simples absoluta ( fi ): é o número de repetições de um valor individual ou de uma
classe de valores da variável.
k

f
i 1
i n
b. Frequência simples relativa ( fri): representa a proporção de observações de um valor individual
ou de uma classe em relação ao número total de observações. Para calcular a frequência relativa
basta dividir a frequência absoluta da classe ou do valor individual pelo número total de observações.
É um valor importante para comparações.

Estatística Geral 2018 – Texto de Apoio 18


Tabela 14
Taxas (em %) Número de fri (%)
Centros de Saúde ( f i ) fi
6 --- 16
16 --- 26
28
24
29,79
25,53
fri 
26 --- 36 15 15,96 n
36 --- 46 15 15,96
46 --- 56 4 4,26 k

 fr  1
56 --- 66 3 3,19
66 --- 76 2 2,13 i
76 --- 86 2 2,13
i 1
86 --- 96 1 1,06
Total () 94 100,01

DISTRIBUIÇÕES CUMULATIVAS

Frequência absoluta acumulada “abaixo de” ( Fi )

A frequência absoluta acumulada “abaixo de” uma classe ou de um valor individual é a soma das
frequências simples absoluta da classe ou de um valor com as frequências simples absoluta das
classes ou dos valores anteriores. A expressão “abaixo de” refere-se ao facto de que as frequências a
serem acumuladas corresponde aos valores menores ou anteriores ao valor ou à classe cuja
frequência acumulada se quer obter, incluindo no cálculo a frequência do valor ou da classe. Quando
se quer saber quantas observações existem até uma determinada classe ou valor individual, recorre-
se à frequência acumulada “abaixo”.

Tabela 15
Taxas (em %) Número de j
Fj   fi
Fi
Centros de Saúde ( fi )
6 --- 16 28 28
i 1
16 --- 26 24 52
26 --- 36
36 --- 46
15
15
67
82
F1  f1
46 --- 56 4 86
56 --- 66
66 --- 76
3
2
89
91 Fk  n
76 --- 86 2 93
86 --- 96 1 94
Total () 94

Frequência relativa acumulada “abaixo de” ( Fri )


A frequência relativa acumulada da classe ou do valor individual i é igual a soma da frequência
simples relativa da classe ou do valor individual com as frequências simples relativas das classes ou
dos valores anteriores. As frequências relativas acumuladas podem ser obtidas de duas formas:
1. Acumulando as frequências simples relativas de acordo com a definição de frequências
acumuladas.
2. Calculando as frequências relativas directamente a partir das frequências absolutas de acordo com
a definição de frequências relativas:

Professor: Lidaia & Nhongo 19


Tabela 16
Taxas (em %)
fri (%) Fri (%)

Fr1  fr1
6 --- 16 29,79 29,79 j
16 --- 26 25,53 55,32 Fr j   fri
26 --- 36 15,96 71,28 i 1
36 --- 46 15,96 87,24
Fi
Frk  1 Fri 
46 --- 56 4,26 91,50
56 --- 66 3,19 94,69
66 --- 76 2,13 96,82 n
76 --- 86 2,13 98,95
86 --- 96 1,06 100,01
Total () 100,01

Frequência Acumulada “Acima de”


Frequência absoluta acumulada “acima de” ( F’i )
A frequência absoluta acumulada “acima de” uma classe ou de um valor individual representa o
número de observações existentes além do valor ou da classe, incluindo no cálculo as observações
correspondentes a esse valor ou a essa classe. Para obter a frequência absoluta acumulada “acima
de”, soma-se à frequência simples absoluta da classe ou do valor individual as frequências simples
absolutas das classes ou dos valores individuais posteriores.

Tabela 17 k
Taxas (em %) Número de
Centros de Saúde ( f i )
F’i F j   f i
6 --- 16 28 94 i j
16 --- 26
26 --- 36
24
15
66
42
F1  n
36 --- 46 15 27

Fk  f k
46 --- 56 4 12
56 --- 66 3 8
66 --- 76 2 5
76 --- 86 2 3
86 --- 96 1 1
Total () 94

Frequência relativa acumulada “acima de” ( F’ri )


A frequência relativa acumulada “acima de” uma classe ou do valor individual j é igual à soma da
frequência simples relativa da classe ou do valor individual com as frequências simples relativas das
classes ou dos valores posteriores. Pode-se obter as frequências relativas acumuladas “acima de” a
partir da:
1. definição de frequências acumuladas;
2. definição de frequências relativas.

Estatística Geral 2018 – Texto de Apoio 20


Tabela 18
Taxas (em %) F’ri (%) k
F rj   fri
fri (%)
6 --- 16 29,79 100,01 i j
16 --- 26 25,53 70,22
26 --- 36
36 --- 46
15,96
15,96
44,69
28,73
F r1  1
46 --- 56 4,26 12,77
56 --- 66
66 --- 76
3,19
2,13
8,51
5,32 F rk  frk
Fi
76 --- 86 2,13 3,19

F ri 
86 --- 96 1,06 1,06
Total () 100,01
n
Relação entre as frequências cumulativas

Fi  Fi1  n

Fri  F ri1  1

APRESENTAÇÃO GRÁFICA
Constitui uma apresentação geométrica dos dados. Permite ao analista obter uma visão tão rápida,
fácil e clara do fenómeno e sua variação.

REPRESENTAÇÃO GRÁFICA
A Estatística Descritiva pode descrever os dados através de gráficos.
A apresentação gráfica é um complemento importante da apresentação tabular. A vantagem de um
gráfico sobre a tabela está em possibilitar uma rápida impressão visual da distribuição dos valores ou
das frequências observadas. Os gráficos propiciam uma ideia inicial mais satisfatória da concentração
e dispersão dos valores, uma vez que através deles os dados estatísticos se apresentam em termos
de grandezas visualmente interpretáveis.

REQUISITOS FUNDAMENTAIS EM UM GRÁFICO:


a. Simplicidade: possibilitar a análise rápida do fenómeno observado. Deve conter apenas o
essencial.
b. Clareza: possibilitar a leitura e interpretações correcta dos valores do fenómeno.
c. Veracidade: deve expressar a verdade sobre o fenómeno observado.

TIPOS DE GRÁFICOS QUANTO A FORMA:


a. Diagramas: gráficos geométricos dispostos em duas dimensões. São mais usados na
representação de séries estatísticas.

Professor: Lidaia & Nhongo 21


b. Cartogramas: é a representação sobre uma carta geográfica, sendo muito usado na Geografia,
História e Demografia.
c. Estereogramas: representam volumes e são apresentados em três dimensões.
d. Pictogramas: a representação gráfica consta de figuras representativas do fenómeno. Desperta
logo a atenção do público.

CLASSIFICAÇÃO DOS GRÁFICOS QUANTO AO OBJECTIVO


1. Gráficos de informação
O objectivo é proporcionar uma visualização rápida e clara da intensidade das categorias ou dos
valores relativos ao fenómeno. São gráficos tipicamente expositivos, devendo ser o mais completo
possível, dispensando comentários explicativos.

2. Gráficos de análise
Estes gráficos fornecem informações importantes na fase de análise dos dados, sendo também
informativos.
Os gráficos de análise, geralmente, vêm acompanhados de uma tabela e um texto onde se destaca
os pontos principais revelados pelo gráfico ou pela tabela.

PRINCIPAIS TIPOS DE GRÁFICOS

GRÁFICOS EM CURVAS OU EM LINHAS


São usados para representar séries temporais, principalmente quando a série cobrir um grande
número de períodos de tempo.
Considere a tabela seguinte

Tabela 19 - Parturientes atendidas numa maternidade de um Hospital Rural nos anos 1984-1994
Anos Parturientes
1984 816
1985 904
1986 1.203
1987 1.147
1988 1.239
1989 1.565
1990 1.620
1991 1.833
1992 1.910
1993 1.890
1994 1.903

Estatística Geral 2018 – Texto de Apoio 22


Gráfico 1 - Parturientes atendidas numa maternidade de um Hospital Rural nos anos 1984-1994
Patruentes atendidas no Hospital Rural nos anos - 1984-1994
(Patruentes)
2500

2000

1500

1000

500

0
84 85 86 87 88 89 90 91 92 93 94

GRÁFICOS DE BARRAS
É a representação de uma série estatística através de rectângulos, dispostos em colunas.
Este tipo de gráfico representa praticamente qualquer série estatística.

As regras para a construção são as mesmas do gráfico em curvas. As bases das colunas são
iguais e as alturas são proporcionais aos respectivos dados.

Exemplo:
Tabela 20 - Crianças atendidas na pediatria do Hospital Municipal ABC- 1991-1995
Anos Numero de crianças
1991 117.579
1992 148.550
1993 175.384
1994 220.272
1995 265.626

Para cada ano é construído uma coluna, variando a altura (proporcional a cada quantidade). As
colunas são separadas uma das outras.
Observação: O espaço entre as colunas pode variar de 1/3 a 2/3 do tamanho da base da coluna.

Gráfico 2 - Crianças atendidas na pediatria do Hospital Municipal ABC- 1991-1995

300000

250000

200000

150000

100000

50000

0
1991 1992 1993 1994 1995

Professor: Lidaia & Nhongo 23


GRÁFICO DE BARRAS MÚLTIPLAS (ADJACENTES)
É um tipo de gráfico útil para estabelecer comparações entre as grandezas de cada categoria dos
fenómenos estudados.

A modalidade de apresentação das colunas é chamado de Gráfico de Colunas Remontadas. Ele


proporciona economia de espaços sendo mais indicado quando a série apresenta um número
significativo de categorias.
Exemplo:
Tabela 21 - Entrada de migrantes em três Províncias de certo País - 1992-1994
Número de migrantes
Anos Estados
Total
Província 1 Província 2 Província 3
1992 4.526 2.291 1.626 609
1993 4.633 2.456 1.585 592
1994 4.450 2.353 1.389 708

Gráfico 3 - Entrada de migrantes em três Províncias de certo País - 1992-1994


Gráfico 4.6. Entrada de migrantes em três Províncias de Certo País
1992-1994.
3000
2500
2000
1500
1000
500
Quantidade

0
1992 1993 1994

GRÁFICO EM SECTORES
É a representação gráfica de uma série estatística em um círculo de raio qualquer, pôr meio de
sectores com ângulos centrais proporcionais às ocorrências. É utilizado quando se pretende
comparar cada valor da série com o total. O total da série corresponde a 360 (total de graus de um
arco de circunferência). O gráfico em sectores representam valores absolutos ou porcentagens
complementares.
As séries geográficas, específicas e as categorias em nível nominal são mais representadas em
gráficos de sectores, desde que não apresentem muitas parcelas (no máximo sete).
Cada parcela componente do total será expressa em graus, calculada através de uma regra de três:
Total - 360
Parte - x

f
si  n
i
 360º ou s  360º f r
i
i

Estatística Geral 2018 – Texto de Apoio 24


Exemplo:
Tabela 22 - Produção Agrícola da Província A - 1995
Produtos Quantidade (t) fri(%)
Chá 400.000
Açúcar 200.000
Milho 100.000
Feijão 20.000
Total 720.000

f 400000 f 200000
s
1
n
1
 360º 
720000
 360º  200º s 2

n
2
 360º 
720000
 360º  100º

f 100000 f 20000
s3  n
3
 360º 
720000
 360º  50º s4  n
4
 360º 
720000
 360º  10º

Gráfico 4 - Produção Agrícola da Província A - 1995


Gráfico 4.8. Produção Agrícola da Província A - 1995.
Feijão
Milho
3%
14%

Chá
Açucar 55%
28%

Outras maneiras de representar graficamente

Gráfico 5 - Produção Agrícola da Província A - 1995


Gráfico 4.9. Produção Agrícola da Província A - 1995.

450.000
400.000
350.000
300.000
250.000
200.000
150.000
100.000
50.000
0
Chá Açucar Milho Feijão
Quantidade (t)

HISTOGRAMA E POLÍGONO DE FREQUÊNCIAS


HISTOGRAMA

Professor: Lidaia & Nhongo 25


São gráficos de superfícies utilizados para representar distribuições de frequências com dados
agrupados em classes.

O histograma é composto por rectângulos (denominados células), cada um deles representando um


conjunto de valores próximos (as classes).

A largura da base de cada célula deve ser proporcional à amplitude do intervalo da classe que ela
representa e a área de cada célula deve ser proporcional à frequência da mesma classe.

Se todas as classes tiverem igual amplitude, então as alturas dos rectângulos serão proporcionais às
frequências das classes que eles representam.

Considere o histograma obtido a partir da


Tabela 23
Taxas (em %) Número de
fri (%)
Centros de Saúde ( f i )
6 --- 16 28 29,79
16 --- 26 24 25,53
26 --- 36 15 15,96
36 --- 46 15 15,96
46 --- 56 4 4,26
56 --- 66 3 3,19
66 --- 76 2 2,13
76 --- 86 2 2,13
86 --- 96 1 1,06
Total () 94 100,01

Gráfico 7

Estatística Geral 2018 – Texto de Apoio 26


POLÍGONO DE FREQUÊNCIAS
é um gráfico em linha, sendo as frequências marcadas sobre perpendiculares ao eixo
horizontal, levantadas pelos pontos médios dos intervalos de classe. Para realmente
obtermos um polígono (linha fechada), devemos completar a figura, ligando os extremos da
linha obtida aos pontos médios da classe anterior à primeira e da posterior à última, da
distribuição.

Gráfico 8

.Polígono de frequência acumulada (Ogiva Crescente): é traçado marcando-se as


frequências acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos
correspondentes aos limites superiores dos intervalos de classe.

Professor: Lidaia & Nhongo 27


Gráfico 9

.Polígono de frequência acumulada (Ogiva Decrescente): é traçado marcando-se as


frequências acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos
correspondentes aos limites inferiores dos intervalos de classe.

Gráfico 10.

Estatística Geral 2018 – Texto de Apoio 28


A CURVA DE FREQUÊNCIA ( Curva polida):
Enquanto o polígono de frequência nos dá a imagem real do fenómeno estudado, a curva de
frequência nos dá a imagem tendencial. O polimento (geometricamente, corresponde à
eliminação dos vértices da linha poligonal) de um polígono de frequência nos mostra o que
seria tal polígono com um número maior de dados em amostras mais amplas.
Consegue-se isso com o emprego de uma fórmula bastante simples:
f  2  f i  f i 1
f ci  i 1
4

Tabela 11

Taxas (em %) fi fCi

6 --- 16 28 20
16 --- 26 24 22,75
26 --- 36 15 17,25
36 --- 46 15 12,25
46 --- 56 4 6,5
56 --- 66 3 3
66 --- 76 2 2,25
76 --- 86 2 1,75
86 --- 96 1 1
Total () 94

Gráfico 9

Professor: Lidaia & Nhongo 29


RAMO-E-FOLHAS

O diagrama Ramo-e-Folhas, criado por John Tukey, é um procedimento utilizado


paraarmazenar os dados sem perda de informação. É utilizado para se ter uma idéia visual
dadistribuição dos dados. Cada valor observado, xi, da variável X, deve consistir de no
mínimo doisdígitos e a variável pode ser tanto quantitativa discreta como contínua.

Para construí-lo, divide-se cada número em duas partes. A primeira é denominada ramo e
asegunda, folhas. O ramo consistirá de um ou mais dígitos iniciais se o valor da variável for
umnúmero inteiro e do número inteiro, se o valor da variável for um número com decimais.
Nas folhas, colocam-se os dígitos restantes se o valor observado for número inteiro, ou os
decimais, casocontrário.

Fonte: Idade dos alunos da disciplina Inferência Estatística

Estatística Geral 2018 – Texto de Apoio 30


MEDIDAS ESTATÍSTICAS
O conhecimento de uma população ou de uma amostra é, por extensão, o conhecimento dos
parâmetros, ou medidas estatísticas, associados a essa população ou amostra. Assim, a
representação, ou caracterização, de uma série de dados quantitativos através de uns poucos
parâmetros permite um conhecimento razoável desses dados. Geralmente são utilizados três tipos de
medidas estatísticas:
medidas de posição;
medidas de variação;
medidas de forma

Há que se fazer uma distinção entre a notação utilizada para as medidas estatísticas relativas a uma
população e uma amostra. Por convenção, parâmetros populacionais são representados por letras
gregas enquanto os parâmetros estimados de uma amostra são representados por letras latinas.

MEDIDAS DE POSIÇÃO
São as estatísticas que representam uma série de dados orientando-nos quanto à posição da
distribuição em relação ao eixo horizontal do gráfico da curva de frequência.

Estas medidas dividem-se em: Separatrizes e Promédias

As separatrizes englobam a mediana, os quartis , os decis e os percentis.

As medidas de posições mais importantes são as medidas de tendência central ou


promédias.
As medidas de tendência central mais utilizadas são: média aritmética, moda e mediana.
Outros promédios menos usados são as médias: geométrica, harmónica, quadrática, cúbica
e biquadrática.

SEPARATRIZES

MEDIANA (ME)
A mediana de um conjunto de valores, dispostos segundo uma ordem ( crescente ou
decrescente), é o valor situado de tal forma no conjunto que o separa em dois subconjuntos
de mesmo número de elementos.

Existem duas fórmulas para o cálculo da mediana, para dados não agrupados em intervalos
de classe e para dados agrupados em intervalos de classe, que são:

Professor: Lidaia & Nhongo 31


Para dados não agrupados em Intervalos de classe:

M e  (1  d )  X I  d  X I 1
Onde:
n 1 n 1
d é a parte decimal da divisão e I é a parte inteira da divisão
2 2
Exemplos:
Determine a mediana dos valores:
1) 5, 2, 6, 13, 9, 15, 10
Rol crescente: 2, 5, 6, 9, 10, 13, 15.
7 1 8
n7  4 I 4 d 0
2 2
M e  (1  0)  X 4  0  X 5  X 4  9

2) 1, 3, 0, 0, 2, 4, 1, 3, 5, 6, 2, 6.
Rol crescente: 0, 0, 1, 1, 2, 2, 3, 3, 4, 5, 6, 6.
12  1 13
n  12   6,5 I  6 d  0,5
2 2
M e  (1  0,5)  X 6  0,5  X 7  0,5  2  0,5  3  2,5

Para dados agrupados em intervalos de classe temos a seguinte fórmula:


n
 Fi 1
M e  li  2  hi
fi
Onde li – é o limite inferior da classe medianal
Fi-1 – é a frequência acumulada “abaixo de” da classe imediatamente inferior à classe
medianal
fi – frequência simples absoluta da classe medianal
hi – amplitude da classe medianal

Estatística Geral 2018 – Texto de Apoio 32


Exemplo:
Determine a mediana
Taxas (em %) Número de
Fi
Centros de Saúde ( f i )
6 --- 16 28 28
16 --- 26 24 52
26 --- 36 15 67
36 --- 46 15 82
46 --- 56 4 86
56 --- 66 3 89
66 --- 76 2 91
76 --- 86 2 93
86 --- 96 1 94
Total () 94

n 94
A mediana encontra-se na segunda classe porque   47 comparando com as
2 2
frequências acumuldas, o elemento 47 encontra-se na segunda classe. Logo a classe
medianal é a segunda, isto é, 16 --- 26
li  l 2  16 n
Fi 1  F1  28  Fi 1
47  28
M e  li  2  hi  16   10  23,92
f i  f 2  24 fi 24
hi  h2  10

Emprego da Mediana
 Quando desejamos obter o ponto que divide a distribuição em duas partes iguais.
 Quando há valores extremos que afectam de maneira acentuada a média aritmética.
 Quando a variável em estudo é salário.

QUARTIS
Denominamos quartis os valores de uma série que a dividem em quatro partes iguais.
Precisamos portanto de 3 quartis (Q1, Q2 e Q3) para dividir a série em quatro partes iguais.

Existem duas fórmulas para o cálculo da mediana, para dados não agrupados em intervalos
de classe e para dados agrupados em intervalos de classe, que são:

Quartis em dados não agrupados em intervalos de classe

Qk  (1  d )  X I  d  X I 1 ; K  1,3
Onde:
K  n  1 K  n  1
d é a parte decimal da divisão e I é a parte inteira da divisão
4 4

Professor: Lidaia & Nhongo 33


Exemplo:
Calcule os quartis das séries: { 5, 2, 6, 9, 10, 13, 15 }, { 1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13 }
Para a série: { 5, 2, 6, 9, 10, 13, 15 }
Rol crescente: 2, 5, 6, 9, 10, 13, 15 n=7
1  7  1 8
k 1  2 I 2 d 0
4 4
Q1  1  0  X 2  0  X 3  X 2  5

2  7  1 16
k2  4 I 4 d 0
4 4
Q2  1  0  X 4  0  X 5  X 4  9

3  7  1 24
k 3  6 I 6 d 0
4 4
Q3  1  0  X 6  0  X 7  X 6  13

Para a série: { 1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13 } n=12


Rol: Os dados já estão em rol crescente.
1  12  1 13
k 1   3,25 I  3 d  0,25
4 4
Q1  1  0,25  X 3  0,25  X 4  0,75  X 3  0,25  X 4
Q1  0,75  2  0,25  3  2,25

2  12  1 26
k2   6,5 I  6 d  0,5
4 4
Q2  1  0,5  X 6  0,5  X 7  0,5  X 6  0,5  X 7
Q2  0,5  5  0,5  6  6,5

3  12  1 39
k 3   9,75 I  9 d  0,75
4 4
Q3  1  0,75  X 9  0,75  X 10  0,25  X 9  0,75  X 10
Q3  0,25  9  0,75  9  9

Estatística Geral 2018 – Texto de Apoio 34


Quartis para dados agrupados em intervalos de classe
Para dados agrupados em classes temos a seguinte fórmula:
kn
 Fi 1
Qk  l i  4  hi , onde k  1,3
fi
Onde li – é o limite inferior da classe do quartil k
Fi-1 – é a frequência acumulada “abaixo de” da classe imediatamente inferior à classe
do quartil k
fi – frequência simples absoluta da classe do quartil k
hi – amplitude da classe do quartil k

Exemplo:
Determine os quartis para a tabela abaixo
Taxas (em %) Número de
Fi
Centros de Saúde ( f i )
6 --- 16 28 28
16 --- 26 24 52
26 --- 36 15 67
36 --- 46 15 82
46 --- 56 4 86
56 --- 66 3 89
66 --- 76 2 91
76 --- 86 2 93
86 --- 96 1 94
Total () 94
1  94
 Fi 1
4 23,5  0
Q1  li   hi  6   10  14,39
fi 28

2  94
 Fi 1
4 47  28
Q2  l i   hi  16   10  23,92
fi 24

3  94
 Fi 1
70,5  67
Q3  li  4  hi  36   10  38,33
fi 15

Professor: Lidaia & Nhongo 35


DECIS
Os decis são os valores de uma série que a dividem em dez partes iguais. Indicamos os
decis : D1, D2, ... , D9. Deste modo precisamos de 9 decis para dividirmos uma série em 10
partes iguais.

Existem duas fórmulas para o cálculo da mediana, para dados não agrupados em intervalos
de classe e para dados agrupados em intervalos de classe, que são:

Decis em dados não agrupados em intervalos de classe

Dk  (1  d )  X I  d  X I 1 ; K  1,9
Onde:
K  n  1 K  n  1
d é a parte decimal da divisão 10 e I é a parte inteira da divisão 10

Exemplo
Calcule os decis dos dados seguintes: 0, 1, 1, 2, 4, 0, 1, 1, 3, 4, 0, 1, 2, 3, 5, 0, 1, 2, 3, 5, 0, 1,
2, 3, 5, 0, 1, 2, 3, 6, 1, 1, 2, 3, 6, 1, 1, 2, 3, 6, 1, 1, 2, 3, 6, 1, 1, 2, 3, 7, 1, 1, 2, 4, 7

Role crescente: 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2,
3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 5, 5, 5, 6, 6, 6, 7, 7.

1  50  1 51
k 1   5,1 I  5 d  0,1
10 10
D1  1  0,1  X 5  0,1  X 6  0,9  X 5  0,1  X 6  0,9  0  0,1  0  0

2  50  1 102
k2   10,2 I  10 d  0,2
10 10
D2  1  0,2  X 10  0,2  X 11  0,8  X 10  0,2  X 11  0,8  1  0,2  1  1

3  50  1 153
k 3   15,3 I  15 d  0,3
10 10
D3  1  0,3  X 15  0,3  X 16  0,7  X 15  0,3  X 16  0,7  1  0,3  1  1

4  50  1 204
k4   20,4 I  20 d  0,4
10 10
D4  1  0,4  X 20  0,4  X 21  0,6  X 20  0,4  X 21  0,6  1  0,4  1  1

5  50  1 255
k 5   25,5 I  25 d  0,5
10 10
D5  1  0,5  X 25  0,5  X 26  0,5  X 25  0,5  X 26  0,5  2  0,5  2  2

Estatística Geral 2018 – Texto de Apoio 36


6  50  1 306
k 6   30,6 I  30 d  0,6
10 10
D6  1  0,6  X 30  0,6  X 31  0,4  X 30  0,6  X 31  0,4  2  0,6  2  2

7  50  1 357
k 7   35,7 I  35 d  0,7
10 10
D7  1  0,7   X 35  0,7  X 36  0,3  X 35  0,7  X 36  0,3  3  0,7  3  3

8  50  1 408
k 8   40,8 I  40 d  0,8
10 10
D8  1  0,8  X 40  0,8  X 41  0,2  X 40  0,8  X 41  0,2  4  0,8  4  4

9  50  1 459
k 9   45,9 I  45 d  0,9
10 10
D9  1  0,9  X 45  0,9  X 46  0,1  X 45  0,9  X 46  0,1  5  0,9  6  5,9

De especial interesse é o quinto decil, que divide o conjunto em duas partes iguais. Assim
sendo, o quinto decil é igual ao segundo quartil, que por sua vez é igual à mediana.

Para dados agrupados em intervalos de classe usa-se a fórmula:


kn
 Fi 1
Dk  l i  10  hi K  1,9
fi
Onde li – é o limite inferior da classe do decil k
Fi-1 – é a frequência acumulada “abaixo de” da classe imediatamente inferior à classe
do decil k
fi – frequência simples absoluta da classe do decil k
hi – amplitude da classe do decil k

Exemplo:
Determine os decis
Taxas (em %) Número de
Fi
Centros de Saúde ( fi )
6 --- 16 28 28
16 --- 26 24 52
26 --- 36 15 67
36 --- 46 15 82
46 --- 56 4 86
56 --- 66 3 89
66 --- 76 2 91
76 --- 86 2 93
86 --- 96 1 94
Total () 94

Professor: Lidaia & Nhongo 37


1  94
 Fi 1
10 9,4  0
D1  li   hi  6   10  9,36
fi 28

2  94
 Fi 1
10 18,8  0
D2  l i   hi  6   10  12,71
fi 28

3  94
 Fi 1
10 28,2  28
D3  li   hi  16   10  16,08
fi 24

4  94
 Fi 1
37,6  28
D4  li  10  hi  16   10  20
fi 24

5  94
 Fi 1
47  28
D5  li  10  hi  16   10  23,92
fi 24

6  94
 Fi 1
10 56,4  52
D6  li   hi  26   10  28,93
fi 15

7  94
 Fi 1
10 65,8  52
D7  li   hi  26   10  35,2
fi 15

8  94
 Fi 1
10 75,2  67
D8  li   hi  36   10  41,47
fi 15

9  94
 Fi 1
10 84,6  82
D9  li   hi  46   10  52,5
fi 4

Estatística Geral 2018 – Texto de Apoio 38


PERCENTIL OU CENTIL
Denominamos percentis ou centis como sendo os noventa e nove valores que separam uma
série em 100 partes iguais. Indicamos: P1, P2, ... , P99. É evidente que P50 = Me ; P25 = Q1 e
P75 = Q3.

Percentis em dados não agrupados em intervalos de classe

Pk  (1  d )  X I  d  X I 1 ; K  1,99
Onde:
d K  n  1 I K  n  1
é a parte decimal da divisão e é a parte inteira da divisão
100 100

Exemplo
Calcule os percentis 15, 25, 75 e 90 dos dados seguintes: 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1,
1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 5, 5, 5, 6, 6, 6, 7, 7.

15  50  1 765
k  15   7,65 I  7 d  0,65
100 100
P15  1  0,65  X 7  0,63  X 8  0,35  X 7  0,35  X 8  0,9  1  0,1  1  1

25  50  1 1275
k  25   12,75 I  12 d  0,75
100 100
P25  1  0,75  X 12  0,75  X 13  0,25  X 12  0,75  X 13  0,25  1  0,75  1  1

75  50  1 3825
k  75   38,25 I  38 d  0,25
100 100
P75  1  0,25  X 38  0,25  X 39  0,75  X 38  0,25  X 39  0,75  3  0,25  3  3

90  50  1 4590
k  90   45,9 I  45 d  0,9
100 100
P90  1  0,9  X 45  0,9  X 46  0,1  X 45  0,9  X 46  0,1  5  0,9  6  5,9

Para dados agrupados em classes temos a seguinte fórmula:


kn
 Fi 1
100
Pk  li   hi , onde k  1,99
fi
Onde li – é o limite inferior da classe do percentil k
Fi-1 – é a frequência acumulada “abaixo de” da classe imediatamente inferior à classe
do percentil k
fi – frequência simples absoluta da classe do percentil k
hi – amplitude da classe do percentil k

Professor: Lidaia & Nhongo 39


Exemplo
Determine os Percentis 25, 50 e 75
Taxas (em %) Número de
Fi
Centros de Saúde ( f i )
6 --- 16 28 28
16 --- 26 24 52
26 --- 36 15 67
36 --- 46 15 82
46 --- 56 4 86
56 --- 66 3 89
66 --- 76 2 91
76 --- 86 2 93
86 --- 96 1 94
Total () 94
25  94
 Fi 1
23,5  0
P25  li  100  hi  6   10  14,39
fi 28

50  94
 Fi 1
47  28
P50  li  100  hi  16   10  23,92
fi 24

75  94
 Fi 1
70,5  67
P75  li  100  hi  36   10  38,33
fi 15

OUTLIERS:
As observações que apresentam um grande afastamento das restantes ou são inconsistentes
com elas são habitualmente designadas por outliers. Estas observações são também
designadas por observações “anormais”, contaminantes, estranhas, extremas ou aberrantes.

A preocupação com observações outliers é antiga e data das primeiras tentativas de analisar
um conjunto de dados. Inicialmente pensava-se que a melhor forma de lidar com este tipo de
observações seria através da sua eliminação da análise.
As opiniões não eram unânimes: uns defendiam a rejeição das observações “inconsistentes
com as restantes”, enquanto outros afirmavam que as observações nunca deveriam ser
rejeitadas simplesmente por parecerem inconsistentes com os restantes dados e que todas as
observações deviam contribuir com igual peso para o resultado final.

Estatística Geral 2018 – Texto de Apoio 40


Antes de decidir o que deverá ser feito às observações outliers é conveniente ter
conhecimento das causas que levam ao seu aparecimento. Em muitos casos as razões da sua
existência determinam as formas como devem ser tratadas. Assim, as principais causas que
levam ao aparecimento de outliers são:
• Erros de medição;
• Erros de execução;
• Variabilidade inerente dos elementos da população.

Aplicação Práticas
• Detecção de fraudes.
• Comportamento de gastos de consumidores.
• Em análises médicas (resultados não esperados de tratamentos).
• Pesquisa farmacêutica. • Marketing. • Etc.

O estudo de outliers, independentemente da(s) sua(s) causa(s), pode ser realizado em várias
fases:
• A fase inicial é a da identificação das observações que são potencialmente aberrantes. A
identificação de outliers consiste na detecção, com métodos subjectivos, das observações
surpreendentes. A identificação é feita, geralmente, por análise gráfica ou, no caso de um
número de dados ser pequeno, por observação directa dos mesmos. São assim
identificadas as observações que têm fortes possibilidades de virem a ser designadas por
outliers.
• Na segunda fase, tem-se como objectivo a eliminação da subjectividade inerente à fase
anterior. Pretende-se saber se as observações identificadas como outliers potenciais o são,
efectivamente. São efectuados testes à ou às observações “preocupantes”. Devem ser
escolhidos os testes mais adequados para a situação em estudo. As observações suspeitas
são testadas quanto à sua discordância. Se for aceite a hipótese de algumas observações
serem outliers, elas podem ser designadas como discordantes. Uma observação diz-se
discordante se puder considerar-se inconsistente com os restantes valores depois da
aplicação de um critério estatístico objectivo. Muitas vezes o termo discordante é usado
como sinónimo de outlier.
• Na última fase é necessário decidir o que fazer com as observações discordantes. A
maneira mais simples de lidar com essas observações é eliminá-las. Como já foi dito, esta
abordagem, apesar de ser muito utilizada, não é aconselhável. Ela só se justifica no caso
de os outliers serem devidos a erros cuja correcção é inviável. Caso contrário, as
observações consideradas como outliers devem ser tratadas cuidadosamente pois contêm
informação relevante sobre características subjacentes aos dados e poderão ser decisivas
no conhecimento da população à qual pertence a amostra em estudo.

Métodos de identificação
• Gráfico de Box-Plot
• Modelos de discordância
• Teste de Dixon
• Teste de Grubbs
• Z-scores

Professor: Lidaia & Nhongo 41


GRÁFICO DE BOX-PLOT
O boxplot (gráfico de caixa) é um gráfico utilizado para avaliar a distribuição empírica do
dados. O boxplot é formado pelo primeiro e terceiro quartil e pela mediana. As hastes
inferiores e superiores se estendem, respectivamente, do quartil inferior até o menor valor
não inferior ao limite inferior e do quartil superior até o maior valor não superior ao limite
superior. Os limites são calculados da forma abaixo

O boxplot pode ainda ser utilizado para uma comparação visual entre dois ou mais grupos.
Por exemplo, duas ou mais caixas são colocadas lado a lado e se compara a variabilidade
entre elas, a mediana e assim por diante. Outro ponto importante é a diferença entre os
quartis que é uma medida da variabilidade dos dados.

Um segmento de reta vertical conecta o topo da caixa ao maior valor observado e outro
segmento conecta a base da caixa ao menor valor observado, este segmento denomina-se
Whisker, ou fio de bigode.

O gráfico de Box é construído da seguinte forma:


• Calcula-se a mediana, o quartil inferior (Q1) e o quartil superior (Q3);
• Subtrai-se o quartil superior do quartil inferior = (L)
• Os valores que estiverem no intervalo de Q3+1,5L e Q3+3L e no intervalo Q1-1,5L e
Q1-3L, serão considerados outliers podendo, portanto ser aceitos na população com
alguma suspeita;
• Os valores que forem maiores que Q3+3L e menores que Q1-3L devem ser
considerados suspeitos de pertencer à população, devendo ser investigada a
origem da dispersão. Estes pontos são chamados de extremos.

Estatística Geral 2018 – Texto de Apoio 42


PROMÉDIAS

MODA (MO)
É o valor que ocorre com maior freqüência em uma série de valores.

Desse modo, o salário modal dos empregados de uma fábrica é o salário mais comum, isto
é, o salário recebido pelo maior número de empregdos dessa fábrica.

.A Moda quando os dados não estão agrupados


 A moda é facilmente reconhecida: basta, de acordo com definição, procurar o valor
que mais se repete.
Exemplo: Na série { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 }
a moda é igual a 10.

 Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça
mais vezes que outros.
Exemplo: { 3 , 5 , 8 , 10 , 12 } não apresenta moda. A série é amodal.

 .Em outros casos, pode haver dois ou mais valores de concentração. Dizemos, então,
que a série tem dois ou mais valores modais.
Exemplo: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. A série
é bimodal.

.A Moda quando os dados estão agrupados


a) Sem intervalos de classe
Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta
fixar o valor da variável de maior freqüência.

Exemplo: Qual o número de filhos mais comum num grupo de 50 casais abaixo:
Nº de filhos Nº de casais
0 6
1 16
2 9
3 8
4 3
5 3
6 3
7 2

Resp: 1 (um) filho é número modal, pois é o de maior freqüência simples.

b) Com intervalos de classe


A classe que apresenta a maior freqüência é denominada classe modal. Pela definição,
podemos afirmar que a moda, neste caso, é o valor dominante que está compreendido entre
os limites da classe modal. O método mais simples para o cálculo da moda consiste em
tomar o ponto médio da classe modal. Damos a esse valor a denominação de moda bruta..

Professor: Lidaia & Nhongo 43


li  Li
M o 
2

.Método mais elaborado pela fórmula de CZUBER:

f i  f i 1 1
M o  li   hi ou M o  li   hi
2 f i  ( f i 1  f i 1 ) 1   2
Onde
li é o limite inferior da classe modal
fi é a frequência simples absoluta da classe modal
fi-1 é a frequência simples absoluta da classe anterior (inferior) à modal
fi+1 é a frequência simples absoluta da classe posterior (superior) à modal
hi é o amplitude da classe modal
Δ1 = fi - fi-1, e Δ2 = fi - fi+1

Estatística Geral 2018 – Texto de Apoio 44


Exemplo
Determine a moda e a moda bruta ( repare que a tabela foi modificada)

Taxas (em %) Número de


Centros de Saúde ( f i )
6 --- 16 4
16 --- 26 5
26 --- 36 13
36 --- 46 24
46 --- 56 28
56 --- 66 15
66 --- 76 2
76 --- 86 2
86 --- 96 1
Total () 94

f i  f i 1 f5  f4 28  24
M o  li   hi  l5   h5  46   10
2  f i  ( f i 1  f i 1 ) 2  f5  ( f4  f6 ) 2  28  (24  15)

4 40
M o  46   10  46   48
56  36 20

li  Li 46  56
M o    51 Moda bruta
2 2

A moda é utilizada quando desejamos obter uma medida rápida e aproximada de posição ou
quando a medida de posição deva ser o valor mais típico da distribuição.

MÉDIA ARITMÉTICA
A média aritmética (  ou X ) é a soma de todos os valores observados da variável dividida
pelo número total de observações.

Sob uma visão geométrica a média de uma distribuição é o centro de gravidade, representa o
ponto de equilíbrio de um conjunto de dados. É a medida de tendência central mais utilizada
para representar a massa de dados.

Seja (X1, ..., Xn) um conjunto de dados. A média é dada por:


N n

 Xi X i
 i 1
X  i 1
para dados populacionais e amostrais, respectivamente.
N n

Caso os dados estejam apresentados segundo uma distribuição de freqüência, tem-se:


K k

 X i  fi   X i  fi 
 i 1
X  i 1

N n

Professor: Lidaia & Nhongo 45


Observe que no caso de dados agrupados a média é obtida a partir de uma ponderação,
onde os pesos são as freqüências simples absolutas de cada classe e Xi é o ponto médio da
classe i.

Citam-se a seguir, algumas propriedades da média aritmética:


1. a média é um valor calculado facilmente e depende de todas as observações;
2. é única em um conjunto de dados e nem sempre tem existência real, ou seja, nem
sempre é igual a um determinado valor observado;
3. a média é afectada por valores extremos observados;
4. por depender de todos os valores observados, qualquer modificação nos dados fará
com que a média fique alterada. Isto quer dizer que somando-se, subtraindo-se,
multiplicando-se ou dividindo-se uma constante a cada valor observado, a média ficará
acrescida, diminuída, multiplicada ou dividida desse valor;
5. a soma da diferença de cada valor observado em relação à média é zero, ou seja, a
soma dos desvios é zero.
 
 Xi  X  0
A propriedade 5, é de extrema importância para a definição de variância, uma medida
de dispersão a ser definida posteriormente.
Destaca-se, ainda, que a propriedade 3, quando se observam no conjunto dados
discrepantes, faz da média uma medida não apropriada para representar os dados.
Neste caso, não existe uma regra prática para a escolha de uma outra medida. O ideal
é, a partir da experiência do pesquisador, decidir pela moda ou mediana. Para ilustrar,
considere o número de filhos, por família, para um grupo de 8 famílias: 0, 1, 1, 2, 2, 2,
3, 4. Neste caso, a média é X = 1,875 filhos por família.

Entretanto, incluindo ao grupo uma nova família com 10 filhos, a média passa a ser X
= 2,788, o que eleva em 48,16% o número médio de filhos por família. Assim, ao
observar a média, pode-se pensar que a maior parte das famílias deste grupo tem três
filhos quando, na verdade, apenas uma tem três filhos.

MEDIDAS DE DISPERSÃO
De acordo com Toledo (1985), fenômenos que envolvem análises estatísticas caracterizam-se por
suas semelhanças e variabilidades. As medidas de dispersão auxiliam as medidas de tendência
central a descrever o conjunto de dados adequadamente. Indicam se os dados estão, ou não,
próximos uns dos outros.

Desta forma, não há sentido calcular a média de um conjunto onde não há variação dos seus
elementos. Existe ausência de dispersão e a medida de dispersão é igual a zero. Por outro lado,
aumentando-se a dispersão, o valor da medida aumenta e se a variação for muito grande, a média
não será uma medida de tendência central representativa.

Faz-se necessário, portanto, ao menos uma medida de tendência central e uma medida de dispersão
para descrever um conjunto de dados.

Estatística Geral 2018 – Texto de Apoio 46


As medidas de posição se propõem a representar uma distribuição de valores, como já mencionado.
Permitem, também, a comparação de distribuições do mesmo fenômeno em locais ou períodos
diferentes como, por exemplo, a comparação entre as expectativas de vida das populações dos
países nos cinco continentes. Além disso, a média aritmética é uma medida de representação quando
a distribuição for simétrica e não heterogênea. Mas o que entendemos por distribuição heterogênea?
Quando uma distribuição é dita heterogênea? Essas e outras questões são respondidas à luz das
medidas de variação.

As medidas de variação constituem importante instrumento para avaliar: a amplitude com que as
observações variam; e como os valores estão distribuídos em torno de algum valor-critério. Podem
ser de caráter absoluto ou relativo (percentual), como apresentadas a seguir.

MEDIDAS ABSOLUTAS DE VARIAÇÃO


As cinco medidas de dispersão que serão definidas a seguir são: amplitude total, amplitude
interquartílica, desvio médio, variância e desvio padrão. Com exceção à primeira, todas têm como
ponto de referência a média.

AMPLITUDE TOTAL (λ)


A amplitude total de um conjunto de dados é a diferença entre o maior e o menor valor
observado. A medida de dispersão não levar em consideração os valores intermediários
perdendo a informação de como os dados estão distribuídos e/ou concentrados.
  X max  X min

AMPLITUDE INTERQUARTÍLICA (Dq)


A amplitude interquartílica é a diferença entre o terceiro e o primeiro quartil. Esta medida é
mais estável que a amplitude total por não considerar os valores mais extremos. Esta medida
abrange 50% dos dados e é útil para detectar valores discrepantes.
Dq=Q3−Q1.

DESVIO-MÉDIO (Dm)
A diferença entre cada valor observado e a média é denominado desvio e é dado por (Xi−μ)
se o conjunto de dados é populacional, ou por (Xi− X ) se os dados são amostrais.

Ao somar todos os desvios, ou seja, ao somar todas as diferenças de cada valor observado
em relação a média, o resultado é igual a zero (propriedade 5 da média). Isto significa que
esta medida não mede a variabilidade dos dados. Para resolver este problema, pode-se
desconsiderar o sinal da diferença, considerando-as em módulo e a média destas diferenças
em módulo é denominada desvio médio:
N n

 Xi   X i X
Dm  i 1
ou Dm  i 1
,
N n
para dados populacionais ou amostrais, respectivamente. Caso os dados estejam
apresentados segundo uma distribuição de freqüência, tem-se:

 X    fi  X 
K k

i i  X  fi
Dm  i 1
ou Dm  i 1
,
N n

Professor: Lidaia & Nhongo 47


VARIÂNCIA E DESVIO PADRÃO
Enquanto não há nada conceitualmente errado em se considerar o desvio médio, segundo
Pagano (2004), esta medida não tem certas propriedades importantes e não é muito
utilizada. O mais comum é considerar o quadrado dos desvios em relação à média e então
calcular a média.
Obtém-se, assim a variância que é definida por:

 X 
N n

 X i   
2
X
2
i
2  i 1
ou S 2  i 1 ,
N n 1
se os dados são populacionais ou amostrais, respectivamente. Caso os dados estejam
apresentados segundo uma distribuição de freqüência, tem-se:

  X   X  
K k
    fi
2
X  fi
2
i i
 
2 i 1
ou S 2 i 1

N n 1

Entretanto, ao calcular a variância observa-se que o resultado será dado em unidades


quadráticas, o que dificulta a sua interpretação. O problema é resolvido extraindo-se a raiz
quadrada da variância, definindo-se, assim, o desvio padrão:

 X 
N n

 X i   
2
X
2
i
  i 1
ou S, i 1

N n 1
se os dados são populacionais ou amostrais e, se estiverem em distribuição de freqüências:

  X   X  
K k
    fi
2
X  fi
2
i i
  i 1
ou S i 1

N n 1
É importante destacar que se duas populações apresentam a mesma média, mas os desvios
padrão não são iguais, isto não significa que as populações têm o mesmo comportamento.

MEDIDA RELATIVA DE VARIAÇÃO


Medidas absolutas, via de regra, são problemáticas face à dificuldade de se estabelecer uma base de
comparação que permita concluir sobre a ordem de grandeza da medida obtida. Por exemplo, até que
ponto podemos dizer que 144 anos2 exprime uma grande variação das idades? Como vimos, a
variância é uma medida quadrática, o que torna a sua ordem de grandeza difícil de ser avaliada. Tudo
bem, extraímos a sua raiz quadrada. Até que ponto 12 anos pode ser considerada uma alta dispersão
das idades em torno da média? A amostra é heterogênea ou homogênea em relação à idade média
de seus membros? Por que numa distribuição uma dispersão igual a 12 é baixa e em outra alta?
Como comparar dispersões oriundas de distribuições com médias diferentes?

Como se vê, a medida absoluta de dispersão dos dados tem limitações no tocante às conclusões.
Principalmente na comparação de grupos com médias diferentes. Como o desvio padrão varia com a
ordem de grandeza da média, comparar grupos, quanto à sua variação, quando as respectivas
médias são diferentes não pode ser feita com os desvios padrões. Surge, então, a medida
adimensional, isto é, sem unidade de medida, definida como Coeficiente de Variação:

O coeficiente de variação mede a percentagem de dispersão dos dados em relação à média,


podendo ser expressa em termos decimais ou percentuais (multiplicando-o por 100). Dizemos que

Estatística Geral 2018 – Texto de Apoio 48


uma distribuição é homogênea quando a variabilidade relativa, expressa pelo coeficiente de variação,
não ultrapassar a 20 ou 25%. Obviamente a distribuição não deixa de ser homogênea para valores
maiores do que 25%, mas vai perdendo grau de homogeneidade na medida em que o coeficiente
aumenta.

MEDIDAS DE ASSIMETRIA
A medida de assimetria é um indicador da forma da distribuição dos dados. Ao construir uma
distribuição de freqüências e/ou um histograma, está-se buscando, também, identificar
visualmente, a forma da distribuição dos dados que é ou não confirmada pelo coeficiente de
assimetria de Pearson (As) definido como:

  MO X  MO
CAP  ou CAP  , para dados populacionais e amostrais,
 S
respectivamente.

Uma distribuição é classificada como:


simétrica se média = mediana = moda ou CAP = 0;

assimétrica negativa se média ≤ mediana ≤ moda ou CAP < 0. O lado mais longo do
polígono de freqüência (cauda da distribuição) está à esquerda do centro.

assimétrica positiva se moda ≤ mediana ≤ média ou CAP>0. O lado mais longo do polígono
de freqüência está à direita do centro.

Simétrica Assimétrica negativa Assimétrica positiva

CAP=0 CAP<0 CAP>0

MEDIDAS DE CURTOSE
A medida de curtose é o grau de achatamento da distribuição, é um indicador da forma desta
distribuição. É definido como:
P75  P25 Q3  Q1
CPC  
2  ( P90  P10 ) 2  D9  D1 

Professor: Lidaia & Nhongo 49


A curtose ou achatamento é mais uma medida com a finalidade de complementar a
caracterização da dispersão em uma distribuição. Esta medida quantifica a concentração ou
dispersão dos valores de um conjunto de dados em relação às medidas de tendência central
em uma distribuição de freqüências.

Uma distribuição é classificada quanto ao grau de achatamento como:


Leptocúrtica: quando a distribuição apresenta uma curva de freqüência bastante fechada,
com os dados fortemente concentrados em torno de seu centro, CPC<0,263.

Mesocúrtica: quando os dados estão razoavelmente concentrados em torno de seu centro,


CPC=0,263

Platicúrtica: quando a distribuição apresenta uma curva de freqüência mais aberta, com os
dados fracamente concentrados em torno de seu centro, CPC>0,263.

BOX PLOT OU DESENHO ESQUEMÁTICO


O gráfico Box Plot (ou desenho esquemático) é uma análise gráfica que utiliza cinco medidas
estatísticas: valor mínimo, valor máximo, mediana, primeiro e terceiro quartil da variável
quantitativa. Este conjunto de medidas oferece a idéia da posição, dispersão, assimetria,
caudas e dados discrepantes. A posição central é dada pela mediana e a dispersão pelo
desvio interquartílico Dq=Q3–Q1. As posições relativas de Q1, Q2 e Q3 dão uma noção da
assimetria da distribuição. Os comprimentos das caudas são dados pelas linhas que vão do
retângulo aos valores atípicos.

Segundo Triola (2004), um outlier ou ponto discrepante é um valor que se localiza distante de
quase todos os outros pontos da distribuição. A distância a partir da qual considera-se um
valor como discrepante é aquela que supera 1,5Dq. De maneira geral, são considerados
outliers todos os valores inferiores ei=Q1-1,5Dq ou os superiores a Ei=Q3+1,5Dq.

Exemplo: Considere as idades de uma amostra de 22 estudantes. Desenhe o gráfico Box


Plot:
18 18 19 20 20 20 20 20 20 21 21
22 23 24 25 25 25 26 29 30 35 37

Estatística Geral 2018 – Texto de Apoio 50


No conjunto de dados não existe aluno com idade inferior a 11,375, ou seja, não há aluno
com idade considerada discrepante inferiormente. Entretanto, existem dois indivíduos cujas
idades são superiores a 34,375, pontos estes considerados discrepantes neste conjunto de
dados: as idades 35 e 37. Estes pontos são identificados no diagrama de caixas por meio de
um asterisco na direção das linhas traçadas.

Note-se que no intervalo interquartílico (dentro do retângulo) existem 50% dos dados, dos
quais, 25% estão entre a linha da mediana e a linha do primeiro quartil e os outros 25% estão
entre a linha da mediana e a linha do terceiro quartil. Cada linha da cauda mais os valores
discrepantes contêm os 25% restantes da distribuição. A Figura acima mostra que a
distribuição das idades dos alunos apresenta assimetria positiva, ou seja, dispersam-se para
os valores maiores.

Professor: Lidaia & Nhongo 51


PRINCIPIOS DE CONTAGEM

REGRA DA ADIÇÃO
Se existirem k procedimentos e o i-ésimo procedimento puder ser realizado de ni
maneiras, i = 1,2,3,…,k, então, o número de maneiras pelas quais poderemos
realizar ou o procedimento1, ou o procedimento 2, ou …, ou o procedimento k,
é dado por n1+n2+n3+…+nk, supondo-se que dois quaisquer deles não se
possam realizar conjuntamente.

Exemplo
1- Suponha-se que estejamos planeando uma viagem e devamos escolher entre o
transporte por autocarro ou comboio. Se existirem cinco rodovias e três ferrovias.
Quantos caminhos disponíveis existem para a viagem.
Dados:
n1  5
n  n1  n2  5  3  8
n2  3

2- Existem 12 categorias de defeitos menores de uma peça manufacturada, e 10 tipos de


defeitos graves. De quantas maneiras poderão ocorrer os defeitos?
Dados:
n1  12
n  n1  n2  12  10  22
n2  10

REGRA DA MULTIPLICAÇÃO
Se existirem k procedimentos e o i-ésimo procedimento puder ser executado de n i
maneiras, i = 1, 2, 3, …, k, então a tarefa formado por 1, seguido por 2, …, seguido
pelo procedimento k, poderá ser executada de n1xn2xn3x…xnk maneiras

Exemplos
1- Suponhamos que a matricula de carro contem três letras distintas, seguidas por quatro
dígitos, com o primeiro diferente de zero. Quantas placas podem ser impressas?
Dados:

Estatística Geral 2018 – Texto de Apoio 52


n1  26
n 2  25
7
n3  24
n4  9
n   ni n1  n2  n3  n4  n5  n6  n7  140400000
i 1
n5  10
n6  10
n7  10

2- Um a peça manufacturada deve passar por três estações de controle. Em cada


estação, a peça é inspeccionada para determinada característica e marcada
adequadamente. Na primeira estação, três classificações são possíveis, na segunda
estação, quatro classificações e na última cinco classificações são possíveis. Quantas
maneiras pelas as quais uma peça pode ser marcada?
Dados:
3
n1  3
n2  4
n   ni n1  n2  n3  3  4  5  60
i 1
n3  5

FACTORIAL
O produto dos números naturais de 1 a n, inclusive, aparece frequentemente em matemática
e, por isso, é representado pelo símbolo especial n! (lê-se “n factorial”):

n! = 1x2x3x4x5x…xn ou n! = nx…x4x3x2x1
por definição 0!=1

Exemplo
5!= 1x2x3x4x5 =120 saiba também que 5!=5x4x3x2x1=120
e 5! = 5x4!

8! = 8x7x6x5x4x3x2x1 = 40320 ou 8! = 8x7! = 8x7x6! = 56x6! = 56x720 = 40320

PERMUTAÇÕES E ARRANJOS
Arranjos – é um agrupamento com uma certa ordem de p elementos tomados de um
determinado de um determinado conjunto de n elementos
n!
a) se não existir repetição de elementos na sequência a fórmula será: An ,k  ,
(n  k )!
neste caso deve-se respeitar a condição n  p

Professor: Lidaia & Nhongo 53


 n , neste caso
k
b) Se existir repetição de elementos na sequência a fórmula será: A
n,k

não há restrições.

Exemplos
1. Com os elementos do conjunto {1,2,3,4} quantos números diferentes:
a) de três algarismos diferentes podem ser formados?
Dados
4!
n4
k 3
A4,3  (4  3)!
 4  3  2  24

b) de três algarismos podem ser formados?


Dados

A4,3  4  64
3
n4
k 3

Permutações – é um agrupamento de todos elementos de um conjunto numa


determinada ordem. É de referir que no conjunto podemos ter um ou mais elementos
repetidos k vezes. O número de agrupamentos possíveis será:
a) Se os n elementos do conjunto forem diferentes: Pn  n!
b) Se no conjunto existir repetição de alguns elementos k 1, k2, k3
n!
vezes: n Pk 1,k 2 ,k 3 
k1 ! k 2 ! k 3 !
c) Se os elementos estiverem dispostos numa mesa redonda, anel, colar, ou seja de
forma circular e todos serem diferentes:
Pc  n  1!
n

Exemplos:
1. De quantas maneiras 6 pessoas podem sentar-se numa fila?
Dados
n6 P6  6! 6  5  4  3 2 1  720
2. Quantas palavras com ou sem significado na língua portuguesa se podem escrever com
a palavra: Perco, Arriscado
Dados
n5 P 5
 5! 5  4  3  2 1  120

Dados
n9
9!
  90720
k1  2 9P 2, 2 2!2!
k2  2

3. Quantos anéis diferentes podem ser formados usando as letras da palavra: letras, poder

Estatística Geral 2018 – Texto de Apoio 54


Dados
n6 Pc 6
 (6  1)! 5! 5  4  3  2 1  120

n5 Pc 5
 (5  1)! 4! 4  3  2 1  24

COMBINAÇÕES
Combinação – é um agrupamento de n elementos p a p. Neste caso nos interessa os
n!
conjuntos possíveis não a colocação dos elementos no agrupamento: C n,k 
p!(n  k )!

Exemplo
Quantos conjuntos diferentes de três letras diferentes podemos formar com os
elementos do conjunto {a, q, e, r, t, u, g}
Dados

n7 7! 7!
k 3
C 7 ,3  
3!7  3! 3!4!
 35

Professor: Lidaia & Nhongo 55


PROBABILIDADE

INTRODUÇÃO
A ciência manteve-se ate pouco tempo atrás, firmemente apegada a lei da “causa e efeito”.
Quando o efeito esperado não se concretizava, atribuía-se o facto ou a uma falha na
experiência ou a uma falha na identificação da causa. Não poderia haver quebra da cadeia
lógica. Segundo Laplace (Pierre Simon) uma vez conhecidas a vizinhanca, a velocidade e a
direcão de cada átomo no universo, poder-se-ia, a partir daI, predizer com certeza, o futuro
ate a eternidade.
Sabe-se hoje, através do princIpio da incerteza, que não é bem assim. Que não existem
meios que permitam determinar Os movimentos dos elétrons individuais se conhecido a sua
velocidade, conforme o estabelecido em 1927, pelo fisico alemão W. Heinsenberg.

MODELOS
Conforme J. Neymann, toda a vez que se emprega Matemática com a finalidade de estudar
algum fenômeno deve-se começar por construir um modelo matemático. Este modelo pode
ser: determinístico ou então probabilístico.

MODELO DETERMINISTICO
Neste modelo as condicoes sob as quais o experimento é executado, determinam o resultado
do experimento. Tome-se, por exemplo, a lei de 0hm, V=IR. Se R e I forem conhecidos,
então V estará precisamente determinado.

MODELO NAO-DETERMINISTICO OU PROBABILISTICO


É um modelo em que de antemão não é possIvel explicitar ou definir um resultado particular.
Este modelo é especificado através de uma distribuição de probabilidade. E utilizado quando
se tem um grande número de variáveis influenciando o resultado e estas variáveis não
podem ser controladas. Tome-se por exemplo, o lançamento de um dado onde se tenta
prever o número da face que ira sair, a retirada de uma carta de um baralho, etc.
O modelo estocástico é caracterizado como um modelo probabilIstico que depende ou varia
com o tempo.

EXPERIMENTO ALEATÓRIO (NÃO-DETERMINÍSTICO)


Não existe uma definicão satisfatória de Experimento Aleatório. Por isto é necessário ilustrar
o conceito um grande número de vezes para que a idéia fique bem clara. Convém lembrar
que os exemplos dados são de fenômenos para os quais modelos probabilIsticos são
adequados e que por simplicidade, são denominados de experimentos aleatórios, quando, de
facto, o que deveria ser dito é “modelo não-determinIstico aplicado a um experimento”.
Ao descrever um experimento aleatório deve-se especificar não somente que operacão ou
procedimento deva ser realizado, mas também o que é que deverá ser observado. Note-se a
diferença entre E2 e E3.

Estatística Geral 2018 – Texto de Apoio 56


E1: Joga-se um dado e observa-se o número obtido na face superior.
E2: Joga-se uma moeda 4 vezes e o observa-se o número de caras obtido.
E3: Joga-se uma moeda 4 vezes e observa-se a sequência de caras e coroas.
E4: Um lote de 10 peças contém 3 defeituosas. As peças são retiradas uma a uma (sem
reposicão) até que a última defeituosa seja encontrada. Conta-se o número de peças
retiradas.
E5: Uma lâmpada nova é ligada e observa-se o tempo gasto até queimar.
E6: Lança-se uma moeda ate que ocorra uma cara e conta-se então o nümero de
lançamentos necessários.
E7: Lançam-se dois dados e anota-se o total de pontos obtidos.
E8: Lançam-se dois dados e anota-se o par obtido.

Características dos Experimentos Aleatórios


Observando-se os exemplos acima pode-se destacar algumas características comuns:
1. Podem ser repetidos indefinidamente sob as mesmas condiçoes.
2. Não se pode adiantar um resultado particular, mas pode-se descrever todos os
resultados possIveis
3. Se repetidos muitas vezes apresentarão uma regularidade em termos de frequência
de resultados.

O ESPAÇO AMOSTRAL
DEFINIÇÃO
É o conjunto de todos os resultados possíveis de um experimento aleatório. Anota-se por S,
E ou Ω.

Exemplo Determinar o espaço amostrall dos experimentos anteriores. S i refere-se ao


experimento E.
S1={1,2,3,4,5,6}
S2={ 0, 1, 2, 3, 4 }
S3 ={cccc, ccck, cckc, ckcc, kccc, cckk, kkcc, ckck, kckc, kcck, ckkc, ckkk, kckk, kkck,
kkkc, kkkk }
S4={3,4,5,6,7,8,9, 10}
S5= {teR/t 0 }
S6={1,2,3,4,5,...}
S7= {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 }
S8= { (1,1), (1,2), (1,3), (1,4), (1,5), (1,6) (2,1), (2,2), (2,3), (2,4), (2,5), (2,6) (3,1), (3,2),
(3,3), (3,4), (3,5), (3,6) (4,1), (4,2), (4,3), (4,4), (4,5), (4,6) (5, 1), (5, 2), (5,3), (5,4),
(5,5), (5,6), (6,1), (6,2), (6,3), (6,4), (6,5), (6,6) }

Ao descrever um espaço amostral de um experimento, deve-se ficar atento para o que se


está observando ou medido. Deve-se falar em “um” espaço amostrall associado a um
experimento e não de “o” espaço amostrall. Deve-se observar ainda que nem sempre os
elementos de um espaço amostrall são números.

CLASSIFICAÇÃO DE UM ESPAO AMOSTRAL


Um espaço amostrall, conforme exemplos anteriores pode ser classificado em:
(a) Finito. São os espaços: S1, S2, S3, S4, S7 e S8

Professor: Lidaia & Nhongo 57


(b) Infinitos. (i) Enumeráveis (ou contáveis): S6
(ii) Não-enumeráveis (ou não contáveis): S5

EVENTOS
DEFINIÇÃO:
Qualquer subconjunto de um espaço amostral Ω é denominado evento. Assim tem-se que:
Ω é o evento certo;
{ a } é o evento elementar e Ø é 0 evento impossIvel.

Convém observar que tecnicamente todo subconjunto de um espaço amostral é um evento


apenas quando ele for finito ou, então, infinito enumerável. Se o espaço amostral é infinito
não-enumerável é possível construir subconjuntos que não são eventos. Se Ω é finito, isto é,
#(Ω)=n então o número de eventos possíveis é 2n.

COMBINAÇÃO DE EVENTOS
Pode-se realizar operações entre eventos da mesma forma que elas são realizadas entre
conjuntos. Antes de definir as operacões é conveniente definir o que se entende por
ocorrência de um evento.
Seja E um experimento com um espaço amostral associado Ω. Seja A um evento de Ω. É
dito que o evento A ocorre se realizada a experiência, isto é, se executado E, o resultado for
um elemento de A.
Sejam A e B dois eventos de um mesmo espaço amostrall Ω. Diz-se que ocorre o evento:
1. A união B ou A soma B, anotado por AUB, se e somente se A ocorre ou B ocorre.
AUB
2. A produto B ou A intersecão B, anotado por A∩B ou AR, se e somente A ocorre e B
ocorre. A∩B
3. A menos B ou A diferença B, anota-se A - B, se e somente se A ocorre e B não
ocorre. A-B
4. O complementar de A, anotado por A , se somente se A não ocorre.

EVENTOS MUTUAMENTE EXCLUDENTES


Dois eventos A e B, são denominados mutuamente exclusivos ou excludentes, se eles não
puderem ocorrer juntos, isto é, se A∩B=Ø

CONCEITOS DE PROBABILIDADE
Existem trés formas de se definir probabilidade. A definição clássica, a definição frequencial
e a definição axiomática.

DEFINIÇÃO CLÁSSICA DE PROBABILIDADE


Seja E um experimento aleatório e Ω um espaço amostrall associado formado por “n”
resultados igualmente prováveis. Seja A  Ω um evento com “m” elementos. A
probabilidade de A, anotada por P(A), é definida como sendo:

Estatística Geral 2018 – Texto de Apoio 58


m
P( A)  Isto é, a probabilidade do evento A é o quociente entre o nümero “m” de casos
n
favoráveis e o número “n” de casos possíveis.

Exemplo: Calcular a probabilidade de no lançamento de um dado equilibrado obter-se:


(a) Um resultado igual a 4.
(b) Um resultado Impar.
Ω={ 1, 2, 3, 4, 5, 6} n=#(Ω)=6
m 1
(a) A ={ 4 } m=#(A)=1 então P( A)    16,67%
n 6
m 3
(b) B={ 1,3,5} m=#(B)=3 então P( B)    50%
n 6

CRÍTICA À DEFINIÇÃO CLÁSSICA


(I) A definição clássica é dúbia, já que a idéia de “igualmente provável” é a mesma de
“com probabilidade igual”, isto é, a definição é circular, porque está definindo
essencialmente a probabilidade com seus próprios termos.
(II) A definição não pode ser aplicada quando o espaço amostrall é infinito.

A DEFINIÇÃO DE PROBABILIDADE COMO FREQUÊNCIA RELATIVA


Na prática acontece que nem sempre é possível determinar a probabilidade de um evento.
Neste caso é necessário ter um método de aproximação desta probabilidade. Um dos
métodos utilizados é a experimentação que objectiva estimar o valor da probabilidade de um
evento A com base em valores reais. A probabilidade avaliada através deste processo é
denominada de probabilidade empírica.

Frequência relativa de um evento


Seja E um experimento e A um evento de um espaço amostrall associado ao experimento E.
Suponha-se que E seja repetido “n” vezes e seja “m” o número de vezes que A ocorre nas “n”
repetiçöes de E. Então a frequência relativa do evento A, anotada por fr, é o quociente:
m número de vezes que A ocorre
fr  
n nümero de vezes que E é repetido

Exemplo
(I) Uma moeda foi lançada 200 vezes e fomeceu 102 caras. Então a frequência relativa
de “caras” é: fr= 102/200=0,51=51%
(II) Um dado foi lançado 100 vezes e a face 6 apareceu 18 vezes. Então a frequência
relativa do evento A={ face 6 } é: fr= 18/100= 0,18=18%

Propriedades da frequüência relativa


Seja E um experimento e A e B dois eventos de um espaço amostrall associado Ω. Sejam frA
e frB as frequências relativas de A e B respectivamente. Então.
(i) 0 ≤ frA ≤ 1, isto é, a frequência relativa do evento A é um número que varia entre 0 e 1.
(ii) frA=1 se e somente se, A ocorre em todas as “n” repetições de E.

Professor: Lidaia & Nhongo 59


(iii)frA=0, se e somente se, A nunca ocorre nas “n” repetições de E.
(iv) frAUB= frA + frB se A e B forem eventos mutuamente excludentes.

Definição
Seja E um experimento e A um evento de um espaço amostral associado Ω. Suponhamos
que E é repetido “n” vezes e seja frA a frequência relativa do evento. Então a probabilidade
de A é definida como sendo o limite de frA quando “n” tende ao infinito. Ou seja:
P( A)  lim frA
n 
Deve-se notar que a frequência relativa do evento A é uma aproximacão da probabilidade de
A. As duas se igualam apenas no limite. Em geral, para um valor de n, razoavelmente grande
a frA é uma boa aproximacão de P(A).

Crítica à definição freqüencial


Esta definição, embora útil na prática, apresenta dificuldades matemáticas, pois o limite pode
não existir. Em virtude dos problemas apresentados pela definição clássica e pela definição
frequencial, foi desenvolvida uma teoria moderna, na qual a probabilidade é um conceito
indefinido, como o ponto e a recta o são na geometria.

DEFINIÇÃO AXIOMATICA DE PROBABILIDADE


Seja E um experimento aleatório com um espaço amostral associado Ω. A cada evento
A   associa-se um número real, representado por P(A) e denominado “probabilidade de
A”, que satisfaz as seguintes propriedades (axiomas):
(i) 0≤P(A)≤ 1;
(ii) P(Ω)= 1;
(iii) P(AUB)=P(A) + P(B) se A e B forem eventos mutuamente excludentes.
(iv) Se A1, A2, ..., An, ......, forem, dois a dois, eventos mutuamente excludentes,
 n  n
então: P  Ai    P( Ai )
 i 1  i 1

Consequências dos axiomas (propriedades)


(i) P(Ø) =0
(ii) Se A e A são eventos complementares então: P(A)+P( A )= 1 ou P( A )= 1-P(A)
(iii) Se A  B então P(A) ≤ P(B)
(iv) Se A e B são dois eventos quaisquer então: P(A\B)=P(A)-P(A∩B)
(v) Se A e B são dois eventos quaisquer de Ω, então: P(AUB)=P(A)+P(B)-P(A∩B)
(vi) P(AUBUC) = P(A) + P(B) + P(C) - P(AnB) - P(A∩C) - P(B∩C) + P(A∩B∩C)
(vii) Se A1, A2, ..., An, ... são eventos de um espaço amostral Ω, então: P(A1UA2U...U
 n  n n n
n 1 
n

An) =   i  
P A  P ( Ai )   P ( Ai  A j )   P( Ai  A j  Ar )  ...   1 P  Ai 
 i 1  i 1 i j 2 i  j  r 3  i 1 

Estatística Geral 2018 – Texto de Apoio 60


PROBABILIDADE CONDICIONADA E INDEPENDÊNCIA
Suponha-se que se quer extrair duas peças ao acaso de um lote que contém 100 peças das
quais 80 peças são boas e 20 defeituosas, de acordo com os critérios (a) com reposicão e (b)
sem reposicão. Define-se os seguintes eventos:
A = {A primeira peca é defeituosa } e B = { A segunda peca é defeituosa }

Então, se a extracão for com reposicão P(A) = P(B) = 20 / 100 = 1 / 5 = 20%, porque existem
20 peças defeituosas num total de 100.

Agora se a extracão for sem reposicão tem-se ainda que P(A) = 20 / 100 = 20%, mas o
mesmo não é verdadeiro para P(B). Neste caso, é necessário conhecer a composição do lote
no momento da extração da segunda peça, isto é, é preciso saber se a primeira peça retirada
foi ou não defeituosa. Neste caso é necessário saber se A ocorreu ou não. O que mostra a
necessidade do conceito de probabilidade condicionada.

DEFINIÇÃO
Sejam A e B dois eventos de um espaço amostral 5, associado a um experimento E, onde
P(A)> 0. A probabilidade de B ocorrer condicionada a A ter ocorrido, será representada por
P(B/A), e lida como: “probabilidade de B dado A” ou “probabilidade de B condicionada a A”, e
calculada por:
P( A  B)
P( B / A) 
P( A)

No exemplo acima, então P(B/A) = 19 / 99, pois se A ocorreu (isto é, se saiu peça defeituosa
na primeira retirada) existirão na urna apenas 99 peças das quais 19 defeituosas.
Sempre que se calcular P(B/A) está se calculando a probabilidade de ocorrência do evento B
em relacão ao epaço amostral reduzido A, ao invés de fazé-lo em relacão ao espaço
amostral original Ω.
Quando se calcula P(B) está se calculando a probabilidade de estar em B, sabendo-se que
se está em Ω, mas quando se calcula P(B/A) está calculando a probabilidade de B, sabendo-
se que se está em A agora e não mais em Ω, isto é, o espaço amostral fica reduzido de Ω
para A.

É simpbes verificar as seguintes propriedades de P(B/A) para A fixado:


(i) 0≤P(B/A)≤ 1,
(ii) P(Ω/A) =1,
(iii) P[(B1UB2)/A] = P(B1 / A) + PB2 / A) se B1∩B2 =Ø
(iv) P[(B1UB2U...) /A] = P(B1/A) + P(B2/A) + ... se Bi ∩Bj =Ø para i≠ j.

Observe-se que estas propriedades são idénticas aos axiomas de probabilidade. Pode-se
também comparar P(A/B) e P(A).

TEOREMA DA MULTIPLICAÇÃO
Com o conceito de probabilidade condicionada é possIvel apresentar uma maneira de se
calcular a probabilidade da intersecção de dois eventos A e B em função destes eventos.
Esta expressão é denominada de teorema da multiplicação. P(A∩B) = P(A)xPB/A) =
P(A/B)xP(B).

Professor: Lidaia & Nhongo 61


INDEPENDÊNCIA DE DOIS EVENTOS
Sejam A e B dois eventos de um espaço amostral Ω. A e B são ditos independentes se a
probabilidade de um deles ocorrer não afectar a probabilidade do outro ocorrer, isto é, se:
P(A/B) =P(A) ou P(BIA) = P(B) ou ainda se P(A∩B) = P(A)xP(B)
Qualquer uma das 3 relacoes acima pode ser usada como definição de independéncia.

Exemplo
Trés componentes C1, C2, e C3, de um mecanismo são postos em série (em linha recta).
Suponha que esses componentes sejam dispostos em ordem aleatória. Seja R o evento {C2
está a direita de C1 }, e seja S o evento { C3 está a direita de C1 }. Os eventos R e S são
independentes? Justifique.

Para que R e S sejam independentes deve-se ter: P(R∩S) = P(R)xP(S). 0 espaço amostral
para este caso é: Ω = { C1C2C3, C1C3C2, C2C1C3, C2C3C1, C3C1C2, C3C2C1 } As sequências
em que C2 está à direita de C1 são: R= {C1C2C3, C1C3C2, C3C1C2}. Logo: P(R)= 3/6 = 50%

As sequéncias em que C3 está à direita de C1 são: S = { C1C2C3, C1C3C2, C2C1C3 }. Logo


P(S) = 3/6 = 50%

As sequências em que C2 está à direita de C1 e C3 está também à direita de C1 são:


R∩S = { C1C2C3, C1C3C2 }. Logo P(R∩S)=2/6 = 1/3 =33,33%=P(R)xP(S) = 0,5x0,5 = 0,25 =
25%

Portanto os eventos R e S não são independentes.

TEOREMAS DA PROBABILIDADE TOTAL E DE BAYES


0 conceito de probabilidade condicionada pode ser utilizado para calcular a probabilidade de
um evento simples A ao invés da probabilidade da intersecão de dois eventos A e B. Para
tanto é necessário o conceito de partição de um espaço amostral.

Definição
Diz-se que os conjuntos A1, A2, ..., An eventos de um mesmo espaço amostral Ω, formam
uma partição deste espaço se:
(a) Ai∩Aj =Ø, para todo i≠ j.
(b) A1UA2...U An=Ω
(c) P(A1)> 0, para todo i
Exemplo
Considere-se o espaço amostral obtido pelos números das
faces no lançamento de um dado equilibrado e sejam os eventos: A1= {1,2,3}, A2={4,5} e
A3={6}

Então, pode-se verificar facilmente que, os eventos acima formam uma partição do espaço
amostral Ω={ 1, 2, 3, 4, 5, 6}.

Estatística Geral 2018 – Texto de Apoio 62


TEOREMA DA PROBABILIDADE TOTAL
Considere-se um espaço amostral Ω e A1, A2, ..., An uma partição deste espaço amostral.
Seja B um evento de Ω. Então B, pode ser escrito como (A figura anterior ilustra a partição
com n = 8):
B=(B∩A1)U(B∩A2)U... U(B∩A)

É claro que, alguns destes conjuntos B∩Ai poderão ser vazios, mas isto não representa
nenhum problema na decomposicão de B. 0 importante é que todos os conjuntos B∩A1,
B∩A2, ..., B∩An são dois a dois mutuamente excludentes. E por isto, pode-se aplicar a
propriedade da adição de eventos mutuamente excludentes e escrever.

P(B) =P[(B∩A1)U(B∩A2)U... U(B∩An)] = P(B∩A1) + P(B∩A2) + ... + P(B∩An) Mas cada um dos
termos P(B∩Ai) pode ser escrito na forma: P(B∩Ai) = P(Ai)xP(B/Ai), pela definição de
probabilidade condicionada, obtém-se então o denominado teorema da probabilidade total:
P(B) = P(A1)xP(B/A1) + P(A2)xP(B/A2) + ...+ ..P(An).P(B/An)

Exemplo
Uma determinada peça é manufaturada por 3 fábricas: A, B e C. Sabe-se que A produz o
dobro de peças que B e que B e C produzem o mesmo número de peças. Sabe-se ainda que
2% das peças produzidas por A e por B são defeituosas, enquanto que 4% das produzidas
por C são defeituosas. Todas as peças produzidas são misturadas e colocadas em um
depósito. Se do depósito for retirada uma peça ao acaso, qual a probabilidade de que ela
seja defeituosa?

Considerem-se os seguintes eventos: D = { A peca é defeituosa }, A = { A peca provém da


fábrica A }, B = { A peca provém da máquina B } e C = { A peca provém da máquina C }.
Tem-se então que: P(A) = 50%, P(B) = P(C) = 25%, uma vez que so existem as 3 fábricas e
que A produz o dobro de B e esta por sua vez produz a mesma quantidade que C. Sabe-se
também que P(D/A)=P(D/B)=2% e que P(D/C)=4%.

Pela teorema da probabilidade total pode-se escrever que:


P(D) =P(A).P(D/A) + P(B).P(D/B) + P(C).P(D/C) =0,5x0,02 + 0,25x0,02 + 0,25x0,04 = 2,50%,
pois A, B e C formam uma partição do espaço amostral Ω.

TEOREMA DE BAYES
Suponha-se que no exemplo acima, uma peca é retirada do depósito e se verifica que é
defeituosa. Qual a probabilidade de que tenha sido produzida pela fábrica A? ou B? ou ainda
C?

Neste caso, o que se quer calcular é a probabilidade condicionada P(A/D). Pela notação já
vista acima, e generalizando a questão o que se está interessado em obter é a probabilidade
de ocorrência de um dos Ai dado que B ocorreu, isto é, o que se quer é saber o valor de
P(Ai/B), onde os eventos A1, A2, ..., An formam uma partição de Ω e B é um evento qualquer
de Ω.

Professor: Lidaia & Nhongo 63


Aplicando a definição de probabilidade condicionada segue que:
P( Ai  B) P( Ai )  P( B / Ai )
P( Ai / B)  
P( B) P( B) , onde P(B) é avaliado pelo teorema da probabilidade
total. Este resultado é conhecido como teorema de Bayes. Assim:

P( Ai )  P( B / Ai )
P( Ai / B) 
P( A1 )  P( B / A1 )  P( A2 )  P( B / A2 )  ...  P( An )  P( B / An )
Exemplo
Considerando a pergunta acima vem então: P(A/D), isto é a probabilidade de ter sido
produzida pela máquina A dado que a peça é defeituosa é:

P( A)  P( D / A)
P ( A / D) 
P( A)  P( D / A)  P( B)  P( D / B)  P(C )  P( D / C )

0,50  0,02
P ( A / D)   0,40  40%
0,50  0,02  0,25  0,02  0,25  0,04

Estatística Geral 2018 – Texto de Apoio 64


Variável aleatória
Uma variável aleatória pode ser entendida como uma variável quantitativa, cujo resultado
(valor) depende de factores aleatórios.

Exemplos:
– número de coroas obtido no lançamento de 2 moedas;
– número de itens defeituosos em uma amostra retirada, aleatoriamente, de um lote;
– número de defeitos em um azulejo que sai da linha de produção;
– número de pessoas que visitam um determinado site, num certo período de tempo;
– volume de água perdido por dia, num sistema de abastecimento;
– resistência ao desgaste de um certo tipo de aço, num teste padrão;
– tempo de resposta de um sistema computacional;
– grau de empeno em um azulejo que sai da linha de produção.
– uma caixa contem 5 parafusos defeituosos e 5 não defeituosos. O número de parafusos
defeituosos extraídas em uma amostra de 2 parafusos extraídos sem reposição
– As peças que saem de uma linha de produção s ão inspeccionadas e o seu estado é
registado: boa ou com defeito. Quando e encontrada uma peça defeituosa a operação pára
para se averiguar qual a causa do defeito. O número de peças inspeccionadas é uma variável
aleatória
– O rendimento familiar mensal de um habitante de uma determinada cidade seleccionado ao
acaso e uma variável aleatória.
– O tempo de vida de uma pilha produzida no sector C de uma fabrica é uma variável
aleatória.

Variável aleatória
Formalmente, uma variável aleatória é uma função que associa elementos do espaço
amostral ao conjunto de números reais.

- Desta forma, pode-se escrever os resultados de um experimento aleatório através de


números, ao invés de palavras ou símbolos, possibilitando um tratamento matemático
facilitado. Em outras palavras, a variável aleatória traduz o resultado do experimento em
números reais.
- No cálculo de probabilidades, estudam-se as V.A.s (Variáveis Aleatórias) e calculam-se as
probabilidades associadas a elas. Uma medida de probabilidade é associada ao espaço
amostral por meio de uma variável aleatória X. A medida pode ser um número, uma área,
um volume.
- Na Estatística Descritiva, constrói-se uma Tabela de Frequência, na qual uma frequência
absoluta (e também uma frequência relativa) é associada a cada valor. Pode-se fazer o
mesmo com o cálculo de probabilidades, originando uma tabela que associa a cada valor,
sua probabilidade de ocorrência. Esta tabela é denominada Distribuição de Probabilidade.

Formalização

Professor: Lidaia & Nhongo 65


- Levantados os resultados possíveis da V.A., os valores numéricos da V.A. são
denotados por letras minúsculas: x1, x2, x3, ..., xn.
- Desse modo, para uma variável aleatória X, que assume os valores x1, x2, x3, ..., xn,
define-se uma função de probabilidade p(xi) que tem as seguintes propriedades:
1) p(xi) ≥ 0, para todo i, onde p(xi) é a probabilidade associada a X=xi, ou seja, a
probabilidade de ocorrência de um determinado resultado da V.A..
2) p(xi) = 1
- Se a distribuição de probabilidades de uma V.A. é explicitamente conhecida, então
todo o resumo estatístico (média, desvio padrão, etc.) também será conhecido.

Tipos de Variáveis Aleatórias


Diz-se que uma variável aleatória é discreta se todos os seus valores podem ser listados, e
estes valores pertencem a um conjunto finito ou infinito, numerável.
Exemplo:
Número de chegadas a uma fila,
Número de caras em uma jogada de duas moedas,
Resultado da jogada de um dado.

Uma V.A. é contínua se os seus valores não podem ser listados, mas podem assumir um
número infinito de valores em um intervalo finito ou infinito.
Exemplo:
Intervalo de tempo entre chegadas,
Altura de pessoas em uma sala.
O exercício com teste de celulares a seguir exemplifica o levantamento de resultados
elementares, definição de uma variável aleatória e a construção das funções pmf e CDF.

Variável Aleatória Discreta

Seja X uma variável aleatória discreta, então X pode assumir os valores x 1 , x2 ,....
Chamaremos de função de probabilidade da variável aleatória X a função que a cada x i
associa sua probabilidade de ocorrência, ou seja,

tal que:

Estatística Geral 2018 – Texto de Apoio 66


Função de Distribuição de Probabilidade Acumulada

Definimos função de distribuição de probabilidade acumulada da variável variável aleatória


aleatória X como sendo:

Para o caso discreto, temos:

Consideremos a variável aleatória


P(X = 0) = ¼, P(X = 1) = ½, P(X = 2) = ¼.
Podemos observar que , para i = 0, 0 ≤ P( X = i ) ≤ 1 1,2 e

então,

Exercício

Professor: Lidaia & Nhongo 67


1) Considere uma variável aleatória X com a seguinte função de probabilidade:

a) Determine o valor da constante “c" que torna legítima a função de probabilidade acima.
b) Determine a função de distribuição acumulada F e construa o gráfico.
c) Calcule a P(X>1), P(X≥3), P(X≤4), P(5/2<X≤5).

2) Seja X uma variável aleatória discreta com função de distribuição acumulada dada por:
F(-2)=0,3, F(0)=0,5, F(1)=0,6, F(2)=0,8 e F(5)=1. Calcule P(-1≤X≤4).

Variável aleatória Contínua

Uma variável aleatória X é contínua se existir uma função f, denominada denominada função
de densidade densidade de probabilidade probabilidade (fdp) de X, que satisfaça as seguintes
condições:

Suponha que X é uma variável aleatória contínua com a seguinte fdp:

Mostre que f(x) é uma fdp.


Calcule P (X ≤ 1 /2)
Calcule P (1/4≤ X ≤ 3/4)

Função de Distribuição de Probabilidade Acumulada

Estatística Geral 2018 – Texto de Apoio 68


Definimos função de distribuição de probabilidade acumulada da variável variável aleatória
aleatória X como sendo: F(x)=P(X≤x)
Para o caso contínuo, temos:

Exemplo

Encontre a função de distribuição acumulada da seguinte função de densidade de


probabilidade

Exercício
1) Seja X uma variável aleatória com densidade

a) Determine Determine o valor da constante constante “d" que torna legítima legítima a
função de densidade de probabilidade acima.
b) Determine a função de distribuição acumulada F.
c) Calcule a P(X>1), P(X<1/2) e P(-1/2<X≤2/3)

2) Dada a função de distribuição acumulada


F(x)=0 para x<-1
F(x)=(x+1)/2 para -1≤x<1
F(x)=1 para x ≥1

Calcule:
a) f(x)
b) P(X=0) e P(-1/2<X≤1/2)

Esperança

Professor: Lidaia & Nhongo 69


A esperança de uma variável aleatória é por definição a média de sua distribuição de
probabilidades (no mesmo sentido de média de distribuição de frequências)

X for uma variável aleatória discreta, então

X for uma variável aleatória contínua, então,

Variância

A variância de uma variável aleatória é por definição a variância de sua distribuição de


probabilidades (no mesmo sentido de variância de distribuição de frequências). Isto é,

Se X for uma variável aleatória discreta, então

e se X for uma variável aleatória contínua, então,

Propriedades do valor esperado e variância

Estatística Geral 2018 – Texto de Apoio 70


Distribuições de Probabilidade de variáveis
aleatórias
Até o momento, as variáveis aleatórias consideradas não possuiam, necessariamente,
qualquer sentido de aplicação. Entrentanto, algumas variáveis aleatórias são muito
importantes e, devido a esta importância, surge o interesse em estudar suas distribuições de
probabilidade.

Uma distribuição de probabilidade é essencialmente um modelo de descrição probabilística de


uma população. As ideias de população e distribuição de probabilidade são, deste modo,
indissociáveis e serão, a partir de agora, tratadas como sinónimos. As distribuições de
probabilidade formam capital importância da Estatística, uma vez, que pela sua natureza, a
estatística somente considera variáveis cujos valores não ocorrem de modo determinístico

No estudo de uma variável aleatória é importante saber:


- O tipo de distribuição de probabilidade da variável;
- A função de probabilidade da variável;
- Os parâmetros da distribuição;
- As medidas descritivas da distribuição (média, Variância, assimetria, etc…)

Existem inúmeros modelos descrevendo o comportamento probabilístico de variáveis discretas


e contínuas. Estudaremos principais tipos de distribuições discretas e contínuas.

Distribuições de probabilidade de variáveis aleatórias discretas


As distribuições discretas mais importantes e utilizadas são: Uniforme, Hipergeométrica,
Bernoulli, Geométrica, Pascal, Binomial, Multinomial e Poisson.

Distribuição Uniforme Discreta

Seja uma variável aleatória discreta X, que assume os valores x1, x2, ... , xr. Diz-se que X tem
distribuição uniforme discreta se, e somente se, para todo i= 1 , 2 , ... , r:

Professor: Lidaia & Nhongo 71


Parâmetros
A distribuição uniforme discreta tem um parâmetro:
r= quantidade de valores que a variável pode assumir

A forma simbólica para X que distribuição uniforme discreta é a seguinte:


X ~ Unif(r)

Medidas descritivas
Média ou valor esperado

Variância

Exemplo
Seja X a variável aleatória que representa o resultado observado no lançamento de um dado.
Determine a distribuição de probabilidade.

Distribuição Hipergeométrica

Consideremos uma população de tamanho N, dividida em duas sub-populações de tamanho


M e N-M. Suponha que desejamos retirar dessa população um grupo de n elementos
(amostra), um a um, sem reposição. Se a variável aleatória X é definida como o número de
elementos da sub-população de tamanho M, observa-se uma relação de dependência entre os
elementos retirados, pois, como não há reposição, a probabilidade de sucesso (retirar
ellemento da sub-população de tamanho M) muda a cada retirada.

Função de Probabilidade
De modo geral, se X é uma variável que tem distrisbuição hipergeométrica, então a sua
função de probabilidade será:

Estatística Geral 2018 – Texto de Apoio 72


Onde o X assume valores de 0 até Min(M,n)

Parâmetros
A distribuição hipergeométrica tem três parâmetros:
N= tamanho da população
M= número de elementos da sub-população de interesse
n= número de elementos retirados

A forma simbólica para X que distribuição hipergeométrica é a seguinte:


X ~ Hip (N,M,n)

Medidas descritivas
Média ou valor esperado

Variância

Exemplo:
De entre 10 painéis solares apresentados numa exposição, sete são do tipo placa plana e três
são do tipo concentrador. Uma pessoa que visita a exposição escolhe, ao acaso, três painéis
para observer. Se a variável X é definida como o número de painéis do tipo placa plana
observados, construa a distribuição de probabilidade de X.

Professor: Lidaia & Nhongo 73


Distribuição de Bernoulli

Esta distribuição foi deduzida no final do século XVII pelo matemático suiço Jacob Bernoulli.
Modelo de descrição probabilística dos resultados de um experiment de Bernolli. O
experimento (ou ensaio) de Bernoulli é definido como o experiment aleatório que possui
apenas dois resultados possíveis, que são 0 que representa fracasso e 1 que representa
sucesso.

Função de Probabilidade
De modo geral, se X é uma variável que tem distrisbuição Bernoulli, então a sua função de
probabilidade será:

Onde o X assume valores de 0 e 1 e o p é a probabilidade de sucesso de uma única tentativa

Parâmetros
A distribuição de Bernoulli tem um parâmetro:
p= probabilidade de sucesso

A forma simbólica para X que distribuição de Bernoulli é a seguinte:


X ~ Ber (p)

Medidas descritivas
Média ou valor esperado

Variância

Exemplo:
Um experimento aleatório consiste em lançar um dado e observar o seu resultado. Seja X a
variável aleatória que representa aparecimento da face “6’ numa única jogada. Determine a
função de probabilidade da variável X.

Estatística Geral 2018 – Texto de Apoio 74


Distribuição Geométrica

Seja X uma variável aleatória discreta que indica o número de observações de um


experimento de Bernoulli até a ocorrência de um sucesso, com probabilidade p, isto é, o
número de tentativas até se obter um sucesso. Neste caso, diz-se que X tem distribuição
geométrica, com parâmetro p. O modelo probabilístico é dado por:

Parâmetros
A distribuição geométrica tem um parâmetro:
p= probabilidade de sucesso

A forma simbólica para X que distribuição geométrica é a seguinte:


X ~ Geo (p)

Medidas descritivas
Média ou valor esperado

Variância

Exemplo
A proporção de não conformidade de certo componente é 8%. Ao se inspeccionar um lote
desses componentes, qual a probabilidade de se encontrar uma unidade defeituosa na
quarta observação?

Professor: Lidaia & Nhongo 75


Distribuição de Pascal

Seja X uma variável aleatória discreta que indica o número de observações de um


experimento de Bernoulli, com probabilidade p de sucesso, até a ocorrência de r sucessos.
Aqui diz-se que X tem distribuição de Pascal, cujo modelo probabilístico é dado por:

Parâmetros
A distribuição de Pascal tem dois parâmetros:
p= probabilidade de sucesso
r= número de sucessos

A forma simbólica para X que distribuição de Bernoulli é a seguinte:


X ~ Pas (r;p)

Medidas descritivas
Média ou valor esperado

Variância

Distribuição Binomial

Seja X uma variável aleatória que indica o número de sucessos observados em n eventos de
um experimento de Bernoulli, com probabilidade p de sucesso. Então diz-se que X tem
distribuição binomial com parâmetros n e p, e modelo de probabilidade dado por:

Parâmetros
A distribuição de Pascal tem dois parâmetros:
p= probabilidade de sucesso
n= número de tentativas ou repetição do experimento (tamanho da amostra)

A forma simbólica para X que distribuição de Binomial é a seguinte:


X ~ Bin (n;p)

Estatística Geral 2018 – Texto de Apoio 76


Medidas descritivas
Média ou valor esperado

Variância

Exemplo:
A proporção de não conformidade de certo componente é 8%. Ao se inspeccionar um lote de
12 unidades deste componente, qual a probabilidade de se encontrar três unidades não
conformes?

Distribuição Multinomial

Seja um experimento aleatório executado n vezes, com r possíveis resultados, e probabilidades


p1, p2, ... , pr. Sejam X1, X2, ... , Xr as variáveis aleatórias discretas que indicam o total de
ocorrências de cada uma das r respostas, e que representam respectivamente K 1, K2, ..., Kr
sucessos, tais que K1+K2+ ... +Kr= n. Aqui diz-se que X tem distribuição multinomial, ou
polinomial. O modelo de probabilidade é dado por:

Parâmetros
A distribuição de Multinomial tem 2 vezes r parâmetros:
P1, P2 , …, Pr = probabilidades de sucessos
X1, X2, ... , Xr = as variáveis discretas que representam cada sucesso

A forma simbólica para X que distribuição de Multinomial é a seguinte:


X ~ Mult (X1, X2, ... , Xr; p1, p2, ... , pr)

Medidas descritivas
Média ou valor esperado

Variância

Professor: Lidaia & Nhongo 77


Exemplo:
Na inspeção de qualidade de um produto são utilizadas quatro categorias para classificação:
conforme, aproveitável, reciclável e refugado. As probabilidades de pertencer a cada um dos
grupos são, respectivamente: p1= 0,70, p2= 0,15, p3= 0,10 e p4= 0,05. Em um lote de 10
unidades, qual a probabilidade de se encontrar seis unidades conformes, duas aproveitáveis,
uma reciclável e uma refugada?

Distribuição de Poisson

Um experimento aleatório é chamado Experimento de Poisson quando consiste em observar as


ocorrências de determinado evento ao longo de um intervalo contínuo subdividido em pequenos
intervalos, de acordo com as seguintes propriedades:
1. O numero de sucessos em determinado intervalo independe do número de sucessos em
qualquer outro intervalo.
2. A probabilidade de sucesso em um intervalo é proporcional ao comprimento deste mesmo
intervalo.
3. A probabilidade de mais de um sucesso em um intervalo muito pequeno é desprezível.
Seja X a variável aleatória discreta que indica o número de sucessos observados em um intervalo
de um experimento de Poisson. Neste caso diz-se que X tem distribuição de Poisson com
parâmetro λ, e o modelo de probabilidade é dado por:

Parâmetros
A distribuição de Poisson tem um parâmetro:
λ= o valor médio no interval considerado

A forma simbólica para X que distribuição de Possion é a seguinte:


X ~ Po (λ)

Medidas descritivas
Média ou valor esperado

Variância

Exemplo

Estatística Geral 2018 – Texto de Apoio 78


O número médio de clientes atendidos por um terminal é de 12 por hora. Qual a
probabilidade de se ter que atender cinco clientes em meia hora?

Professor: Lidaia & Nhongo 79


Exercícios

1. Um aeroporto regista em média oito aterragens a cada período de seis horas. Qual a
probabilidade de registar duas aterragens em uma hora?

2. Um procedimento de inspecção de qualidade consiste em retirar para inspecção duas


unidades de cada lote de 20 unidades. Se nenhuma das duas unidades é defeituosa, o
lote é aprovado. Supondo que um lote contenha duas unidades defeituosas, qual a
probabilidade de ser aprovado?

3. A proporção de não conformidade de um produto é igual a 6%. Qual a probabilidade de


uma amostra de 15 unidades apresentar duas não conformes?

4. No exercício anterior, qual a probabilidade de que se tenha que inspecionar quatro


unidades até encontrar uma defeituosa?

5. No processo de fabrico de um produto, a taxa de rejeicção é de 20%. Ao receber uma


encomenda de oito unidades do produto, a gerência decide fabricar dez unidades. Qual a
probabilidade desta quantidade ser suficiente para atender à encomenda?

6. Uma instituição financeira classifica os clientes em três grupos de risco: Alto risco, médio
risco e baixo risco. Um levantamento apontou que 6% dos clientes pertencem ao primeiro
grupo, 12% ao segundo e 82% ao terceiro. Qual a probabilidade de um grupo de 15
clientes apresentar um cliente do primeiro grupo, dois do segundo e 12 do terceiro?

7. Certo tipo de cabo é vendido em rolos de 50m. Verificou-se que cada rolo apresenta em
média duas imperfeições. Qual a probabilidade de um segmento de 10m apresentar uma
falha?

8. A proporção de não conformidade de um produto é de 4%. O produto é comercializado


em embalagens com 12 unidades. Uma embalagem é rejeitada se for encontrada mais de
uma unidade não conforme. Qual a probabilidade de que, em uma encomenda de dez
embalagens, no máximo duas sejam rejeitadas?

9. No exercício anterior, se cada embalagem rejeitada representa um custo de 50,00Mt para


o fabricante, qual o custo esperado para uma encomenda de 1000 embalagens?

10. Uma rede de auto-atendimento possui 12 unidades, que operam oito horas por dia. Em
média são atendidos dois clientes por hora. Qual a probabilidade de que, em um intervalo
de 15 minutos, oito unidades estejam ocupadas?

Estatística Geral 2018 – Texto de Apoio 80


Distribuições de probabilidade de Variáveis aleatórias contínuas
É difícil identificar o tipo de distribuição de probabilidade de uma variável continua.
Geralmente é necessário fazer uma pesquisa para saber se a variável de interesse já foi
estudad antes e a sua distribuição de probabilidade já foi identificada. Uma das formas de
identificar o tipo de distribuição de uma variável continua é observando o campo de variação
desta Variável.
Exitem vários tipos de distribuições contínuas, As mais importantes são as seguintes:
Uniforme, Exponencial e Normal

Distribuição Uniforme

Seja X uma variável aleatória continua que assume valores no interval [ ]. Se a


probabilidade de X assumer valores num sub-intervalo é a mesma que para qualquer outro
sub-intervalo de mesmo comprimento, então, esta variável tem distribuição uniforme.

Função de densidade de probabilidade


De modo geral, se X é uma variável aleatória contínua que tem distribuição uniforme, então
sua função densidade de probabilidade será:

Parâmetros
A distribuição de uniforme tem dois parâmetros:
= o menor valor para o qual a variável X está definida;

Professor: Lidaia & Nhongo 81


= o maior valor para o qual a variável X está definida;

A forma simbólica para X que distribuição de Possion é a seguinte:


X~U( )

Medidas descritivas
Média ou valor esperado

Variância

Função de distribuição acumulada


A função de distribuição acumulada da uniforme é facilmente encontrada

Exemplo:
Seja X uma variável aleatória contínua com distribuição uniforme no interval [5, 10].
Determine as probabilidades
a) P(X<7)
b) P(X>8,5)
c) P(8<X<9)
d) P(|X-7,5|>2

Estatística Geral 2018 – Texto de Apoio 82


Distribuição Exponencial

Seja X uma variável aleatória contínua que só assume valores não negativos. Se esta variável
é o tempo decorrido entre ocorrências sucessivas de um processo de Poisson, então ela tem
distribuição exponencial

Na distribuição de Poisson, a variável aleatória é definida como o número de ocorrências


(sucesso) em determinado período de tempo, sendo a média das ocorrências no período
definida como λ. Na distribuição exponencial, a variável aleatória é definida como o tempo
entre duas ocorrfências, sendo a média de tempo entre ocorrências igual a 1/λ.

A distribuição exponencial é muito utilizada no campo de confiabilidade para a modelagem do


tempo até a ocorrência de falha em components electrónicos, bem como do tempo de espera
em sistemas de filas.

Professor: Lidaia & Nhongo 83


Função densidade de probabilidade
De modo geral, se X é uma variável aleatória contínua que tem distribuição exponencial,
então sua função densidade de probabilidade será:

Parâmetros
A distribuição exponencial tem um parâmetro:
= número médio de ocorrências em determinado período de tempo (λ>0)
= o maior valor para o qual a variável X está definida;

A forma simbólica para X que distribuição de Possion é a seguinte:


X ~ Exp ( )

Medidas descritivas
Média ou valor esperado

Variância

Função de distribuição acumulada


A função de distribuição acumulada da exponencial pode ser facilmente encontrada

Para calcular P(X>k)=

Propriedade da distribuição exponencial


A distribuição exponencial apresenta uma propriedade interessante que é denominada falta
de memória. Isso significa que a probabilidade de ocorrência de valores de X não afecta pelo
conhecimento da ocorrência de valores anterioes, ou seja,

Estatística Geral 2018 – Texto de Apoio 84


Exemplo:
Suponha que um component electrónico tenha um tempo de vida X (em unidades de 1000
horas) que segue uma distribuição exponencial de parâmetro λ=1. Suponha que op custo de
fabrico do item seja de 4 Meticais e que o preço de venda seja 10 Meticais. O fabricante
garante devolução total se X<0,90. Qual o lucro esperado por item?

P(Y=-4)=P(X<0,9)=0,59343
P(Y=6)=P(X≥0,9)=0,40657

E(Y)=-4x0,59343+6x0,40657=0,0657

Distribuição Normal

A distribuição normal (ou distribuição de Gauss ou distribuição Gaus-Laplace) é uma


distribuição especialmente importante na metodologia estatística. Sua importância advém das
suas propriedades, do número de fenómenos (variáveis) que podem, pelo menos
aproximadamente, ser modelados através dela e da quantidade de métodos e técnicas que
são derivados tendo-a como pressuposição básca. Esse conjunto de métodos e técnicas forma
a chamada Estatística Clássica ou Estatística Paramétrica.

É uma distribuição teórica de frequências, onde a maioria das observações se situa em torno
da média (Centro da distribuição) e diminui gradual e simetricamente no sentido dos
extremos. A distribuição normal é representada graficamente pela curva normal (também
chamada curva de Gauss) que tem a forma de sino e é simétrica em relaç~ao ao centro,
onde se localiza a média

Professor: Lidaia & Nhongo 85


Função densidade de probabilidade
De modo geral, se X é uma variável aleatória contínua, possui distribuição normal se sua
função densidade de probabilidade for:

Parâmetros
A distribuição normal tem dois parâmetros:
= média (determina o centro da distribuição);
= variância (Determina a dispers~ao da distribuição);

A forma simbólica para X que distribuição de Possion é a seguinte:


X~N( )

Medidas descritivas
Média ou valor esperado

Variância

Propriedades da distribuição normal


1. O máximo da funç~ao densidade de probabilidade se dá no ponto X=
2. A distribuição é simétrica em relação ao centro onde coincide a média, a moda e a
mediana

3. Os pontos de inflexão (onde a curva passa de covexa para côncava) são exactamente

4. Verifica-se na distribuição normal que:

Estatística Geral 2018 – Texto de Apoio 86


Copnsiderando que a área sob a curva no intervalo de interesse é que corresponde a
probabilidade, utiliza-se as curvas seguintes para ilustrar esta propriedade.

Distribuição normal padrão

É uma distribuição normal de uma variável Z que tem média igual a zero ( ) e desvio
padrão igual a um ( ). Para a variável Z, a funç~ao densidade de probabilidade resulta

A função densidade de probabilidade mais simplificada da distribuição normal padrão, facilitou


o cálculo das áreas sob a sua curva. Assim, a curva normal padrão foi dividida em pequenas
tiras, cujas áreas foram calculadas e apresentadas numa tabela. Na tabela da distribuição
normal padrão, podemos encontrar as áreas correspondenttes aos intervalos 0 a z.

Professor: Lidaia & Nhongo 87


Os valores negativos não são apresentados na tabela porque a curva é simétrica; portanto, as
áreas correspondents a estes valores são exactamente iguais às dos seus simétricos positivos,
por exemplo, P(-1<Z<0)=P(0<Z<1).

Regras de consulta da tabela da distribuição normal padrão


Consdideremos x1<x2<0<x3<x4.

Estatística Geral 2018 – Texto de Apoio 88


Exercícios

1. Uma variável X é uniformemente distribuída no interval [10, 20]. Determine.


a) Valor esperado e variância de X
b) P(12,31<X<16,50)

2. Os tempos até a falha de um dispositivo electrónico seguem o modelo exponencial,


com uma taxa de falha 0,012 falhas/hora. Indique qual a probabilidade de um
dispositivo escolhido ao acaso sobreviver a 50 horas? E a 100 horas?

3. Suponha que um mecanismo electrónico tenha um tempo de vida X (em unidades de


1000 horas) que é considerado uma variável aleatória com função densidade de
probabilidade dada por:

Suponha ainda que o custo de fabric de um item seja de 3 Meticais e o preço de venda
seja 7 Meticais. O fabricante garante total devolução se X≤0,8. Qual o lucro esperado
por item?

4. Seja Z uma variável aleatória com distribuição normal padrão. Determine as seguintes
probabilidades
a) P(0<Z<1,73)
b) P(0,81<Z<+∞)
c) P(-1,25<Z<-0,63)

5. Suponha que a estatura de recém-nascidos do sexo feminine é uma variável com


distribuição normal de média 48cm e desvio padrão 3cm. Determine:
a) A probabilidade de um recém-nascido ter estatura entre 42cm e 49cm;
b) A probabilidade de um recém-nascido ter estatura superior a 52cm;
c) O número de recém-nascidos que têm estatura inferior à , dentre os 532
que nqsceram numa determinada maternedidade, no período de um mês.

6. Suponha que as notas de uma prova sejam normalmente distribuídas, com média 72 e
desvio padrão 1,3. Considerando que 18% dos alunos mais adiantados receberam letra
“A” e 10% dos mais atrasados a letra “R”, encontre a nota minima para receber “A” e
a nota máxima para receber “R”.

7. Uma variável aleatória X é normalmente distribuída, com média igual a 5 e variância


igual a 4. Calcular as probabilidades:
a) P(5 ≤ X ≤ 7,5)
b) P(4,5 ≤ X ≤ 7,5)
c) P(5,8 ≤ X ≤ 8,5)

Professor: Lidaia & Nhongo 89


d) P(6,5 ≤ X )
e) P(X ≤7,5)
f) P(X ≤ 4,5)

8. Os diâmetros dos tubos produzidos por uma máquina são normalmente distribuídos,
com média igual a 49,7 mm e desvio padrão igual a 0,18 mm. Um cliente rejeita
qualquer unidade com diâmetro superior a 50,2 mm. Qual a probabilidade de uma
unidade ser rejeitada ?

9. O peso líquido dos potes de margarina de certa marca é normalmente distribuído, com
média igual a 500 g e desvio padrão igual a 8 g. Um cliente rejeitou 15% de um lote,
alegando que o peso líquido era inferior ao seu limite de tolerância. Quanto vale este
limite?

10. Um aeroporto regista em média cinco aterragens por hora. Qual a probabilidade de
que o intervalo entre duas aterragens seja superior a 20 minutos?

11. O tempo médio até a ocorrência da primeira falha em um componente é igual a 500
horas. O fabricante oferece uma garantia de 200 horas. Qual a probabilidade de que a
primeira falha ocorra dentro deste prazo?

12. Seja uma variável aleatória X, tal que X ~ N (μ, 2). Calcular:
a) P(X ≤ μ + )
b) P(X ≤ μ + 2 )
c) P(μ – ≤ X ≤ μ + )
d) P(μ – 3 µ X ≤ μ + 3 )

13. O tempo médio até a ocorrência da primeira falha em um componente é igual a 500
horas. O fabricante oferece uma garantia de 200 horas. Um equipamento utiliza oito
unidades deste componente. Qual a probabilidade de no máximo duas unidades
apresentarem defeito no prazo de garantia?

Estatística Geral 2018 – Texto de Apoio 90

Você também pode gostar