Livro Estatistica e Probabilidade
Livro Estatistica e Probabilidade
Livro Estatistica e Probabilidade
Estatística e
Probabilidade
Híbrido
GRADUAÇÃO
Estatística e
Probabilidade
Me. Rebecca Manesco Paixão
DIREÇÃO UNICESUMAR
Reitor Wilson de Matos Silva, Vice-Reitor e
Pró-Reitor de Administração Wilson de Matos
Silva Filho, Pró-Reitor Executivo de EAD William
Victor Kendrick de Matos Silva, Pró-Reitor de
Ensino de EAD Janes Fidélis Tomelin, Presidente
da Mantenedora Cláudio Ferdinandi.
C397 CENTRO UNIVERSITÁRIO DE MARINGÁ. Núcleo de Educação a
Distância; PAIXÃO, Rebecca.
NEAD - NÚCLEO DE EDUCAÇÃO A DISTÂNCIA
Estatística e Probabilidade. Rebecca Manesco Paixão. Diretoria Executiva Chrystiano Mincoff, James
Maringá-PR.: Unicesumar, 2019. Prestes e Tiago Stachon; Diretoria de Graduação
288 p.
“Graduação - Híbridos”. e Pós-graduação Kátia Coelho; Diretoria de
Permanência Leonardo Spaine; Diretoria de
1. Estatística. 2. Probabilidade. 3. EaD. I. Título. Design Educacional Débora Leite; Head de
ISBN: 978-85-459-2041-0 Produção de Conteúdos Celso Luiz Braga de Souza
CDD - 22 ed. 001.4226 Filho; Head de Metodologias Ativas Thuinie Daros;
CIP - NBR 12899 - AACR/2 Head de Curadoria e Inovação Tania Cristiane Yoshie
Fukushima; Gerência de Projetos Especiais Daniel
F. Hey; Gerência de Produção de Conteúdos
Impresso por: Diogo Ribeiro Garcia; Gerência de Curadoria
Carolina Abdalla Normann de Freitas; Supervisão
do Núcleo de Produção de Materiais Nádila de
Almeida Toledo; Supervisão de Projetos Especiais
Yasminn Talyta Tavares Zagonel; Projeto
Gráfico José Jhonny Coelho e Thayla Guimarães
Cripaldi; Fotos Shutterstock
Coordenador de Conteúdo Fabio Augusto Gentilin
e Crislaine Rodrigues Galan.
Designer Educacional Janaina de Souza Pontes e
NEAD - Núcleo de Educação a Distância Amanda Peçanha dos Santos.
Av. Guedner, 1610, Bloco 4 - Jardim Aclimação Revisão Textual Cintia Prezoto Ferreira e Carla
CEP 87050-900 - Maringá - Paraná Cristina Farinha.
unicesumar.edu.br | 0800 600 6360 Editoração Victor Augusto Thomazini e André
Morais de Freitas.
Ilustração Natalia de Souza Scalassara e Welington
Vainer Satin de Oliveira.
Realidade Aumentada Cesar Henrique Seidel,
Maicon Douglas Curriel e Thiago Marçal Surmani.
PALAVRA DO REITOR
13
Representação
Tabular e Gráfica
dos Dados
37
Estatística
Descritiva: Medidas
de Posição
73
Estatística
Estatística
Descritiva: Medidas
Inferencial:
de Variação, de
Estimação e Teste de
Assimetria e de
Hipóteses
Curtose
97 189
Inferência a Partir de
Probabilidade
Duas Amostras
125 221
Distribuições de Correlação e
Probabilidade Regressão
155 249
29 Amostragem estratificada
138 Probabilidade: experimento aleatório
259 Correlação e regreção linear
Utilize o aplicativo
Unicesumar Experience
para visualizar a
Realidade Aumentada.
Me. Rebecca Manesco Paixão
Introdução à Estatística
PLANO DE ESTUDOS
OBJETIVOS DE APRENDIZAGEM
Podemos dizer que a estatística é uma ciência que fornece métodos para coleta,
organização, descrição, análise e interpretação de dados de todas as áreas do conhe-
cimento, auxiliando na tomada de decisões.
Logo, a importância da estatística relaciona-se com o desenvolvimento científico
e tecnológico, uma vez que, por meio dela, é possível analisarmos dados e tomarmos
decisões.
UNIDADE 1 15
A estatística, a grosso modo, pode ser dividida em três áreas, a saber: estatística
descritiva, estatística inferencial e probabilidade.
• Estatística descritiva: preocupa-se com a descrição de dados, de modo a
organizá-los e resumi-los, com vistas a torná-los mais fáceis de serem enten-
didos, discutidos e transmitidos.
• Estatística inferencial: preocupa-se com a interpretação e análise dos da-
dos, de forma a extrapolar conclusões sobre a população, a partir dos dados
colhidos da amostra.
• Probabilidade: teoria matemática que estuda a incerteza oriunda de fenô-
menos de caráter aleatório (MAGALHÃES; LIMA, 2008).
16 Introdução à Estatística
Quando se utilizam amostras de respostas voluntárias, como em pesquisas feitas
pela internet ou pelo telefone, “podem ser tiradas conclusões válidas apenas em
relação ao grupo específico que escolheu participar, mas é prática comum estende-
rem-se, incorretamente, as conclusões a uma população maior” (TRIOLA 2008, p. 11).
Fonte: adaptado de Triola (2008).
1 EXEMPLO Uma pesquisa realizada pela consultoria JLeiva Cultura & Esporte, com participação
do Datafolha, questionou 10.630 pessoas, com idade superior a 12 anos, os três gê-
neros musicais que mais gostavam, por ordem de preferência. O resultado mostrou
que o sertanejo é o estilo mais popular (37%), seguido do MPB (27%), gospel (21%),
rock (21%), pagode e pop (ambos com 17%), que completem os cinco mais citados
(BARCINSKI, 2018, on-line)1.
A partir da pesquisa, podemos concluir que as 10.630 pessoas constituem uma
amostra, enquanto que a população consiste na coleção inteira dos brasileiros.
Além disso, temos outros dois conceitos importantes neste estudo: censo e estatística.
Censo consiste no processo de examinar todos os elementos da população; por sua
vez, a estatística é utilizada para avaliação dos elementos de uma amostra.
Por meio do censo, podemos obter as medidas capazes de descrever toda a po-
pulação (parâmetros) e, ao se trabalhar com amostras, obtemos as estimações e, a
partir delas, os estimadores.
Assim, podemos dizer que parâmetros se tratam de medidas descritivas de uma po-
pulação, enquanto que estimadores são medidas descritivas de uma amostra e que, indi-
retamente, são capazes de estimar um parâmetro, a partir do cálculo de probabilidades.
Dados
Larson e Faber (2010, p. 3) definem dados como “informações que vêm de obser-
vações, contagens, medições ou respostas”; logo, dados são as informações com as
quais trabalharemos, e que são obtidos a partir da observação, contagem ou medição
de variáveis.
UNIDADE 1 17
Os dados podem ser denominados de primários ou secundários. Dados primá-
rios são aqueles colhidos diretamente na fonte das informações, ao contrário dos
dados secundários, os quais já foram coletados e encontram-se organizados em
bancos de dados, publicações, dentre outras fontes.
Além disso, os dados podem ser quantitativos ou qualitativos. Dados quantita-
tivos referem-se às entradas numéricas, como a altura dos jogadores de basquete;
por sua vez, dados qualitativos referem-se às entradas não numéricas, como a cor
dos olhos dos recém-nascidos.
No contexto do dado estatístico quantitativo, cabe destacar que ele pode ser dis-
creto (descontínuo) ou contínuo. Normalmente, o dado discreto é resultante de
uma contagem de quantidades enumeráveis, e, por isso, seus valores são expressos
por meio de números inteiros não negativos; por exemplo da contagem de alunos
presentes na aula de Estatística e Probabilidade. Por sua vez, diz-se que X é um
dado contínuo quando assume todos os valores intermediários ao passar de a para
b; por exemplo da temperatura registrada em um termômetro de mercúrio, em que
ao dilatar-se, o filete da temperatura passa por todas as temperaturas intermediárias
(TOLEDO; OVALLE, 1985).
2 EXEMPLO Em 2013, o site especializado em viagens, Conde Nast Travever, publicou uma lista
com os 154 melhores novos hotéis abertos em 2012. Na Tabela 1, é apresentada a ava-
liação do site para 10 lugares onde se hospedar na América Central e América do Sul.
Preço do Número de
Hotel País
quarto quartos
El Secreto Belize $$$ 13
Kurà Design Villas Costa Rica $$$ 6
Tántalo Hotel Panamá $ 12
B.O.G Hotel Colômbia $ 55
Casa San Agustín Colômbia $$ 30
Sugar Beach, a Viceroy
Santa Lúcia $$$ 80
Resort
MashpiLodge Equador $$$$ 22
Palacio Nazarenas Peru $$$$ 55
JW Marriott Peru $ 153
Botanique Hotel &Spa Brasil $$$$ 17
18 Introdução à Estatística
A partir da Tabela 1, podemos inferir que a população é de 154 hotéis e a amostra é dos
10 novos hotéis para se hospedar na América Central e América do Sul. Se avaliarmos
a variável país, então, estaremos trabalhando com um dado qualitativo; se avaliarmos a
variável número de quartos, então, estaremos trabalhando com um dado quantitativo.
Ainda, uma forma de distinguir os dados é por meio do nível de mensuração, o
qual pode ser: nominal, ordinal, intervalar ou racional. Cabe destacar que essas clas-
sificações são fatores importantes na determinação de qual procedimento usado na
aplicação da estatística em problemas reais.
• Nível nominal de mensuração: aplica-se a dados qualitativos, que podem
ser categorizados utilizando rótulos, qualidades ou nomes. Não possibilita
operações aritméticas. Quando as variáveis nominais assumem duas categorias,
são chamadas de variáveis dicotômicas, enquanto que quando assumem três
ou mais categorias, denominam-se variáveis categóricas.
• Nível ordinal de mensuração: aplica-se a dados qualitativos e quantitativos,
os quais podem ser organizados pela ordem ou posição. No entanto, as dife-
renças entre as entradas de dados não são significantes.
• Nível intervalar de mensuração: os dados podem ser ordenados, de modo
que há diferenças significativas entre eles, e um registro nulo não é interpre-
tado como zero inerente.
• Nível racional de mensuração: semelhante ao nível intervalar, no entanto, é
possível estabelecer relações de razões entre os dados, ou seja, um dado pode
ser múltiplo do outro, e, ainda, o registro nulo é o zero inerente.
UNIDADE 1 19
Pensando ainda no restaurante, os pratos mais vendidos são macarrão, strogonoff e
risoto. Neste caso, podemos dizer que há uma hierarquia nos valores encontrados, de
modo que o macarrão é superior ao strogonoff, que, por sua vez é superior ao risoto.
Logo, estamos trabalhando com um conjunto de dados no nível ordinal.
Além disso, o saldo no caixa do restaurante, ao longo dos vários dias do mês, é
um exemplo de conjunto de dados no nível racional, de modo que se o saldo for
zero em um determinado dia, teremos a ausência de valor. Ainda, para este conjunto
de dados, é possível fazer uma relação de multiplicação, ou seja, se na segunda-feira
havia R$ 100,00 no caixa e na terça-feira havia R$ 200,00 então, podemos afirmar
que, na terça-feira, havia o dobro do valor que no dia anterior.
Por fim, quanto ao conjunto de dados intervalar, exemplificamos com a lista de
temperaturas registradas em uma determinada cidade, uma vez que, a partir desta
lista, podemos fazer uma hierarquização entre as temperaturas, e não há zero inerente,
ou seja, a temperatura pode ser zero graus.
O Quadro a seguir sumariza os quatro níveis de mensuração. Observe.
Quadro 2 - Níveis de mensuração e suas características.
Subtrair os Determinar se um
Nível de Categorizar Ordenar os
valores dos dado é múltiplo
mensuração os dados dados
dados do outro
Nominal Sim Não Não Não
Ordinal Sim Sim Não Não
Intervalar Sim Sim Sim Não
Racional Sim Sim Sim Sim
20 Introdução à Estatística
Fases do
Método Estatístico
Definir o problema
Coletar os dados
Apurar os dados
Apresentar os dados
UNIDADE 1 21
Definição do Problema e Identificação da Variável
de Interesse e da População do Estudo
Coleta de Dados
A quarta fase é de coleta dos dados, a qual refere-se à obtenção propriamente dita das
informações de interesse. Pode ser conduzida direta ou indiretamente.
Diz-se coleta direta quando os dados são obtidos diretamente da fonte; como
no caso da pesquisa de preferência de marcas de refrigerante pelos consumidores.
Existem três tipos de coleta de dados direta: contínua, periódica e ocasional.
• Coleta contínua: os dados são obtidos ininterruptamente durante um de-
terminado período. Por exemplo, os registros de nascimentos de uma deter-
minada cidade.
• Coleta periódica: os dados são obtidos em períodos curtos. Por exemplo o
censo industrial, realizado anualmente.
• Coleta ocasional: os dados são obtidos esporadicamente. Por exemplo coleta
de casos fatais de surto epidêmico.
22 Introdução à Estatística
Por outro lado, diz-se coleta indireta quando ela é inferida com base nos elementos
obtidos a partir da coleta direta. De acordo com Toledo e Ovalle (1985), este tipo de co-
leta pode ser feita por analogia, por proporcionalização, por indícios ou por avaliação.
• Coleta por analogia: o conhecimento de um determinado fenômeno é
induzido a partir de outro que com ele guarda relações de casualidade.
• Coleta por proporcionalização: o conhecimento de um determinado fenô-
meno se induz das condições quantitativas de uma parte dele.
• Coleta por indícios: são escolhidos fenômenos sintomáticos para discussão
de um aspecto geral da vida social.
• Coleta por avaliação: por meio de estimativas cadastrais ou informações
fidedignas, presume-se o estado quantitativo de um fenômeno.
UNIDADE 1 23
As tabelas são utilizadas com vistas a apresentação numérica dos dados, dispon-
do-os em linhas e colunas distribuídas de modo ordenado. Veja um exemplo de
tabela na Figura 2.
Por sua vez, os gráficos são utilizados de forma a permitir uma visualização fácil e
rápida dos dados numéricos. Veja um exemplo de gráfico na Figura 3.
Y
40
34,41 33,91
35
30,37 30,71 31,12 30,65 30,83
29,28 28,82 29,70
30 28,70 28,06
25
0
2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 X
Fonte: IBGE, Diretoria de Pesquisas, Coordenação de Agropecuária, Pesquisa Trimestral do Abate de Animais, 2006-2017.
Caro (a) aluno (a), atente-se que existem diversos tipos de tabelas e gráficos que podem
ser utilizados para representação dos dados coletados. Na Unidade 2, aprofundaremos
nossos conhecimentos no que diz respeito a estas formas.
Por fim, a última fase do trabalho estatístico é a de análise e interpretação dos dados,
permitindo chegar a uma conclusão.
24 Introdução à Estatística
Planejamento
Experimental
UNIDADE 1 25
Estudos
Estatíticos
Experimento:
Estudo Observacional:
Você faz Aplica algum
observa e mede,mas
observações apenas tratamento.
não modifica.
ou modifica os sujeitos
de alguma forma?
Período de Período de tempo
tempo passado à frente
Quando
as observações Elementos-chave no planeja-
são feitas? mento de experimentos:
1. Controla efeitos de variáveis
por meio de:
experimentos cegos, blocos,
Um ponto
planejamento experimental,
no tempo
completamente, aleatorizado,
planejamento experimental
Estudo retrospectivo rigorosamente, controlado.
(ou de controle de 2. Replicação
caso): retorna no 3. Aleatorização
tempo para coletar
dados sobre algum
período passado. Estudo transversal:
os dados são
medidos em algum
ponto no tempo.
Estudo prospectivo
(ou longitudinal ou
de coorte): avança
no tempo e observa
grupos com fatores
em comum,tais
como fumantes e
não fumantes.
26 Introdução à Estatística
Controle de Variáveis
Variáveis são características que podem ser avaliadas (ou medidas) sob as mesmas
condições, em cada elemento da população, por exemplo: peso, altura, tipo sanguíneo,
grau de escolaridade, religião e dentre outros.
O controle do efeito das variáveis pode ser conduzido a partir de experimentos
cegos, planejamento em blocos aleatorizado, planejamento completamente aleatoriza-
do ou, ainda, por meio de planejamento, rigorosamente, controlado (TRIOLA, 2008).
• Experimento cego: técnica em que o sujeito não sabe se está recebendo o
medicamento ou o placebo, permitindo inferir se o medicamento traz efeitos
significativos na pessoa. A técnica é, normalmente, utilizada em pessoas sujeitas
a tratamentos, em que um grupo recebe um medicamento, e outro recebe um
placebo que não contém o medicamento e não causa danos.
• Planejamento em blocos aleatorizado: técnica aplicada em experimentos
em que há fatores com forte efeito sobre a variável em consideração. Logo,
devemos formar grupos de sujeitos com características semelhantes e, na se-
quência, associar, aleatoriamente, os tratamentos aos sujeitos dentro de cada
bloco. Por exemplo, para testar a eficiência de um determinado medicamento,
podem ser formados um bloco de mulheres e um bloco de homens, uma vez
que o medicamento poderá ter efeitos diferentes dependendo do sexo da pessoa.
• Planejamento completamente aleatorizado: neste tipo de planejamento,
os sujeitos são associados a diferentes tipos de tratamento, por meio de um
processo de seleção aleatória. Por exemplo, para testar a eficiência do medica-
mento, as crianças, que vão receber o medicamento ou o placebo, são escolhidas
aleatoriamente, como a partir de uma jogada de moedas.
• Planejamento rigorosamente controlado: neste tipo de planejamento, os su-
jeitos são, cuidadosamente, escolhidos, a fim de possibilitar comparações entre
os diferentes grupos. No teste da eficiência do medicamento, são escolhidas
crianças da mesma faixa etária, com pesos semelhantes, alturas semelhantes e
dentre outras variáveis, a fim de possibilitar a comparação rigorosa dos grupos
que vão receber o medicamento ou o placebo.
UNIDADE 1 27
Ainda, considerar o tamanho amostral é um passo fundamental. As amostras
devem ser grandes o suficiente de modo que o comportamento errático não disfarce
o efeito dos tratamentos. No entanto, Triola (2008) cita que mais importante do que
o tamanho da amostra é ter uma amostra cujos dados tenham sido escolhidos de
modo apropriado, por exemplo da seleção aleatória.
28 Introdução à Estatística
• Amostragem casual simples: os elementos da população são escolhidos de
forma totalmente aleatória, como por sorteio, de modo que cada um tenha a
mesma probabilidade de ser selecionado.
Em uma turma de 50 alunos de engenharia, para escolher uma amostra repre-
sentativa de 10%, inserem-se os nomes dos alunos em uma urna, e retiram-se
5 nomes, formando a amostra. Neste caso, cada elemento tem a mesma pro-
æ1ö
babilidade de ser selecionado, ou seja, çççè 50 ÷÷÷ø .
• Amostragem sistemática: os elementos da população apresentam-se or-
denados, de forma que a sua retirada é feita periodicamente para compor a
amostra, utilizando-se um intervalo I, a partir do número sorteado.
Para obter a amostra de cinco alunos de engenharia, de uma turma de 50 alu-
50
nos, temos que N = 50 , n = 5 e I = = 10 . Assim, o sorteio será feito entre
5
os 10 primeiros da lista de chamada; se o sorteado for, por exemplo, o aluno
de número 3 da lista, a amostra será formada pelos alunos de número 3, 13,
23, 33 e 43 da lista de chamada.
• Amostragem estratificada: a população é dividida em subgrupos (estratos), de
modo que, nesta divisão, os indivíduos sejam semelhantes (homogêneos) entre
si. Assim, na composição da amostra, devem ser sorteados elementos de todos os
estratos. Teremos uma amostra estratificada uniforme quando os estratos possuem,
aproximadamente, o mesmo tamanho; caso contrário, teremos uma amostra
estratificada proporcional, em que serão sorteados um número proporcional de
elementos ao número de elementos do estrato.
Na turma de 50 alunos de engenharia, composta por 30 mulheres e 20 homens,
para extrair uma amostra representativa
de 10% da população, teremos:
Quadro 4 - Exemplo de extração de amostra
representativa de 10% da população
Feminino 30 3
Masculino 20 2
Total 50 5
Fonte: a autora.
UNIDADE 1 29
• Amostragem por conglomerado: a população é dividida em grupos dife-
rentes (conglomerados), em que é extraída uma amostra apenas dos conglo-
merados selecionados, e não de toda a população.
Caro(a) aluno(a), nesta unidade introdutória à estatística, pudemos ver que a esta-
tística pode ser dividida em três áreas: estatística descritiva, estatística inferencial e
probabilidade. Ainda, tivemos a oportunidade de estudar alguns conceitos impor-
tantes relacionados à estatística, tais como: população, amostra, censo, estatística,
parâmetros, estimadores, dentre outros. Finalizamos os estudos com as fases do
método estatístico e com a importância do planejamento experimental.
30 Introdução à Estatística
Você pode utilizar seu diário de bordo para a resolução.
31
3. Avalie se o conjunto de dados está no nível intervalar ou no nível racional.
32
LIVRO
Estatística
Autor: Fernanda Cesar Bonafini
Editora: Pearson Education do Brasil
Sinopse: baseados na premissa de que o ensino atual exige um processo flexí-
vel de construção do saber, os livros que compõem a Bibliografia Universitária
Pearson são concisos sem serem rasos e simples sem serem simplistas. Para
tanto, eles apresentam os principais conceitos dos temas propostos em uma
estrutura didática única, com linguagem dialógica, diagramação diferenciada e
hipertextos, entre outros elementos. Em Estatística, isso não é diferente. Nela,
tópicos como correlação e regressão, intervalo de confiança e distribuição de
probabilidades discretas – que, dependendo da abordagem, podem parecer
complicados – são apresentados de um ponto de vista inusitado que, ao mostrar
como as coisas funcionam na prática, possibilita ao leitor um processo intensivo
(e real) de aprendizagem.
33
CARNIEL, I. G. Estatística. Maringá: Centro Universitário de Maringá, 2014.
LARSON, R.; FARBER, B. Estatística aplicada. 4. ed. São Paulo: Pearson Prentice Hall, 2010.
MAGALHÃES, M. N.; LIMA, A. C. P. Noções de probabilidade e estatística. 6. ed. São Paulo: Editora da
Universidade de São Paulo, 2008.
TOLEDO, G. L.; OVALLE, I. I. Estatística básica. 2. ed. São Paulo: Atlas, 1985.
REFERÊNCIA ON-LINE
1
Em: https://blogdobarcinski.blogosfera.uol.com.br/2018/07/24/pesquisa-comprova-no-brasil-o-sertanejo-li-
dera-mas-o-futuro-e-do-funk/. Acesso em: 16 set. 2019.
2
Em: https://www.cntraveller.com/. Acesso em: 16 set. 2019.
3
Em: https://tvefamosos.uol.com.br/noticias/ooops/2018/10/16/tv-paga-veja-ranking-dos-30-canais-mais-vis-
tos-no-pais-em-setembro.htm. Acesso em: 16 set. 2019.
4
Em: https://agenciadenoticias.ibge.gov.br/agencia-sala-de-imprensa/2013-agencia-de-noticias/releases/
14157-asi-censo-2010-114-milhoes-de-brasileiros-60-vivem-em-aglomerados-subnormais. Acesso em: 16
set. 2019.
Em: http://www.agrocfm.com.br/abate-voltou-a-crescer-em-2017-apos-dois-anos-de-queda-aponta-ibge/.
5
34
1. C.
2. D.
3. O conjunto de dados referentes aos anos em que o Brasil foi campeão da copa do mundo estão no nível
intervalar, uma vez que conseguimos estabelecer diferenças entre os dados, no entanto não podemos
dizer que um ano é múltiplo do outro.
35
36
Me. Rebecca Manesco Paixão
Representação Tabular
e Gráfica dos Dados
PLANO DE ESTUDOS
OBJETIVOS DE APRENDIZAGEM
Além disso, o documento deixa claro que a moldura de uma tabela não deve conter
traços verticais que a delimitem à esquerda e à direita. A Figura 1 ilustra um exem-
plo de tabela de dados estatísticos, composta pelos elementos característicos que
acabamos de estudar.
Omissão censitária
segundo a Pesquisa de Avaliação -
1970, 1980, 1991 e 2000 - Brasil
Ano do Omissão
censo (%)
1970 7,3
1980 4,3
1991 4,7
2000 5,8
Fonte: IBGE, Pesquisa de Avaliação da Cobertura
da Coleta do Censo 1970, 1980, 1991 e 2000
UNIDADE 2 39
Normalmente, quando trabalhamos com dados estatísticos, é comum a necessi-
dade de apresentar em uma única tabela mais do que uma série. Assim, temos uma
tabela de dupla entrada quando as séries aparecem conjugadas, ou seja, há duas
ordens de classificação: uma horizontal (linha) e uma vertical (coluna). A Figura 2
ilustra este tipo de tabela.
Fonte: a autora.
Fonte: a autora.
Fonte: a autora.
UNIDADE 2 41
• Se a soma das parcelas da série arredondada for inferior ao total, deve-se retor-
nar à série original, arredondando-se por excesso tantas parcelas quantas forem
as unidades em falta. Serão escolhidas as parcelas anteriormente arredondadas
por falta, cujas frações desprezadas representem o menor erro relativo.
Tabela 5 - Exemplos de arredondamento de soma, se a soma das parcelas da série arredondada for
inferior ao total
Série original Série arredondada Série corrigida
5,34 5 5
7,45 7 7
18,50 18 19*
19,90 20 20
22,37 22 22
26,43 26 27*
99,99 98 < 100 100
* arredondamentos refeitos
Fonte: a autora.
UNIDADE 2 43
Tabela 6 - Produção mundial de milho ao longo dos anos
Por sua vez, séries heterógradas são aquelas em que o fenômeno apresenta sub-
divisões ou gradações. A distribuição de frequências é uma série heterógrada, em
que todos os elementos (época, local e fenômeno) são fixos, de modo que os dados
encontram-se agrupados de acordo com a variação quantitativa ou intensidade
do fenômeno.
24 51 40 39 44
35 52 31 53 39
41 32 31 54 56
42 43 36 55 34
56 29 62 27 48
45 57 34 47 32
37 38 46 25 48
32 42 65 33 47
Fonte: a autora.
UNIDADE 2 45
Os dados apresentados, na Tabela 9, são chamados de dados brutos, uma vez que não
se encontram, numericamente organizados, ou seja, os dados encontram-se da forma
como foram coletados. Quando organizamos estes dados, seja em ordem crescente
ou decrescente, temos o que chamamos de rol, conforme Tabela 10.
Tabela 10 - Rol crescente da idade dos professores da Universidade X
24 25 27 29 31
31 32 32 32 33
34 34 35 36 37
38 39 39 40 41
42 42 43 44 45
46 47 47 48 48
51 52 53 54 55
56 56 57 62 65
Fonte: a autora.
Uma vez que organizamos os dados em rol, podemos resumi-los em uma tabela, cuja
leitura seja facilitada. Assim, a Tabela 11 ilustra a distribuição de frequências da
idade dos professores da Universidade X.
Atente-se que para facilitar a interpretação dos dados, agrupamo-los em faixas de
valores, denominadas de classes. Nestas, incluímos o extremo inferior e excluímos
o superior, que na tabela é indicado pelo símbolo − ; isto é, o intervalo de classe é
fechado à esquerda e aberto à direita.
Tabela 11 - Distribuição de frequências: idade dos professores da Universidade X.
21 − 31 4
31 − 41 15
41 − 51 11
51 − 61 8
61 − 71 2
Fonte: a autora.
k 1 3, 3 log10 n
k= n
Em que n diz respeito ao número total de dados coletados.
Limite inferior de classe ( li ): menores números pertencentes às diferentes
classes.
Limite superior de classe ( Li ): maiores números pertencentes às diferentes
classes.
Amplitude total ( H ): diferença entre o maior e o menor valor observado da
variável em estudo:
H Ln l1
Atente-se que as fórmulas para determinação do número de classe não nos levam
a uma decisão final, uma vez que esta vai depender de um julgamento pessoal. É
interessante evitar classes com frequências nulas ou, ainda, classes com frequências
demasiadamente grandes. Usualmente, utilizam-se de 5 a 20 classes.
UNIDADE 2 47
Pontos médios das classes ( xi ): pontos médios dos intervalos que determinam
cada classe:
li Li
xi
2
xn xn1 h
Fonte: a autora.
H = 188 − 160 = 28 cm
188 160
h 5, 6
5
159 − 165 1
165 − 171 1
171 − 177 10
177 − 183 4
183 − 189 2
Fonte: a autora.
UNIDADE 2 49
Frequência relativa percentual (f r%): produto da frequência relativa por 100, ou
seja:
f r % f r 100
Fonte: a autora.
Frequência
Crianças com Frequência Frequência Frequência
relativa
catapora absoluta relativa acumulada
percentual
7 1 0,05 5 5
8 2 0,10 10 15
9 5 0,25 25 40
10 8 0,40 40 80
11 3 0,15 15 95
12 1 0,05 5 100
Fonte: a autora.
158 − 160 32
160 − 162 85
164 − 166 97
166 − 168 46
168 − 170 23
Frequências decrescem até tornarem-se
baixas novamente
170 − 172 7
Fonte: a autora.
UNIDADE 2 51
Gráficos
UNIDADE 2 53
Gráficos em barras
50
45
40
28
Quantidade
30
20
15
12
10
0
Cerveja Água Suco Refrigerante
Bebida
Por sua vez, a Figura 4 apresenta um gráfico de barras horizontal para os mesmos
dados referentes às vendas de bebidas de uma determinada lanchonete. É importan-
te destacar que este tipo de gráfico é frequentemente utilizado para variáveis cujas
categorias possuam designações extensas.
Refrigerante 12
Suco 15
Bebida
Água 28
Cerveja 45
0 10 20 30 40 50
Quantidade
Além dos gráficos de barras apresentados, existem outros mais elaborados, por exem-
plo os gráficos de barras compostas e dos gráficos de barras agrupadas.
No gráfico de barras compostas, apresentamos cada barra segmentada em partes
componentes. Observe a Figura 5 que retrata a preferência de conteúdos da internet
entre os sexos feminino e masculino.
Jogos 35 14
Celebridades 12 40
Conteúdo
Esportes 60 18
Homens
Mulheres
Política 15 24
Cultura 20 30
0 20 40 60 80 100
Quantidade
UNIDADE 2 55
14
Jogos 35
Celebridades 40
12
Conteúdo
18
Esportes 60 Homens
24 Mulheres
Política 15
Cultura 30
20
0 10 20 30 40 50 60 70
Quantidade
Gráficos pictóricos
2004
2005
2006
2007
100
89 87
90 82 81
80 73 78
70
69
Quantidade
60
50
62 56
54
40 45
30 34
20
10
0
aio
Fe ro
iro
ço
ril
sto
o
br
br
br
br
nh
lh
Ab
i
ar
ne
re
o
Ju
m
m
m
tu
Ju
M
Ag
ve
Ja
ve
te
ze
Ou
Se
De
No
Mês
Figura 8 - Exemplo de gráfico em linhas
Fonte: a autora.
Além disso, nos gráficos em linhas também é comum termos mais que uma variável
representada. A Figura 9 ilustra a quantidade de smartphones e de tablets vendidos
por uma determinada loja, ao longo dos meses de 2019.
89 87
100 82 81
78
90 73
80 69
70
61
54
Quantidade
60 62 54 52
56
50 40 39
40
45
30 20 32 34 33
20 27
21
10 17
11
0
ril
aio
Fe ro
iro
ço
sto
Ou o
o
br
br
br
br
nh
lh
Ab
i
ar
ne
re
o
Ju
m
m
m
tu
Ju
M
Ag
ve
Ja
ve
te
ze
Se
De
No
Mês
Smartphones Tablets
UNIDADE 2 57
Gráficos em setores
18 20
Pop
Rock
24 Sertanejo
32 Samba
Pagode
12 Funk
7 Eletrônica
40
Diagramas de dispersão
Quantidade
1,2
1
0,8
0,6
0,4
0,2
0
0 20 40 60 80 100
Peso (kg)
Gráficos polares
PRECIPITAÇÃO PLUVIOMÉTRICA
RECIFE – 1993
OUT.
SET. NOV.
DEZ.
AGO.
FEV.
JUN.
MAR.
MAI.
ABR.
UNIDADE 2 59
Gráficos triangulares
0
100%
10
90
20
80
30
70
40
60
50
Matas 50 Lavouras
1 60
40
2
70
30 5
4 80
20
3
90
10
100%
0
100% 90 80 70 60 50 40 30 20 10 0
Pastagens
Histogramas
UNIDADE 2 61
No eixo vertical (y), construímos a escala em que serão lidos os valores relativos
ao número de frequências de classe, de modo que a área de cada retângulo do histo-
grama corresponda à frequência da classe que o retângulo representa.
4 EXEMPLO Considere os dados da altura (cm) dos alunos de uma determinada sala de aula.
154 166 190 163 162 185 184 172 173 182
178 174 178 174 175 176 175 176 176 181
154 − 165 3 15 3
165 − 176 10 50 13
176 − 187 6 30 19
187 − 198 1 5 20
Fonte: a autora.
12
10
10
Frequência absoluta
8
6
6
4
3
2
1
0
[154,165] (165,176] (176,187] (187,198]
Altura (cm)
40%
Frequência relativa
30%
30%
20%
15%
10%
5%
0%
[154,165] (165,176] (176,187] (187,198]
Altura (cm)
250
198
Frequência absoluta
200
150
100 97
85
50 46
32 23
12 7
0
8]
0]
2]
4]
6]
8]
0]
2]
,15
,16
,16
,16
,16
,16
,17
,17
56
58
60
62
64
66
68
70
[1
(1
(1
(1
(1
(1
(1
(1
Altura (cm)
Figura 16 - Exemplo de histograma de distribuição normal
Fonte: a autora.
Polígono de Frequências
UNIDADE 2 63
É importante destacar que este tipo de representação gráfica pode ser utilizada
para referir-se às frequências absolutas ou às frequências relativas. A Figura 17 ilus-
tra a representação gráfica dos dados apresentados no Exemplo 1, por meio de um
polígono de frequências absolutas.
12
10
10
8
Frequência
6 6
4
3
2
1
0
[154,165] (165,176] (176,187] (187,198]
Altura (cm)
Figura 17 - Exemplo de polígono de frequências
Fonte: a autora.
20
19
Frequência acumulada
20
15 13
10
5 3
0
[154,165] (165,176] (176,187] (187,198]
Altura (cm)
Figura 18 - Exemplo de polígono de frequências acumulada
Fonte: a autora.
80 100%
70 90%
70
80%
60
Frequência acumulada
70%
Número de casos
50 46 60%
40 37 50%
30
30 40%
30%
20
20%
10 10%
0 0%
Defeituoso Atraso na Outros Errado
entrega
UNIDADE 2 65
Você pode utilizar seu diário de bordo para a resolução.
66
2. Em estatística, os gráficos são utilizados para representação visual dos dados.
Neste tipo de gráfico, utilizamos segmentos de reta ligados a pontos localizados
diretamente acima dos valores dos pontos médios de classe. De qual gráfico
estamos falando?
a) Gráfico de barras.
b) Histograma.
c) Polígono de frequência.
d) Pictograma.
e) Gráfico de setores.
10 15 100 90 77 55 60 52 47 93
20 75 77 80 74 0 82 69 64 92
85 100 84 85 80 65 63 72 91 89
86 74 87 60 67 84 89 74 65 87
26 100 56 62 100 97 81 76 74 65
67
LIVRO
LIVRO
Estatística básica
Autor: Geraldo Luciano Toledo e Ivo Izidoro Ovalle
Editora: Atlas
Sinopse: essa obra contém a matéria fundamental para estudos subsequentes
no campo da estatística inferencial, pois aborda os tópicos mais importantes da
estatística básica. Seu conteúdo limita-se aos pontos introdutórios dos estudos
estatísticos. Como passo inicial, o texto cuida de uma introdução geral à com-
preensão da estatística. Em seguida, o texto trata de distribuição de frequên-
cias, e em terceiro lugar, focaliza a apresentação gráfica com esclarecimentos
didáticos acerca do assunto.
Comentário: recomenda-se a leitura da parte 2: distribuição de frequências.
68
ABNT. Associação Brasileira de Normas Técnicas. NBR 14.724 – Informação e documentação – trabalhos
acadêmicos – apresentação. ABNT, 2011.
CARVALHO, E. A.; ARAÚJO, P. C. Os dados estatísticos e a representação gráfica. In: CARVALHO, E. A. Leituras
cartográficas e interpretações estatísticas. Natal: EDUFRN, 2008. Disponível em: http://www.ead.uepb.edu.
br/ava/arquivos/cursos/geografia/leituras_cartograficas/Le_Ca_A13_J_GR_260508.pdf. Acesso em: 18 set. 2019.
CONAB. Companhia Nacional de Abastecimento. Prévia Perspectivas para a agropecuária. Brasilia: conab,
2018. Volume 6. Disponível em: https://www.conab.gov.br/images/arquivos/outros/Perspectivas-para-a-
agropecuaria-2018-19.pdf. Acesso em: 18 set. 2019.
CHAMBERS, J. M.; CLEVELAND, W. S.; KLEINER, B.; TUKEY, P. A. Graphical methods for data analysis.
Nova York: Chapman and Hall, 1983.
TOLEDO, G. L.; OVALLE, I. I. Estatística básica. 2. ed. São Paulo: Atlas, 1985.
REFERÊNCIAS ON-LINE
1
Em: https://observatoriocensal.org/2015/11/24/avaliacao-dos-censos-demograficos-brasileiros/. Acesso em:
18 set. 2019.
2
Em: https://agenciadenoticias.ibge.gov.br/agencia-sala-de-imprensa/2013-agencia-de-noticias/releases/
14389-asi-ibge-mapeia-a-populacao-indigena. Acesso em: 18 set. 2019.
3
Em: https://www.fiesp.com.br/indices-pesquisas-e-publicacoes/safra-de-graos-brasil/. Acesso em: 18 set. 2019.
5
Em: http://angloresolve.plurall.net/press/question/1386926. Acesso em: 18 set. 2019.
69
1. D.
2. C.
3. A distribuição de frequências para a nota dos 50 alunos encontra-se ilustrada na Tabela a seguir:
70
71
72
Me. Rebecca Manesco Paixão
Estatística Descritiva:
Medidas de Posição
PLANO DE ESTUDOS
Medidas de Tendência
Central
OBJETIVOS DE APRENDIZAGEM
• Estudar as medidas estatísticas de posição: medidas de • Estudar as medidas de centro: média, mediana e moda.
centro e separatrizes. • Estudar as medidas separatrizes: quartis, decis e percentis.
Medidas
de Posição
Medidas de
tendência Separatrizes
central
Média
aritmética Quartis
Mediana Decis
Moda Percentis
Média Aritmética
UNIDADE 3 75
Assim, para a população, a média aritmética é dada por:
N
xi
i 1
N
20 20 21 21 21 22 22 22 23 23 24 24 25 26
x
14
314
14
22, 428
Logo, podemos concluir que a média aritmética da idade dos alunos é de 22,428 anos.
Por sua vez, trabalhamos com a média aritmética ponderada quando os valores
do conjunto possuem pesos diferentes. Logo, ela pode ser calculada a partir do quo-
ciente entre a somatória do produto dos valores da variável ( xi ) com os respectivos
pesos ( wi ), pela somatória dos pesos, ou seja:
n
xi wi
i 1
x n
wi
i 1
1
1 = 0 ,1
10
2
2 = 0, 2
10
3
3 = 0, 3
10
4
4 = 0, 4
10
Fonte: a autora.
Por meio da Tabela 1, podemos inferir que a primeira prova terá peso 0,1; a segunda
prova peso 0,2; a terceira prova peso 0,3; e a quarta prova peso 0,4.
Considerando que Maria tenha tirado as seguintes notas: 8, 7, 9 e 6, respectiva-
mente nas 4 provas, a sua nota final será a média aritmética ponderada, dada por:
(8 0, 1) (7 0, 2) (9 0, 3) (6 0, 4)
x
0, 1 0, 2 0, 3 0, 4
0, 8 1, 4 2, 7 2, 4
1
7, 3
Além disso, também podemos calcular a média quando tivermos uma distribuição
de frequências, por meio da fórmula:
n
xj f j
j 1
x n
fj
j 1
UNIDADE 3 77
3 EXEMPLO A Tabela 2 ilustra a distribuição de frequências para a idade dos médicos de um
hospital.
Tabela 2 - Distribuição de frequências para a idade dos médicos de um hospital
24 − 30 27 6
30 − 36 33 15
36 − 42 39 20
42 − 48 45 17
48 − 54 51 2
Fonte: a autora.
( xi x ) 0
Em nosso estudo sobre média, observamos que ela é sensível a qualquer valor que
seja discrepante no conjunto de dados (ou também denominado de outlier). Logo,
nestes casos, a mediana pode ser utilizada e corresponde ao valor central ou à média
aritmética dos valores centrais de um conjunto de observações, organizados em rol,
seja em ordem crescente ou decrescente.
Neste estudo, iremos denotar a mediana por x .
“Um valor discrepante (outlier) é uma entrada de dados que está muito afastada
das outras entradas em um conjunto de dados”.
Fonte: Larson e Farber (2010, p. 58).
n n 1
culo da média dos dois números centrais, ou seja, x 1 ;
2 2 2
n 1
mente no centro da lista, ou seja, x .
2
UNIDADE 3 79
4 EXEMPLO Considerando os dados do Exemplo 1, sobre a idade dos alunos do segundo período
de Engenharia e dispondo-os em ordem crescente, obtemos o seguinte conjunto de
dados:
20 20 20 21 21 21 22 22 23 23 24 24 25 26
22 22
x
2
22
5 EXEMPLO Considere o seguinte conjunto de dados sobre as temperaturas diárias (ºC) registradas
ao longo de uma semana, dispostos em ordem crescente.
22,5 24 25 27 27,5 28 32
n
f AC Md 1 h
2
x lMd
f Md
Em que:
lMd é o limite inferior da classe Md.
n é o tamanho da amostra.
h é a amplitude da classe.
f Md é a frequência absoluta da classe Md.
f ACMd −1 é a frequência acumulada da classe anterior à Md.
35 − 45 5 5
45 − 55 12 17
55 − 65 18 35
65 − 75 14 49
75 − 85 6 55
85 − 95 3 58
Fonte: a autora.
n
Para o cálculo da mediana, temos que n = 58 , logo = 29 . Assim, temos que a classe
2
Md é a terceira.
Aplicando os dados na fórmula, teremos que a mediana será:
58
17 10
2
x 55
18
(29 17) 10
55
18
120
55
18
61,667
Isso significa que 50% das pessoas que estavam na missa possuem idades abaixo de
61 anos.
UNIDADE 3 81
Moda
Chamamos de moda aquele valor que aparece com maior frequência no conjunto
de dados. A moda, neste estudo, será denotada pelo símbolo x .
É importante destacar que, quando dois valores aparecem com a mesma maior
frequência, cada um é uma moda, assim, dizemos que o conjunto de dados é bimodal.
Quando mais de dois valores ocorrem com a mesma maior frequência, cada um é
uma moda e o conjunto de dados é dito multimodal.
Quando, no conjunto de dados, nenhum valor se repete, dizemos que não há
moda ou que o conjunto é amodal.
7 EXEMPLO Considerando os dados do Exemplo 1, sobre a idade dos alunos do segundo período
de Engenharia, temos que as idades 20 e 21 anos são, ambas, modas, porque ocorrem
com a mesma maior frequência.
8 EXEMPLO Considere o seguinte conjunto de dados sobre o peso de moedas (g) de 50 centavos:
9,0 9,1 8,9 9,2 9,1 9,3 9,3 9,4 8,8 9,3
9,3 9,6 8,6 8,8 9,3 9,1 9,0 9,3 9,3 9,3
8,6 8,8 8,8 8,9 9,0 9,0 9,1 9,1 9,1 9,2
9,3 9,3 9,3 9,3 9,3 9,3 9,3 9,3 9,4 9,6
Logo, a moda é 9,3 porque é o valor que aparece com maior frequência.
Além disso, dentre as medidas de centro estudadas até o momento, a moda é a
única que se aplica a valores qualitativos. Observe o Exemplo 9.
9 EXEMPLO Uma pesquisa buscou identificar qual era o sabor preferido de sorvete pelas crianças;
para isso, foram entrevistadas 18 crianças.
Os resultados foram: 7 votos para morango, 4 votos para chocolate, 3 votos para
creme, 3 votos para milho e 1 voto para limão.
Assim, a partir da pesquisa, podemos inferir que a moda é morango, por ter apre-
sentado mais votos de preferência.
Neste caso, não poderíamos calcular média ou mediana, pois as entradas não são
numéricas.
x^ lMo
f Mo - f Mo-1 h
( f Mo - f Mo-1 ) ( f Mo - f Mo1 )
Em que:
lMo é o limite inferior da classe Mo.
h é a amplitude da classe Mo.
f Mo−1 é a frequência absoluta da classe anterior à Mo.
f Mo é a frequência absoluta da classe Mo.
f Mo+1 é a frequência absoluta da classe posterior Mo.
0, 5 − 0, 8 4
0, 8 − 1,1 4
1, 1 − 1, 4 7
1, 4 − 1, 7 1
Fonte: a autora.
Por meio dos dados apresentados na Tabela 4, temos que a classe Mo é a terceira.
UNIDADE 3 83
Aplicando os dados na fórmula, a moda será:
x^ = 1, 1 +
( 7 − 4 ) ⋅ 0, 3
( 7 − 4 ) + (7 − 1)
3 ⋅ 0, 3
= 1, 1 +
3+6
0, 9
= 1, 1 +
9
= 1, 2
x^ = 3 ⋅ x − 2 ⋅ x
Atenção! Esta fórmula nos dá um valor aproximado da moda, e só deve ser utilizada
quando a distribuição de frequências apresenta simetria com relação à média.
Quartis
Fonte: a autora.
UNIDADE 3 85
Logo, temos que:
• 1º Quartil ( Q1 ): valor que possui 25% dos dados à esquerda e 75% à direita.
• 2º Quartil ( Q2 ): valor que possui 50% dos dados à esquerda e 50% à direita.
• 3º Quartil ( Q3 ): valor que possui 75% dos dados à esquerda e 25% à direita.
IQR Q3 Q1
Atente-se que o IQR é uma medida de variação que nos dá uma ideia de quanto
50% dos dados varia. Além disso, segundo Larson e Farber (2010), em um conjunto
de dados, qualquer valor que seja maior que 1, 5 IQRs à esquerda de Q1 ou à direi-
ta de Q3 é considerado um valor discrepante.
25 45 5 30 23 65 47 89 72 71 85 42 45 63 81
5 23 25 30 42 45 45 47 63 65 71 72 81 85 89
P 0, 25 (15 1) 0, 25 16 4
Ou seja, Q1 = 30
O terceiro quartil ( Q3 ) encontra-se na posição 12, pois:
P 0, 75 (15 1) 0, 75 16 12
Ou seja, Q3 = 72
Assim, podemos calcular a amplitude interquartil, que será:
IQR 72 30
42
Decis correspondem aos valores que dividem um conjunto de dados em dez partes
iguais. Podem ser obtidos, conforme o Quadro 2:
Quadro 2 - Decis
Fonte: a autora.
Percentis
UNIDADE 3 87
Atente-se que, na estatística, muitas vezes, os percentis são utilizados para iden-
tificar valores que sejam excepcionalmente baixos ou altos, dentro de um conjunto
de dados, como nas notas de provas ou nas medidas de crescimento de crianças
(LARSON; FARBER, 2010).
Quadro 3 - Percentis
Fonte: a autora.
Atente-se que para dados em rol, o cálculo das medidas separatrizes é dado por:
Sk xl p Fp ( xl p 1 xl p )
O segundo quartil (Q2) é igual ao quinto decil (D5), que é igual ao quinquagésimo
percentil (P50) que, por sua vez, é igual a mediana do conjunto de dados.
18 19 20 21 21 22 24 24 25 27 30 33 38
30 27 3
Assim, o quartil será o menor valor somado ao produto da parte decimal pela dife-
rença encontrada:
Q3 27 (0, 5 3)
27 1, 5
28, 5
Dessa forma, podemos concluir que 75% dos indivíduos possuem idade inferior a
28,5 anos.
Por sua vez, quando temos distribuição de frequências em classes, o cálculo das
separatrizes é feito por meio da seguinte fórmula:
p fACi −1 ) h
Sk li
fi
Em que:
li é o limite inferior.
h é a amplitude da classe da separatriz.
fi é a frequência absoluta da classe da separatriz.
f ACi−1 é a frequência acumulada da classe anterior à da separatriz.
n
p k , com k = 1, 2, 3 para determinação dos quartis.
4
n
p k , com k = 1, 2, , 9 para determinação dos decis.
10
n
p k , com k = 1, 2, , 99 para determinação dos percentis.
100
UNIDADE 3 89
13 EXEMPLO Considere a distribuição de frequências para a idade de um grupo de indivíduos,
disposta na Tabela 5, e determine o 72º percentil.
Tabela 5 - Distribuição de frequências para a idade de um grupo de indivíduos
Idade dos indivíduos (anos) Frequência absoluta ( fi ) Frequência acumulada ( fAC )
4 −9 8 8
9 −1 4 12 20
14 − 19 17 37
19 − 24 3 40
Fonte: a autora.
40
P 72 0, 4 72 28, 8
100
P72 14
28, 8 20 5 14 2, 59 16, 59
17
Assim, podemos concluir que 72% do grupo de indivíduos possui idade inferior a
16,59 anos.
1. Considere o seguinte conjunto de dados para a idade (anos) das pessoas que
frequentaram um show de rock:
30 20 25 26 32 28 37 25 26
22 24 39 47 24 25 21 24 24
31 32 24 29 28 24 24 23 21
0,5 − 0,8 4 4
0,8 − 11
, 4 8
11
, − 1, 4 7 15
1,4 − 17
, 1 16
91
3. Assinale a alternativa que contenha o trigésimo percentil ( P30 ) para a distribui-
ção de frequências:
5 −2 5 4 4
25 − 45 6 10
45 − 65 14 24
65 − 85 26 50
85 − 105 14 64
105 − 125 8 72
125 − 145 6 78
145 − 165 2 80
a) 25.
b) 40.
c) 45.
d) 65.
e) 80.
92
LIVRO
Introdução à estatística
Autor: Mario F. Triola
Editora: LTC
Sinopse: um livro introdutório de estatística que inclui um estilo de escrita
amigável, conteúdo que reflete as características importantes de um curso
introdutório moderno de estatística, o uso da tecnologia computacional mais
recente, de conjuntos de dados interessantes e reais, e abundância de compo-
nentes pedagógicos. O CD-ROM inclui os conjuntos de dados do Apêndice B do
livro. Esses conjuntos de dados encontram-se armazenados em formato texto,
planilhas do Minitab, planilhas do Excel e uma aplicação para a calculadora TI-83.
Inclui também programas para a calculadora gráfica TI-83 Plus®, o Programa
Estatístico STATDISK (Versão 9.1) e um suplemento do Excel, desenvolvido para
aumentar os recursos dos programas estatísticos do Excel.
WEB
93
CARNIEL, I. G. Estatística. Maringá: Centro Universitário de Maringá, 2014.
CATANHEIRA, N. P. Estatística aplicada a todos os níveis. 2. ed. Curitiba: InterSaberes, 2018.
LARSON, R.; FARBER, B. Estatística aplicada. 4. ed. São Paulo: Pearson Prentice Hall, 2010.
TOLEDO, G. L.; OVALLE, I. I. Estatística básica. 2. ed. São Paulo: Atlas, 1985.
TRIOLA, M. F. Introdução à estatística. 10. ed. Rio de Janeiro: LTC, 2008.
94
1. Considerando o conjunto de dados sobre a idade das pessoas que frequentaram um show de rock, temos
que:
Mediana: 25
Moda: 24
16
P 7 11, 2
10
Logo, D7 encontra-se na terceira classe:
(11, 2 8) 0, 3
D7 1, 1 1, 24
7
3. D.
80
P 30 24
100
Logo, P30 encontra-se na terceira classe:
(24 10) 20
P30 45 65
14
95
96
Me. Rebecca Manesco Paixão
Estatística Descritiva:
Medidas de Variação, de
Assimetria e de Curtose
PLANO DE ESTUDOS
OBJETIVOS DE APRENDIZAGEM
• Estudar as medidas de variação: amplitude total, desvio • Compreender medidas de variação relativa: coeficiente
médio, variância e desvio padrão. de variação e escore z.
• Estudar medidas de assimetria e de curtose.
Medidas
de Variação
45
40
Tempo de espera (min)
35
30
25
20
15
10
5
0
1 2 3 4 5
Cliente
A B C
Figura 1 - Tempo de espera (min) para atendimento dos clientes pelos gerentes dos bancos A, B e C
Fonte: a autora.
As medidas de variação que nos interessam, neste estudo, são: amplitude total, desvio
médio, variância e desvio padrão.
UNIDADE 4 99
Amplitude Total
AT xmax xmin
Em que:
xmax é o maior valor do conjunto de dados.
xmin é o menor valor do conjunto de dados.
2 EXEMPLO Calcule a amplitude total para os dados apresentados no Exemplo 1, sobre o tempo
de espera para atendimento nos bancos A, B e C.
Para o banco A, temos que:
ATA 20 20 0
ATB 23 15 8
ATC 40 5 35
20 −30 25 12
30 −40 35 20
40 −50 45 14
50 −60 55 10
60 −70 65 4
Fonte: a autora.
AT 65 15 50
ou, também, podemos calcular a amplitude total pelo segundo método, considerando
o limite superior da última classe e o limite inferior da primeira classe. Assim:
AT 70 10 60
Desvio Médio
O desvio médio é igual à média aritmética dos valores absolutos dos desvios toma-
dos em relação à média. Para dados brutos, temos que o desvio médio, com relação
à média, é calculado por:
n
xi x
i 1
DM
n
UNIDADE 4 101
4 EXEMPLO Considerando o seguinte conjunto de dados sobre o tempo gasto (min) para a exe-
cução de uma determinada tarefa:
17 18 19 20 21 22 23
17 18 19 20 21 22 23
x
7
140
7
20
xi x 12
12
DM =
7
= 1, 714
n
x j x f j
j 1
DM
n
(15 5) (25 12) (35 20) (45 14) (55 10) (65 4)
x
5 12 20 14 10 4
75 300 700 630 550 260
65
2515
65
38, 69
xj x fj 713,26
713, 26
DM =
65
= 10, 97
Variância
A variância é uma medida de variação que considera todos os valores dos dados no
cálculo, a partir do quadrado dos desvios em relação à média aritmética dos dados.
A variância para uma população é dada por:
N
( xi µ)2
σ2 i 1
N
UNIDADE 4 103
Por sua vez, a variância para uma amostra é dada por:
N
( xi x )2
s2 i 1
n 1
5 7 8 10 10
xi xi x xi x
2
5 5-8=-3 (-3)2=9
7 7-8=-1 (-1)2=1
8 8-8=0 0
10 10-8=2 (2)2=4
10 10-8=2 (2)2=4
2
xi x 18
18
s2 =
4
= 4, 5
Portanto, a variância dos dados é 4,5 anos2.
A partir do Exemplo 6, notamos que a unidade de variância é dada em unidades
quadráticas, sendo a mesma da característica avaliada; no caso, em anos2. Isso acaba
por dificultar a interpretação da variância, de forma que o problema é resolvido por
meio da extração da raiz quadrada, resultando no que chamamos de desvio padrão.
O desvio padrão nos dá a ideia da distribuição dos desvios em torno da média. Como
dito anteriormente, ele é obtido a partir da raiz quadrada do resultado da variância.
Assim, o desvio padrão da população é dado por:
N
( xi µ)2
i 1
σ
N
N
( xi x )2
i 1
s
n 1
=s s2
= 4, 5 = 2, 12
Portanto, o desvio padrão é 2,12 anos. Isso significa que a dispersão média entre a
idade dos cachorros é de 2,12 anos.
Também é possível calcularmos o desvio padrão para dados tabelados. Para tanto,
fazemos o uso da seguinte fórmula:
s
( x j x )2 f j
n 1
UNIDADE 4 105
8 EXEMPLO Considerando a distribuição de frequências para o consumo de energia elétrica (kwh):
Tabela 2 - Distribuição de frequências para o consumo de energia
5 −2 5 15 4
25 − 45 35 6
45 − 65 55 14
65 − 85 75 26
85 − 105 95 10
Fonte: a autora.
A média é:
(15 4) (35 6) (55 14) (75 26) (95 10)
x
4 6 14 26 10
60 210 770 1950 950
60
3940
60
65, 67
Logo, podemos calcular o desvio padrão da seguinte forma:
(x j x ) ( x j x )2 (x j x )2 f j
15-65,67=-50,67 (-50,67)2=2567,11 2567,11•4=10268,44
35-65,67=-30,67 (-30,67)2=940,44 940,44•6=5642,67
55-65,67=-10,67 (-10,67) =113,78
2
113,78•14=1592,89
75-65,67=-9,33 (9,33)2=87,11 87,11•26=2264,89
95-65,67=-29,33 (29,33)2=860,44 860,44•10=8604,44
(x j x )2 f j 28373, 33
28373, 33
s
59
480, 90
21, 93
AT
s≈
4
99,7% com
3 desvios padrão
95% com
2 desvios padrão
68% com
1 desvio padrão
34% 34%
2,35% 2,35%
13,5% 13,5%
x– – 3s x– – 2s x– – s x– x– + s x– + 2s x– + 3s
Figura 2 - Distribuição em forma de sino
Fonte: Bonafini (2012, p. 32).
UNIDADE 4 107
Ainda, há um terceiro conceito útil na interpreta-
ção do valor de um desvio padrão, que é o Teore-
ma de Chebyshev, em homenagem ao estatístico
russo Pafnuti Chebychev (1821 – 1894), que se
aplica a qualquer conjunto de dados do qual não
conhecemos o modelo de distribuição (TRIOLA,
2008; BONAFINI, 2012).
O referido Teorema nos diz que a proporção
de qualquer conjunto de dados que se situa a K
desvios padrões da média é sempre, no mínimo,
1 − 1 / K 2 , em que K > 1 . Para K = 2 e K = 3 ,
respectivamente, temos que:
• Pelo menos 75% de todos os valores se lo-
calizam a 2 desvios padrões da média.
• Pelo menos 89% de todos os valores se lo-
calizam a 3 desvios padrões da média.
Coeficiente de Variação
UNIDADE 4 109
9 EXEMPLO Considerando o seguinte conjunto de dados para o peso (kg) de homens:
73 73 74 77 77 84 87 88 88 91
73 73 74 77 77 84 87 88 88 91
x
10
812
10
81, 2
xi xi x xi x
2
73 73-81,2=-8,2 (-8,2)2=67,24
73 73-81,2=-8,2 (-8,2)2=67,24
74 74-81,2=-7,2 (-7,2)2=51,84
77 77-81,2=-4,2 (-4,2)2=17,64
77 77-81,2=-4,2 (-4,2)2=17,64
84 84-81,2=2,8 (2,8)2=7,84
87 87-81,2=-5,8 (5,8)2=33,64
88 88-81,2=6,8 (6,8)2=46,24
88 88-81,2=68 (6,8)2=46,24
91 91-81,2=9,8 (9,8)2=96,04
2
xi x 4516
,
451, 6
s=
9
= 50, 17
= 7, 08
7, 08
CV 100% 8, 72%
81, 2
xµ
Para a população, o escore z é calculado por: z
σ
xx
Para a amostra, o escore z é calculado por: z
s
Valores não usuais tem escores z menores do que -2 ou maiores do que +2, ou
seja: escore z 2 ou escore z 2.
10 EXEMPLO Segundo Triola (2008), Lyndon Johnson foi o presidente mais alto do último século,
com altura de 215,9 cm. Os presidentes do século passado tinham alturas médias de
181,6 cm e desvio padrão de 5,34 cm.
Podemos calcular o escore z da seguinte forma:
215, 9 181, 6
z
5, 34
34, 6
5, 34
6, 42
Logo, a altura de Lyndon Johnson está 6,42 desvios padrões acima da média.
Podemos interpretar o escore z como uma medida de posição, de modo que
ele descreve a localização de um valor com relação à média. Logo, um escore z = 3
indica que um determinado valor encontra-se três desvios padrões acima da
média; enquanto que um escore z 3 indica que um valor está três desvios
padrões abaixo da média. Também podemos ter z = 0 , o que significa que o valor
x é igual a média.
UNIDADE 4 111
Medidas de Assimetria
e de Curtose
Medidas de Assimetria
25
20 20
20
15
10
10 10
0
a b c d e
Turmas
Figura 4 - Exemplo de distribuição de dados simétricos
Fonte: a autora.
UNIDADE 4 113
A partir do resultado, podemos inferir que:
• Se AS < 0 a distribuição será assimétrica à esquerda.
• Se AS = 0 a distribuição será simétrica.
• Se AS > 0 a distribuição será assimétrica à direita.
Q1 Q3 2 x
AS
Q3 Q1
10 − 20 15 5
20 − 30 25 10
30 − 40 35 15
40 − 50 45 20
50 − 60 55 5
Fonte: a autora.
(20 − 15) ⋅ 10
x^ = 40 +
(20 − 15) + (20 − 5)
50
= 40 +
20
= 40 + 2, 5
= 42, 5
(x j x )2 f j 6818, 05
6818, 05
s
54
126, 26
11, 24
36, 82 42, 50
AS
11, 24
5, 68
11, 24
0, 51
UNIDADE 4 115
Medidas de Curtose
A medida de curtose nos indica até que ponto a curva de frequências de uma dis-
tribuição é mais achatada ou aguda do que uma curva-padrão, denominada de curva
normal. Podemos ter três tipos de curvas, de acordo com o grau de curtose:
• Curva mesocúrtica: quando a curva de frequências apresenta um grau de
achatamento equivalente ao da curva normal.
• Curva platicúrtica: quando a curva de frequências apresenta alto grau de
achatamento, superior ao da curva normal. Em curvas deste tipo, há várias
classes com frequências similares.
• Curva leptocúrtica: quando a curva de frequências apresenta alto grau de
afilamento, superior ao da curva normal. Neste tipo de curva, os valores en-
contram-se mais agrupados em torno da moda.
LEPTOCÚRTICA
MESOCÚRTICA
PLATICÚRTICA
Q3 Q1
k
2 ( P90 P10 )
3 55
30 10
4
Q3 40
20
(41, 25 30)
40
2
11, 25
40
2
40 5, 625
=45,625
55
100 10 5 10
P10 20
10
20 (5, 50 5)
20 0,550
20, 50
UNIDADE 4 117
Para o 90 percentil, temos que:
55
100 90 30 10
P90 40
20
(49, 5 30)
40
2
19, 50
40
2
40 9, 75
49, 75
3 −5 25
5 −7 18
7 −9 9
9 −11 4
2. Em uma indústria, o salário médio dos homens é de R$ 4.000,00 com desvio pa-
drão de R$ 2.000,00, enquanto que o salário médio das mulheres é de R$ 3.500,00
com desvio padrão de R$ 1.700,00. Sabendo disso, avalie se a dispersão relativa
dos salários é maior para os homens ou para as mulheres.
3. Considerando que uma distribuição apresentou média igual a 18, moda igual a
20 e desvio padrão igual a 6, leia as afirmações que seguem:
I) O coeficiente de assimetria é 0,77.
II) O coeficiente de assimetria é -0,33.
III) A distribuição é assimétrica à esquerda.
IV) Nada podemos afirmar sobre a simetria dos dados.
119
LIVRO
120
BONAFINI, F. C. Estatística. São Paulo: Pearson Education do Brasil, 2012.
LOPES, L. F. D. Apostila estatística. Santa Maria: UFSM, 2003. Disponível em: http://www.inf.ufsc.br/~vera.
carmo/LIVROS/LIVROS/Luis%20Felipe%20Dias%20Lopes.pdf. Acesso em: 19 set. 2019.
MARTINS, G. A. Estatística geral e aplicada. 3. ed. São Paulo: Editora Atlas, 2010.
TOLEDO, G. L.; OVALLE, I. I. Estatística básica. 2. ed. São Paulo: Atlas, 1985.
121
1. A média é:
(x j x ) ( x j x )2 (x j x )2 f j
(x j x )2 f j 348,80
348, 80
s=
69
= 5, 05
= 2, 25
122
Para as mulheres, o coeficiente de variação é:
1200
CV 100%
3800
0, 31 100%
31%
Logo, podemos concluir que os salários dos homens têm dispersão relativa maior do que o das mulheres.
Apenas as afirmações II e III estão corretas. Calculando o coeficiente de assimetria, temos que:
18 20
AS
6
2
6
0, 33
123
124
Me. Rebecca Manesco Paixão
Probabilidade
PLANO DE ESTUDOS
OBJETIVOS DE APRENDIZAGEM
W k , c
P( A) c
UNIDADE 5 127
• Abordagem clássica da probabilidade (método clássico):
Nesta abordagem, supomos que um determinado experimento tenha n diferentes
eventos simples, e que cada um destes tenha igual chance de ocorrer. Se o evento A
pode ocorrer em s dessas n formas, então:
1
P(4) =
6
A lei dos grandes números afirma que quando um experimento é repetido por
diversas vezes, a probabilidade empírica de um evento ocorrer se aproxima de sua
probabilidade real.
2 EXEMPLO Qual a probabilidade dos filhos de um casal serem duas meninas e um menino?
Para resolvermos este exemplo, precisamos, primeiramente, identificar o espaço
amostral:
1 Menino Menino Menino
2 Menina Menina Menina
3 Menino Menino Menina
4 Menino Menina Menino
5 Menino Menina Menina
128 Probabilidade
Podemos inferir que das oito possibilidades diferentes, três delas correspondem a
duas meninas e um menino. Assim:
3
P( 2 meninas e 1 menino)= = 0, 375
8
3 EXEMPLO Uma revendedora online entrevistou 200 clientes para saber se eles estavam satis-
feitos com o tempo de entrega dos produtos. 150 clientes responderam que estavam
satisfeitos, enquanto 50 responderam que estavam insatisfeitos.
Qual a probabilidade de que o próximo cliente entrevistado esteja insatisfeito
com o tempo de entrega?
Temos que a frequência do evento “insatisfeito” é 50. Logo, a probabilidade empírica
do próximo cliente estar insatisfeito com o tempo de entrega é de:
50 1
P(insatisfeito
= ) = = 0, 25
200 4
UNIDADE 5 129
Operações
com Eventos
Regra da Adição
de Probabilidades
130 Probabilidade
Na teoria dos conjuntos, o símbolo U corresponde à união; na aritmética, corres-
ponde à soma; e na álgebra boolena, corresponde à disjunção “OU”.
Fonte: Castanheira (2018).
P( A B) P( A) P( B)
P (A) P (B)
P (A) P (B)
P (A e B)
UNIDADE 5 131
4 EXEMPLO Considerando W 1, 2, 3, 4, 5, 6 , A 2, 4, 6 e B 4, 5, 6
Temos que:
A B 2, 4, 6 4, 5, 6
2, 4, 5, 6
A B 2, 4, 6 4, 5, 6
4, 6
5 EXEMPLO Considerando que tenham sido lançadas duas moedas, e que sejam os eventos A
“saída de faces iguais” e B “saída de cara na primeira moeda”. Temos que:
A k , k , c, c
B k , c , k , k
P( A B) k , k
P( A B) k , k , c, c , k , c
Eventos Complementares
P ( A) P( A) 1
P ( A) 1 P( A)
P( A) 1 P( A)
132 Probabilidade
6 EXEMPLO Na maternidade de um hospital, durante uma semana, nasceram 300 bebês: 180 me-
ninos e 120 meninas. Se um bebe for escolhido aleatoriamente, qual a probabilidade
de que não seja menino?
Temos que:
180
P(menino)=
300
= 0,6
Portanto,
P(menina) =1 -P (menino)
=1-0,6
=0,4
Dessa forma, podemos concluir que a probabilidade do bebê não ser menino é de 40%.
UNIDADE 5 133
Probabilidade Condicional
e Independência Estatística
P( A B) P A B
P( A B)
P( B) P( B)
134 Probabilidade
A partir desta relação, obtemos a regra formal da multiplicação de probabilidades:
P A B P( B) P( A B)
7 EXEMPLO Qual a probabilidade de, ao retirar uma carta de um baralho convencional, ser “uma
dama vermelha”, dado que a carta retirada foi uma “figura”?
Para encontrarmos a probabilidade desejada, precisamos fazer algumas consi-
derações:
• O baralho convencional possui 52 cartas; logo o espaço amostral é 52.
• O baralho convencional possui 12 figuras (valete, dama ou rei).
2
P( A B) , uma vez que no baralho existem duas damas vermelhas, as quais
52
UNIDADE 5 135
8 EXEMPLO Ao lançar simultaneamente um dado de seis faces e uma moeda, a probabilidade de
obter um “dois” e uma “cara” é de:
Para o dado, temos que W 1, 2, 3, 4, 5, 6 e que A 2
1
Logo, P(A) =
6
Para a moeda, temos que W c, k e que B k
1
Logo, P ( B ) =
2
Os eventos são independentes e, assim, a probabilidade será dada por:
P( A B) P( A B)
P( A) P( B)
1 1
6 2
1
12
0, 083
9 EXEMPLO Uma urna contém 5 bolas (2 vermelhas e 3 azuis). Sorteamos 2 bolas ao acaso sem
reposição, ou seja, sorteamos a primeira bola, verificamos sua cor e não a devolvemos
à urna; na sequência, sorteamos a segunda bola e verificamos sua cor.
A Figura 3 ilustra o diagrama de árvore para as probabilidades das cores das bolas
sorteadas sem reposição.
136 Probabilidade
1/4
2/5
3/4
2/4
3/5
2/4
Figura 3 - Diagrama de árvore para a retirada das bolas da urna sem reposição
Fonte: a autora.
3 2 6
5 4 20
3 2 6
5 4 20
Fonte: a autora.
UNIDADE 5 137
b) Qual a probabilidade de retirar a bola ver-
melha na segunda extração?
2 6
P (VV ) P ( AV )
20 20
8
20
0, 4
Assim, a probabilidade de retirar a bola vermelha
na segunda extração é de 0,4.
Probabilidade: experimento aleatório
c) Qual a probabilidade de retirar a bola azul, dado que a primeira foi vermelha?
2 3
Temos que P (V ) = e que P ( A) =
5 4
3
P( A V ) =
4
= 0, 75
Assim, a probabilidade de retirar a bola azul, dado que a primeira foi vermelha é de 0,75.
10 EXEMPLO Uma urna contém 5 bolas (2 vermelhas e 3 azuis). Sorteamos 2 bolas ao acaso com
reposição, ou seja, sorteamos a primeira bola, verificamos sua cor e a devolvemos à
urna; na sequência, sorteamos a segunda bola e verificamos sua cor.
A Figura 4 ilustra o diagrama de árvore para as probabilidades das cores das bolas
sorteadas com reposição.
138 Probabilidade
2/5
2/5
3/5
2/5
3/5
3/5
Figura 4 - Diagrama de árvore para a retirada das bolas da urna com reposição.
Fonte: a autora.
UNIDADE 5 139
b) Qual a probabilidade de retirar a bola azul, dado que a primeira foi vermelha?
3
P( A V ) =
5
= 0, 6
Assim, a probabilidade de retirar a bola azul, dado que a primeira foi vermelha é de 0,6.
Teorema de Bayes
Vimos que:
P( A B) P( B) P( A B) ou P( A B) P( A) P( B A)
P( A) P( B A) P( B) P ( A B )
P( A) P( B A)
P( A B)
P( B)
P (B K ) P (A B K )
P(B K A) n
P( Bi ) P(A Bi )
i 1
11 EXEMPLO Temos cinco urnas, cada uma com seis bolas. Duas dessas urnas (tipo C1 ) têm 3 bolas
brancas; duas outras (tipo C2 ) têm 2 bolas brancas; e a última urna (tipo C3 ) tem
6 bolas brancas. Escolhemos uma urna ao acaso e dela retiramos uma bola. Qual a
probabilidade de a urna escolhida ser do tipo C3 , sabendo-se que a bola sorteada é
branca?
140 Probabilidade
Urna
C1 C2 C3
1 2 3 4 5
C
o B
r
Bc
Ω
Figura 5 - Espaço amostral e eventos para o Exemplo 11
Fonte: Bussab e Morettin (2010, p. 116).
UNIDADE 5 141
Contagem
142 Probabilidade
Princípio Fundamental da Contagem
Regra do Fatorial
13 EXEMPLO Em uma visita ao parque de diversões “Beto Carreiro World”, você deseja ir em quatro
atrações: Big Tower, Firewhip, Raskapuska e Star Mountain. Quantas rotas diferentes
são possíveis?
Aplicando a regra do fatorial, existem 4! rotas possíveis para visitar as atrações.
4 ! 4 3 2 1 24
UNIDADE 5 143
Regra das Permutações
(Quando Todos os Itens São Diferentes)
n!
n Pr
(n r )!
14 EXEMPLO De quantas maneiras podemos formar códigos de seis dígitos, de modo que nenhum
seja repetido?
Temos que n = 10 (ou seja, os dígitos podem ser 0, 1, 2, 3, 4, 5, 6, 7, 8 ou 9) e que
r = 6 , logo o número de diferentes sequências de arranjos é de:
10 !
10 P6
(10 6)!
10 9 8 7 6 5 4 3 2 1
4 3 2 1
3628800
24
151200
Isto é, existem 151.200 maneiras possíveis nas quais o código de seis dígitos não
tenha dígitos repetidos.
Esta regra é utilizada quando há um total de n itens disponíveis, e alguns são iguais
a outros. Consideramos os rearranjos de itens distintos como sequências diferentes.
Assim, se há n1 iguais entre si, n2 iguais entre si, , nk iguais entre si, o número
de permutações de todos os n itens selecionados sem reposição é:
n!
n1 !n2 ! nk !
144 Probabilidade
15 EXEMPLO Em uma determinada quadra, uma loteadora deseja construir três casas térreas,
quatro sobrados e uma casa com vários planos. De quantas maneiras diferentes, as
casas podem ser organizadas na quadra?
Temos que, na quadra, serão construídas oito casas, das quais três serão térreas,
quatro sobrados e uma com vários planos, e que a ordem de construção não importa.
Assim:
8! 8 7 6 5 4 3 21
4 ! 3! 1! 4 3 21 3 21 1
40320
=
24 6
40320
144
280
Esta regra é utilizada quando há n diferentes itens disponíveis, de modo que a or-
dem não é importante. Neste caso, considera-se as reorganizações dos mesmos itens
como sendo a mesma; por exemplo: a combinação ABC é igual à combinação CBA.
O número de combinações de r itens escolhidos (sem reposição) dentre n itens
diferentes é:
n!
n Cr
(n r )!r!
UNIDADE 5 145
16 EXEMPLO A professora de ciências deseja selecionar alunos para serem monitores de classe. 15
alunos se candidatam, mas só existem 5 vagas para o cargo. Quantas combinações
diferentes de 5 alunos podemos selecionar dos 15 candidatos?
Temos que n = 15 e r = 5 . Como a ordem não é importante, podemos calcular
as combinações possíveis da seguinte forma:
15!
15 C5
(15 5)! 5!
15 14 13 12 11 10 9 8 7 6 5 4 3 2 1
(10 9 8 7 6 5 4 3 2 1) (5 4 3 2 1)
1307674368000
3628800 120
3003
Logo, existem 3.003 combinações diferentes de 5 alunos serem selecionados, dentre
os 15 candidatos ao cargo de monitor de ciências.
Nos Exemplos 17 e 18, abordaremos a aplicação da contagem em problemas que
envolvam probabilidade.
17 EXEMPLO A palavra MISSISSIPPI tem 11 letras: um M, quatro I, quatro S e dois P. Se essas letras
forem organizadas em ordem aleatória, qual a probabilidade de formarmos a própria
palavra MISSISSIPPI?
Por definição, temos que as permutações distinguíveis podem ser calculadas da
seguinte forma:
11! 11 10 9 8 7 6 5 4 3 2 1
1! 4 ! 4 ! 2 ! (1) (4 3 2 1) (4 3 2 1) (2 1)
39916800
1 24 24 2
39916800
1152
34650
146 Probabilidade
Para encontrarmos a probabilidade das letras dispostas em ordem aleatória formarem
a palavra MISSISSIPPI, fazemos:
1
P ( MISSISSIPPI ) =
34650
= 0, 00002886
UNIDADE 5 147
Você pode utilizar seu diário de bordo para a resolução.
148
LIVRO
149
BUSSAB, W. O.; MORETTIN, P. A. Estatística Básica. 6. ed. São Paulo: Saraiva, 2010.
MONTGOMERY, D. D.; RUNGER, G. C. Estatística aplicada e probabilidade para engenheiros. 4. ed. São
Paulo: LTC, 2006.
150
1. Temos que o espaço amostral é:
W 1, 2, 3, 4, 5, 6
A 1, 2, 3
3 1
Logo, P(A)= = = 0, 5
6 2
2. A.
E o evento é “retirar uma figura”. Lembrando que em um baralho de 52 cartas, 12 serão com figuras, pois
podemos ter 4 valetes, 4 damas e 4 reis.
12
P(retirar uma figura=
) = 0, 23
52
3. Considerando que a primeira carta não é reposta, temos que os eventos são dependentes. Seja a dama
denotada por Q e o rei denotado por K , precisamos encontrar P (Q ∩ K ) :
P(Q K) P(Q) P( K Q)
4 4
52 51
16
2652
4
663
0, 006
Logo, a probabilidade de selecionar uma dama e um rei, sem reposição da primeira carta, é de 0,006.
151
152
153
154
Me. Rebecca Manesco Paixão
Distribuições de
Probabilidade
PLANO DE ESTUDOS
Distribuições Discretas
Distribuições Amostrais
de Probabilidade
Variável Aleatória
Distribuições Contínuas
e Distribuição de
de Probabilidade
Probabilidade
OBJETIVOS DE APRENDIZAGEM
• Compreender o que são variáveis aleatórias e distribuições • Estudar as distribuições contínuas de probabilidade: dis-
de probabilidades. tribuição uniforme, distribuição exponencial e distribuição
• Estudar as distribuições discretas de probabilidade: distri- normal.
buição de Bernoulli, distribuição geométrica, distribuição • Estudar a relação entre a média da população e as médias
binomial e distribuição de Poisson. das amostragens tiradas da população.
Variável Aleatória e
Distribuição de
Probabilidade
UNIDADE 6 157
Distribuições Discretas
de Probabilidade
2 EXEMPLO Lançam-se dois dados. Seja x a soma das faces, podemos determinar a distribuição
de probabilidades para a soma das faces:
= x P(x)
2
σ 2 x µ P ( x )
Por outro lado, o cálculo do desvio padrão é obtido a partir da raiz quadrada da
variância:
2
σ x µ P( x)
Escore Frequência
1 12
2 23
3 23
4 20
5 32
Fonte: a autora.
x P ( x) x P (x )
1 0,12 1•0,12=0,12
2 0,13 2•0,13=0,26
3 0,23 3•0,23=0,69
4 0,20 4•0,20=0,80
5 0,32 5•0,32=1,60
P (x ) 1 x P (x ) 3, 4 7
Logo, podemos concluir que a média do grau de satisfação é de 3,47, em uma escala
que vai de 1 a 5.
A média da distribuição de probabilidades não nos dá informações sobre como os
resultados variam. Para isso, podemos utilizar a variância e o desvio padrão. Observe
o Exemplo 4.
UNIDADE 6 161
Logo, a variância é:
s 2 = 1, 8691
E o desvio padrão é:
s = 1, 8691
= 1, 36715
Isso significa que a maioria dos valores de dados difere da média não mais do que
1,38 pontos.
Caro(a) aluno(a), dentre as principais distribuições discretas de probabilidade,
destacam-se a distribuição de Bernoulli, distribuição geométrica, distribuição bino-
mial e distribuição de Poisson. Veremos cada uma delas a seguir.
Distribuição de Bernoulli
p (0) P( x 0) 1 p
p (1) P( x 1) p
µ= p
s 2 p (1 p )
P( x 0) 1 0, 7 0, 3
P( x= 1=
) 0, 7
µ = 0, 7
Distribuição Geométrica
P( x) p q x 1
UNIDADE 6 163
Para a distribuição geométrica, temos que:
1
µ=
p
(1 p )
s2
p2
6 EXEMPLO Considerando que a probabilidade de fazer uma venda por telefone é de 0,10, qual a
probabilidade da primeira venda ocorrer na segunda ou na terceira ligação?
Neste exemplo, precisamos fazer a soma das probabilidades de a venda ocorrer
na segunda ( x = 2 ) ou na terceira ligação ( x = 3 ), considerando que p = 0, 10 e
q = 0, 90 .
P ( x 2) 0, 10 0, 9021
0, 10 0, 90
0, 09
P ( x 3) 0, 10 0, 9031
0, 10 0, 902
0, 10 0, 81
0, 081
P( x 2) P( x 3) 0, 09 0, 081
0, 171
Distribuição Binomial
n!
P( x k ) p k (1 p ) nk
k !(n k )!
Em que:
n =número de tentativas
k =número de sucessos
7 EXEMPLO Uma fábrica de calças jeans opera com média de 5% de produtos defeituosos. Em
uma amostra de 20 unidades, a probabilidade de uma amostra apresentar nenhum
defeito é de:
20 !
P ( x 0) 0, 050 0, 9520
0 ! (20 0)!
20 !
1 0, 358
20 !
1 1 0, 358
0, 358
µ = n⋅ p
s2 n p q
8 EXEMPLO Considerando que, em Curitiba, cerca de 48% dos dias são nublados, determine a
média e o desvio padrão para o número de dias nublados durante o mês de abril.
O mês de abril tem 30 dias, logo n = 30 . Além disso, temos que p = 0, 48 e q = 0, 52
Assim, a média será:
µ = 30 ⋅ 0, 48
= 14, 4
E o desvio padrão será:
σ 30 0, 48 0, 52
7, 488
2, 74
Isso significa que, no mês de abril, em média, há 14,4 dias que são nublados, com
desvio padrão de 2,74 dias.
UNIDADE 6 165
Distribuição de Poisson
l x e l
P( x)
x!
Em que:
l é o número médio de ocorrência.
x é o número de ocorrências de um evento ao longo de algum intervalo. Aten-
te-se que essas ocorrências devem ser aleatórias, independentes umas das outras e
uniformemente distribuídas sobre o intervalo em uso.
e = 2, 71828...
P ( x 2)
52 e5
2!
25 0, 00674
2 1
0, 168
2
0, 0842
Para este tipo de distribuição, temos que a esperança média e a variância, são dadas
por:
2
=
µ σ= λ
10 EXEMPLO Em um livro de 200 páginas, há 200 erros de impressão. Qual a probabilidade de uma
página aleatória conter pelo menos 3 erros?
Neste exemplo, precisamos encontrar P ( x ≥ 3) , tal que:
P( x 3) 1 P( x 3)
1 P( x 0) P( x 1) P ( x 2)
P ( x 3) 1
10 e1
11 e1
12 e1
0! 1! 2!
1 0, 3678 1 0, 3678 1 0, 3678
1
1 1 2 1
1 0, 3678 0, 3678 0, 1839
1 0, 9195
0, 0805
É importante destacar que a distribuição de Poisson pode ser utilizada para aproxi-
mar uma distribuição Binomial quando n é muito grande, e a probabilidade p é
pequena. Para tal, os seguintes requisitos devem ser satisfeitos:
• n ≥ 100
• n p 10
UNIDADE 6 167
11 EXEMPLO Em um jogo de azar, podemos comprar um ticket com uma sequência de 4 dígitos, de
modo que, se a sequência for sorteada, então ganhamos o prêmio diário. Se durante
120 dias você comprar um ticket por dia, qual a probabilidade de ganhar exatamente
uma vez?
1
Temos que n = 120 e que p = (pois há um conjunto vencedor entre os
10000
10.000 possíveis).
Logo, as condições n ≥ 100 e n p 10 são satisfeitas, e podemos utilizar a dis-
tribuição de Poisson para aproximar a distribuição Binomial.
1
l 120
10000
0, 012
P ( x 1)
0, 0121 e0,012
1!
0, 012 0, 988
1
0, 012
UNIDADE 6 169
Por definição, o gráfico deve indicar a probabilidade da variável estar entre o inter-
valo de a até b , o que é expresso por meio da integral:
b
P(a x b) f ( x) dx
a
Sabendo que a integral definida de uma função entre dois pontos determina a área
sob a curva representativa da função, temos que a função f ( x) é chamada de função
densidade de probabilidade da variável aleatória contínua x .
Média e Variância
2
σ 2 µ( x2 ) µ( x)
k x se 0 x 1
12 EXEMPLO Considerando f ( x)
0 se x 0 ou x 1
Temos que:
1
k x dx 1
0 1
x2
k 1
2
0
2
(1)
k (0) 1
2
k
1
2
k 2
logo:
1
(
µ( x ) = ∫ x2 ⋅ 2 x dx
2
)
0
1
( )
= ∫ 2 x3 dx
0
1
x4
= 2
4 0
(1) 4
= 2 − (0)
4
2
=
4
1
=
2
Assim,
2
1 2
s2
2 3
1 4
2 9
1
18
UNIDADE 6 171
Neste estudo, dentre as principais distribuições contínuas, destacam-se: distribuição
uniforme, distribuição exponencial e distribuição normal.
Distribuição Uniforme
Uma variável aleatória contínua tem distribuição uniforme quando seus valores es-
palham-se uniformemente sobre as faixas de valores possíveis em um intervalo a, b .
Isso significa que, na representação gráfica, temos uma forma retangular (Figura 1).
A função densidade de probabilidade é dada por:
1
se a x b
f ( x) b a
0 se a x ou x b
f (x)
1
b–a
x
a b
Para este tipo de distribuição, temos que a média e a variância são calculadas por,
respectivamente:
a+b
µ=
2
2(b a )2
s
12
Distribuição Exponencial
l elx se x 0
f ( x)
0 se x 0
Em que:
λ = média
x = tempo
e = 2, 71828...
1
µ=
λ
1
σ2 =
λ2
UNIDADE 6 173
14 EXEMPLO Em minutos, o intervalo de tempo entre emissões consecutivas de uma fonte radioa-
tiva é uma variável aleatória com distribuição exponencial de parâmetro l = 0, 1 .
Qual a probabilidade de haver uma emissão em um intervalo inferior a 5 minutos?
Temos que:
5
P( x 5) 0, 1 e0,1x dx
0
5
e0,1x
0
e0,15 e0
0, 61 1
0, 39
Distribuição Normal
Uma variável aleatória contínua x tem distribuição normal (ou também conhecida
2
por distribuição gaussiana) com parâmetros µ e s se sua função densidade de
probabilidade é dada por:
( x µ )2
1
f ( x) e 2σ 2 para - x
σ 2π
Em que:
e = 2, 71828...
p = 3, 14159...
Atente-se que, neste tipo de distribuição, pode-se ter qualquer média e qualquer desvio
padrão positivo, de modo que esses dois parâmetros vão determinar o formato da
2
curva normal. Para simplificar, usaremos a notação x ~ N (µ, σ ) para indicar que
x tem distribuição normal.
ƒ(x)
µ x
UNIDADE 6 175
Distribuição Normal Padrão
Quando a média for 0 e o desvio padrão for 1, temos uma distribuição padrão, ou
também denotada por z ~ N (0, 1) . Por definição, toda a distribuição normal pode ser
convertida em uma distribuição normal padrão, por meio do cálculo dos z-escores:
xµ
z
σ
15 EXEMPLO Determine o z-escore que tem uma área de 10,75% à sua direita.
Temos que a área é de 10,75% ou 0,1075. Logo, toda a área anterior a ela é de
1 0, 1075 0, 8925 .
Procurando, na Tabela A que se encontra no apêndice do livro, o z-escore cuja
área correspondente é 0,8925, encontramos o número 1,24.
54
z 1
1
74
z 3
1
UNIDADE 6 177
17 EXEMPLO 51% dos adultos dos Estados Unidos cujas promessas de final de ano foram de se
exercitar mais alcançaram seus objetivos. Você seleciona aleatoriamente 65 adultos
nos EUA que fizeram tais promessas e lhes pergunta se eles cumpriram a promessa.
Qual é a probabilidade de que menos de 40 deles respondam sim? (LARSON; FAR-
BER, 2010).
Temos que: n = 65 , p = 0, 51 e q = 0, 49
Logo,
n p 65 0, 51
33, 15
n q 65 0, 49
31, 85
µ = 65 ⋅ 0, 51
= 33, 15
s 65 0, 51 0, 49
16, 2435
4, 03
Na distribuição binomial, os valores possíveis do centro “menores que 40” são: ..., 37,
38, 39. Para usar distribuição normal, aplicamos a correção pela continuidade para
o valor de x , adicionando 0,5 ao limite 39 à direita para conseguir x = 39, 5 .
O z-escore correspondente é:
39, 5 33, 15
z
4, 03
6, 35
4, 03
1, 58
P( z 1, 58) 0, 9429
UNIDADE 6 179
Teorema do Limite Central
O teorema do limite central nos explica porque a distribuição normal é tão im-
portante em estatística. São dois os conceitos definidos:
• Se n ≥ 30 , e amostras de tamanho n são tiradas de qualquer população com
média µ e desvio padrão s , então a distribuição amostral das médias das
amostras se aproxima de uma distribuição normal, de modo que, quanto maior
o número de indivíduos da amostra, maior a aproximação.
• Caso uma distribuição seja normal, a distribuição amostral de médias das
amostras é normalmente distribuída para qualquer amostra de tamanho n .
µx = µ
Enquanto que o desvio padrão das médias amostrais será:
s
sx =
n
xµ
z
σ
n
1 N n
sx s
n N 1
Nesta unidade, pudemos definir uma variável aleatória, assim como estudar sobre as
distribuições de probabilidades discretas e contínuas.
UNIDADE 6 181
Você pode utilizar seu diário de bordo para a resolução.
182
LIVRO
183
BONAFINI, F. C. Estatística. São Paulo: Pearson Education do Brasil, 2012.
BUSSAB, W. O.; MORETTIN, P. A. Estatística Básica. 6. ed. São Paulo: Saraiva, 2010.
LARSON, R.; FARBER, B. Estatística aplicada. 4. ed. São Paulo: Pearson Prentice Hall, 2010.
MAGALHÃES, M. N.; LIMA, A. C. P. Noções de probabilidade e estatística. 6. ed. São Paulo: Editora da
Universidade de São Paulo, 2008.
MONTGOMERY, D. D.; RUNGER, G. C. Estatística aplicada e probabilidade para engenheiros. 4. ed. São
Paulo: LTC, 2006.
184
1. No lançamento de três moedas, temos x sendo o número de caras.
x P( x)
1
0
8
3
1
8
3
2
8
1
3
8
P ( x) 1
P ( x 7)
e20 207
7!
0, 000000002 1280000000
7 6 5 4 3 2 1
2, 638277
5040
0,0000523
185
3. O cálculo é feito por meio da distribuição geométrica, assim:
P( x 4) 0, 30 0, 704 1
0, 30 0, 703
0, 30 0, 343
0, 1029
186
187
188
Me. Rebecca Manesco Paixão
Estatística Inferencial:
Estimação e Teste
de Hipóteses
PLANO DE ESTUDOS
Estimação da Proporção e
da Variância Populacional
Estimação e Tamanhos
Amostrais Teste de Hipótese
OBJETIVOS DE APRENDIZAGEM
1 EXEMPLO Uma pesquisa, em uma amostra aleatória, apontou que, de 100 estudantes de engenha-
ria, 65 são homens. Dessa forma, podemos afirmar que a estimativa da proporção de
homens estudantes de engenharia dessa população é de 65%, uma vez que a proporção
amostral é a melhor estimativa pontual da proporção populacional.
Além disso, é importante destacar que a estimativa pode ser pontual ou intervalar.
A primeira diz respeito a um único valor estimado para um parâmetro populacional
(ou seja, é um dado amostral que queremos verificar se é correspondente à popula-
ção). Por sua vez, a estimativa intervalar corresponde ao intervalo, no qual podemos
“encaixar” o parâmetro que estamos buscando.
5 4 2 0
2 3 1 4
3 7 3 7
4 4 6 8
2 2 1 12
10 1 4 4
8 6 3 5
9 5 9 4
6 1 0 10
5 1 0 9
180
x=
40
= 4, 5
UNIDADE 7 191
Estimação da Média Populacional
(Amostras Grandes)
Neste item, vamos aprender como usar amostras estatísticas para estimar um parâ-
metro populacional desconhecido quando a população é, normalmente, distribuída
e o desvio padrão é conhecido, ou quando o tamanho da amostra for maior que 30.
No Exemplo 2, vimos que a estimativa pontual foi de 4,5 erros gramaticais por
página do livro; no entanto, a probabilidade de que a média populacional seja exa-
tamente este valor é muito pequena. Nesse sentido, é mais lógico procurarmos por
um intervalo no qual o parâmetro buscado seja “encaixado”.
Para obtermos a estimativa intervalar, utilizamos a estimativa pontual como o
centro do intervalo e, depois, adicionamos e subtraímos a margem do erro. A este
intervalo de confiança, associamos um nível de confiança, o qual nos dá a pro-
babilidade de o intervalo estimado conter o parâmetro populacional (LARSON;
FARBER, 2010; TRIOLA, 2008).
A relação entre o intervalo e o nível de confiança é estabelecida por um cálculo
baseado no modelo de distribuição normal. Na Unidade 7, nós estudamos que a área
abaixo da curva corresponde à probabilidade que procuramos, e que os deslocamentos
no eixo x são correspondentes aos z-escores.
A Figura 1 ilustra a forma de obtenção do nível de confiança (c). Este corresponde
à área sob a curva normal padrão entre os valores críticos −zc e zc , de modo que a
área remanescente é dada por 1− c .
1 1
2 (1 - c) 2 (1 - c)
z
- zc z=0 zc
Figura 1 - Nível de confiança – distribuição normal
Fonte: a autora.
Quanto à margem de erro (E), esta diz respeito à maior distância entre o ponto de
estimativa e o valor do parâmetro estimado. É calculada por:
s
E zc s x zc
n
3 EXEMPLO A diretora de uma universidade deseja estimar a média de idade de todos os estudantes
matriculados no 1º ano de engenharia. Em uma amostra aleatória de 40 estudantes,
a idade média encontrada foi de 21 anos. Em estudos anteriores, verificou-se que
a população é normalmente distribuída e que o desvio padrão conhecido é de 1,2.
Sabendo disso, encontre a margem de erro para a amostra, considerando o nível de
confiança de 95%.
Temos que a margem de erro é de:
1, 2
E 1, 96
40
1, 2
1, 96
6, 32
1, 96 0, 19
0, 37
xE xE
UNIDADE 7 193
Atente-se! No caso a seguir, o tamanho da amostra não depende do tamanho da
população, mas sim do nível de confiança desejado, da margem de erro e do desvio
padrão σ.
21 − 0, 37 < µ < 21 + 0, 37
20,63 < µ < 21, 37
No item anterior, vimos como estimar a média populacional para amostras grandes.
A partir de agora, veremos como estimar a média populacional para amostras pe-
quenas, quando s não é conhecido.
Sempre que a variável aleatória for normalmente distribuída (ou aproximadamente
normalmente distribuída), podemos utilizar a distribuição t :
x
t
s
n
Como não conhecemos o valor de s , ele é estimado a partir do valor do desvio padrão
amostral s . Isso introduz uma outra fonte de não confiabilidade; assim, para manter
o intervalo de confiança em um nível desejado, compensamos a não confiabilidade
adicional fazendo o intervalo de confiança um pouco mais largo. Para isso, usamos
os valores críticos de t ( tc ), conforme a Tabela B no apêndice do livro.
Um conceito-chave na distribuição t são os graus de liberdade, que dizem respeito
ao número de valores amostrais que podem variar depois da imposição de certas
restrições aos dados amostrais. Para estimar a média da população pela distribuição
t, os graus de liberdade são iguais ao tamanho da amostra menos um:
g .l. n 1
UNIDADE 7 195
A Figura 2 ilustra a obtenção do nível de confiança para a distribuição t.
1 1
2 (1 - c) 2 (1 - c)
t
- tc tc
6 EXEMPLO Encontre o valor crítico tc para uma amostra de 13 indivíduos e uma confiança de 95%.
Primeiramente, devemos calcular os graus de liberdade:
g .l. 13 1
12
Para g .l. = 12 e c = 0, 95 temos que o valor procurado é tc = 2, 179 . Isso quer dizer
que 95% da área sob a curva da distribuição t com 12 graus de liberdade está entre
t 2, 179 .
Por definição, a construção do intervalo de confiança usando a distribuição t é
similar à construção do intervalo de confiança usando a distribuição normal, como
vimos anteriormente.
O intervalo de confiança para a estimativa de µ (com s desconhecido) é dada por:
xE xE
g .l. 26 1
25
Com g .l. = 25 e c = 0, 95 , temos que tc = 2, 060 .
UNIDADE 7 197
Estimação da Proporção
e da Variância Populacional
O cálculo de intervalos de confiança também pode ser utilizado para estimar se uma
média amostral de sucessos corresponde à média populacional.
Para isto, vamos considerar as notações:
p = proporção populacional .
8 EXEMPLO Em uma pesquisa com 800 brasileiros, 500 disseram que seu esporte favorito é fu-
tebol. Encontre a estimativa pontual para a proporção populacional dos brasileiros
que dizem que seu esporte favorito é o futebol.
Temos que:
p = 500
800
= 0, 625
p E p p E
em que:
p q
E zc
n
UNIDADE 7 199
9 EXEMPLO Construa um intervalo de 95% de confiança para a proporção dos brasileiros que
dizem que o futebol é seu esporte favorito, com base nos dados obtidos no Exemplo 8.
Temos que:
p 0, 625
q 1 0, 625 0, 375
A margem de erro será de:
E 1, 96
0, 625 0, 375
800
0, 23
1, 96
800
1, 96 0, 00029
1, 96 0, 017
0, 033
2
z c p q
n
E2
10 EXEMPLO Uma pesquisa deseja determinar a porcentagem de adolescentes que usam o e-mail
como forma de comunicação. Quantos adolescentes devem ser entrevistados para
que se tenha 95% de confiança em que a porcentagem amostral não terá erro maior
do que 2%? Considere o resultado de um estudo anterior que verificou que 20% dos
adolescentes usavam o e-mail como forma de comunicação.
De acordo com os dados do estudo anterior, temos que:
p 0, 2
q 1 0, 2 0, 8
1-c c
2
1-c
2
Ȯ2
ȮL2 ȮR2
UNIDADE 7 201
11 EXEMPLO Encontre os valores críticos e um intervalo de confiança de 90% quando o tamanho
da amostra for 10.
Como n = 10 , temos que:
g .l. 10 1
9
2 2
Assim, as áreas à direita de cR e cL são:
1 0, 90
cR2
2
0, 10
2
0, 05
1 0, 90
cL2
2
1, 90
2
0, 95
2 2
As áreas à direita de cR e cL são:
1 0, 99
cR2
2
0, 01
2
0, 005
1 0, 99
cL2
2
1, 99
2
0, 995
Isso significa que, com 99% de confiança, pode-se dizer que o desvio padrão da po-
pulação está entre 0,073 e 0,155 gramas.
UNIDADE 7 203
Teste de Hipótese
H A : p ≠ 0, 75
No entanto, como nossa decisão é baseada em uma amostra, ao invés de ser baseada
na população inteira, sempre há a possibilidade de tomarmos a decisão errada. Assim,
dois tipos de erro podem ocorrer:
• Erro do tipo I: ocorre se a hipótese nula for rejeitada quando é verdadeira;
• Erro do tipo II: ocorre se a hipótese nula não for rejeitada quando é falsa.
Os possíveis erros e acertos de uma decisão encontram-se sintetizados no Quadro 1.
Quadro 1 - Possíveis erros e acertos de uma decisão a partir de um teste de hipótese
Realidade
H0 verdadeira H0 falsa
Decisão Aceitar H0 Decisão correta Erro tipo II
Rejeitar H0 Erro tipo I Decisão correta
UNIDADE 7 205
Neste estudo, serão utilizadas as seguintes estatísticas de teste:
p p
• Estatística de teste para a proporção: z
pq
n
xµ xµ
• Estatística de teste para a média: z σ ou t s
n n
2 (n 1) s 2
• Estatística de teste para o desvio padrão: χ
σ2
14 EXEMPLO Um fabricante de biscoitos anuncia que o peso médio dos conteúdos de seus pacotes
de 250 gramas é mais do que 250 gramas.
Temos que a afirmação é: “o peso médio dos conteúdos dos pacotes de biscoitos
é mais do que 250 gramas”, logo as hipóteses são:
H 0 : µ 250
H A : µ > 250
Por definição, o teste é de hipóteses unilateral à direita, pois o sinal usado em H A é > .
Já vimos que a tomada de decisão será baseada na hipótese nula, ou seja, rejeitá-la
ou deixar de rejeitá-la. E a forma mais segura de efetuarmos a decisão é relacionando
o nível de significância com o valor P . Se P ≤ a podemos rejeitar H 0 ; e se P > a
deixamos de rejeitar H 0 .
Além disso, uma forma alternativa de rejeitar ou deixar de rejeitar a hipótese nula
é o método tradicional (ou método clássico) de teste de hipótese. A partir deste,
rejeitamos H 0 se a estatística de teste ficar dentro da região crítica; e deixamos de
rejeitar H 0 se a estatística de teste não ficar dentro da região crítica.
UNIDADE 7 207
15 EXEMPLO Pesquisas afirmam que, usando sistema ABS, a média das distâncias de frenagem é
menor do que 30 metros.
• Neste caso, temos que a hipótese nula será “a média das distâncias de frenagem
é maior ou igual a 30 metros”, ou seja, H 0 : µ ≥ 30.
• Se você rejeitar H 0 então você deve concluir que “há evidências suficientes
para apoiar a afirmação”. Se você falha em rejeitar H 0 , então você deve concluir
que “não há evidência suficiente para apoiar a afirmação”.
Rejeite a hipótese nula se o valor P for menor Rejeite a hipótese nula se a estatística de
ou igual ao nível de significância. Deixe de teste estiver na região crítica. Deixe de
rejeitar a hipótese nula quando o valor P for rejeitar a hipótese nula se a estatística de
maior que o nível de significância teste não estiver na região crítica
Nos próximos tópicos, vamos estudar alguns exemplos de teste de hipótese para a
média de amostras grandes e pequenas, para uma proporção e para o desvio padrão.
Utilizaremos o passo a passo, descrito na Figura 5, para testar afirmativas sobre uma
média populacional para amostras grandes. Para encontrarmos o valor P, primei-
ramente, vamos verificar se o teste de hipótese é bilateral, unilateral à direita ou
unilateral à esquerda. Na sequência, calculamos seu valor tendo como base a siste-
mática dos z-escores.
16 EXEMPLO Uma hamburgueria afirma que a média do tempo de produção dos hambúrgueres é
menor que 20 minutos. Uma seleção aleatória de 32 tempos de produção tem média
de 18 minutos e desvio padrão de 2,5 minutos. Há evidência suficiente para apoiar
a afirmação em a = 0, 01 ? Utilize o método do valor P .
Temos que a afirmação é: “a média do tempo de produção dos hambúrgueres é
menor que 20 minutos”, logo, as hipóteses são:
H 0 : µ ≥ 20
H A : µ < 20
UNIDADE 7 209
Teste de Hipóteses para a Média
(Amostras Pequenas)
17 EXEMPLO Uma revendedora de carros diz que o preço médio do Onix 2015 é de no mínimo R$
33.000,00. Para testar a afirmação, coletamos 16 preços e dessa amostra extraímos uma
média de R$ 32.500,00 e desvio padrão de R$ 1.500,00. Considerando que a variável
é normalmente distribuída, verifique se temos condições de rejeitar a hipótese, para
um nível de significância de 0,05.
Temos que a afirmação é: “a média do preço do Onix 2015 é de no mínimo R$
33.000,00”, logo as hipóteses são:
H 0 : µ ≥ 33000
H A : µ < 33000
Iremos testar uma afirmativa feita sobre uma proporção populacional. Lembrando
que, se n p 5 e n q 5 para uma distribuição binomial, então um distribuição
amostral para p é normal, com µ = p e σ p q .
n
18 EXEMPLO Uma pesquisa declara que entre 500 trabalhadores selecionados aleatoriamente, 65%
obtiveram seus empregos por meio de anúncios na internet. Use os dados amostrais
com um nível de significância de 0,05 para testar a afirmativa de que a maioria dos
trabalhadores (mais de 50%) obtém seus empregos por meio de anúncios na internet.
Os produtos n p 500 0, 5 250 e n q 500 0, 5 250 são maiores que 5 e,
portanto, podemos usar um teste z.
A afirmação é: “mais de 50% dos trabalhadores obtém seus empregos por meio
de anúncios na internet”. Então as hipóteses são:
H 0 p 0, 5
H A p 0, 5
A estatística de teste é:
0, 65 0, 5
z
0, 5 0, 5
500
0, 15
0, 25
500
0, 15
0, 0005
0,15
0, 022
6, 81
UNIDADE 7 211
Como o teste é unilateral à direita, com uma estatística de teste z = 6, 81 , o valor P
é a área à direita de z = 6, 81 . Consultando a Tabela A, inserida no apêndice do livro,
temos que, para valores de z = 3, 50 e maiores, usamos 0,0001 para a área acumulada
à direita da estatística de teste. Logo, o valor P é 0,0001.
Como o valor P de 0,0001 é menor do que nível de significância a = 0, 05 , re-
jeitamos a hipótese nula.
Portanto, podemos concluir que há evidências amostrais suficientes para apoiar
a afirmativa de que a maioria dos trabalhadores obtém seus empregos por meio de
anúncios na internet.
19 EXEMPLO Uma pizzaria afirma que o desvio padrão no tempo de entrega das pizzas é menor
que 4 minutos. Uma amostra aleatória de 24 tempos de entrega tem um desvio padrão
de 3,2 minutos. Com a = 0, 01 , há evidência suficiente para suportar a afirmação da
pizzaria? Suponha que a população seja normalmente distribuída.
A afirmação é: “o desvio padrão no tempo de entrega das pizzas é menor que 4
minutos”. Logo, as hipóteses são:
H0 : s 4
HA :s 4
UNIDADE 7 213
Você pode utilizar seu diário de bordo para a resolução.
214
LIVRO
215
BONAFINI, F. C. Estatística. São Paulo: Pearson Education do Brasil, 2012.
LARSON, R.; FARBER, B. Estatística aplicada. 4. ed. São Paulo: Pearson Prentice Hall, 2010.
MAGALHÃES, M. N.; LIMA, A. C. P. Noções de probabilidade e estatística. 6. ed. São Paulo: Editora da
Universidade de São Paulo, 2008.
216
1. Para encontrarmos n fazemos:
2
15
n 1, 96
3
(1, 96 5)2
(9, 8)2
96, 04
2. Temos que:
p 0, 65
q 1 0, 65 0, 35
Considerando 90% de confiança, temos que:
E 1, 645
0, 65 0, 35
500
0, 2275
1, 645
500
1, 645 0, 000455
1, 645 0, 021
0, 035
Portanto, o intervalo de confiança é de:
0, 65 0, 035 p 0, 65 0, 035
0, 615 p 0, 685
217
3. Temos que a afirmação é: “a média dos salários é menor do que R$ 40.000,00”. Logo, as hipóteses são:
H 0 : µ ≥ 40000
H A : µ < 40000
O teste é unilateral à esquerda com a = 0, 05 , então o valor critico é z0 1, 645 , de modo que a região
de rejeição é z0 1, 645 .
38500 40000
z
3000
30
1500
3000
5, 48
1500
547, 45
2, 74
Como z está na região de rejeição, pode-se concluir que há evidências suficientes no nível de significância
de 5% para apoiar a afirmação dos professores de que a média do salário é menor do que R$ 40.000,00.
218
219
220
Me. Rebecca Manesco Paixão
Inferência a Partir
de Duas Amostras
PLANO DE ESTUDOS
OBJETIVOS DE APRENDIZAGEM
• Testar a diferença entre as médias de amostras indepen- • Estudar o teste de ajuste qui-quadrado para testar se uma
dentes e dependentes. distribuição de frequência se encaixa em uma distribuição
• Testar a diferença entre duas proporções amostrais. esperada.
• Estudar o teste F para comparar variâncias.
Diferença Entre
as Médias
µ1 µ2
s12 s22
n1 n2
Como a distribuição amostral para x1 x2 é uma distribuição normal, podemos
utilizar o teste z para testar a diferença entre as duas médias populacionais:
z
x1 x2 µ1 µ2
σ x1 x2
em que
s12 s22
s x1 x2
n1 n2
UNIDADE 8 223
No teste de hipótese, temos que:
• A hipótese nula H 0 é uma hipótese estatística que geralmente diz que não
há diferença entre os parâmetros de duas populações. Essa hipótese sempre
contém os símbolos , ou .
• A hipótese alternativa H A é uma hipótese estatística que é verdadeira quando
é falso. Essa hipótese sempre contém o símbolo >, ≠ ou < .
1 EXEMPLO Uma organização afirma que há uma diferença entre a média de salário de homens e
de mulheres. Os resultados de uma pesquisa aleatória de 200 indivíduos encontram-se
na Tabela 1. As duas amostras são independentes. Usando a = 0, 05 , os resultados
apoiam a afirmação?
Tabela 1 - Estimação amostral das médias salariais – Exemplo 1
Mulheres Homens
R $2290
x1 R$2290 R $2370
x2 R$2370
R $750
s1 R$750 R $800
s2 R$800
200
n1 200 200
n2 200
Fonte: a autora.
Queremos testar a afirmação de que “há uma diferença na média dos salários”. As
hipóteses são:
H 0 : µ1 = µ2
H A : µ1 ≠ µ2
Neste item, vamos aprender a testar a diferença entre as médias de duas populações
pequenas, utilizando o teste t. Para tanto, as seguintes condições são necessárias:
• As amostras devem ser independentes.
• As amostras devem ser selecionadas aleatoriamente.
• Cada população deve ter uma distribuição normal.
t
x1 x2 µ1 µ2
σ x1 x2
UNIDADE 8 225
No caso em que as variâncias da população são iguais, a informação das duas
amostras é combinada para calcular uma estimativa coligada do desvio padrão s :
s
n1 1 s12 n2 1 s22
n1 n2 2
1 1
s x1 x2 s
n1 n2
g .l. n1 n2 2
s12 s22
s x1 x2
n1 n2
2 EXEMPLO Um fabricante afirma que o alcance de chamada do seu telefone sem fio é maior do
que o do seu principal concorrente. Você realiza um estudo com 6 telefones selecio-
nados aleatoriamente deste fabricante e 8 telefones similares, do concorrente, sele-
cionados aleatoriamente. Os resultados encontram-se na Tabela 2. Assumindo que
as populações são, normalmente, distribuídas e que as variâncias de população são
iguais, em a = 0, 05 , você pode apoiar a afirmação do fabricante?
Fabricante Concorrente
1250metros
x1 1250 1200
x2 120 metros
40metros
s1 40 25metros
s2 25
n1 66 n2 68
Fonte: a autora.
H 0 : µ1 ≤ µ2
H A : µ1 > µ2
UNIDADE 8 227
A Figura 1 ilustra um resumo para os testes para as médias de duas amostras
independentes. Observe:
O tamanho de ambas
amostras é pelo Sim Use o teste z.
menos 30?
Não
Sim
Use o teste t com
Os desvios padrões As variâncias da σ x1 - x2 = 1 1
+
de ambas populações Não Sim n1 n2
população são iguais?
são conhecidos?
e g.l = n1 - 1 + n2 - 2.
Sim Não
σ x1 - x2 = s12 + s12
n1 n2
e g.l = menor que
n1 - 1 or n2 - 1.
d x1 x2
d − µd
t=
sd
n
d d
2
sd
n 1
Quando estes requisitos são atendidos, a distribuição é aproximada por uma distri-
buição t com n −1 graus de liberdade, onde n é o número de dados emparelhados.
3 EXEMPLO Um fabricante de tênis afirma que os corredores podem diminuir seus tempos
de corrida com seu novo tênis para corrida. Oito corredores são selecionados
aleatoriamente e têm seus tempos medidos antes e após usarem os tênis. Os
tempos são mostrados na Tabela 3. Assumindo que sejam distribuídos
normalmente, existe evidência suficiente para apoiar a afirmação em a = 0, 10 ?
Tabela 3 - Tempos de corrida antes e após usar o tênis de corrida, em segundos – Exemplo 3
Corredor Tempo antigo Tempo novo
1 91 91
2 89 88
3 87 80
4 74 76
5 92 96
6 84 83
7 85 80
8 79 73
Fonte: a autora.
UNIDADE 8 229
A afirmação é que “os corredores podem diminuir seus tempos de corrida”, ou seja, o
tempo de corrida será maior sem usar o tênis, do que usando os novos tênis de corrida.
As hipóteses são:
H 0 : µd ≤ 0
H A : µd > 0
3 87 80 87-80=7 (7)2=49
4 74 76 74-76=-2 (-2)2=4
5 92 96 92-96=-4 (-4)2=16
6 84 83 84-83=1 (1)2=1
7 85 80 85-80=5 (5)2=25
8 79 73 79-73=6 (6)2=36
14 132
14
d
= = 1, 75
8
2
14
132
sd 8
8 1
132 3, 0625
7
18, 42
4, 29
1, 75 0
t
4, 29
8
1, 75
1, 52
1, 15
UNIDADE 8 231
Diferença entre
Proporções
Caso as condições sejam satisfeitas, então a distribuição de amostragem para p1 − p2 ,
a diferença entre as proporções de amostra, é uma distribuição normal com média:
µ p = p1 − p2
1 − p2
p1q1 p2 q2
s p
1 p2 n1 n2
x1 x2
p
n1 n2
1 1
s p pq
1 p2
n1 n2
em que q 1 p .
Se a hipótese nula indica p1 = p2 , p1 ≤ p2 ou p1 ≥ p2 , então p1 = p2 é assumido
e a expressão p1 − p2 é igual a 0 no teste anterior.
UNIDADE 8 233
Tenha sua dose extra de conhecimento assistindo ao vídeo.
Para acessar, use seu leitor de QR Code.
(0, 35 0, 43) 0
z
1 1
(0, 39)(0, 61)
150 200
0, 08
(0, 2379)(0, 0016)
0, 08
0, 00038
0, 08
0, 0195
4, 10
UNIDADE 8 235
Teste F para Comparação
de Variâncias
g.l.N = 1 e g.l.D = 8
g.l.N = 8 e g.l.D = 26
g.l.N = 16 e g.l.D = 7
g.l.N = 3 e g.l.D = 11
F
1 2 3 4
Figura 2 - Distribuições F
Fonte: Larson e Farber (2010, p. 462).
UNIDADE 8 237
5 EXEMPLO O gerente de uma rede fast food está fazendo um sistema, que diminui a variância de
tempo que os clientes esperam antes das suas refeições ficarem prontas. No antigo
sistema, uma amostra aleatória de 25 clientes teve uma variância de 300 segundos2.
Com o novo sistema, uma amostra aleatória de 17 clientes teve uma variância de
180 segundos2. Com µ = 0, 10 , há evidência suficiente para adotar o sistema novo?
Suponha que as populações sejam normalmente distribuídas.
A afirmação é “a variância do tempo de espera no novo sistema é menor que a
variância do tempo de espera no antigo sistema”. Logo, as hipóteses são:
H 0 : s12 s22
H A : s12 s22
O teste é unilateral à direita. Com α 0, 10, g .l.N 25 1 24 e g .l.D 17 1 16,
o valor crítico é Fc = 1, 87 .
O teste estatístico é:
300
F=
180
= 1, 667
Como F não está na área de rejeição, não devemos rejeitar a hipótese nula.
Isso significa que não há evidência suficiente para a rede de fast food trocar para
o novo sistema.
UNIDADE 8 239
No cálculo do teste estatístico, usamos as frequências observadas e as frequências
esperadas. A frequência observada O diz respeito à frequência da categoria obser-
vada nos dados da amostra, enquanto que a frequência esperada E é a frequência
calculada para a categoria.
A frequência esperada é obtida supondo a distribuição específica (ou hipotética),
dada por:
Ei n pi
c
2 O E 2
E
A diretora de uma escola faz uma pesquisa sobre as preferências musicais de 200
estudantes selecionados aleatoriamente. Os resultados encontram-se na Tabela 4.
Usando a = 0, 01 , faça um teste de ajuste qui-quadrado para testar se as distribuições
são diferentes.
Como as frequências observadas foram obtidas usando uma amostra aleatória, e cada
frequência esperada é no mínimo 5, podemos usar o teste de ajuste qui-quadrado
para testar a distribuição proposta. As hipóteses são:
H 0 : a distribuição de preferências musicais dos estudantes é de 20% rock,
5% MPB, 35% sertanejo, 15% funk e 255% POP
H A : a distribuição de preferências musicais dos estudantes difere da
distribuição esperada ou afirmada
UNIDADE 8 241
Você pode utilizar seu diário de bordo para a resolução.
Cor Frequência
Amarelo 17
Azul 15
Laranja 20
Marrom 13
Verde 14
Vermelho 21
242
LIVRO
Estatística aplicada
Autor: Ron Larson e Betsy Farber
Editora: Pearson
Sinopse: este livro apresenta os temas essenciais da estatística, como probabili-
dade, intervalos de confiança e testes de hipóteses. Esta 6ª edição foi totalmente
revista e atualizada, principalmente os tópicos sobre coleta de dados, medidas de
variação, medidas de posição e, em especial, o uso e a definição da distribuição
normal e a distribuição T. Além disso, conta com mais de 200 exemplos e 2.300
exercícios propostos. Obra fundamental para alunos dos cursos de administra-
ção, ciências contábeis, economia e de graduação em tecnológica em gestão.
243
BONAFINI, F. C. Estatística. São Paulo: Pearson Education do Brasil, 2012.
LARSON, R.; FARBER, B. Estatística aplicada. 4. ed. São Paulo: Pearson Prentice Hall, 2010.
MAGALHÃES, M. N.; LIMA, A. C. P. Noções de probabilidade e estatística. 6. ed. São Paulo: Editora da
Universidade de São Paulo, 2008.
244
1. As amostras são dependentes, uma vez que o ritmo cardíaco dos mesmos indivíduos é analisado tanto em
descanso como após a atividade física.
2. Queremos determinar se a taxa de mortalidade por câncer de mama é menor para aquelas que tomaram
a medicação do que para aquelas que tomaram o placebo. As hipóteses são:
H 0 : p1 p2
H A : p1 p2
A estimativa ponderada é:
p 360 500
1800 2000
860
3800
0, 23
q 1 0, 23
0, 77
O teste z é:
360 500
0
1800 2000
z
1 1
(0, 23)(0, 77)
1800 2000
0, 2 0, 25 0
(0, 23)(0, 77)(0, 00105)
0, 05
0, 000186
0, 05
0, 0136
3, 67
245
Isso significa que, no nível de significância de 1%, há evidência suficiente para concluir que a taxa
de mortalidade por câncer de mama é menor para aquelas mulheres que tomaram a medicação
do que para aquelas que tomaram o placebo.
3. A afirmação do fabricante de confetes é que a distribuição é uniforme, o que quer dizer que as
frequências esperadas das cores são iguais. Para encontrar E, basta dividirmos o tamanho das
frequências pelo número de cores; logo, E=100/6=16,67.
As hipóteses são:
Como há seis categorias, a distribuição qui-quadrado tem g .l. = 5 e com a = 0, 10 , o valor critico
2
é cc = 9, 236 .
246
247
248
Me. Rebecca Manesco Paixão
Correlação e
Regressão
PLANO DE ESTUDOS
Regressão Linear
OBJETIVOS DE APRENDIZAGEM
• Estudar a correlação linear entre duas variáveis. • Calcular o erro padrão da estimativa para construir um
• Determinar a linha de regressão. intervalo estimado para y .
Correlação Linear
UNIDADE 9 251
Coeficiente de Correlação Linear
n x y x y
r
n x x n y y
2 2 2 2
2
Não confunda x com x2 . No primeiro, fazemos a soma de todos os valores, e
elevamos ao quadrado o valor final; no segundo, calculamos o quadrado de cada
um dos termos e depois somamos todos os valores.
2 2
x 350 y 2030 x y 147200 x 25250 y 863700
r
5 147200 350 2030
5 25250 350 5 863700 2030
2 2
736000 710500
126250 122500 4318500 4120900
25500
3750 197600
25500
61, 24 444, 52
25500
27221, 4
0, 936
UNIDADE 9 253
Assim, podemos concluir que há uma forte correlação linear positiva entre os dados,
uma vez que r é próximo de 1. Ou seja, quanto maior a massa corporal do individuo,
maior é o consumo anual de água.
Ao traçarmos um diagrama de dispersão para as duas variáveis, essa relação fica
mais clara. Observe a Figura 2.
Consumo anual de água (L) 600
500
400
300
200
100
0
0 20 40 60 80 100
Massa corporal (kg)
Figura 2 - Dispersão da massa corporal e o consumo de água por ano – Exemplo 1
Fonte: a autora.
Será que, baseado em poucos pares de dados, é possível fazer uma inferência sobre
uma população de todos pares de dados?
Muitas vezes, queremos determinar se há evidências suficientes para decidir se o
coeficiente de correlação é significante. E esta determinação pode ser feita a partir
do valor calculado de r . Se o valor absoluto de r excede o valor crítico (Tabela E,
no apêndice do livro) no nível de significância adotado, podemos concluir que há
evidências suficientes para dizer que há correlação significante entre as duas variáveis.
Dessa forma, seja r = 0, 936, calculado no Exemplo 1, utilizando um nível de
significância de 0,05, podemos concluir que há correlação entre x e y , uma vez que
r > 0, 878 . No entanto, se utilizarmos o nível de significância de 0,01, concluiremos
que não há correlação, uma vez que r < 0, 959 .
• Teste bilateral
Um teste t pode ser usado se a correlação entre duas variáveis for significante. A
estatística de teste é dada por:
r
t
1 r2
n2
Os valores críticos de t encontram-se na Tabela F com n − 2 graus de liberdade.
UNIDADE 9 255
2 EXEMPLO Uma amostra revelou que o coeficiente de correlação entre o nível de renda e a
porcentagem de doações para um grupo de 47 pessoas é de 0,78. Teste a hipótese de
existência de correlação entre as variáveis, com a = 5% .
Temos que as hipóteses são:
H0 : r 0
HA :r 0
UNIDADE 9 257
y
Valor y d6
observado
d4
d3 d5
Valor y
previsto
d2
Para um dado valor x,
d1
d = (valor y observado) - (valor y previsto)
x
A equação de uma reta de regressão para uma variável independente x e uma variável
dependente y é dada por:
y mx b
x y
xy n
m
x2
x2 n
b y mx
y mx
n n
em que y e x são as médias de y e de x , respectivamente. Atente-se que a linha de
regressão sempre passa pelo ponto ( x, y ) .
3 EXEMPLO Determine a equação de uma reta de regressão para os dados apresentados, no Exem-
plo 1, para a correlação entre a massa corporal e o consumo anual de água de 5
indivíduos entrevistados.
(350 2030)
(147200)
m 5
3502
(25250)
5
710500
147200
5
122500
25250
5
147200 142100
25250 24500
5100
750
6, 8
350
x=
5
= 70
2030
y=
5
= 406
b 406 6, 8 70
406 476
70
Logo, a equação de regressão é:
y 6, 8 x 70 Correlação e regreção linear
UNIDADE 9 259
Quando a reta de regressão se ajusta bem aos dados, podemos utilizá-la para prever
o valor de uma variável, a partir do conhecimento de um valor particular da outra
variável.
4 EXEMPLO A equação de regressão para os dados sobre tempo gasto estudando e a nota do ves-
tibular dos alunos do ensino médio é dada por y 50 x 25 . Use essa equação para
prever a nota esperada de um aluno que estudou 7 horas por dia.
Para prever a nota tirada no vestibular, substituímos x na equação de regressão
pelo tempo gasto estudando; logo, a nota no vestibular será de:
y 50 7 25
350 25
375
Como vimos, a equação de regressão é uma ótima ferramenta para se fazer previsões
para y . No entanto, quase sempre haverá um erro entre y e y .
A Figura 4 apresenta a reta de regressão, as linhas para x e y e um ponto defini-
do por ( xi , y i ) , que representa uma aferição “real” das variáveis. A partir do ponto
( xi , y i ) , podemos calcular três desvios.
y
( xi , yi ) Desvio não
Desvio explicado
total yi - y^i
yi - y
( xi , y^i ) Desvio
y explicado
( xi , yi )
y^i - y
x
x
Figura 4 - Desvio total, desvio explicado e desvio não explicado
Fonte: Bonafini (2012, p. 145).
• Desvio total: yi − y ;
• Desvio explicado: y i − y ;
• Desvio não explicado: yi − y i .
variação explicada
r2 =
variação total
5 EXEMPLO O coeficiente de correlação entre a massa corporal e o consumo anual de água é dado
por r = 0, 936 . Sabendo disso, encontre o coeficiente de determinação.
Temos que o coeficiente de determinação é dado por:
2
r 2 0, 936
0, 876
Isso significa que cerca de 87,6% da variação, no consumo anual de água, pode ser
explicada pela variação na massa corporal, enquanto que o restante (12,4%) da va-
riação deve ser atribuído a outros valores.
UNIDADE 9 261
Erro Padrão
da Estimativa
se
( yi yi )2
n2
em que n é o número de pares pedidos no con-
junto de dados.
Outra fórmula que nos leva ao cálculo de se é:
se
y 2 b y m x y
n2
15 26 1,405.15+7,311=28,386 (26-28,386)²=5,692996
20 32 1,405.20+7,311=35,411 (32-35,411)²=11,634921
20 38 1,405.20+7,311=35,411 (38-35,411)²=6,702921
30 56 1,405.30+7,311=49,461 (56-49,461)²=42,758521
40 54 1,405.40+7,311=63,511 (54-63,511)²=90,459121
45 78 1,405.45+7,311=70,536 (78-70,536)²=55,711296
50 80 1,405.50+7,311=77,561 (80-77,561)²=5,948721
60 88 1,405.60+7,311=91,611 (88-91,611)²=13,039321
2
( yi yi ) 231, 947818
231, 947818
se
8 2
231, 947818
6
38, 6579
6, 21
O erro padrão da estimativa pode ser usado para construir estimativas intervalares
que nos ajudarão a verificar quão confiáveis são nossas estimativas pontuais de y .
UNIDADE 9 263
Supondo que, para cada valor fixado de x , os valores amostrais correspondentes
de y sejam normalmente distribuídos ao longo da reta de regressão e que as dis-
tribuições normais tenham a mesma variância, o intervalo de previsão para um y
individual é dado por:
y E y y E
1 n( x0 x)2
E tc se 1
n
n x2 2
x
em que:
tc é o valor crítico correspondente ao nível de confiança dado, encontrado por
meio da tabela de distribuição t
se é o erro padrão
x0 é o valor de x correspondente ao y que queremos calcular
x é a média amostral.
Neste sentido, temos 95% de confiança que, quando o tempo de propaganda na rádio
é de 42 minutos, as vendas semanais estão entre R$ 50.021,00 e R$ 82.621,00.
Finalizamos nossos estudos sobre a correlação e a regressão linear. Vimos que,
após verificarmos a existência de correlação entre os dados, o próximo passo é de-
terminar a equação da linha que melhor modela os dados. Essa equação pode ser
usada para prever os valores de y dado um valor de x .
UNIDADE 9 265
Você pode utilizar seu diário de bordo para a resolução.
x 2 4 6 8 10
y 10 8 6 10 12
x y
23 26
21 25
28 31
27 29
23 27
28 31
27 32
22 28
26 30
25 30
3. A tabela abaixo mostra a área de oito espaços (em pés quadrados) e a capaci-
dade de resfriamento (em BTU por hora) de ares-condicionados usados neles. A
equação de regressão é y = 9,468x + 3002,991 (LARSON; FARBER, 2010). Sabendo
disso, determine o erro padrão da estimativa.
266
LIVRO
267
BONAFINI, F. C. Estatística. São Paulo: Pearson Education do Brasil, 2012.
LARSON, R.; FARBER, B. Estatística aplicada. 4. ed. São Paulo: Pearson Prentice Hall, 2010.
MAGALHÃES, M. N.; LIMA, A. C. P. Noções de probabilidade e estatística. 6. ed. São Paulo: Editora da
Universidade de São Paulo, 2008.
268
1. O cálculo do coeficiente de correlação linear é dado por:
x y x•y x2 y2
r
5 288 30 46
5 220 30 5 444 46
2 2
1440 1380
1100 900 2220 2116
60
200 104
60
14, 14 10, 20
60
144, 23
0, 416
269
2. O cálculo da regressão linear é dado por:
x y x•y x2
23 26 23.26=598 23.23=529
21 25 21.25=525 21.21=441
28 31 28.31=868 28.28=784
27 29 27.29=783 27.27=729
23 27 23.27=621 23.23=529
28 31 28.31=868 28.28=784
27 32 27.32=864 27.27=729
22 28 22.28=616 22.22=484
26 30 26.30=780 26.26=676
25 30 25.30=750 25.25=625
2
x 250 y 289 x y 7273 x 6310
(250 289)
(7273)
b 10
(6310)
2502
10
72250
7273
10
62500
6310
10
7273 7225
6310 6250
48
60
0, 8
250
x=
10
= 25
270
289
y=
10
= 28, 9
a 28, 9 0, 8 25
28, 9 20
8, 9
Logo, a equação da reta de regressão é dada por:
y 8, 9 0, 8 x
O diagrama de dispersão é representado por:
35
30
25
y = 8.9 + 0.8x
20
15
10
0
0 5 10 15 20 25 30
271
3. O cálculo do erro é dado por:
x y x •y y2
272
CONCLUSÃO
Área
z
z 0
z 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0.00
-3.4 0.0002 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003
-3.3 0.0003 0.0004 0.0004 0.0004 0.0004 0.0004 0.0004 0.0005 0.0005 0.0005
-3.2 0.0005 0.0005 0.0005 0.0006 0.0006 0.0006 0.0006 0.0006 0.0007 0.0007
-3.1 0.0007 0.0007 0.0008 0.0008 0.0008 0.0008 0.0009 0.0009 0.0009 0.0010
-3.0 0.0010 0.0010 0.0011 0.0011 0.0011 0.0012 0.0012 0.0013 0.0013 0.0013
-2.9 0.0014 0.0014 0.0015 0.0015 0.0016 0.0016 0.0017 0.0018 0.0018 0.0019
-2.8 0.0019 0.0020 0.0021 0.0021 0.0022 0.0023 0.0023 0.0024 0.0025 0.0026
-2.7 0.0026 0.0027 0.0028 0.0029 0.0030 0.0031 0.0032 0.0033 0.0034 0.0035
-2.6 0.0036 0.0037 0.0038 0.0039 0.0040 0.0041 0.0043 0.0044 0.0045 0.0047
-2.5 0.0048 0.0049 0.0051 0.0052 0.0054 0.0055 0.0057 0.0059 0.0060 0.0062
-2.4 0.0064 0.0066 0.0068 0.0069 0.0071 0.0073 0.0075 0.0078 0.0080 0.0082
-2.3 0.0084 0.0087 0.0089 0.0091 0.0094 0.0096 0.0099 0.0102 0.0104 0.0107
-2.2 0.0110 0.0113 0.0116 0.0119 0.0122 0.0125 0.0129 0.0132 0.0136 0.0139
-2.1 0.0143 0.0146 0.015 0.0154 0.0158 0.0162 0.0166 0.0170 0.0174 0.0179
-2.0 0.0183 0.0188 0.0192 0.0197 0.0202 0.0207 0.0212 0.0217 0.0222 0.0228
-1.9 0.0233 0.0239 0.0244 0.025 0.0256 0.0262 0.0268 0.0274 0.0281 0.0287
-1.8 0.0294 0.0301 0.0307 0.0314 0.0322 0.0329 0.0336 0.0344 0.0351 0.0359
-1.7 0.0367 0.0375 0.0384 0.0392 0.0401 0.0409 0.0418 0.0427 0.0436 0.0446
-1.6 0.0455 0.0465 0.0475 0.0485 0.0495 0.0505 0.0516 0.0526 0.0537 0.0548
-1.5 0.0559 0.0571 0.0582 0.0594 0.0606 0.0618 0.0630 0.0643 0.0655 0.0668
-1.4 0.0681 0.0694 0.0708 0.0721 0.0735 0.0749 0.0764 0.0778 0.0793 0.0880
-1.3 0.0823 0.0838 0.0853 0.0869 0.0885 0.0901 0.0918 0.0934 0.0951 0.0968
-1.2 0.0985 0.1003 0.1020 0.1038 0.1056 0.1075 0.1093 0.1112 0.1131 0.1151
-1.1 0.1170 0.1190 0.1210 0.1230 0.1251 0.1271 0.1292 0.1314 0.1335 0.1357
-1.0 0.1379 0.1401 0.1423 0.1446 0.1469 0.1492 0.1515 0.1539 0.1562 0.1587
-0.9 0.1611 0.1635 0.166 0.1685 0.1711 0.1736 0.1762 0.1788 0.1814 0.1814
-0.8 0.1867 0.1894 0.1922 0.1949 0.1977 0.2005 0.2033 0.2061 0.2090 0.2119
-0.7 0.2148 0.2177 0.2206 0.2236 0.2266 0.2296 0.2327 0.2358 0.2389 0.242
-0.6 0.2451 0.2483 0.2514 0.2546 0.2578 0.2611 0.2643 0.2676 0.2709 0.2743
-0.5 0.2776 0.281 0.2843 0.2877 0.2912 0.2946 0.2981 0.3015 0.3050 0.3085
-0.4 0.3121 0.3156 0.3192 0.3228 0.3264 0.3300 0.3336 0.3372 0.3409 0.3446
-0.3 0.3486 0.352 0.3557 0.3594 0.3632 0.3669 0.3707 0.3745 0.3783 0.3821
-0.2 0.3859 0.3897 0.3936 0.3974 0.4013 0.4052 0.409 0.4129 0.4168 0.4207
-0.1 0.4247 0.4286 0.4325 0.4364 0.4404 0.4443 0.4483 0.4522 0.4562 0.4602
-0.0 0.4641 0.4681 0.4721 0.4761 0.4801 0.4840 0.4880 0.4920 0.4960 0.5000
277
Tabela A - Distribuição normal padrão: área acumulada à esquerda – continuação
Área
z
0 z
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5949 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7518 0.7549
0.7 0.7580 0.7612 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8108 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.883
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995
3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998
3.5 ou
0,9999
mais
Fonte: Larson e Farber (2010, p. A17).
278
Tabela B - Distribuição t
Nível de
g.l. 0,50 0,80 0,90 0,95 0,98 0,99
confiança, c
Unilateral, a 0,25 0,10 0,05 0,025 0,01 0,005
Bilateral, a 0,50 0,20 0,10 0,05 0,02 0,01
1 1,000 3,078 6,314 12,706 31,821 63,657
2 0,816 1,886 2,920 4,303 6,965 9,925
3 0,765 1,638 2,353 3,182 4,541 5,841
4 0,741 1,533 2,132 2,776 3,747 4,604
5 0,727 1,476 2,015 2,571 3,365 4,032
6 0,718 1,440 1,943 2,447 3,143 3,707
7 0,711 1,415 1,895 2,365 2,998 3,499
8 0,706 1,397 1,860 2,306 2,896 3,355
9 0,703 1,383 1,833 2,262 2,821 3,250
10 0,700 1,372 1,812 2,228 2,764 3,169
11 0,697 1,363 1,796 2,201 2,718 3,106
12 0,695 1,356 1,782 2,179 2,681 3,055
13 0,694 1,350 1,771 2,160 2,650 3,012
14 0,692 1,345 1,761 2,145 2,624 2,997
15 0,691 1,341 1,753 2,131 2,602 2,947
16 0,690 1,337 1,746 2,120 2,583 2,921
17 0,689 1,333 1,740 2,110 2,567 2,898
18 0,688 1,330 1,734 2,101 2,552 2,878
19 0,688 1,328 1,729 2,093 2,539 2,861
20 0,687 1,325 1,725 2,086 2,528 2,845
21 0,686 1,323 1,721 2,080 2,518 2,831
22 0,686 1,321 1,717 2,074 2,508 2,819
23 0,685 1,319 1,714 2,069 2,500 2,807
24 0,685 1,318 1,711 2,064 2,492 2,797
25 0,684 1,316 1,708 2,060 2,485 2,787
26 0,684 1,315 1,706 2,056 2,479 2,779
27 0,684 1,314 1,703 2,052 2,473 2,771
28 0,683 1,313 1,701 2,048 2,467 2,763
29 0,683 1,311 1,699 2,045 2,462 2,756
∞ 0,674 1,282 1,645 1,960 2,326 2,576
Fonte: Larson e Farber (2010, p. A18).
279
Tabela C - Distribuição qui-quadrado
Área à direita do valor crítico
g.l.
0,995 0,99 0,975 0,95 0,90 0,10 0,05 0,025 0,01 0,005
280
Tabela D - Distribuição F - a = 0, 01
g .l.D α = 0, 01
g .l.N
1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞
1 4052 4999 5403 5625 5764 5859 5928 5982 6022 6056 6106 6157 6209 6235 6261 6287 6313 6339 6366
2 98.50 99.00 99.17 99.25 99.30 99.33 99.36 99.37 99.39 99.40 99.42 99.43 99.45 99.46 99.47 99.47 99.48 99.49 99.50
3 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.35 27.23 27.05 26.87 26.69 26.60 26.50 26.41 26.32 26.22 26.13
4 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.55 4.37 14.20 14.02 13.93 13.84 13.75 13.65 13.56 13.46
5 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 10.05 9.89 9.72 9.55 9.47 9.38 9.29 9.20 9.11 9.02
6 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.72 7.56 7.40 7.31 7.23 7.14 7.06 6.97 6.88
7 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62 6.47 6.31 6.16 6.07 5.99 5.91 5.82 5.74 5.65
8 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81 5.67 5.52 5.36 5.28 5.20 5.12 5.03 4.95 4.86
9 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26 5.11 4.96 4.81 4.73 4.65 4.57 4.48 4.40 4.31
10 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85 4.71 4.56 4.41 4.33 4.25 4.17 4.08 4.00 3.91
11 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63 4.54 4.40 4.25 4.10 4.02 3.94 3.86 3.78 3.69 3.60
12 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30 4.16 4.01 3.86 3.78 3.70 3.62 3.54 3.45 3.36
13 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 4.19 4.10 3.96 3.82 3.66 3.59 3.51 3.43 3.34 3.25 3.17
14 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 3.94 3.80 3.66 3.51 3.43 3.35 3.27 3.18 3.09 3.00
15 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80 3.67 3.52 3.37 3.29 3.21 3.13 3.05 2.96 2.87
16 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3.69 3.55 3.41 3.26 3.18 3.10 3.02 2.93 2.84 2.75
17 8.40 6.11 5.18 4.67 4.34 4.10 3.93 3.79 3.68 3.59 3.46 3.31 3.16 3.08 3.00 2.92 2.83 2.75 2.65
18 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60 3.51 3.37 3.23 3.08 3.00 2.92 2.84 2.75 2.66 2.57
281
282
g .l.D α = 0, 01
g .l.N
19 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52 3.43 3.30 3.15 3.00 2.92 2.84 2.76 2.67 2.58 2.49
20 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37 3.23 3.09 2.94 2.86 2.78 2.69 2.61 2.52 2.42
21 8.02 5.78 4.87 4.37 4.04 3.81 3.64 3.51 3.40 3.31 3.17 3.03 2.88 2.80 2.72 2.64 2.55 2.46 2.36
22 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35 3.26 3.12 2.98 2.83 2.75 2.67 2.58 2.50 2.40 2.31
23 7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41 3.30 3.21 3.07 2.93 2.78 2.70 2.62 2.54 2.45 2.35 2.26
24 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26 3.17 3.03 2.89 2.74 2.66 2.58 2.49 2.40 2.31 2.21
25 7.77 5.57 4.68 4.18 3.85 3.63 3.46 3.32 3.22 3.13 2.99 2.85 2.70 2.62 2.54 2.45 2.36 2.27 2.17
26 7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.18 3.09 2.96 2.81 2.66 2.58 2.50 2.42 2.33 2.23 2.13
27 7.68 5.49 4.60 4.11 3.78 3.56 3.39 3.26 3.15 3.06 2.93 2.78 2.63 2.55 2.47 2.38 2.29 2.20 2.10
28 7.64 5.45 5.47 4.07 3.75 3.53 3.36 3.23 3.12 3.03 2.90 2.75 2.60 2.52 2.44 2.35 2.26 2.17 2.06
29 7.6 5.42 5.54 4.04 3.73 3.50 3.33 3.20 3.09 3.00 2.87 2.73 2.57 2.49 2.41 2.33 2.23 2.14 2.03
30 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07 2.98 2.84 2.70 2.55 2.47 2.39 2.30 2.21 2.11 2.01
40 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89 2.80 2.66 2.52 2.37 2.29 2.20 2.11 2.02 1.92 1.80
60 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 2.63 2.50 2.35 2.20 2.12 2.03 1.94 1.84 1.73 1.60
120 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56 2.47 2.34 2.19 2.03 1.95 1.86 1.76 1.66 1.53 1.38
∞ 6.63 4.61 3.78 3.23 3.02 2.80 2.64 2.51 2.41 2.32 2.18 2.04 1.88 1.79 1.70 1.59 1.47 1.32 1.00
Tabela D - Distribuição F - a = 0, 05
g .l.D α = 0, 05
g .l.N
1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞
1 161.40 199.50 215.70 224.60 230.20 234.00 236.80 238.90 240.50 241.90 243.90 245.90 248.00 249.10 250.10 251.10 252.20 253.30 254.30
2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.41 19.43 19.45 19.45 19.46 19.47 19.48 19.49 19.50
3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.74 8.70 8.66 8.64 8.62 8.59 8.57 8.55 8.53
4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.91 5.86 5.80 5.77 5.75 5.72 5.69 5.66 5.63
5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.68 4.62 4.56 4.53 4.50 4.46 4.43 4.40 4.36
6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.00 3.94 3.87 3.84 3.81 3.77 3.74 3.70 3.67
7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.57 3.51 3.44 3.41 3.38 3.34 3.30 3.27 3.23
8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.28 3.22 3.15 3.12 3.08 3.04 3.01 2.97 2.93
9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.07 3.01 2.94 2.90 2.86 2.83 2.79 2.75 2.71
10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.91 2.85 2.77 2.74 2.70 2.66 2.62 2.58 2.54
11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85 2.79 2.72 2.65 2.61 2.57 2.53 2.49 2.45 2.40
12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 2.69 2.62 2.54 2.51 2.47 2.43 2.38 2.34 2.30
13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 2.67 2.60 2.53 2.46 2.42 2.38 2.34 2.30 2.25 2.21
14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.53 2.46 2.39 2.35 2.31 2.27 2.22 2.18 2.13
15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54 2.48 2.40 2.33 2.29 2.25 2.20 2.16 2.11 2.07
16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 2.42 2.35 2.28 2.24 2.19 2.15 2.11 2.03 2.01
17 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 2.45 2.38 2.31 2.23 2.19 2.15 2.10 2.06 2.01 1.96
18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 2.34 2.27 2.19 2.15 2.11 2.06 2.02 1.97 1.92
19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42 2.38 2.31 2.23 2.16 2.11 2.07 2.03 1.98 1.93 1.88
283
284
g .l.D α = 0, 05
g .l.N
20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.28 2.20 2.12 2.08 2.04 1.99 1.95 1.90 1.84
21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37 2.32 2.25 2.18 2.10 2.05 2.01 1.96 1.92 1.87 1.81
22 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34 2.30 2.23 2.15 2.07 2.03 1.98 1.94 1.89 1.84 1.78
23 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32 2.27 2.20 2.13 2.05 2.01 1.96 1.91 1.86 1.81 1.76
24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 2.25 2.18 2.11 2.03 1.98 1.94 1.89 1.84 1.79 1.73
25 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28 2.24 2.16 2.09 2.01 1.96 1.92 1.87 1.82 1.77 1.71
26 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27 2.22 2.15 2.07 1.99 1.95 1.90 1.85 1.80 1.75 1.69
27 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31 2.25 2.20 2.13 2.06 1.97 1.93 1.88 1.84 1.79 1.73 1.67
28 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24 2.19 2.12 2.04 1.96 1.91 1.87 1.82 1.77 1.71 1.65
29 4.18 3.33 2.93 2.70 2.55 2.43 2.35 2.28 2.22 2.18 2.10 2.03 1.94 1.90 1.85 1.81 1.75 1.70 1.64
30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16 2.09 2.01 1.93 1.89 1.84 1.79 1.74 1.68 1.62
40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08 2.00 1.92 1.84 1.79 1.74 1.69 1.64 1.58 1.51
60 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 1.99 1.92 1.84 1.75 1.70 1.65 1.59 1.53 1.47 1.39
120 3.92 3.07 2.68 2.45 2.29 2.17 2.09 2.02 1.96 1.91 1.83 1.75 1.66 1.61 1.55 1.50 1.43 1.35 1.25
∞ 3.84 3.00 2.60 2.37 2.21 2.10 2.01 1.94 1.88 1.83 1.75 1.67 1.57 1.52 1.46 1.39 1.32 1.22 1.00
Tabela D - Distribuição F - a = 0, 10
α = 0, 10
g .l.D
g .l.N
1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞
1 39.86 49.50 53.59 55.83 57.24 58.20 58.91 59.44 59.86 60.19 60.71 61.22 61.74 62.00 62.26 62.53 62.79 63.06 63.33
2 8.53 9.00 9.16 9.24 9.29 9.33 9.35 9.37 9.38 9.39 9.41 9.42 9.44 9.45 9.46 9.47 9.47 9.48 9.49
3 5.54 5.46 5.39 5.34 5.31 5.28 5.27 5.25 5.24 5.23 5.22 5.20 5.18 5.18 5.17 5.16 5.15 5.14 5.13
4 4.54 4.32 4.19 4.11 4.05 4.01 3.98 3.95 3.94 3.92 3.90 3.87 3.84 3.83 3.82 3.80 3.79 3.78 3.76
5 4.06 3.78 3.62 3.52 3.45 3.40 3.37 3.34 3.32 3.30 3.27 3.24 3.21 3.19 3.17 3.16 3.14 3.12 3.10
6 3.78 3.46 3.29 3.18 3.11 3.05 3.01 2.98 2.96 2.94 2.90 2.87 2.84 2.82 2.80 2.78 2.76 2.74 2.72
7 3.59 3.26 3.07 2.96 2.88 2.83 2.78 2.75 2.72 2.70 2.67 2.63 2.59 2.58 2.56 2.54 2.51 2.49 2.47
8 3.46 3.11 2.92 2.81 2.73 2.67 2.62 2.59 2.56 2.54 2.50 2.46 2.42 2.40 2.38 2.36 2.34 2.32 2.29
9 3.36 3.01 2.81 2.69 2.61 2.55 2.51 2.47 2.44 2.42 2.38 2.34 2.30 2.28 2.25 2.23 2.21 2.18 2.16
10 3.29 2.92 2.73 2.61 2.52 2.46 2.41 2.38 2.35 2.32 2.28 2.24 2.20 2.18 2.16 2.13 2.11 2.08 2.06
11 3.23 2.86 2.66 2.54 2.45 2.39 2.34 2.30 2.27 2.25 2.21 2.17 2.12 2.10 2.08 2.05 2.03 2.00 1.97
12 3.18 2.81 2.61 2.48 2.39 2.33 2.28 2.24 2.21 2.19 2.15 2.10 2.06 2.04 2.01 1.99 1.96 1.93 1.90
13 3.14 2.76 2.56 2.43 2.35 2.28 2.23 2.20 2.16 2.14 2.10 2.05 2.01 1.98 1.96 1.93 1.90 1.88 1.85
14 3.10 2.73 2.52 2.39 2.31 2.24 2.19 2.15 2.12 2.10 2.05 2.01 1.96 1.94 1.91 1.89 1.86 1.83 1.80
15 3.07 2.70 2.49 2.36 2.27 2.21 2.16 2.12 2.09 2.06 2.02 1.97 1.92 1.90 1.87 1.85 1.82 1.79 1.76
16 3.05 2.67 2.46 2.33 2.24 2.18 2.13 2.09 2.06 2.03 1.99 1.94 1.89 1.87 1.84 1.81 1.78 1.75 1.72
17 3.03 2.64 2.44 2.31 2.22 2.15 2.10 2.06 2.03 2.00 1.96 1.91 1.86 1.84 1.81 1.78 1.75 1.72 1.69
285
286
α = 0, 10
g .l.D
g .l.N
18 3.01 2.62 2.42 2.29 2.20 2.13 2.08 2.04 2.00 1.98 1.93 1.89 1.84 1.81 1.78 1.75 1.72 1.69 1.66
19 2.99 2.61 2.40 2.27 2.18 2.11 2.06 2.02 1.98 1.96 1.91 1.86 1.81 1.79 1.76 1.73 1.70 1.67 1.63
20 2.97 2.59 2.38 2.25 2.16 2.09 2.04 2.00 1.96 1.94 1.89 1.84 1.79 1.77 1.74 1.71 1.68 1.64 1.61
21 2.96 2.57 2.36 2.23 2.14 2.08 2.02 1.98 1.95 1.92 1.87 1.83 1.78 1.75 1.72 1.69 1.66 1.62 1.59
22 2.95 2.56 2.35 2.22 2.13 2.06 2.01 1.97 1.93 1.90 1.86 1.81 1.76 1.73 1.70 1.67 1.64 1.60 1.57
23 2.94 2.55 2.34 2.21 2.11 2.05 1.99 1.95 1.92 1.89 1.84 1.80 1.74 1.72 1.69 1.66 1.62 1.59 1.55
24 2.93 2.54 2.33 2.19 2.10 2.04 1.98 1.94 1.91 1.88 1.83 1.78 1.73 1.70 1.67 1.64 1.61 1.57 1.53
25 2.92 2.53 2.32 2.18 2.09 2.02 1.97 1.93 1.89 1.87 1.82 1.77 1.72 1.69 1.66 1.63 1.59 1.56 1.52
26 2.91 2.52 2.31 2.17 2.08 2.01 1.96 1.92 1.88 1.86 1.81 1.76 1.71 1.68 1.65 1.61 1.58 1.54 1.50
27 2.90 2.51 2.30 2.17 2.07 2.00 1.95 1.91 1.87 1.85 1.80 1.75 1.70 1.67 1.64 1.60 1.57 1.53 1.49
28 2.89 2.50 2.29 2.16 2.06 2.00 1.94 1.90 1.87 1.84 1.79 1.74 1.69 1.66 1.63 1.59 1.56 1.52 1.48
29 2.89 2.50 2.28 2.15 2.06 1.99 1.93 1.89 1.86 1.83 1.78 1.73 1.68 1.65 1.62 1.58 1.55 1.51 1.47
30 2.88 2.49 2.28 2.14 2.05 1.98 1.93 1.88 1.85 1.82 1.77 1.72 1.67 1.64 1.61 1.57 1.54 1.50 1.46
40 2.84 2.44 2.23 2.09 2.00 1.93 1.87 1.83 1.79 1.76 1.71 1.66 1.61 1.57 1.54 1.51 1.47 1.42 1.38
60 2.79 2.39 2.18 2.04 1.95 1.87 1.82 1.77 1.74 1.71 1.66 1.60 1.54 1.51 1.48 1.44 1.40 1.35 1.29
120 2.75 2.35 2.13 1.99 1.90 1.82 1.77 1.72 1.68 1.65 1.60 1.55 1.48 1.45 1.41 1.37 1.32 1.26 1.19
∞ 2.71 2.30 2.08 1.94 1.85 1.77 1.72 1.67 1.63 1.60 1.55 1.49 1.42 1.38 1.34 1.30 1.24 1.17 1.00
Tabela E - Valores críticos do coeficiente de correlação de Pearson
n α = 0, 05 α = 0, 01
4 0,950 0,999
5 0,878 0,959
6 0,811 0,917
7 0,754 0,875
8 0,707 0,834
9 0,666 0,798
10 0,632 0,765
11 0,602 0,735
12 0,576 0,708
13 0,553 0,684
14 0,532 0,661
15 0,514 0,641
16 0,497 0,623
17 0,482 0,606
18 0,468 0,590
19 0,456 0,575
20 0,444 0,561
25 0,396 0,505
30 0,361 0,463
35 0,335 0,430
40 0,312 0,402
45 0,294 0,378
50 0,279 0,361
60 0,254 0,330
70 0,236 0,305
80 0,220 0,286
90 0,207 0,269
100 0,196 0,256
Fonte: a autora.
287
Tabela F - Distribuição t
Nível de
g.l. 0,50 0,80 0,90 0,95 0,98 0,99
confiança, c
288