EST Ebook
EST Ebook
EST Ebook
ESTATÍSTICA
Copyright © UVA 2020
Nenhuma parte desta publicação pode ser reproduzida por qualquer
meio sem a prévia autorização desta instituição.
REVISÃO DIAGRAMAÇÃO
Janaina Vieira UVA
Lydianna Lima
Formato: PDF
ISBN 978-65-5700-089-2
1. Estatística. 2. Probabilidades. I. Universidade Veiga de Almeida. II.
Título.
CDD – 519.5
Apresentação 6
Autor 7
UNIDADE 1
UNIDADE 2
Probabilidade 93
• Introdução à probabilidade
• Conceitos de probabilidade
• Probabilidade condicional
SUMÁRIO
UNIDADE 3
UNIDADE 4
• Correlação
• Regressão linear
APRESENTAÇÃO
Para coletar, organizar, analisar, apresentar, interpretar e tirar conclusões sobre elas preci-
samos de um ramo poderoso da Matemática Aplicada, que denominamos de Estatística.
Não podemos escapar dos dados, assim como não podemos evitar o
uso de palavras. Tal como palavras os dados não se interpretam a si
mesmos, mas devem ser lidos com entendimento. Da mesma maneira
que um escritor pode dispor as palavras em argumentos convincentes
ou frases sem sentido, assim também os dados podem ser convincen-
tes, enganosos ou simplesmente inócuos. A instrução numérica, a capa-
cidade de acompanhar e compreender argumentos baseados em dados,
é importante para qualquer um de nós. O estudo da estatística é parte
essencial de uma formação sólida. (MOORE, 2000)
Seja qual for a área ou o objeto de estudo do pesquisador, este poderá utilizar conceitos
de Estatística. É difícil encontrar uma situação real em que não se utilize a Estatística para
solucionar problemas, gerenciar qualidade, comparar metodologias, testar hipóteses, evi-
denciar tendências, diminuir riscos e, principalmente, auxiliar na tomada de decisões.
6
AUTOR
Graduada em Engenharia Civil pela Universidade Federal de Juiz de Fora – UFJF, licen-
ciada em Matemática pela Universidade Federal de Santa Catarina – UFSC e mestra em
Educação Matemática pela Universidade Severino Sombra – USS. Iniciou sua trajetória
docente no Ensino Superior em 1991, ingressando como professora da Universidade Vei-
ga de Almeida – UVA em 2010. Ministra aulas de Cálculo Elementar, Cálculo I, Cálculo
II, Matemática I, Matemática II, Matemática Financeira e Estatística, para os cursos de
Engenharias, Administração e Ciências Contábeis.
7
UNIDADE 1
OBJETIVO
9
A estatística no Brasil e no mundo
Agora veremos a evolução da estatística no Brasil até o momento atual. Observe a tabela
a seguir.
Destaques no Brasil
10
Primeiro censo geral da população brasileira feito por José Maria da Silva
1872
Paranhos, conhecido como Visconde do Rio Branco.
11
O Brasil teve a honra de receber Sir Ronald Aylmer Fisher para participar do 2°
1955
Congresso Internacional de Biometria, realizado em Campinas.
12
Conceitos fundamentais
1. Variáveis
Exemplo
2. Dados
Exemplo
3. População e Amostra
Você já imaginou se, ao fazer uma pesquisa eleitoral em nosso país, ti-
véssemos que entrevistar todos os eleitores do Brasil?
Quando fazemos a coleta dos dados em situações em que todos os elementos são ana-
lisados, estamos trabalhando com uma “população”.
13
Quando fazemos a coleta dos dados em situações em que uma parte ou subgrupo é
considerado, estamos trabalhando com uma “amostra”.
População:
É o conjunto de todos os elementos sobre o qual desejamos obter informação.
Amostra:
É um subconjunto de elementos retirados da população para obter-se a infor-
mação desejada.
Ampliando o foco
14
Ao realizar uma pesquisa com amostras é importante ter muito cuidado com a repre-
sentatividade delas. É importante assegurar que a parte escolhida da população seja
suficientemente adequada para estimar o comportamento do todo.
Situação 1
Afirmativa: Cerca de 68% dos entrevistados defendem a pena de morte como solução
para a violência no país. Isso equivale a mais da metade dos brasileiros.
Pensamento correto: Se não for informado o número de entrevistados isso pode ser fal-
so. Suponhamos que apenas 3 pessoas deram essa opinião, em que 2 foram favoráveis
e 1 contra. O tamanho da amostra não foi suficiente para ser representativa.
15
Situação 2
Situação 3
Pensamento correto: Essa informação não é suficiente para saber se nessa empresa
todos recebem bons salários. Suponhamos que o presidente da empresa receba R$
401.000,00 e 99 funcionários recebam R$ 1.000,00.
Situação 4
Pensamento correto: Essa pesquisa pode ter sido feita baseada em amostras de 10 pes-
soas que já tinham afinidade com a marca e foram especialmente selecionadas para dar
esse resultado.
Tipos de erros
2. Erros não amostrais: ocorrem quando os dados amostrais são coletados incor-
retamente, devido a uma amostra tendenciosa, instrumento de medida defeituoso,
anotações erradas, erro do pesquisador. Não devem existir ou devem ser minimiza-
dos com cuidado, atenção e planejamento.
16
Tipos de variáveis
Nominal
Qualitativa
(atributo)
Ordinal
Variável
Discreta
Quantitativa
(números)
Contínua
Agora, com base na figura anterior, vamos apresentar cada uma delas. Preste atenção!
Qualitativas
A resposta a ser anotada é uma qualidade ou atributo, ou seja, será anotada com uma
palavra ou um código numérico.
• Qualitativa nominal: não existe uma hierarquia ou uma ordenação nas possíveis
respostas.
Exemplo: profissão, sexo, estado civil, CPF, RG, senha.
17
Quantitativas
A resposta a ser anotada é uma medição ou contagem, ou seja, será anotada com
um número.
Exemplo
O trecho a seguir foi extraído da página do IBOPE na internet.
18
Tabulação dos dados coletados:
Fonte: ibopeinteligencia.com
População e Amostra
População: 8.407.202 habitantes com 18 anos ou mais do município de São Paulo.
Amostra: 1.183 indivíduos com 18 anos ou mais moradores no município de São Paulo.
19
Escolaridade: qualitativa ordinal.
Raça/cor: qualitativa nominal.
Nº de pessoas no domicílio: quantitativa discreta.
Considerações gerais:
Exemplo 2
Observe a tabela com as informações e veja o posicionamento das variáveis envolvidas
no esquema apresentado, de acordo com a classificação a que ela pertence.
Informações sobre nome, estado civil, grau de instrução, número de filhos, salário, idade,
procedência, altura e massa corporal de 10 funcionários da Universidade Veiga de Almeida.
Superior
Eduardo Casado 3 12.534,72 30 capital 1,87 85
completo
Superior
Cláudia Casada 2 18.145,78 56 interior 1,65 62
completo
Ensino
Carlos Solteiro 0 3.456,78 18 capital 1,91 95
médio
Superior
Paola Solteira 0 4.567,89 20 Interior 1,68 55
Incompleto
Superior
Maria Casada 1 6.789,10 48 capital 1,60 65
completo
20
• Nome
• Estado civil • Grau de instrução
Qualitativa Qualitativa
• Procedência nominal ordinal
• Salário
• Número de filhos Quantitativa Quantitativa
discreta contínua • Altura
• Idade
• Massa
Exemplo 3
Observe possíveis respostas de uma pesquisa sobre os tipos de amostragens, tanto pro-
babilísticas quanto não probabilísticas, com um exemplo para cada tipo pesquisado.
21
Deseja-se obter uma amostra
Quando a população em composta de 80 famílias resi-
estudo já encontra-se dentes em determinada rua, que
ordenada de acordo com conta com 2.000 casas. Assim,
algum critério específico, nosso intervalo seria dado por
como fichários, prontuá- 2.000/80, que resulta em 25. Con-
rios, listas, calculamos siderando os critérios aleatórios,
um intervalo de amostra- devemos escolher um número
Sistemática gem, também conhecido entre as casas 0 e 25 e, a partir
com intervalo de seleção, daí, contar de 25 em 25 casas
que definirá quais ele- para inclusão na amostra. Consi-
mentos participarão da derando que o número sorteado
pesquisa. O cálculo dele foi 5, selecionaremos a família
Amostragens é dado pelo tamanho da da referida casa para participar
Probabilísticas população dividido pelo da amostra, e depois aqueles
tamanho da amostra. residentes nas casas 5, 30, 55, 80,
105, até atingirmos 80 casas.
Os indivíduos escolhidos
nessa pesquisa estão
Acidental prontamente disponíveis Pesquisas de opinião em
ou casual e não porque foram sele- supermercados.
cionados por meio de um
critério estatístico.
Intencionalmente é
Amostragens Para um estudo sobre auto-
escolhido o grupo de ele-
não Intencional móveis, o pesquisador procura
mentos que irá compor a
probabilísticas apenas oficinas.
amostra.
Assemelha-se ao método
de amostragem estrati- Deseja-se entrevistar apenas
ficada, diferindo apenas indivíduos da classe A, que repre-
Por quotas
pelo fato de a escolha sentam 12% da população. Esta
não seguir critérios de será a quota para o trabalho.
aleatoriedade.
22
Ao entrevistar imigrantes de um
país específico, pode-se iniciar
buscando pessoas conhecidas e
Cada indivíduo entrevis- pedir novos contatos de conter-
Amostragens
tado indica uma ou mais râneos conhecidos delas. Esse
não Bola de neve
pessoas para a próxima processo continua até que o
probabilísticas
entrevista. pesquisador tenha todas as en-
trevistas de que necessita ou até
que todos os contatos tenham
sido atingidos.
Indicadores e Índices
O indicador é uma medida quantitativa que auxilia na tomada de decisões. É obtido re-
lacionando-se as variáveis. Muito usado para avaliar tendências e performances. É um
excelente feedback, já que permite demonstrar, de forma clara e objetiva, o desempenho
de um processo em um determinado intervalo de tempo.
Exemplo
Para entender melhor esses conceitos vamos supor que uma organização utili-
ze como indicador o número de colaboradores com nível superior completo di-
vidido pelo número total de colaboradores. Se a empresa apurar esse indicador
em um determinado período e alcançar 0,5 ou 50% esse será o seu índice de
escolaridade de nível superior dos funcionários.
Os indicadores e índices são muito usados nas áreas de sustentabilidade, meio ambiente,
economia, entre outras.
23
Observe a tabela a seguir com os indicadores e índices mais usados.
24
INCC - Índice Nacional de Custo da
Construção - Mede a variação de preços
que faz parte do setor da construção civil
na economia brasileira.
Ampliando o foco
Tenha em mente que tanto os indicadores quanto os índices são de grande utili-
dade para o planejamento estratégico de uma empresa e também para o nosso
dia a dia. Neste material apresentaremos apenas alguns desses indicadores e
índices, contudo existe uma variedade deles.
Para saber mais é importante que você pesquise sobre indicadores e índices
ligados à sua área de interesse.
Divisões da Estatística
Estatística
Ferramentas usadas para estimar, induzir ou inferir
Estatística leis de comportamento de uma população, basean-
indutiva do-se em resultados obtidos em uma pesquisa feita
com uma amostra retirada dessa população.
25
Softwares estatísticos
Muitos softwares fazem integração entre informática e estatística. Contudo, neste mate-
rial listaremos os softwares mais usados. Veja a seguir uma breve descrição sobre cada
um deles.
6. Bioestat – Software para estudantes de fácil uso para iniciantes, voltado sobretudo
para a área de Ciências Biológicas, mas pode ser usado em qualquer área. É gratuito e
tem versão em português.
MIDIATECA
26
Elaboração e análise de gráficos e tabelas
Um dos objetivos da Estatística é fazer a síntese e a organização dos valores que a variável
de estudo pode assumir. Para alcançar esse propósito lançamos mão das tabelas e dos
gráficos que viabilizarão informações rápidas e seguras a respeito da variável em estudo.
Neste tópico abordaremos como fazer a coleta dos dados, a organização em tabelas de
distribuição de frequências e algumas representações gráficas.
27
Organização dos dados coletados em tabelas
28
Exemplo de uma tabela com os elementos.
Quantidade de vezes
Número Cabeçalho
que foi sorteado
1ª Classe 53 261 Casa ou
10 260 célula
23 254
5 254
33 248 Corpo
4 248
27 245
54 244
9ª Classe 24 244
42 244
Total 2.502
Fonte: https://www.somatematica.com.br/megasenaFrequentes.php Rodapé
Considerações:
- A tabela não é delimitada à esquerda e nem à direita (deve ficar aberta lateralmente).
- A tabela é limitada superiormente e inferiormente por uma linha grossa ou dupla.
- Os elementos “fonte” e “título” são obrigatórios.
- Devemos colocar um traço horizontal (–) quando o valor é zero.
- Quando não temos os dados sinalizamos com três pontos (...).
- Um ponto de interrogação (?) deve ser usado quando temos dúvida quando à exatidão
de determinado valor.
- O zero (0) deve ser usado quando o valor é muito pequeno para ser expresso pela uni-
dade utilizada.
• Dados brutos: são os dados originais na forma como foram coletados, sem ne-
nhuma organização.
29
• Frequência absoluta ou frequência simples ou simplesmente frequência: é a
quantidade de vezes que cada valor é observado.
Exemplo
O SINCOM realizou uma pesquisa sobre os preços de um modelo de computador em 20
lojas de informática, na cidade de Juiz de Fora, em julho de 2020. Foram coletados os
valores a seguir em reais:
2000 2500 2000 2600 2000 2600 2600 2500 2500 2000
2000 2000 2500 2600 2600 2600 2600 2600 2600 2600
2000 2000 2000 2000 2000 2000 2500 2500 2500 2500
2600 2600 2600 2600 2600 2600 2600 2600 2600 2600
Rol
2000 2000 2000 2000 2000 2000 2500 2500 2500 2500
2600 2600 2600 2600 2600 2600 2600 2600 2600 2600
30
Tabela: Preço do microcomputador modelo X, em 20 lojas de JF – Julho 2020.
2000 6
2500 4
2600 10
Total 20
A frequência relativa será obtida dividindo-se a frequência absoluta pelo total. Para ex-
pressarmos o resultado em porcentagem temos que multiplicar o resultado por 100.
Total 20 100%
31
Tabela: Preço do microcomputador modelo X, em 20 lojas de JF – Julho 2020.
Total 20 100%
A frequência acumulada relativa será a soma de todas as frequências relativas que estão
na classe(linha) ou acima dela:
Total 20 100%
32
Tabela de distribuição de frequência COM intervalos de
classe
Quando os dados obtidos assumem muitos valores diferentes, é costume, em vez de lis-
tar as respostas uma a uma, apresentar as tabelas em intervalos, chamados de classes.
Frequência
Idade Frequência Frequência Frequência
Acumulada
(anos) Absoluta Relativa Acumulada
Relativa
Fonte: IBGE - Pesquisa Nacional por Amostra de Domicílios Contínua anual (2020).
33
Elementos de uma distribuição de frequências com intervalos de classe:
Uma distribuição de frequência com intervalos de classe apresenta alguns elementos.
São eles:
1. Classes
Exemplo:
Na tabela 2, temos:
1ª classe: 0 I---- 4
2ª classe: 4 I---- 6
3ª classe: 6 I---- 10
4ª classe: 10 I---- 15
5ª classe: 15 I---- 18
6ª classe: 18 I---- 25
7ª classe: 25 I---- 30
8ª classe: 30 I---- 40
9ª classe: 40 I---- 60
10ª classe: 60 anos ou mais
Temos três formas que podem ser usadas para calcular o número de classes de uma
tabela de distribuição de frequências em função da quantidade de dados (n):
Sejam:
k = número de classes
n = quantidade de dados
34
~
• Primeira forma: Fórmula de Sturges: k = 1 + 3,3 · log n
• Segunda forma: k = n
3. Limites da classe
São os valores extremos de cada classe. O menor número é o limite inferior da classe (Li)
e o maior número, o limite superior (LS) da classe.
Exemplo:
Na tabela 2 temos:
Na primeira classe: Li = 0 LS = 4
Na quinta classe: Li = 15 LS = 18
Na décima classe: Li = 60 LS = -
35
Exemplo
1º) Considere o seguinte levantamento sobre o número de salários mínimos recebidos
pelos funcionários de uma empresa:
Funcionário Nº de S.M
Funcionário 1 1
Funcionário 2 4
Funcionário 3 4,2
Funcionário 4 3,9
Funcionário 5 5
Funcionário 6 2,5
Funcionário 7 (voluntário) 0
Funcionário 8 3
Funcionário 9 4,1
3º) Suponha que vamos preencher a coluna da frequência absoluta da seguinte tabela
de distribuição:
Nº de Frequência
Explicação
salários Absoluta
36
4º) Modifique o intervalo e faça a contagem da frequência absoluta:
Nº de Frequência
Explicação
salários Absoluta
Nº de Frequência
Explicação
salários Absoluta
37
Por fim, modificando novamente o intervalo e fazendo a contagem teremos:
Nº de Frequência
Explicação
salários Absoluta
AA = xmáximo – xmínimo
hi = Lsi – Lii
Como vimos na tabela População feminina residente no Brasil por idade, em 2019, que
apresenta a população feminina residente no Brasil por idade em 2019, temos:
Amplitude da décima classe (60 anos ou mais) → h10 = Ls10 – Li10 = ???
(não pode ser determinada, já que o limite superior não foi especificado)
38
Quando a tabela ainda não foi criada, para calcular o intervalo de cada classe devemos
dividir a amplitude total (AT) pelo número de classes(k). Então:
AA
h=
k
A amplitude de um intervalo de classe pode ser igual em toda tabela (que é preferível,
sempre que possível) ou diferente em algumas classes.
Lii + Lsi
Xi =
2
Na tabela que apresenta a população feminina residente no Brasil por idade em 2019,
temos:
Calculamos da mesma maneira para todas as classes que possuem limite inferior e limi-
te superior.
Ponto médio da décima classe (60 anos ou mais) → (não pode ser determinado, já que o
limite superior não foi especificado)
39
8. Frequências de cada classe
As frequências absolutas, relativas e acumuladas são calculadas exatamente iguais ao
cálculo das frequências para tabelas de distribuição de frequência sem intervalos de
classe. São elas:
• Frequências relativas: obtida pela divisão entre a frequência e o total ou pela fre-
quência acumulada e o total. Geralmente são expressas em %.
Para isso, é preciso efetuar uma divisão e o resultado deve ser arredondado.
I) Se o primeiro algarismo a ser abandonado for menor do que 5, ou seja quando o pri-
meiro algarismo a ser abandonado for 0,1,2,3 ou 4, ficará inalterado o último algarismo
que permanece.
II) Se o primeiro algarismo a ser abandonado for maior do que 5, ou seja, quando o pri-
meiro algarismo a ser abandonado é o 6,7,8, ou 9, aumenta-se em uma unidade o alga-
rismo que permanece.
Exemplos:
13,87 passa para 13,9.
24,08 passa para 24,1.
34,99 passa para 35,0.
40
III) Quando o algarismo a ser abandonado for igual a 5 existem dois critérios e você deve
adotar o que achar mais conveniente, sem nenhum problema.
Se, após o 5 seguir em qualquer casa um algarismo diferente de zero, aumenta-se uma
unidade ao algarismo que permanece. (Esse critério é adotado por calculadoras e com-
putadores.)
Exemplos:
7,352 passa para 7,4.
45,6501 passa para 45,7.
86,250002 passa para 86,3.
Exemplos:
18,75 passa para 18,8
29,65 passa para 29,6
37,75000 passa para 37,8
49,8500 passa para 49,8
Exemplo 1
Em julho de 2020 foi feita uma pesquisa sobre a idade de 50 funcionários da UVA. Os
dados estão apresentados a seguir:
31 43 44 44 45 48 45 46 47 45
49 50 51 53 54 54 56 58 26 65
18 20 20 21 22 24 25 25 62 27
29 34 30 30 41 31 32 33 29 35
36 36 37 37 40 37 38 38 38 37
41
Como devemos construir a tabela completa de distribuição de frequências, com o intervalo
fechado à esquerda?
Resolução:
Sete passos devem ser seguidos para confeccionarmos a tabela de distribuição de fre-
quências com intervalos de classe:
18 20 20 21 22 24 25 25 26 27
29 29 30 30 31 31 32 33 34 35
36 36 37 37 37 37 38 38 38 40
41 43 44 44 45 45 45 46 47 48
49 50 51 53 54 54 56 58 62 65
~
k= 1 + 3,3 · log n
~
k = 1 + 3,3 · log 50
~
k= 1 + 3,3 · 1,6989970004
~
k = 1 + 5,606601014
~
k= 6,606601014
~
k = 7 classes
Se tivéssemos optado pelo método da raiz quadrada de determinação das classes teríamos:
k= n
k = 50
~
k = 7,071067812 = 7 classes
42
3º passo: cálculo da amplitude dos intervalos de classe (h).
AA
h=
k
65 – 18 ~
h= = 6,714285714 = 7
7
Para determinar o limite superior da primeira classe basta adicionar a amplitude da clas-
se ao limite inferior, ou seja:
1ª classe: Li = 18 Ls = 18 + 7 = 25
O limite superior da primeira classe será o limite inferior da segunda classe e assim su-
cessivamente, até que o maior valor pesquisado esteja contido na última classe.
2ª classe: Li = 25 Ls = 25 + 7 = 32
3ª classe: Li = 32 Ls = 32 + 7 = 39
4ª classe: Li = 39 Ls = 39 + 7 = 46
5ª classe: Li = 46 Ls = 46 + 7 = 53
6ª classe: Li = 53 Ls = 53 + 7 = 60
7ª classe: Li = 60 Ls = 60 + 7 = 67 (67 > 65 → ok!)
43
Tabela: Idade de 50 funcionários da Universidade Veiga de Almeida em Julho de 2020.
Total 50 1
Fonte: Elaborada pela autora. Dados fictícios.
Interpretação da tabela
Uma amostra com 50 dados, coletados em julho de 2020, informam as idades de cola-
boradores da Universidade Veiga de Almeida – UVA.
Após a organização desses dados pode-se observar que aproximadamente 26% dos fun-
cionários apresentam idade igual ou superior a 32 anos e inferior a 39 anos. Em seguida,
com um percentual de 20%, estão os colaboradores que apresentam idade de 25 até
antes de 32 anos. Percebe-se que 4% dos empregados estão acima de 60 anos e 12%
estão abaixo de 25 anos. Mais da metade dos colaboradores, aproximadamente 58%,
têm idade abaixo de 39 anos.
Você pode perceber que outras informações ainda podem ser retiradas da tabela?
Exemplo 2
Os dados coletados pela Secretaria do Meio Ambiente e já ordenados referem-se aos
níveis de ruído em decibéis de algumas áreas residenciais da cidade do Rio de Janeiro.
44
Resposta:
Tabela: Níveis de ruído de algumas áreas residenciais da cidade
do Rio de Janeiro, em julho de 2020.
Frequência
Nível de ruido Frequência Frequência Frequência
Acumulada
(dB) absoluta Relativa Acumulada
Relativa
Total 32 100,0%
Histograma
45
Para representá-la graficamente vamos utilizar um tipo de gráfico que se chama Histograma.
fi
14
12
10
8
6
4
2
0
18 25 32 39 46 53 60 67 Idade
(anos)
Ampliando o foco
Na planilha eletrônica Excel, versão 2016, existe o comando que gera automa-
ticamente o histograma. Basta selecionar a base de dados e clicar em Inserir
– Gráficos -Histograma.
Polígono de frequência
a. Marcar os pontos no gráfico, sendo que no eixo horizontal você marca os pontos mé-
dios das classes e no eixo vertical as frequências.
46
b. Relacionar cada ponto médio com sua respectiva frequência.
c. Marcar metade das distâncias dos pontos médios no eixo horizontal antes da primeira
classe e depois da última classe.
d. Traçar os segmentos de retas que ligam os pontos marcados.
e. Colocar o título e o nome das variáveis nos eixos.
fi fi
14 14
12 12
10 10
8 8
6 6
4 4
2 2
0 0
18 25 32 39 46 53 60 67 Idade 18 25 32 39 46 53 60 67 Idade
(anos) (anos)
47
Figura: Ogiva de Galton da Idade de 50 funcionários da UVA, em julho de 2020.
Frequência
Acumulada
50
48
43
37
29
16
0 18 25 32 39 46 53 60 67 Idade
(anos)
Existem diversos tipos de gráficos: colunas, barras, linhas ou segmentos, setores ou piz-
za, pictogramas e muitos outros tipos. Com auxílio de computadores podemos represen-
tá-los em terceira dimensão e com movimentos, o que enriquece muito a visualização.
48
Tipo/Características Representação
1. Gráfico de
colunas
Representação
de uma série por
meio de retân-
gulos de mesma
base e alturas
proporcionais aos
respectivos dados.
Utilizado quando
apresentamos as
categorias com
palavras curtas.
2. Gráfico
de barras
Representação
de uma série por
meio de retân-
gulos de mesma
altura e bases
proporcionais aos
respectivos dados.
Utilizado quando
apresentamos as
categorias com
palavras extensas
49
3. Colunas
justapostas
Descreve simulta-
neamente duas ou
mais categorias
para uma variável.
4. Setores
Também conheci-
do como gráfico
de pizza. É utili-
zado sempre que
desejamos ressal-
tar a participação
do dado no total.
5. Gráfico de
linha ou gráfico
de segmentos
Marcamos todos
os pares ordena-
dos corresponden-
tes à série estatís-
tica e os unimos a
partir de uma linha
poligonal traceja-
da ou contínua.
50
6. Diagrama
de dispersão
(scatterplot) e
linha de tendência
O diagrama de dis-
persão, também
conhecido como
scatterplot, é a
representação do
relacionamento
entre duas variá-
veis quantitativas.
A linha de tendên-
cia é a linha que
faz uma aproxima-
ção dessa relação.
7. Box Plot
É um gráfico
que possibilita
interpretar rapi-
damente o com-
portamento da
distribuição em
cada ¼ ou 25%
(quartis). É muito
útil para observar-
mos a existência
de valores discre-
pantes (outliers)
e a simetria da
distribuição.
MIDIATECA
51
Para construir um gráfico é preciso saber que:
Ampliando o foco
Confira as respostas que estão no final do livro e, se tiver alguma dúvida, fale
com o seu tutor pelo Fórum de Dúvidas – Fale com o Tutor.
52
Medidas de posição e de dispersão
Medidas de posição
São medidas usadas para resumir um conjunto de dados em um único valor. As medidas
de posição mais importantes são as medidas de tendência central, que recebem esse
nome pelo fato de que os dados observados tendem, em geral, a se agrupar em torno de
um valor localizado no centro da distribuição de uma série de observações.
Para cada situação acima temos uma metodologia de cálculo diferente. Por isso, antes
de calcularmos as medidas de posição, primeiro temos que identificar como os dados
foram apresentados.
1. Média Aritmética: (x ou )
É a medida de posição mais conhecida e mais utilizada, embora nem sempre seja a mais
representativa.
53
Nas fórmulas estatísticas é comum representar a primeira observação da variável “x” por
x1, o valor da segunda observação por x2 e assim sucessivamente. Em geral o valor da
i-ésima observação é indicado por xi.
Em que:
Σxi
x =
n x – média aritmética amostral.
xi – valores da variável.
Para dados n – número de entradas em uma amostra
Ou
não agrupados
ou
Σxi μ – média aritmética populacional.
μ=
N xi – valores da variável.
N – número de entradas em uma população.
Em que:
Σxi . fi
x =
n x – média aritmética amostral.
xi – valores da variável.
Para dados
agrupados em ou fi – frequência da classe.
tabelas sem n – número de entradas em uma amostra
intervalos ou
de classes
Σxi . fi
μ= μ – média aritmética populacional.
N
xi – valores da variável.
(média ponderada) fi – frequência da classe.
N – número de entradas em uma população.
54
Σxi . fi Em que:
x =
Para dados n
x – média aritmética amostral.
agrupados em
ou μ – média aritmética populacional.
tabelas com
intervalos Xi – pontos médios das classes.
de classes fi – a frequência da classe.
Σxi . fi n – número de entradas em uma amostra.
μ=
N N – número de entradas em uma população.
Exemplo 1
Para dados não agrupados.
55
Podemos observar que os dados não estão agrupados em tabelas. Utilize a fórmula de
cálculo de média para amostras de dados não agrupados:
Σxi
x=
n
5800 + 6800 + 8000 + 8200 + 8000 + 7300 + 7300 + 7900 + 7900 + 7900
x=
10
75100
x= = 7510
10
Exemplo 2
Para dados agrupados em tabelas sem intervalo de classes.
Suponha que as anotações dos salários vieram organizadas em uma tabela sem interva-
los de classes. Vamos calcular a média dos salários dos engenheiros.
5800 1
6800 1
7300 2
7900 3
8000 2
8200 1
Total 10
56
Utilizando a fórmula para cálculo da média para dados agrupados em tabelas sem in-
tervalo de classes temos:
Σxi . fi
x=
n
75100
x= = 7510
10
Exemplo 3
Para dados agrupados em tabelas com intervalo de classes.
Agora, vamos supor que as anotações dos salários vieram organizadas em uma tabela
com intervalos de classes. Vamos calcular a média dos salários dos engenheiros.
Total 10
57
Primeiramente, antes de calcular a média, temos que calcular o ponto médio de cada
classe.
5000 + 6000
5000 I---- 6000 1 = 5500
2
6000 + 7000
6000 I--- 7000 1 = 6500
2
7000 + 8000
7000 I--- 8000 5 = 7500
2
8000 + 9000
8000 I--- 9000 3 = 8500
2
Total 10
Σxi . fi
x=
n
75000
x= = 7500
10
58
Note que, ao agruparmos os dados com intervalos de classes, perdemos um pouco a
precisão das medidas. Por isso, devemos, sempre que possível, usar entre 5 e 20 classes.
Na midiateca você encontra o endereço para pesquisar mais sobre os salários médios e
medianos das categorias profissionais.
1. Mediana
Exemplo
Sem fazer nenhum cálculo podemos observar que as notas giram em torno de
5, porém se calcularmos a média obtemos como resposta o valor 3,75.
Nesses casos, em que temos alguns valores muito altos ou muito baixos em
relação aos outros valores, é mais conveniente usarmos outra medida de posi-
ção, a mediana.
A mediana é o valor central do rol, ou seja, o valor que divide um grupo de valo-
res ordenados em duas partes com o mesmo número de termos, como mostra
a imagem a seguir:
50% 50%
59
A mediana flutua mais de amostra para
amostra do que a média aritmética,
portanto é menos confiável.
Sua determinação é rápida e fácil,
sem necessitar de cálculos complexos.
Não utiliza todos os dados.
60
1 – Calcular a posição ocupada mediana, que denominamos de
Posto da Mediana.
Σfi
P=
2
Para dados
agrupados b) Se a quantidade de dados for “ímpar” usamos:
em tabelas
sem intervalos
de classes 1 + Σfi
P=
2
61
Observe alguns exemplos práticos.
Exemplo 1
Para dados não agrupados
Voltemos aos dados dos salários dos engenheiros recém-formados coletados pela Cen-
tral de Estágios em julho de 2020:
Vamos determinar a mediana dos salários mensais dos engenheiros. Para isso:
1º ) Confeccione o Rol.
5800 6800 7300 7300 7900 7900 7900 8000 8000 8200
7900 + 7900
Md = 7900
2
Exemplo 2
Para dados agrupados em tabelas sem intervalo de classe.
Agora vamos determinar a mediana para dados agrupados em tabelas sem intervalo
de classe:
5800 1
6800 1
62
7300 2
7900 3
8000 2
8200 1
Total 10
Σfi
P=
2
10
P= =5
2
5800 1 1
6800 1 2
7300 2 4
7900 3 7
8000 2 9
8200 1 10
Total 10
63
3º) Procure na coluna da frequência acumulada a primeira classe que contém o posto da
mediana, que nesse exemplo foi igual a 5.
Frequência Acumulada
Quantidade de
Salário (é nessa coluna que faremos a análise,
pessoas (fi)
mas não é aqui que estará o valor da mediana)
1
5800 1
(não contém, pois é menor do que 5)
2
6800 1
(não contém, pois é menor do que 5)
4
7300 2
não contém, pois é menor do que 5)
7
(ok! A frequência acumulada 7 é maior do que
7900 3
5)
essa é a classe da mediana
8000 2 9
8200 1 10
Total 10
Logo, a mediana será igual ao valor da variável que estiver na classe selecionada, a pri-
meira classe em que encontramos o valor da frequência acumulada maior do que o valor
do posto. Então: Md = 7900
Exemplo 3
Para os dados agrupados em tabelas com intervalos de classes.
Finalmente, vamos calcular a mediana para os dados agrupados em tabelas com inter-
valos de classes.
64
Vamos continuar trabalhando com o exemplo dos salários dos engenheiros, porém ago-
ra agrupados em uma tabela com intervalos. Observe a tabela a seguir.
Total 10
Σfi
P=
2
10
P= =5
2
Total 10
65
3º) Procure na coluna da frequência acumulada a primeira classe que contém o posto da
mediana, que nesse exemplo foi igual a 5.
Σfi 10
= =5
2 2
Σfi
– Fa.ant
Md = Li + h · 2
fi
5–2
Md = 7000 + 1000 ·
5
66
Ampliando o foco
2. MODA
É o valor, ou valores, da distribuição que ocorrem com a maior frequência, ou seja, o valor,
ou valores que mais se repetem dentro de uma série de observações. De maneira geral:
67
Tabela: Cálculo da Moda.
Para dados agrupados Basta observar a classe, ou classes, de maior frequência ab-
em tabelas sem
soluta.
intervalos de classes
Em que:
Mo = moda.
Md = mediana.
x ou μ =média.
68
Exemplo 1
Para dados não agrupados.
Voltemos aos dados dos salários dos engenheiros recém-formados coletados pela Cen-
tral de Estágios em julho de 2020:
Vamos determinar a moda dos salários mensais dos engenheiros. Observamos no con-
junto de dados que o valor que mais se repetiu foi R$ 7.900,00. Portanto, esse valor é o
valor da moda.
Exemplo 2
Para dados agrupados em tabelas sem intervalo de classe.
Agora vamos determinar a moda para dados agrupados em tabelas sem intervalo de
classe.
5800 1
6800 1
7300 2
7900 3
8000 2
8200 1
Observamos que a 4ª classe apresenta a maior frequência absoluta. Logo, a média será
o valor da variável nessa classe, ou seja, R$ 7.900,00.
69
Exemplo 3
Para dados agrupados em tabelas com intervalo de classe
Vamos continuar trabalhando com o exemplo dos salários dos engenheiros, porém ago-
ra agrupados em uma tabela com intervalos.
Total 10
Li = 7000
D1 = 5 – 1 = 4
D2 = 5 – 3 = 2
fant = 1
fpost = 3
Md = 7600
x = 7500
7000 + 8000
– Moda bruta: Mo = = 7500
2
70
Moda pelo processo de Czuber
D1
Mo = Li + ·h
D1 + D 2
4
Mo = 7000 + · 1000
4+2
Mo = 7000 + 0,66667 · 1000
Mo = 7000 + 666,67
Mo = 7666,67
fpost
Mo = Li + ·h
fant + fpost
3
Mo = 7000 + · 1000
1+3
Mo = 7000 + 750
Mo = 7750
Mo = 3 · Md – 2 · x
Mo = 3 · 7600 – 2 · 7500
Mo = 22800 – 15000
Mo = 7800
71
Relações entre média, mediana e moda
Se média = mediana = moda Se média > mediana > moda Se média < mediana < moda
Ampliando o foco
Confira as respostas que estão no final do livro e, se tiver alguma dúvida, fale
com o seu tutor pelo Fórum de Dúvidas – Fale com o Tutor.
72
Medidas de dispersão ou de variabilidade
Suponha que temos três turmas diferentes, cada uma com 10 alunos, para as quais foi
aplicada uma avaliação com valor de 10 pontos.
Notas
N1 N2 N3 N4 N5 N6 N7 N8 N9 N10 Total
Turmas
Turma “A” 5 5 5 5 5 5 5 5 5 5 50
Turma “B” 0 0 0 5 5 5 5 10 10 10 50
Turma “C” 1 2 3 4 5 5 6 7 8 9 50
Turma “A” 5 5 5
Turma “B” 5 5 5
Turma “C” 5 5 5
Analisando somente as medidas de posição, concluímos que essas três turmas são idên-
ticas, o que seria um grande erro.
• A Amplitude.
• O Desvio Médio.
• A Variância, o Desvio-Padrão e o Coeficiente de Variação.
73
Agora veremos com mais detalhes cada uma delas. Vamos lá!
Amplitude (Range)
A diferença entre o limite superior da última classe e o limite inferior da primeira classe.
A amplitude é muito pouco usada, pois tem uma grande desvantagem que a é de levar
em conta apenas dois valores, desprezando todos os outros.
Desvio: (D)
D = xi – x
Propriedade importante: a soma dos desvios em relação à média é sempre igual a zero.
Σ|xi – x|
• Para dados não agrupados: Dm =
n
Σ|xi – x| · fi
• Para dados agrupados: Dm =
n
74
Variância: (s2 ou σ2)
Tabela: Cálculo da Variância para dados não agrupados, dados agrupados em tabelas de distribuição
sem intervalos de classes e em tabelas de distribuição com intervalos de classes.
Observe:
75
Desvio-padrão: (s ou σ)
s = s2 para amostras
ou
σ = σ2 para população
Coeficiente de Variação
Para saber se uma dispersão é muito grande em relação à média ou para comparar o
grau de dispersão relativa entre as distribuições de duas ou mais variáveis é preciso utili-
zar uma medida de dispersão relativa, que se chama Coeficiente de Variação.
O coeficiente de variação é útil para comparar a variabilidade de observações com dife-
rentes unidades de medida, como:
s
CV = para amostras
x
ou
σ
CV = para população
μ
76
Exemplo 1
Para dados não agrupados
Voltemos aos dados dos salários dos engenheiros recém-formados coletados pela Cen-
tral de Estágios em julho de 2020.
Σxi
x=
n
5800 + 6800 + 8000 + 8200 + 8000 + 7300 + 7300 + 7900 + 7900 + 7900
x=
n
75100
x= = 7510
10
2º) Calcule os desvios em relação à média e depois eleve cada desvio ao quadrado.
desvio desvio2
77
7900 - 7510 = 390 152100
desvio desvio2
4929000
78
Como estamos trabalhando com uma amostra, para calcular a variância devemos
dividir esse somatório por “n-1”:
s = 547666,67 = 740,05
740,05
CV = = 0,0985
7510
Exemplo 2
Para dados agrupados em tabelas sem intervalo de classe.
5800 1
6800 1
7300 2
7900 3
79
8000 2
8200 1
Total 10
Σxi . fi
x=
n
75100
x= = 7510
10
Quantidade de
Salário desvio = xi-média
pessoas (fi)
80
8000 2 8000 - 7510 = 490
Total 10
Quantidade de
Salário desvio = xi-média desvio²
pessoas (fi)
Total 10
81
4º) Multiplique os quadrados dos desvios pelas respectivas frequências absolutas e fazer
o somatório.
Quantidade de
Salário desvio = xi-média desvio² desvio² . fi
pessoas (fi)
Total 10 4929000
Como estamos trabalhando com uma amostra, para calcular a variância, devemos
dividir esse somatório por “n-1”:
s = 547666,67 = 740,05
740,05
CV = = 0,0985
7510
82
Expressando em porcentagem temos:
Exemplo 3
Para dados agrupados em uma tabela de distribuição com intervalos de classes.
Voltemos ao exemplo.
5000 + 6000
5000 I---- 6000 1 = 5500
2
6000 + 7000
6000 I--- 7000 1 = 6500
2
7000 + 8000
7000 I--- 8000 5 = 7500
2
8000 + 9000
8000 I--- 9000 3 = 8500
2
Total 10
1º) Calcule a média dos salários com a fórmula dos dados agrupados com intervalos.
Σxi . fi
x=
n
83
5500 . 1 + 6500 . 1 + 7500 . 5 + 8500 . 3
x=
10
75000
x= = 7500
10
2º) Calcule o desvio de cada ponto médio em relação à média, fazendo a diferença entre
o valor do ponto médio e a média.
Total 10
Desvio =
Quantidade de Ponto médio
Salário = Ponto Médio - Desvio²
pessoas (fi) da classe (Xi)
Média
84
7000 I--- 8000 5 7500 7500 - 7500 = 0
Total 10
4º) Multiplique o quadrado do desvio pela respectiva frequência absoluta e fazer o soma-
tório dessa coluna.
Ponto
Quantidade de Desvio = Ponto
Salário médio da Desvio² Desvio² . fi
pessoas (fi) Médio - Média
classe (Xi)
5500 - 7500 = 4000000 . 1
5000 I---- 6000 1 5500 4000000
-2000 = 4000000
6500 - 7500 =
6000 I--- 7000 1 6500 1000000 1000000
-1000
7500 - 7500 =
7000 I--- 8000 5 7500 0 0.5=0
0
Total 10 8000000
Como estamos trabalhando com uma amostra, para calcular a variância devemos
dividir esse somatório por “n-1”:
85
O desvio-padrão será a raiz quadrada da variância:
s = 888888,89 = 942,81
942,81
CV = = 0,126
7500
Mais uma vez notamos que os dados agrupados perdem um pouco a precisão, principal-
mente se forem agrupados em poucas classes.
Ampliando o foco
Confira as respostas que estão no final do livro e, se tiver alguma dúvida, entre
em contato com o seu tutor pelo Fórum de Dúvidas – Fale com o Tutor.
O Excel oferece funções para calcular as medidas estatísticas. Contudo, serve apenas
para dados não agrupados.
Suponha que os dados estejam digitados nas células B1 até a célula B50, como mostra
a tabela a seguir.
Comando
86
Mediana =MED(B1:B50)
Moda =MODO(B1:B50)
MIDIATECA
NA PRÁTICA
87
Como funciona na prática? Não basta ter um banco de dados ou conjunto de
dados com informações dos clientes. Também não basta fazer alguns cálculos
em cima desses bancos de dados. É preciso entender a estratégia de negócios
da empresa e como opera o mercado. Além disso, é necessário dispor de técni-
cas para analisar os dados. É nessa parte que a formação em Estatística é mui-
to relevante quanto ao uso de técnicas para analisar esses bancos de dados.
Isso ajuda a empresa a alcançar melhores resultados.
88
tema de medição), modelos de otimizações na logística da empresa, os proje-
tos de seis sigma, planejamentos e experimentos. Os testes de confiabilidade
de produtos também têm papel importante na qualidade. Muitas empresas se
certificam em normas técnicas de qualidade e o estatístico pode tornar-se au-
ditor, aplicando metodologias e raciocínio estatístico para testar se a empresa
está atuando conforme a norma estabelece.
Fonte: http://www.conre3.org.br/portal/dia-do-estatistico-profissionais-falam-sobre-
-o-uso-da-estatistica-no-cotidiano/. Acesso em: 5 jul. 2020. Acesso em: 5 jul. 2020.
89
Resumo da Unidade 1
Também vimos os softwares estatísticos mais usados e algumas funções do Excel que
auxiliam na Estatística descritiva.
Por fim, mostramos que tabelas e gráficos de dados podem ser encontrados com gran-
de frequência no nosso dia a dia, relatórios anuais, artigos de jornais, revistas e estudos
de pesquisa. Sendo assim, é muito importante entender como eles são organizados e,
principalmente, como são interpretados.
90
Referências
MOORE, D. A Estatística Básica e sua prática. Rio de Janeiro: Ed. LTC, 2000.
91
NÚMERO de matrículas na Educação Superior: 2008 – 2018. Inep. Disponível em: http://
download.inep.gov.br/educacao_superior/censo_superior/documentos/2019/censo_da_
educacao_superior_2018-notas_estatisticas.pdf. Acesso em: 28 jul. 2020.
SPIEGEL, Murray R.; STEPHENS, Larry J. Estatística. 4. ed. Porto Alegre: Bookman, 2009
SWEENEY, Dennis J.; WILLIAMS, Thomas A.; ANDERSON, David R. Estatística aplicada
à administração e economia. 3. ed. São Paulo: Cengage Learning, 2013.
92
UNIDADE 2
Probabilidade
INTRODUÇÃO
O mundo em que vivemos exige tomada de decisão, capacidade de lidar com o impre-
visto e respostas para perguntas ainda desconhecidas. O estudo das teorias das pro-
babilidades é de grande importância como suporte para tomadas de decisão, quando
operamos com incertezas.
Se algo pode ter vários resultados e não sabemos ao certo qual ocorrerá, podemos usar
a probabilidade para descrever a chance numérica de cada um dos resultados possíveis.
Se soubermos que amanhã terá 95% de chance de chover, não vamos nos programar
para passar o dia na praia. Seja na vida cotidiana ou nos negócios, ter meios de quanti-
ficar numericamente possibilidades é uma ferramenta extremamente importante para
decidirmos os passos apropriados a serem tomados.
O estudo das probabilidades também será muito importante para entendermos os con-
ceitos da Estatística Inferencial, que iremos estudar nas próximas unidades.
94
OBJETIVO
95
Introdução à probabilidade
É conveniente, então, possuirmos uma medida numérica. Sim, um número que revele a
incerteza presente em cada um destes e de muitos outros questionamentos. Essa medi-
da numérica é a probabilidade.
Ampliando o foco
Experimento
1. Experimento aleatório
96
Exemplo
Sejam os experimentos:
2. Experimento determinístico
Exemplo
97
Espaço amostral: (s ou Ω)
O conceito de espaço amostral é muito importante, pois, na maioria dos casos, será
a ferramenta principal para efetuarmos o cálculo das probabilidades.
Espaço amostral (s ou Ω)
Experimento
Possíveis resultados
Ser defeituosa.
Selecionar uma peça para ser inspecionada.
Não ser defeituosa.
Céu ensolarado.
Céu nublado.
Ventania.
Verificar a previsão do tempo. Chovendo.
Chuva com trovões.
Granizo.
Neve.
Ser bem-sucedido.
Realizar um procedimento cirúrgico.
Não ser bem-sucedido.
Congestionado.
Com lentidão.
Verificar as condições do trânsito.
Com retenções.
Boas condições de tráfego.
98
Ganhar.
Jogar uma partida de futebol. Perder.
Empatar.
Efetuar a venda.
Fazer um contato de vendas.
Não efetuar a venda.
Sair o número 1.
Sair o número 2.
Sair o número 3.
Lançar um dado e observar a face superior.
Sair o número 4.
Sair o número 5.
Sair o número 6.
Evento
99
• Evento complementar: são eventos mutuamente exclusivos, que unidos têm
os mesmos elementos do espaço amostral. É denotado com uma barra acima do
nome do evento.
• Eventos equiprováveis: são eventos em que todos os elementos do espaço
amostral têm a mesma probabilidade de ocorrência.
• Eventos não equiprováveis: são eventos em que os elementos do espaço amos-
tral não têm a mesma probabilidade de ocorrência.
• Eventos independentes: dois eventos são independentes quando a ocorrência de
um evento não influência a ocorrência do outro.
• Eventos condicionados: são aqueles em que o acontecimento de um está condi-
cionado ao acontecimento de outro, ou seja, acontece um se o outro já aconteceu.
Jogar um A={6}
dado
B = {2,3,5}
100
Quais são as chances, ao lan-
çar um dado, de observarmos
na face superior um número
menor ou igual a 6?
Ω = {1,2,3,4,5,6} Evento certo
C=face superior ser um núme-
ro menor ou igual a 6
C={1,2,3,4,5,6}
Jogar um
D={ }
dado
E={5,6}
Ω = {1,2,3,4,5,6}
Evento união
Ω = {1,2,3,4,5,6}
ou
F={1,2}
G=E ∪ F = {1,2,5,6}
101
H=observar na face superior
um número maior do que 2
H={3,4,5,6}
e
Ω = {1,2,3,4,5,6} Evento
Ω = {1,2,3,4,5,6} interseção
I=observar na face superior
um número menor do que 5
I={1,2,3,4}
J=H ∩ I = {3,4}
K ∪ L = {1,2,4,5,6}
M ∪ = {1,2,3,4,5,6} = Ω
102
Para apresentarmos exemplos de eventos equiprováveis, não equiprováveis, independen-
tes e condicionados precisamos primeiro estudar como calculamos as probabilidades, o
que veremos a seguir.
Vamos apresentar três modos de contagem muito usados, que são: experimentos em
múltiplas etapas, arranjos, combinação e permutação.
Se um experimento pode ser descrito como uma sequência de dois estágios sucessivos
e independentes, em que o primeiro estágio pode ocorrer de “m” modos distintos, em
seguida o segundo estágio pode acontecer de “n” modos distintos. Nessas condições,
dizemos que “o número de maneiras distintas de ocorrer esse acontecimento é igual ao
produto m . n”.
Veja um exemplo:
Resolução:
Se quisermos ilustrar as 15 opções podemos lançar mão de um recurso muito útil, que
se chama “árvore de possibilidades”.
103
Figura: Árvore das Possibilidades.
P MP
M E ME
F MF
P NP
N E NE
F NF
P OP
O E OE
F OF
P BP
B E BE
F BF
P VP
V E VE
F VF
104
Veja mais alguns exemplos:
Exemplo 1
Resolução:
a) Para responder de quantas maneiras diferentes serão, basta usar o princípio fun-
damental da contagem:
1ª gestação: 2 opções – O filho ser do sexo masculino ou do sexo feminino.
2ª gestação: 2 opções – O filho ser do sexo masculino ou do sexo feminino.
3ª gestação: 2 opções – O filho ser do sexo masculino ou do sexo feminino.
Logo: 2 . 2. 2 = 8 maneiras.
b) Para responder quais são as possibilidades vamos desenhar a árvore
de possibilidades:
Vamos simbolizar: M sexo masculino e F sexo feminino
M MMM
M
F MMF
M
M MFM
F
F MFF
M FMM
M
F FMF
F
M FFM
F
F FFF
105
Exemplo 2
Resolução:
Classes C D U
Total de
9 9 8
possibilidades
Exemplo 3
Em uma indústria, uma peça deve passar por três estações para receber sua classificação.
106
Resolução:
O fatorial de um número natural “n” é representado por n! (lê-se n fatorial) e definido por:
1) n! = n . (n – 1) . (n – 2) . (n – 3) .... . 2 . 1, para n ≥ 2
2) 1! = 1
3) 0! = 1
Exemplo
a) 4! = 4 . 3 . 2 . 1 = 24
8! 8.7.6.5!
b) = como estamos multiplicando os fatores no
5!.3! 5!.3.2.1
8! 8.7.6.5!
= = 56
5!.3! 5!.3.2.1
2. Arranjos simples
n!
An,k =
(n – k)!
107
Veja alguns exemplos a seguir:
Exemplo 1
n!
An,k =
(n – k)!
5! 5.4.3.2.1
A5,3 = = = 60
(5 – 3)! 2.1
Exemplo 2
n!
An,k =
(n – k)!
10! 10 . 9 . 8 . 7!
A10,3 = = = 720
(10 – 3)! 7!
108
Importante
n!
An,k =
(n – k)!
3. Combinação simples
n!
Cn,k =
(n – k)!
109
Exemplo
Sabemos que a ordem que você marca no cartão dos números escolhidos não
importa nesse agrupamento. Logo, dos 60 números disponíveis, vamos esco-
lher seis deles e calcular a combinação, já que a ordem não importará.
n!
Cn,k =
k! . (n – k)!
60!
C60,6 =
6! . (60 – 6)!
60! 60.59.58.57.56.55.54
C60,6 = =
6! . 54! 6.5.4.3.2.1.54!
60.59.58.57.56.55
C60,6 = = 50.063.860
6.5.4.3.2.1
Ampliando o foco
Para colocar em prática o conteúdo visto nesta unidade visite a Biblioteca Vir-
tual, escolha um livro de Estatística, selecione e faça alguns exercícios do livro
para reforçar o conhecimento.
Confira as respostas que estão no final do livro e, se tiver alguma dúvida, fale
com o seu tutor pelo Fórum de Dúvidas – Fale com o Tutor.
110
Conceitos de probabilidade
Para calcular a probabilidade basta efetuar a divisão entre o número de elementos dos
casos favoráveis ao evento “A” pelo número de elementos possíveis representados no
espaço amostral “Ω”.
111
Exemplo 1
Em um lote de 12 peças, quatro são defeituosas. Sendo retirada uma peça para inspeção, calcu-
le a probabilidade de essa peça ser defeituosa.
1 - Qual é o
Avaliar defeitos em peças produzidas.
experimento?
Ω = { D, D, D, D, D,D,D,D,D,D,D,D}
onde:
2 - Qual é o espaço D = peça defeituosa
amostral?
D = eça não defeituosa
12 peças, sendo 4 defeituosas e 8 perfeitas
12 elementos, então: n (Ω) = 12
5 - Cada elemento
do espaço amostral
tem a mesma chance
de ocorrência?
6 - Fazer o cálculo
números de casos favoráveis n(A) 4
usando o método P(A) = = = = 0,333 = 33%
números de casos possíveis n (Ω) 12
apropriado.
112
Exemplo 2
Etapas Respostas
1 - Qual é o
Lançamento de um dado.
experimento?
2 - Qual é o espaço As faces {1, 2, 3, 4, 5, 6}, portanto são seis elementos, então:
amostral? n (Ω) = 6
4 - Retirem do espaço
amostral os elementos A = {2, 4, 6}, portanto são três elementos, então: n (A) = 3
favoráveis ao evento.
5 - Todos os elemen-
tos do espaço amostral
têm a mesma chance
de ocorrência?
(Se a resposta for “Sim”, Sim, pois temos a informação de que o dado é honesto, ou
então vamos calcular seja, todas as faces têm a mesma probabilidade de sair.
a fórmula da
probabilidade clássica.
Se for “Não”, iremos
usar o cálculo empírico
ou frequencial.)
113
Exemplo 3
Dois dados honestos são lançados e a face superior é observada. Determine a probabili-
dade de a soma das duas faces superiores ser igual a oito.
Etapas Respostas
1 - Qual é o
Lançar dois dados.
experimento?
n (Ω) = 36
4 - Retirem do espaço
A = {(2,6), (3,5), (4,4), (6,2)}, portanto são quatro elementos,
amostral os elementos
então: n (A) = 4
favoráveis ao evento.
5 - Todos os elemen-
tos do espaço amostral
têm a mesma chance
de ocorrência?
114
Exemplo 4
Determine a probabilidade de pelo menos uma face “cara” aparecer, na face superior, no lança-
mento de duas moedas “não viciadas”.
Etapas Respostas
1 - Qual é o
Lançamento de duas moedas .
experimento?
2 - Qual é o espaço Ω = {(cara, cara), (cara, coroa), (coroa, cara), (coroa, coroa)}
amostral? n (Ω) = 4
4 - Retirem do espaço
A = {(cara, cara), (cara, coroa), (coroa, cara)}, portanto são 3
amostral os elementos
elementos, então: n (A) = 3
favoráveis ao evento.
5 - Todos os elemen-
tos do espaço amostral
têm a mesma chance
de ocorrência?
115
Exemplo 5
Etapas Respostas
2 - Qual é o espaço n!
amostral? Cn,k =
k! . (n – k)!
12!
C12,2 =
2! . 10!
12.11.10!
C12,2 = = 66
2.1.10!
116
5 - Todos os elemen-
tos do espaço amostral
têm a mesma chance
de ocorrência?
Exemplo 6
Etapas Respostas
1 - Qual é o
Jogar um cartão com 6 números na Mega-Sena .
experimento?
60!
C60,6 =
6! . 54!
117
60.59.58.57.56.55.54!
C12,2 = = 50.063.860
6.5.4.3.2.1.54!
4 - Retirem do espaço
amostral os elementos P1 cartão.
favoráveis ao evento.
5 - Todos os elemen-
tos do espaço amostral
têm a mesma chance
de ocorrência?
(Se a resposta for “Sim”, Sim, pois todos os números têm a mesma chance de serem
então vamos calcular sorteados. probabilidade clássica.
a fórmula da
probabilidade clássica.
Se for “Não”, iremos
usar o cálculo empírico
ou frequencial.)
118
Probabilidade teórica com eventos não equiprováveis
São usadas quando pelo menos um elemento do espaço amostral tiver diferentes proba-
bilidades de ocorrência dos demais.
Veja um exemplo:
Vamos supor que vamos dar um impulso na seta e desejamos conhecer a probabilidade
de ela vir parar no setor circular com o número 2.
Podemos visualizar que a área do setor circular com os números 2 é diferente da área
dos setores 1 e 3. Logo, essa probabilidade deverá ser calculada para eventos com espa-
ços amostrais não equiprováveis.
Seja Ω o espaço amostral, então: Ω = {1, 2, 3} . Este espaço amostral para não será ade-
quado para resolver esse tipo de problema, já que os elementos não são equiprováveis.
Uma boa estratégia para calcular a probabilidade seria redefinir um novo espaço amos-
tral adequado, dessa vez com eventos equiprováveis.
Seja Ω1 = {1, 2, 2, 3} o novo espaço amostral, desta vez com todos os elementos equipro-
váveis e n(Ω1) = 4 elementos
119
Agora sim, poderemos utilizar o conceito clássico da probabilidade para eventos
equiprováveis. Então:
n (A) 2
P (A) = = = 0,5 = 50%
n (Ω1 ) 4
Vejamos um exemplo.
Seja um experimento de lançar um dado “honesto” várias vezes e observar a face supe-
rior. A tabela a seguir apresenta os resultados do número de vezes em que o número 6
foi observado na face superior.
120
Lançamento do dado
Quantidade de vezes em
Cálculo da frequência
Número de repetições que apareceu o número 6
relativa
na face superior
0
1 0 = 0%
1
0
2 0 = 0%
2
0
3 0 = 0%
3
1
4 1 = 25%
4
1
5 1 = 20%
5
2
6 2 = 33,3%
6
3
20 3 = 15%
20
16
100 16 = 16%
100
165
1000 165 = 16,5%
1000
1677
10000 1667 = 16,67%
1000
1
P (A) = = 0,1667 = 16,67%
6
121
Pela probabilidade empírica, observamos que, à medida que o número de repetições au-
menta, a frequência relativa aproxima-se da probabilidade clássica.
Importante
Probabilidade complementar
Dois eventos, A e B, são complementares se sua intersecção é vazia e sua união é o es-
paço amostral Ω. Isto é:
A∩B=Ø
e
A ∪ B = Ω.
122
Exemplo 1
Etapas: Respostas
1 - Qual é o
Lançamento de um dado.
experimento?
4 - Retirem do espaço
amostral os elementos A = {4} n(A) = 1
favoráveis ao evento.
5 - Cada elemento
do espaço amostral
tem a mesma chance
de ocorrência?
123
Exemplo 2
A probabilidade de uma dona de casa escolher uma determinada marca de café é de 65%. Qual
a probabilidade que em um determinado dia ela escolha outra marca?
Etapas: Respostas
1 - Qual é o
Dona de casa escolher uma marca de café.
experimento?
2 - Qual é o espaço
Vamos supor 100 pessoas.
amostral?
4 - Retirem do espaço
amostral os elementos n(A) = 65
favoráveis ao evento.
5 - Cada elemento
do espaço amostral
tem a mesma chance
de ocorrência?
124
Exemplo 3
Em um lote de 12 peças, quatro são defeituosas e oito são boas. A probabilidade de retirarmos
duas peças boas em uma inspeção é igual a 42%. Qual a probabilidade de pelo menos uma apre-
sentar defeito quando retiramos duas peças para inspeção?
Etapas: Respostas
1 - Qual é o
Retirar duas peças para inspeção
experimento?
2 - Qual é o espaço Não será preciso definir, pois vamos usar o conceito de pro-
amostral? babilidade complementar.
4 - Retirem do espaço
Não será preciso, pois vamos usar o conceito de probabili-
amostral os elementos
dade complementar.
favoráveis ao evento.
5 - Cada elemento
do espaço amostral
tem a mesma chance
de ocorrência?
125
União de eventos (μ)
A B
126
Exemplo 1
Etapas: Respostas
1 - Qual é o
Retirar uma carta de um baralho de 52 cartas.
experimento?
W = {A♣, 2♣, 3♣, 4♣, 5♣, 6♣, 7♣, 8♣, 9♣, 10♣, J♣, Q♣, K♣,
A♠, 2♠, 3♠, 4♠, 5♠, 6♠, 7♠, 8♠, 9♠,10♠, J♠, Q♠, K♠,
2 - Qual é o espaço
A♦, 2♦, 3♦, 4♦, 5♦, 6♦, 7♦, 8♦, 9♦, 10♦, J♦, Q♦, K♦,
amostral?
A♥, 2♥, 3♥, 4♥, 5♥, 6♥, 7♥, 8♥, 9♥, 10♥, J♥, Q♥, K♥}; n (W)
= 52
5 - Cada elemento
do espaço amostral
tem a mesma chance
de ocorrência?
127
Calculando a probabilidade de A ou B temos:
Exemplo 2
Observando a cor dos olhos e a cor do cabelo de um grupo de 100 pessoas temos:
Olho azul 10 20 30
Olho castanho 30 40 70
Total 40 60 100
Escolhendo uma pessoa ao acaso, qual a probabilidade de ser uma pessoa com cabelo
louro e olhos castanhos ou cabelo castanho e olhos azuis?
Etapas: Respostas
1 - Qual é o
Escolher uma pessoa em um grupo de 100 pessoas.
experimento?
128
Evento A: escolher uma pessoa com cabelo louro e olhos
castanhos.
3 - Qual é o evento?
Evento B: escolher uma pessoa com cabelo castanho e
olhos azuis.
n(A)=30
4 - Retirem do espaço n(B)= 20
amostral os elementos
favoráveis ao evento. Elementos comuns de A e B
A ∩ B = { } ; n(A ∩ B) = 0
5 - Cada elemento
do espaço amostral
tem a mesma chance
de ocorrência?
129
Exemplo 3
Etapas: Respostas
1 - Qual é o
Escolher um torcedor em um grupo de 60 pessoas.
experimento?
2 - Qual é o espaço
60 pessoas n(W) =60
amostral?
n(A) = 10
4 - Retirem do espaço n(B) = 5
amostral os elementos
favoráveis ao evento. Elementos comuns de A e B
A ∩ B = { } ; n(A ∩ B) = 0
5 - Cada elemento
do espaço amostral
tem a mesma chance
de ocorrência?
130
Calculando a probabilidade de A ou B temos:
10 5 0 15
P(A ∪ B) = + - = = 0,25 = 25%
60 60 60 60
45
P(C) = = 0,75 = 75%
60
Exemplo 4
Uma pesquisa, em uma agência de turismo, sobre o tipo de viagem nos últimos 12 meses, re-
velou que 45,8% dos clientes viajaram por razões comerciais, 54% por razões pessoais e 30%
viajaram por razões pessoais e comerciais.
a) Qual é a probabilidade de que um viajante, selecionado aleatoriamente, tenha viajado
nos últimos 12 meses por razões comerciais ou pessoais?
b) Qual é a probabilidade de que um viajante, selecionado aleatoriamente, não tenha via-
jado nos últimos 12 meses por razões comerciais ou pessoais?
Etapas: Respostas
131
Vamos considerar 100 pessoas, em que 45,8% dos clientes
2 - Qual é o espaço
viajaram por razões comerciais, 54% por razões pessoais e
amostral?
30% viajaram por razões pessoais e comerciais.
A B
n(A) = 45,8
n(B) = 54
n(A ∩ B) = 30
5 - Cada elemento
do espaço amostral
tem a mesma chance
de ocorrência?
132
a)
b)
Exemplo 5
Escolhendo-se ao acaso uma pessoa entrevistada, qual é a probabilidade de que ela tenha ad-
quirido pelo menos uma versão do produto?
Etapas: Respostas
2 - Qual é o espaço
1000 entrevistados n(Ω) = 1000
amostral?
133
E= escolher pelo menos uma versão do produto.
Podemos dividir o evento E em três partes:
A = escolher o produto A.
3 - Qual é o evento?
B = escolher o produto B.
C = escolher o produto C.
Logo, E= A ∪ B ∪C
5 - Cada elemento
do espaço amostral
tem a mesma chance
de ocorrência?
134
Poderíamos resolver esse problema de outra maneira utilizando o conceito da
probabilidade complementar.
A B
35
215 245
75
145 65
30
C
190
135
Por fim, calculamos das 1.000 pessoas aquelas que não compraram nenhuma
versão do produto:
1000 – 215 - 35 – 75 – 145 – 245 – 65 – 30 = 190
P (C) = 1 − P ( C )
190 810
P(C) = 1 − = = 0,81 = 81%
1000 1000
Exemplo 6
Um jogo de dominó é composto por 28 peças, sendo que em cada peça são representadas duas
quantidades de bolinhas, que variam de zero a seis.
Etapas: Respostas
1 - Qual é o
Retirar uma peça do dominó.
experimento?
Ω = {(0,0), (0,1), (0,2), (0,3), (0,4), (0,5), (0,6), (1,1), (1,2), (1,3),
2 - Qual é o espaço
(1,4), (1,5), (1,6), (2,2), (2,3), (2,4), (2,5), (2,6), (3,3), (3,4), (3,5),
amostral?
(3,6), (4,4), (4,5), (4,6), (5,5), (5,6), (6,6)} n (Ω) = 28
136
Evento A: Saírem 3 bolinhas.
3 - Qual é o evento? Evento B: Saírem 5 bolinhas.
A ∪ B : sair 3 OU 5 bolinhas
5 - Cada elemento
do espaço amostral
tem a mesma chance
de ocorrência?
Ampliando o foco
Para colocar em prática o conteúdo visto nesta unidade visite a Biblioteca Vir-
tual, escolha um livro de Estatística, selecione e faça alguns exercícios do livro
para reforçar o conhecimento.
Confira as respostas que estão no final do livro e, se tiver alguma dúvida, fale
com o seu tutor pelo Fórum de Dúvidas – Fale com o Tutor.
137
Probabilidade condicional
Neste tópico continuaremos os estudos abordando mais algumas relações básicas das
probabilidades: a probabilidade para eventos condicionados, a probabilidade para eventos
independentes e a interseção de eventos. Também apresentaremos o Teorema de Bayes.
Probabilidade condicional
Cálculo:
n (A∩B) P (A∩B)
P(B|A) = ou P(B|A) =
n(A) P(A)
Exemplo1:
Para oferecer uma promoção do tipo “fale grátis de seu móvel para seu fixo”, escolhe-se
aleatoriamente uma pessoa de uma base de dados com 15.000 usuários de telefonia,
dos quais 10.000 possuem telefones fixos, 8.000 telefones móveis e 3.000 têm telefones
fixos e móveis.
Pergunta-se:
138
Etapas: Respostas
5 - Cada elemento
do espaço amostral
tem a mesma chance
de ocorrência?
Sim, pois a pessoa é escolhida aleatoriamente. Temos
que observar que uma condição já aconteceu nesse
(Se a resposta for “Sim”,
evento, ou seja, já sabemos que a pessoa possui uma li-
então vamos calcular
nha de telefonia móvel, por isso vamos usar o conceito
a fórmula da
de probabilidade condicional.
probabilidade clássica.
Se for “Não”, iremos
usar o cálculo empírico
ou frequencial.)
n (A∩B)
P(B|A) =
n(A)
139
b) Já sabendo que ela tem um telefone fixo, qual a probabilidade de ela ter telefone
móvel também?
Etapas: Respostas
5 - Cada elemento
do espaço amostral
tem a mesma chance
de ocorrência?
Sim, pois a pessoa é escolhida aleatoriamente. Temos
que observar que uma condição já aconteceu nesse
(Se a resposta for “Sim”,
evento, ou seja, já sabemos que a pessoa possui uma li-
então vamos calcular
nha de telefonia fixo, por isso vamos usar o conceito
a fórmula da
de probabilidade condicional.
probabilidade clássica.
Se for “Não”, iremos
usar o cálculo empírico
ou frequencial.)
n (A∩B)
P(B|A) =
n(B)
140
Exemplo 2:
Em uma escola com 100 alunos, 60 estudam Estatística, 50 estudam Inglês e 20 es-
tudam Estatística e Inglês. Sabendo que um aluno escolhido aleatoriamente já estuda
Estatística, qual a probabilidade de ele estudar Inglês?
Etapas: Respostas
1 - Qual é o
Escolher aleatoriamente um aluno .
experimento?
E I
40 20 30
4 - Retirem do espaço
amostral os elementos
favoráveis ao evento. 10
n(A) = 60
n(B) = 50
n (A ∩ B)= 20
5 - Cada elemento
do espaço amostral
tem a mesma chance
de ocorrência?
Sim, pois a pessoa é escolhida aleatoriamente. Temos que
(Se a resposta for “Sim”, observar que uma condição já aconteceu nesse evento, ou
então vamos calcular seja, já sabemos que a pessoa escolhida estuda Estatística,
a fórmula da por isso vamos usar o conceito de probabilidade condicional.
probabilidade clássica.
Se for “Não”, iremos
usar o cálculo empírico
ou frequencial.)
141
n (A∩B)
P(B|A) =
n(A)
20
6 - Fazer o cálculo usan- P(B|A) = = 0,33 = 33%
do o método apropriado. 60
P (A∩B) P (A∩B)
Substituindo P(B|A) = P(B) em: P(B|A) = temos: P(B)
P(A) P(A)
Analogamente,
P (A∩B) P (A∩B)
Substituindo P(B|A) = P(A) em: P(B|A) = temos: P(A)
P(B) P(B)
Exemplo 1
O quadro a seguir apresenta o resultado de uma pesquisa sobre a primeira razão para a
escolha de uma determinada Instituição de Ensino Superior – IES:
142
Custo da Qualidade
Outros Total
mensalidade do ensino
Etapas: Respostas
1 - Qual é o
Selecionar aleatoriamente um aluno entrevistado.
experimento?
2 - Qual é o espaço
Está representado no quadro no enunciado da questão.
amostral?
5 - Cada elemento
do espaço amostral
tem a mesma chance
de ocorrência? Sim, pois o aluno foi escolhido aleatoriamente.
(Se a resposta for “Sim”, Porém, temos que prestar atenção, pois uma condição já
então vamos calcular aconteceu nesse evento, ou seja, já sabemos que a pessoa
a fórmula da escolhida frequenta o ensino presencial e por isso vamos
probabilidade clássica. usar o conceito de probabilidade condicional.
Se for “Não”, iremos
usar o cálculo empírico
ou frequencial.)
143
n (A∩B)
P(B|A) =
n(A)
421
6 - Fazer o cálculo usan- P(B|A) = = 0,473 = 47,3%
do o método 890
apropriado. Logo, existe aproximadamente 47,3% de probabilidade
de que o aluno que estuda presencialmente tenha esco-
lhido a qualidade do ensino como primeira razão para
escolher a IES.
Etapas: Respostas
1 - Qual é o
Selecionar aleatoriamente um aluno entrevistado.
experimento?
2 - Qual é o espaço
Está representado no quadro, no enunciado da questão.
amostral?
5 - Cada elemento
do espaço amostral
tem a mesma chance
de ocorrência? Sim, pois o aluno foi escolhido aleatoriamente.
(Se a resposta for “Sim”, Porém, temos que prestar atenção, pois uma condição já
então vamos calcular aconteceu nesse evento, ou seja, já sabemos que a pessoa
a fórmula da escolhida é do EAD e por isso vamos usar o conceito de
probabilidade clássica. probabilidade condicional.
Se for “Não”, iremos
usar o cálculo empírico
ou frequencial.)
144
n (A∩B)
P(B|A) =
n(A)
593
6 - Fazer o cálculo usan- P(B|A) = = 0,571 = 57,1%
do o método apropriado. 1039
n(A ∩ B) = 421
n (Ω) =1929
0,218 ≠ 0,196
145
Interseção de eventos (U)
U
A B
Exemplo 1
Resolução:
Sejam:
Evento A: entregar o respirador 1 no prazo P(A) = 0,994
Evento A: não entregar o respirador 1 no prazo P(A) = 1-0,994 = 0,006
146
Evento B: entregar o respirador 2 no prazo P(B) = 0,994
Evento B : não entregar o respirador 2 no prazo P(B) = 1-0,994 = 0,006
P(A ∩ B) ou P(A ∩ B) = P(A) . P(B) + P(A) . P(B) = 0,994 . 0,006 + 0,006 . 0,994 = 0,012 = 1,2%
c) Ambos os respiradores forem entregues com atraso, logo o respirador 1 foi entre-
gue com atraso E o respirador 2 foi entregue com atraso.
Exemplo 2
Etapas: Respostas
1 - Qual é o
Retirar três peças para serem inspecionadas.
experimento?
2 - Qual é o espaço
12 peças, sendo quatro defeituosas e oito sem defeitos.
amostral?
147
A= selecionar para inspeção a primeira peça sem defeito.
B= selecionar para inspeção a primeira peça sem defeito.
5 - Cada elemento
do espaço amostral
tem a mesma chance
de ocorrência?
(Se a resposta for “Sim”, Sim, pois todas as peças têm a mesma chance de serem
então vamos calcular selecionadas para inspeção.
a fórmula da
probabilidade clássica.
Se for “Não”, iremos
usar o cálculo empírico
ou frequencial.)
Resumindo
∪ ou adição
∩ e Multiplicação
148
P(A ∪ B) = P(A) + P(B)
É o evento que ocorre se A eventos mutuamente exclusivos
A∪B ocorre, ou se B ocorrer ou
se A e B ocorrerem P(A ∪ B) = P(A) + P(B) - P(A ∩ B)
eventos não exclusivos
T3) Se A ⊂ B, então:
P(A) ≤ P(B).
149
Vejamos um exemplo que ilustra o conceito apresentado.
Exemplo
a) A= Menor do que 5.
b) B= Maior do que 5.
c) C= Igual a zero.
d) D= Igual a 1.
e) E= Igual a 2.
f) F= Igual a 3.
g) G= Igual a 4.
h) H= Igual a 1 ou igual a 3.
i) I= Par ou primo.
j) J= Diferente de 1.
k) K=um número par.
l) L=um número ímpar.
m) M= um número par ou ímpar.
Resolução:
n(A) 5
P(A) = = = 1 = 100%
n(Ω) 5
150
Observamos que o número de elementos do evento A é igual ao número de
elementos do espaço amostral. Esse é o maior número de elementos que po-
demos retirar do espaço amostral, portanto essa será a maior probabilidade
que poderá ocorrer. É um exemplo do evento certo.
n(B) 0
P(B) = = = 0 = 0%
n(Ω) 5
c) C= Igual a zero C={0}, logo, o número de elementos do evento C será: n(C)=1 então:
n(C) 1
P(C) = = = 0,2 = 20%
n(Ω) 5
n(D) 1
P(D) = = = 0,2 = 20%
n(Ω) 5
n(E) 1
P(E) = = = 0,2 = 20%
n(Ω) 5
151
f) F= Igual a 3 F={3}, logo, o número de elementos do evento F será: n(F)=1 então:
n(F) 1
P(F) = = = 0,2 = 20%
n(Ω) 5
n(G) 1
P(G) = = = 0,2 = 20%
n(Ω) 5
n(H) 4
P(H) = = = 0,8 = 80%
n(Ω) 5
Observamos que podemos dividir o evento H em 3 eventos: H1= o número igual a 1, H2=
o número igual a 4 e H3= um número primo. Vamos buscar no espaço amostral os ele-
mentos dos eventos.
H1={1}
H2={4}
H3={2,3}
Como a interseção entre os elementos dos eventos dois a dois é vazia, concluímos que
são eventos mutuamente exclusivos.
152
Logo, para calcular a probabilidade H= o número igual a 1 ou o número igual a 4 ou um
número primo, basta calcular cada probabilidade separadamente e efetuar a soma das
probabilidades.
Então:
Com esse item podemos verificar o que diz no axioma 3: se os eventos forem
dois a dois mutuamente exclusivos, então: P(E) = P(E1) + P(E2) +...+ P(En)
i) I=Par ou primo I={0,2,3,4}, logo, o número de elementos do evento I será: n(I)=4 então:
n(I) 4
P(H) = = = 0,8 = 80%
n(Ω) 5
Observamos que podemos dividir o evento I em 2 eventos: I1= número par, I2= número
primo. Vamos buscar no espaço amostral os elementos dos eventos:
I1={0,2,4} n(I1) = 3
I2={2,3} n(I2) = 2
Nesse caso, observamos um elemento na interseção dos eventos. Logo, os eventos não
são mutuamente excludentes. Precisamos de, em vez de usar o axioma 3 para calcular a
probabilidade, devemos usar o teorema 1, que diz:
Logo:
153
n(I1) n(I2) n(I1 ∩ I2)
P(I1 ∪ I2) = = =
n(Ω) n(Ω) n(Ω)
3 2 1 4
P(I1 ∪ I2) = + - = = 0,8 = 80%
5 5 5 5
n(I) 4
P(I) = = = 0,8 = 80%
n(Ω) 5
Outra maneira de calcular a probabilidade pedida seria utilizando o teorema 2, que diz:
se A é o complementar de A, então a soma das probabilidades de um evento com seu
evento complementar é sempre igual a 100%, ou seja, P(I) + P(I ) = 1 ∴ P(I ) + 1 - P(I) ou
P(I) = 1 - P(I )
Teorema de Bayes
O teorema diz: “Se “n” eventos A1, A2, A3, ... , são dois a dois mutuamente exclusivos, tais
que, A1 ∪ A2 ∪ A3 ∪ ... An = Ω, e P(Ai) > 0 então:
154
P(Ai) . P(B\ Ai)
P(Ai\B) =
Σi P(Ai) . P(B\ Ai)
Exemplo 1
Etapas: Respostas
1 - Qual é o
Retirar um aparelho defeituoso para inspeção.
experimento?
155
Determinar a probabilidade de um aparelho celular defei-
tuoso encontrado na inspeção final ter sido produzido na
linha de produção I, na linha de produção II e na linha de
produção III.
156
P(A1) = 50% = 0,5
P(A2) = 40% = 0,4
P(A3) = 10% = 0,1
P(B\A1) = 1% = 0,01
4 - Retirem do espaço
amostral os elementos P(B\A2) = 2% = 0,02
favoráveis ao evento. P(B\A3) = 3% = 0,03
5 - Cada elemento
do espaço amostral
tem a mesma chance
de ocorrência?
(Se a resposta for “Sim”, Sim, pois todos os aparelhos têm a mesma chance de se-
então vamos calcular rem selecionados para inspeção.
a fórmula da
probabilidade clássica.
Se for “Não”, iremos
usar o cálculo empírico
ou frequencial.)
0,005 0,005
P(A1\B) = = = 0,3125 = 31,5%
0,005 + 0,008 + 0,003 0,016
157
P(Ai) . P(B\ Ai)
P(Ai\B) =
Σ i P(Ai) . P(B\ Ai)
0,4 . 0,02
P(A2\B) =
0,5 . 0,01 + 0,4 . 0,02 + 0,1 . 0,03
0,005 0,008
P(A2\B) = = = 0,5 = 50%
0,005 + 0,008 + 0,003 0,016
0,1 . 0,03
P(A3\B) =
0,5 . 0,01 + 0,4 . 0,02 + 0,1 . 0,03
0,005 0,003
P(A3\B) = = = 0,1875 = 18,75%
0,005 + 0,008 + 0,003 0,016
158
Exemplo 2
Um viajante usa os serviços da companhia aérea “A” em 20% das viagens, 30% da com-
panhia “B” e no restante do tempo ele utiliza a companhia “C”. Sabe-se que a porcen-
tagem dos voos que decolam com atraso é de 10%, 6% e 3% respectivamente para as
companhias “A”, “B” e “C”. Suponha que o voo do viajante teve atraso.
Qual a probabilidade de que ele tenha utilizado a companhia “C” nessa viagem?
Etapas: Respostas
2 - Qual é o espaço
amostral?
10% 6% 3%
ATRASOS
3 - Qual é o evento? B\A2 = voo atrasado sabendo que a cia escolhida foi a “B”
B\A3 = voo atrasado sabendo que a cia escolhida foi a “C”
159
P(A1) = 30% = 0,2
P(A2)= 20% = 0,3
5 - Cada elemento
do espaço amostral
tem a mesma chance
de ocorrência?
0,015 0,015
P(A3\B) = = = 0,283 = 28,3%
0,002 + 0,018 + 0,015 0,053
160
Ampliando o foco
Para colocar em prática o conteúdo visto nesta unidade, visite a Biblioteca Vir-
tual, escolha um livro de Estatística, selecione e faça alguns exercícios do livro
para reforçar o conhecimento.
Confira as respostas que estão no final do livro e, se tiver alguma dúvida, fale
com o seu tutor pelo Fórum de Dúvidas – Fale com o Tutor.
161
MIDIATECA
NA PRÁTICA
Foi realizada uma pesquisa de mercado com 500 consumidores com o objetivo
de conhecer a aceitação de um novo produto — chamado Sampler — lançado
no mercado.
Você precisa fazer um relatório para enviar ao CEO da empresa em que traba-
lha dando a ele feedback sobre a aceitação do produto do mercado. Pense em
como o conteúdo desta unidade pode lhe auxiliar na elaboração do relatório.
162
d) Ser do sexo feminino ou ter aprovado o produto.
e) Sabendo que a pessoa selecionada aprovou o produto, qual a probabilidade
de ser do sexo masculino?
f) Dado que a pessoa selecionada seja do sexo feminino, qual a probabilidade
de que ela não tenha aprovado o produto?
Vamos considerar:
240
a) P(A) = = 0,48 = 48%
500
160
c) P(B) = = 0,32 = 32%
500
P(A ∩ B) 140
e) P(A\B) = = = 0,41= 41%
P(B) 340
P(B ∩ A) 60
e) P(B\A) = = = 0,23= 23%
P(A) 260
163
Resumo da Unidade 2
164
Referências
MEGA-SENA: a loteria que paga milhões para o acertador. CEF – Loterias. Disponível
em: http://loterias.caixa.gov.br/wps/portal/loterias/landing/megasena. Acesso em: 18
ago. 2020.
165
UNIDADE 3
Distribuições de Probabilidade
INTRODUÇÃO
OBJETIVO
167
Variáveis aleatórias e distribuições de
probabilidade
Exemplo
Variável aleatória
Uma variável aleatória é uma função que associa a cada elemento do espaço amostral
um único número real. Normalmente escolhemos letras maiúsculas do nosso alfabeto
para representá-las, sendo as mais usuais o “X” e o “Y”.
Apesar da terminologia “variável aleatória”, ela é uma função cujo domínio sempre é for-
mado pelos elementos do espaço amostral e o contradomínio o conjunto dos números
reais. Tais funções são chamadas aleatórias, porque seus valores não podem ser deter-
minados com certeza antes que o experimento seja realizado.
168
Exemplo
Exemplo
Suponha que três aparelhos sejam retirados aleatoriamente para inspeção. Seja a variá-
vel aleatória “X” definida como o número de aparelhos danificados.
Então:
PPP 0
PPD 1
PDP 1
PDD 2
DPP 1
DPD 2
DDP 2
DDD 3
169
Uma variável aleatória pode ser classificada como discreta ou contínua, dependendo do
número de possíveis valores que a variável pode assumir.
A variável aleatória é discreta quando o conjunto de todos os valores que ela pode as-
sumir são associadas aos números naturais, 0, 1, 2, ... Normalmente, são oriundas
de contagens.
Exemplo
Classificar os 160
X=nº de alunos do 0,1,2,..,160
alunos de Estatística
sexo feminino. (finito)
quanto ao sexo.
A variável aleatória é contínua quando os conjuntos de todos os valores que ela pode
assumir pertencem a um intervalo real ou a um conjunto de intervalos não numeráveis.
Normalmente, são oriundas de medições.
170
Exemplo
Pesar um carrega-
X= número de quilos do
mento de um de- X≥0
carregamento.
terminado produto.
X= Porcentagem de con-
Construção de um
clusão do projeto depois 0 ≤ X ≤ 100
apartamento.
de 1 ano.
Seja “X” uma variável aleatória discreta, sejam x1, x2, x3, … , xn os possíveis valores que
a variável pode assumir.
n
b) ∑ i=1, P(xi)=1, ou seja, a soma das probabilidades de todos os valores possíveis de
“X” é igual a 1.
171
Para entendermos melhor a explicação, vamos retomar o exemplo anterior usado na
variável aleatória.
Exemplo
A produção de aparelhos celulares de uma determinada fábrica pode ter duas classifica-
ções quanto à qualidade: Defeituoso ou Perfeito, ou seja, temos um experimento em que
os elementos do espaço amostral não são números e sim atributos, que vamos repre-
sentar como “D”=defeituoso e “P”=perfeito.
Suponha que três aparelhos sejam retirados aleatoriamente para inspeção. Seja a variá-
vel aleatória “X” definida como o número de aparelhos danificados.
Então:
Espaço Amostral: {PPP, PPD, PDP, PDD, DPP, DPD, DDP, DDD}, sendo “D”=defeituoso
e “P”=perfeito
2) A variável aleatória “X” representa o número de aparelhos danificados, podendo
assumir os seguintes valores: 0,1,2 ou 3
172
Devemos, então, calcular a probabilidade de ocorrência de cada valor que é variável aleatória:
PPP
PPD
0 Calculando as probabilidades, temos:
PDP
1
PDD
1 1
DPP P (x = 0) =
3 8
DPD
DDP
DDD 3
P (x = 1) =
8
Número de elementos do espaço
amostral n(Ω)= 8
3
P (x = 2) =
Se X=0 1 ocorrência 8
Se X=1 3 ocorrências
1
P (x = 3) =
Se X=2 3 ocorrências 8
Se X=3 1 ocorrência
Valores de “X” 0 1 2 3
Probabilidade de 1 3 3 1
ocorrência p(X=xi) 8 8 8 8
173
Distribuição de Probabilidade expressa por um gráfico:
1/2
3/8
1/8
0
0 1 2 3 xi
Fonte: Elaborado pela autora (2020).
E(X) = μ = ∑ x i. P(xi)
Onde:
xi = valor da variável aleatória
P(xi) = respectiva probabilidade
Ampliando o foco
174
Variância (σ2)
Avalia o grau de dispersão dos valores da variável aleatória em torno da média. Seu cál-
culo é obtido pela fórmula:σ
Em que:
xi = valor da variável aleatória
μ = Valor esperado
P(xi) = respectiva probabilidade
Desvio-padrão (σ)
σ = σ2
Ampliando o foco
σ
CV = · 100
E(X)
175
Se:
Exemplo
Número de chamadas 0 1 2 3 4 5
- Calculando a variância:
176
Número de
0 1 2 3 4 5 ∑
chamadas (xi)
(xi – μ)2 · p(xi) 0,405 0,0975 0,06 0,315 0,25 0,1225 1,25
então, σ 2 = 1,25
- Calculando o desvio-padrão:
σ = σ2
σ = 1,25 1,118
σ
CV = · 100
E(X)
1,118
CV = · 100 = 74,53%
1,5
Como o coeficiente de variação é muito elevado, pois é maior do que 30%, os dados
estão muito dispersos, então a média não é uma boa medida representativa para
essa distribuição.
177
Função Densidade de Probabilidade (ou simplesmente
Função Densidade)
Define-se a função densidade, a função cuja área sob a curva entre dois valores “a” e “b”
nos revela a probabilidade de que a variável aleatória X assuma um valor entre “a” e “b”
(a<b), de tal forma que:
A forma do gráfico
de uma função desnidade
pode variar consideravelmente,
mas a área sob a curva
sempre será igual a 1
No caso das variáveis aleatórias contínuas, não estaremos mais interessados em saber
a probabilidade de um determinado resultado, como fazemos com as variáveis aleatórias
discretas, mas sim em determinar a probabilidade de o resultado estar em um determi-
nado intervalo.
Como não há probabilidade associada a um ponto único, é indiferente o uso dos símbo-
los < ou ≤ para menor que ou > ou ≥ para maior que, ou seja:
178
Curva densidade de probabilidade e a determinação das probabilidades
a b x a x b x
Então, como vimos, para encontrar a probabilidade precisamos determinar a área sob
uma curva e isso pode ser feito por integral, geometria, tabelas e o uso de tecnologias
computacionais.
Medidas estatísticas
+∞
Esperança Matemática, Valor Esperado ou Média: E(X) = ∫- ∞ x · f(x)dx
+∞
Variância: σ2 = ∫- ∞ (x - E(X))2 · f(x)dx
Para colocar em prática o conteúdo visto nesta unidade, visite a Biblioteca Vir-
tual, escolha um livro de Estatística, selecione e faça alguns exercícios do livro
para reforçar o conhecimento.
Confira as respostas que estão no final do livro e, se tiver alguma dúvida, fale
com o seu tutor pelo Fórum de Dúvidas – Fale com o Tutor.
179
Distribuições de probabilidades discretas
Exemplos:
Sucesso a face
Lançar uma moeda seis observada é cara
vezes e observar a face X = sair a face cara
superior. Fracasso a face
observada é coroa
180
Sucesso a criança
Observar o sexo de 100 X= a criança ser do é menina
partos de uma maternidade. sexo feminino Fracasso a criança
é menino
Sucesso não
Perfurar uma série de poços X= não encontrar se encontra petróleo
de petróleo. petróleo Fracasso encontra-se
petróleo
Sucesso o aluno
Responder aleatoriamente acerta a questão
X=acertar
10 questões de uma
a resposta correta Fracasso o aluno
prova objetiva.
erra a questão
Sucesso o aluno
Responder aleatoriamente erra a questão
10 questões de uma X=errar a resposta
prova objetiva. Fracasso o aluno
acerta a questão
São valores definidores de uma distribuição binomial. Uma variável aleatória binomial
fica completamente determinada quando conhecemos o número de tentativas e a pro-
babilidade de um sucesso.
Em que:
n = número total de ensaios.
p = probabilidade de sucesso em cada ensaio.
181
Cálculo das Probabilidades Cálculo do Valor Esperado Cálculo da Variância
Em que:
x = número de sucessos.
p = a probabilidade de sucesso em cada prova.
n!
( xn ) = = número de combinações de “n” elementos tomados x a x.
x! (n - x)!
Exemplo 1
Resolução:
1º) Definir a variável aleatória, pois será essa definição que vai determinar quem terá o
sucesso e o fracasso.
182
Seja a variável aleatória X=número de acertos na avaliação.
2º) Verificar as hipóteses a serem atendidas para o uso das fórmulas da distribuição
binomial. São elas:
Como todas as hipóteses foram verificadas, então: X ~ B(10 ; 0,2), ou seja, a variável alea-
tória X obedece a uma distribuição binomial, com parâmetros n=10 e p=0,2.
Com isso, podemos fazer o cálculo das probabilidades pedidas, usando as fórmulas da
distribuição binomial, como mostramos a seguir.
P(X=xi) = ( xn ) · px · q(n–x)
P(X=7) = ( 10
7 ) · (0,2) · (0,8)
7 (10-7)
183
10!
P(X=7) = · (0,2)7 · (0,8)(10-7)
7! 3!
10!
P(X=7) = · (0,2)7 · (0,8)3
7! (10-x)!
Logo, com base nas respostas anteriores podemos concluir que vai ser muito difícil um es-
tudante ser aprovado em Estatística sem assistir às aulas e sem estudar para avaliações.
Esse modelo será utilizado para modelar experimentos discretos em que o número de
repetições não é conhecido.
Exemplos:
1. Número de carros que passam em um pedágio em uma hora.
2. Número de vezes em que o corpo de bombeiros é chamado por dia para comba-
ter incêndios em uma cidade.
3. Número de acidentes de trabalho por semana em uma empresa industrial.
184
4. Número de reparos em uma rodovia em um trecho de 100 km.
5. Número de automóveis que chegam ao campus entre 7 e 10 horas da manhã.
6. Número de microrganismos por cm³ de água contaminada.
7. Número de vazamentos em 100 Km de tubulação.
3. Uma distribuição de Poisson modela bem eventos “raros”. Fenômenos raros são
aqueles que ocorrem com pouca frequência para qualquer intervalo de observação.
Por exemplo, o número de automóveis da linha Gol que passam por um radar na
estrada em um intervalo de uma hora e o número de automóveis Porsche Cayenne
que passam nesse mesmo radar, nesse mesmo intervalo de uma hora. Certamente,
o modelo de Poisson deverá ser mais adequado para o automóvel Porsche.
Se soubermos a taxa de frequência por unidade de medida (λ) e a unidade de medida (t),
seremos capazes de responder qualquer pergunta sobre a probabilidade de X, o valor es-
perado e a variância. Basta para isso aplicarmos as fórmulas da distribuição de Poisson,
que são:
e -μ · μx
P(X=xi) = μ=λ·t σ2 = λ · t
x!
185
Em que:
X: número de eventos discretos em t unidades de medida.
λ: taxa de frequência ou coeficiente de proporcionalidade por unidade de medida.
t: unidade de medida.
μ = λ t: média de eventos discretos em t unidades de medida.
e = constante de Euler 2,71828.
Exemplo 1
Intervalo de tempo
Pede-se:
a) Determine a probabilidade de chegarem exatamente 5 carros nessa cabine em
um período de 15 minutos.
b) Determine a probabilidade de chegar exatamente 1 carro nessa cabine em um
período de 3 minutos.
.
Resolução:
Letra a)
Podemos verificar no enunciado que os pressupostos para a modelagem por Poisson
foram satisfeitos. Logo, usaremos esse modelo para responder às questões propostas.
186
chega em uma cabine de um pedágio de uma rodovia, em um intervalo qualquer de
tempo de 15 minutos, seja exatamente igual a 5, ou seja, X=5
10
3) Frequência nesse intervalo de tempo: λ = 10 carros a cada 15 minutos =
15
10
4) Média: μ = λ · t = · 15 = 10 carros
15
Então,
X ~ P(10), ou seja, a variável aleatória X obedece à distribuição de Poisson, com média
igual a 10.
Estando com o parâmetro definido, vamos substituí-lo no modelo de Poisson:
Letra b)
Observamos que o intervalo de tempo agora modificou-se para três minutos. Logo:
10
3) Frequência nesse intervalo de tempo: λ= 10 carros a cada 15 minutos =
15
10
4) Média: μ = λ · t = · 3 = 2 carros
15
5) Então: X ~ P(2)
Então,
X ~ P(2), ou seja, a variável aleatória X obedece à distribuição de Poisson, com média
igual a 2. Estando com o parâmetro definido, vamos substituí-lo no modelo de Poisson:
187
e-μ · μx
P(X=xi) =
x!
e-2 · 21 0,2707
P(X=1) = = = 0,2797 = 27,07%
1! 1
Exemplo 2
Intervalo de comprimento
Pede-se:
a) A probabilidade de não haver nenhum defeito grave em um trecho de 3 km
de rodovia.
b) A probabilidade de existir pelo menos um defeito grave em um trecho de 3 km de
rodovia.
Resolução:
Letra a)
Pelo enunciado verificamos que as hipóteses para a modelagem com a Distribuição de
Poisson estão satisfeitas.
188
Primeiramente, vamos definir a variável aleatória de Poisson X.
X= número de defeitos graves em uma rodovia que aconteceram um mês após o reca-
peamento em um trecho de 3 km.
Podemos notar que estamos trabalhando em um intervalo de comprimento de 3km.
t = 3 km
2 defeitos
λ= 2 defeitos a cada km =
1 km
2
Logo, a média será: μ = λ · t = · 3 = 6 defeitos
1
e-μ · μx
P(X=xi) =
x!
e-6 · 20 0,0025 · 1
P(X=1) = = = 0,0025 = 25%
0! 1
Logo, existe uma probabilidade bem pequena, em torno de 0,25%, de não se encontrar ne-
nhum defeito grave em um trecho de 3Km de uma rodovia, um mês após o recapeamento.
Letra B)
Qual a probabilidade de existir pelo menos um defeito grave em um trecho de 3 km
de rodovia?
Como não sabemos o número final de defeitos, temos que determinar essa probabilida-
de utilizando o conceito de probabilidade complementar, ou seja:
P(X ≥ 1) = 1 - P(X=0)
Logo:
P(X ≥ 1) = 1 - 0,0025 = 0,9975 = 99,75%
189
Então, existe uma probabilidade de 99,75% de ocorrer pelo menos um defeito grave em
um trecho de 3 km da rodovia.
Ampliando o foco
Para colocar em prática o conteúdo visto nesta unidade, visite a Biblioteca Vir-
tual, escolha um livro de Estatística, selecione e faça alguns exercícios do livro
para reforçar o conhecimento.
Confira as respostas que estão no final do livro e, se tiver alguma dúvida, fale
com o seu tutor pelo Fórum de Dúvidas – Fale com o Tutor.
190
Distribuição de probabilidade Normal
A distribuição de probabilidade é:
Modelo Matemático
1 (x – μ)2
– ,
f(x) = e 2 σ2
σ 2π
x μ ∈ ( - ∞; + ∞) e σ2 > 0
Em que:
191
μ = média
σ = desvio padrão
σ 2 = variância
e = 2,71828...
π = 3,14159...
Formato da curva
μ
média = mediana = moda
Observe graficamente:
99, 73%
95,44%
68,26%
- 3σ - 2σ - 1σ μ + 1σ + 2σ + 3σ
Normal
192
Área sob a curva
área total = 1
Simetria
0,5 0,5
Parâmetros
193
Notação
X ~(N μ σ2 )
Simetria
Assíntodas
194
Pontos de Inflexão
- 1σ μ + 1σ
Seja uma variável aleatória normal com média igual a 5 e a variância igual a 4. Suponha-
mos que desejamos calcular a probabilidade de a variável aleatória estar entre 3 e 6.
Como vimos, para determinar essa probabilidade basta determinarmos o valor da área
sob a curva no intervalo considerado.
σ=2
3 5 6
1
e- (x-5) .
6 2
Para calcular essa área e se resolvermos a integral: ∫3
2 2π 2·4
E coloquemos como reposta 0.532807.
Logo, P(3<X<6) 53,28%
Como o cálculo dessa integral não é nada trivial, já que ela não pode ser resolvida analiti-
camente, temos outra opção para determinarmos a área sob a curva, que irá fornecer-nos
a probabilidade. Vamos, então, fazer uma padronização na curva Normal e determinar a
195
área sob a curva usando simplesmente uma tabela, em vez de calcularmos essa integral
pelo desenvolvimento em série. Para isso, vamos fazer uma transformação linear da va-
riável aleatória Normal para variável aleatória padronizada.
X-μi
Z=
σ
Com isso, pode-se demonstrar que a média é sempre igual a zero e a variância
sempre igual a 1.
μ = 0 e σ 2= 1
2π 2
Z ∈ (-∞ + ∞)
σ=1
μ= 0
196
Com o intuito de auxiliar no cálculo das áreas sob a curva, que, como já vimos, são de difí-
cil resolução, usaremos a distribuição Normal Padrão. Nessa distribuição as áreas sob a
curva já foram calculadas e estão apresentadas em tabelas. Serão essas as tabelas que
nos auxiliarão nos cálculos das probabilidades.
Existem vários tipos de tabelas, porém as mais utilizadas são as que oferecem a área
para valores de z-score até a média e também que mostram a área cumulativa. Para esse
Tabela
estudo escolhemos utilizar dadisponibilizada
a tabela Distribuiçãoa seguir.
Normal
DISTRIBUIÇÃO
NORMAL
–
ÁREA
DE
0
até
K
=>
probabilidade
da
variável
z
estar
entre
0
e
k
z
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0
0,0040
0,0080
0,0120
0,0160
0,0199
0,0239
0,0279
0,0319
0,0359
0
0,0398
0,0438
0,0478
0,0517
0,0557
0,0596
0,0636
0,0675
0,0714
0,0753
0,1
0,2
0,0793
0,0832
0,0871
0,0910
0,0948
0,0987
0,1026
0,1064
0,1103
0,1141
0,1179
0,1217
0,1255
0,1293
0,1331
0,1368
0,1406
0,1443
0,1480
0,1517
0,3
0,1554
0,1591
0,1664
0,1664
0,1700
0,1736
0,1772
0,1808
0,1844
0,1879
0,4
0,1915
0,1950
0,1985
0,2019
0,2054
0,2088
0,2123
0,2157
0,2190
0,2224
0,5
0,2257
0,2291
0,2324
0,2357
0,2389
0,2422
0,2454
0,2486
0,2517
0,2549
0,6
0,2580
0,2611
0,2642
0,2673
0,2704
0,2734
0,2764
0,2794
0,2823
0,2852
0,7
0,2881
0,2910
0,2939
0,2967
0,2995
0,3023
0,3051
0,3078
0,3106
0,3133
0,8
0,3159
0,3186
0,3212
0,3238
0,3264
0,3289
0,3315
0,3340
0,3365
0,3389
0,9
0,3413
0,3438
0,3461
0,3485
0,3508
0,3531
0,3554
0,3577
0,3599
0,3621
1
1,1
0,3643
0,3665
0,3686
0,3708
0,3729
0,3749
0,3770
0,3790
0,3810
0,3830
0,3849
0,3869
0,3888
0,3907
0,3925
0,3944
0,3962
0,3980
0,3997
0,4015
1,2
0,4032
0,4049
0,4066
0,4082
0,4099
0,4115
0,4131
0,4147
0,4162
0,4177
1,3
0,4192
0,4207
0,4222
0,4236
0,4251
0,4265
0,4279
0,4292
0,4306
0,4319
1,4
0,4332
0,4345
0,4357
0,4370
0,4382
0,4394
0,4406
0,4418
0,4429
0,4441
1,5
1,6
0,4452
0,4463
0,4474
0,4484
0,4495
0,4505
0,4515
0,4525
0,4535
0,4545
0,4554
0,4564
0,4573
0,4582
0,4591
0,4599
0,4608
0,4616
0,4625
0,4633
1,7
0,4641
0,4649
0,4656
0,4664
0,4671
0,4678
0,4686
0,4693
0,4699
0,4706
1,8
0,4713
0,4719
0,4726
0,4732
0,4738
0,4744
0,4750
0,4756
0,4761
0,4767
1,9
0,4772
0,4778
0,4783
0,4788
0,4793
0,4798
0,4803
0,4808
0,4812
0,4817
2
2,1
0,4821
0,4826
0,4830
0,4834
0,4838
0,4842
0,4846
0,4850
0,4854
0,4857
0,4861
0,4864
0,4868
0,4871
0,4875
0,4878
0,4881
0,4884
0,4887
0,4890
2,2
0,4893
0,4896
0,4898
0,4901
0,4904
0,4906
0,4909
0,4911
0,4913
0,4916
2,3
0,4918
0,4920
0,4922
0,4925
0,4927
0,4929
0,4931
0,4932
0,4934
0,4936
2,4
0,4938
0,4940
0,4941
0,4943
0,4945
0,4946
0,4948
0,4949
0,4951
0,4952
2,5
2,6
0,4953
0,4955
0,4956
0,4957
0,4959
0,4960
0,4961
0,4962
0,4963
0,4964
0,4965
0,4966
0,4967
0,4968
0,4969
0,4970
0,4971
0,4972
0,4973
0,4974
2,7
0,4974
0,4975
0,4976
0,4977
0,4977
0,4978
0,4979
0,4979
0,4980
0,4981
2,8
0,4981
0,4982
0,4982
0,4983
0,4984
0,4984
0,4985
0,4985
0,4986
0,4986
2,9
0,4987
0,4987
0,4987
0,4988
0,4988
0,4989
0,4989
0,4989
0,4990
0,4990
3
0,4990
0,4991
0,4991
0,4991
197
0,4992
0,4992
0,4992
0,4992
0,4993
0,4993
3,1
0,4993
0,4993
0,4994
0,4994
0,4994
0,4994
0,4994
0,4995
0,4995
0,4995
3,2
0,4938
0,4940
0,4941
0,4943
0,4945
0,4946
0,4948
0,4949
0,4951
0,4952
2,5
2,6
0,4953
0,4955
0,4956
0,4957
0,4959
0,4960
0,4961
0,4962
0,4963
0,4964
0,4965
0,4966
0,4967
0,4968
0,4969
0,4970
0,4971
0,4972
0,4973
0,4974
2,7
0,4974
0,4975
0,4976
0,4977
0,4977
0,4978
0,4979
0,4979
0,4980
0,4981
2,8
0,4981
0,4982
0,4982
0,4983
0,4984
0,4984
0,4985
0,4985
0,4986
0,4986
2,9
0,4987
0,4987
0,4987
0,4988
0,4988
0,4989
0,4989
0,4989
0,4990
0,4990
3
0,4990
0,4991
0,4991
0,4991
0,4992
0,4992
0,4992
0,4992
0,4993
0,4993
3,1
0,4993
0,4993
0,4994
0,4994
0,4994
0,4994
0,4994
0,4995
0,4995
0,4995
3,2
0,4995
0,4995
0,4995
0,4996
0,4996
0,4996
0,4996
0,4996
0,4996
0,4997
3,3
0,4997
0,4997
0,4997
0,4997
0,4997
0,4997
0,4997
0,4997
0,4997
0,4998
3,4
3,5
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
3,6
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
3,7
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
3,8
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
3,9
4
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
Fonte: http://ead.uva.br///recurso/DEF/EST/u3_c3_r1/anexo/Tabela-da-Distribuicao-Normal.pdf
Importante
DISTRIBUIÇÃO
NORMAL
–
ÁREA
DE
0
até
K
=>
probabilidade
da
variável
z
estar
entre
0
e
k
z
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0
0,0040
0,0080
0,0120
0,0160
0,0199
0,0239
0,0279
0,0319
0,0359
0
0,0398
0,0438
0,0478
0,0517
0,0557
0,0596
0,0636
0,0675
0,0714
0,0753
0,1
0,2
0,0793
0,0832
0,0871
0,0910
0,0948
0,0987
0,1026
0,1064
0,1103
0,1141
Como devemos 0,1179
usar a tabela
0,1217
0,1255
de0,1293
distribuição
0,1331
Normal
0,1368
padrão?
0,1406
0,1443
0,1480
0,1517
0,3
0,1554
0,1591
0,1664
0,1664
0,1700
0,1736
0,1772
0,1808
0,1844
0,1879
0,4
1º Calcular
0,5
o0,1915
valor de Z com
0,1950
a fórmula
0,1985
0,2019
0,2054
0,2088
0,2123
0,2157
0,2190
0,2224
X 0,6
-μ 0,2257
0,2291
0,2324
0,2357
0,2389
0,2422
0,2454
0,2486
0,2517
0,2549
Z= 0,7
0,2580
0,2611
0,2642
0,2673
0,2704
0,2734
0,2764
0,2794
0,2823
0,2852
σ 0,2881
0,2910
0,2939
0,2967
0,2995
0,3023
0,3051
0,3078
0,3106
0,3133
0,8
arredondando com 0,3186
0,9
0,3159
a precisão 0,3212
de0,3238
duas 0,3264
casas decimais.
0,3289
0,3315
Algumas
0,3340
tabelas
0,3365
não apresen-
0,3389
tam valores
1
negativos
0,3413
0,3438
para Z, porém
0,3461
0,3485
como
0,3508
a 0,3531
curva 0,3554
Normal0,3577
é simétrica
0,3599
em relação à
0,3621
0,3643
0,3665
0,3686
0,3708
0,3729
0,3749
0,3770
0,3790
0,3810
0,3830
média, o sinal não terá nenhuma relevância e poderá ser desprezado.
1,1
0,3849
0,3869
0,3888
0,3907
0,3925
0,3944
0,3962
0,3980
0,3997
0,4015
1,2
0,4032
0,4049
0,4066
0,4082
0,4099
0,4115
0,4131
0,4147
0,4162
0,4177
1,3
0,4192
0,4207
0,4222
0,4236
0,4251
0,4265
0,4279
0,4292
0,4306
0,4319
1,4
0,4332
0,4345
0,4357
0,4370
0,4382
0,4394
0,4406
0,4418
0,4429
0,4441
1,5
198
1,6
0,4452
0,4463
0,4474
0,4484
0,4495
0,4505
0,4515
0,4525
0,4535
0,4545
0,4554
0,4564
0,4573
0,4582
0,4591
0,4599
0,4608
0,4616
0,4625
0,4633
1,7
2º Identificar a parte inteira e a primeira casa decimal, na primeira coluna da tabela.
3º Identificar a segunda casa decimal, na primeira linha com valores na tabela.
4º Fazer o cruzamento da linha com a coluna e buscar o valor da área sob a curva de
zero até z.
Exemplo
Considere X ≥ 800, μ =850, σ 45
1 - Calculando o Z-score:
X-μ 80 - 8500
Z= = = -1,111111
σ 45
pela simetria da curva Normal = 1,111111. Com precisão de duas casas decimais vamos
considerar Z=1,11
DISTRIBUIÇÃO
NORMAL
–
ÁREA
DE
0
até
K
=>
probabilidade
da
variável
z
estar
entre
0
e
k
z
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0
0,0040
0,0080
0,0120
0,0160
0,0199
0,0239
0,0279
0,0319
0,0359
0
0,0398
0,0438
0,0478
0,0517
0,0557
0,0596
0,0636
0,0675
0,0714
0,0753
0,1
0,2
0,0793
0,0832
0,0871
0,0910
0,0948
0,0987
0,1026
0,1064
0,1103
0,1141
0,1179
0,1217
0,1255
0,1293
0,1331
0,1368
0,1406
0,1443
0,1480
0,1517
0,3
0,1554
0,1591
0,1664
0,1664
0,1700
0,1736
0,1772
0,1808
0,1844
0,1879
0,4
0,1915
0,1950
0,1985
0,2019
0,2054
0,2088
0,2123
0,2157
0,2190
0,2224
0,5
0,2257
0,2291
0,2324
0,2357
0,2389
0,2422
0,2454
0,2486
0,2517
0,2549
0,6
0,2580
0,2611
0,2642
0,2673
0,2704
0,2734
0,2764
0,2794
0,2823
0,2852
0,7
0,2881
0,2910
0,2939
0,2967
0,2995
0,3023
0,3051
0,3078
0,3106
0,3133
0,8
0,3159
0,3186
0,3212
0,3238
0,3264
0,3289
0,3315
0,3340
0,3365
0,3389
0,9
0,3413
0,3438
0,3461
0,3485
0,3508
0,3531
0,3554
0,3577
0,3599
0,3621
1
1,1
0,3643
0,3665
0,3686
0,3708
0,3729
0,3749
0,3770
0,3790
0,3810
0,3830
0,3849
0,3869
0,3888
0,3907
0,3925
0,3944
0,3962
0,3980
0,3997
0,4015
1,2
0,4032
0,4049
0,4066
0,4082
0,4099
0,4115
0,4131
0,4147
0,4162
0,4177
1,3
0,4192
0,4207
0,4222
0,4236
0,4251
0,4265
0,4279
0,4292
0,4306
0,4319
1,4
3 - Na 1,5
primeira0,4332
linha com valores
0,4345
0,4357
na tabela,
0,4370
identificamos
0,4382
0,4394
a segunda
0,4406
0,4418
casa decimal,
0,4429
0,4441
no
caso 0,01
1,6
0,4452
0,4463
0,4474
0,4484
0,4495
0,4505
0,4515
0,4525
0,4535
0,4545
0,4554
0,4564
0,4573
0,4582
0,4591
0,4599
0,4608
0,4616
0,4625
0,4633
1,7
0,4641
0,4649
0,4656
0,4664
0,4671
0,4678
0,4686
0,4693
0,4699
0,4706
1,8
0,4713
0,4719
0,4726
0,4732
0,4738
0,4744
0,4750
0,4756
0,4761
0,4767
1,9
0,4772
0,4778
0,4783
0,4788
0,4793
0,4798
0,4803
0,4808
0,4812
0,4817
2
2,1
0,4821
0,4826
0,4830
0,4834
0,4838
199 0,4842
0,4846
0,4850
0,4854
0,4857
0,4861
0,4864
0,4868
0,4871
0,4875
0,4878
0,4881
0,4884
0,4887
0,4890
2,2
0,4893
0,4896
0,4898
0,4901
0,4904
0,4906
0,4909
0,4911
0,4913
0,4916
Tabela da Distribuição Normal
Primeira DISTRIBUIÇÃO
NORMAL
–
ÁREA
DE
0
até
K
=>
probabilidade
da
variável
z
estar
entre
0
e
k
linha z
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
de valores 0
0
0,0040
0,0080
0,0120
0,0160
0,0199
0,0239
0,0279
0,0319
0,0359
0,0398
0,0438
0,0478
0,0517
0,0557
0,0596
0,0636
0,0675
0,0714
0,0753
0,1
0,2
0,0793
0,0832
0,0871
0,0910
0,0948
0,0987
0,1026
0,1064
0,1103
0,1141
0,1179
0,1217
0,1255
0,1293
0,1331
0,1368
0,1406
0,1443
0,1480
0,1517
0,3
0,1554
0,1591
0,1664
0,1664
0,1700
0,1736
0,1772
0,1808
0,1844
0,1879
0,4
0,1915
0,1950
0,1985
0,2019
0,2054
0,2088
0,2123
0,2157
0,2190
0,2224
0,5
0,2257
0,2291
0,2324
0,2357
0,2389
0,2422
0,2454
0,2486
0,2517
0,2549
0,6
0,2580
0,2611
0,2642
0,2673
0,2704
0,2734
0,2764
0,2794
0,2823
0,2852
0,7
0,2881
0,2910
0,2939
0,2967
0,2995
0,3023
0,3051
0,3078
0,3106
0,3133
0,8
0,3159
0,3186
0,3212
0,3238
0,3264
0,3289
0,3315
0,3340
0,3365
0,3389
0,9
0,3413
0,3438
0,3461
0,3485
0,3508
0,3531
0,3554
0,3577
0,3599
0,3621
1
1,1
0,3643
0,3665
0,3686
0,3708
0,3729
0,3749
0,3770
0,3790
0,3810
0,3830
0,3849
0,3869
0,3888
0,3907
0,3925
0,3944
0,3962
0,3980
0,3997
0,4015
1,2
0,4032
0,4049
0,4066
0,4082
0,4099
0,4115
0,4131
0,4147
0,4162
0,4177
1,3
0,4192
0,4207
0,4222
0,4236
0,4251
0,4265
0,4279
0,4292
0,4306
0,4319
1,4
Logo, temos este
1,5
Tabela
resultado:
0,4345
da Distribuição
0,4332
0,4357
0,4370
0,4382
Normal
0,4394
0,4406
0,4418
0,4429
0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
0,4554
0,4564
0,4573
0,4582
0,4591
0,4599
0,4608
0,4616
0,4625
0,4633
1,7
DISTRIBUIÇÃO
1,8
0,4641
NORMAL
–
Á0,4649
0,4656
REA
DE
0
até
K0,4664
0,4671
0,4678
=>
probabilidade
da
0,4686
0,4693
variável
z
estar
0,4699
entre
00,4706
e
k
0,4713
0,4719
0,4726
0,4732
0,4738
0,4744
0,4750
0,4756
0,4761
0,4767
z
0
1,9
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,4772
0,4778
0,4783
0,4788
0,4793
0,4798
0,4803
0,4808
0,4812
0,4817
0
2
0,0040
0,0080
0,0120
0,0160
0,0199
0,0239
0,0279
0,0319
0,0359
0
0,4821
0,4826
0,4830
0,4834
0,4838
0,4842
0,4846
0,4850
0,4854
0,4857
2,1
0,0398
0,0438
0,0478
0,0517
0,0557
0,0596
0,0636
0,0675
0,0714
0,0753
0,1
2,2
0,4861
0,4864
0,4868
0,4871
0,4875
0,4878
0,4881
0,4884
0,4887
0,4890
0,4861
0,4864
0,4868
0,4871
0,4875
0,4878
0,4881
0,4884
0,4887
0,4890
2,2
0,4893
0,4896
0,4898
0,4901
0,4904
200 0,4906
0,4909
0,4911
0,4913
0,4916
2,3
0,4918
0,4920
0,4922
0,4925
0,4927
0,4929
0,4931
0,4932
0,4934
0,4936
2,4
4 - Fazemos o cruzamento da linha com a coluna e identificamos o valor da área sob a
Tabela da Distribuição Normal
curva de zero até z.
DISTRIBUIÇÃO
NORMAL
–
ÁREA
DE
0
até
K
=>
probabilidade
da
variável
z
estar
entre
0
e
k
z
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0
0,0040
0,0080
0,0120
0,0160
0,0199
0,0239
0,0279
0,0319
0,0359
0
0,0398
0,0438
0,0478
0,0517
0,0557
0,0596
0,0636
0,0675
0,0714
0,0753
0,1
0,2
0,0793
0,0832
0,0871
0,0910
0,0948
0,0987
0,1026
0,1064
0,1103
0,1141
0,1179
0,1217
0,1255
0,1293
0,1331
0,1368
0,1406
0,1443
0,1480
0,1517
0,3
0,1554
0,1591
0,1664
0,1664
0,1700
0,1736
0,1772
0,1808
0,1844
0,1879
0,4
0,1915
0,1950
0,1985
0,2019
0,2054
0,2088
0,2123
0,2157
0,2190
0,2224
0,5
0,2257
0,2291
0,2324
0,2357
0,2389
0,2422
0,2454
0,2486
0,2517
0,2549
0,6
0,2580
0,2611
0,2642
0,2673
0,2704
0,2734
0,2764
0,2794
0,2823
0,2852
0,7
0,2881
0,2910
0,2939
0,2967
0,2995
0,3023
0,3051
0,3078
0,3106
0,3133
0,8
0,3159
0,3186
0,3212
0,3238
0,3264
0,3289
0,3315
0,3340
0,3365
0,3389
0,9
0,3413
0,3438
0,3461
0,3485
0,3508
0,3531
0,3554
0,3577
0,3599
0,3621
1
1,1
0,3643
0,3665
0,3665 0,3686
0,3708
0,3729
0,3749
0,3770
0,3790
0,3810
0,3830
0,3849
0,3869
0,3888
0,3907
0,3925
0,3944
0,3962
0,3980
0,3997
0,4015
1,2
0,4032
0,4049
0,4066
0,4082
0,4099
0,4115
0,4131
0,4147
0,4162
0,4177
1,3
0,4192
0,4207
0,4222
0,4236
0,4251
0,4265
0,4279
0,4292
0,4306
0,4319
1,4
Logo a0,4332
área de 0,4345
zero até0,4357
z=1,11 será
0,4370
a mesma
0,4382
área de zero
0,4394
até Z=-1,11
0,4406
0,4418
que é 0,3665
0,4429
0,4441
1,5
1,6
0,4452
0,4463
0,4474
0,4484
0,4495
0,4505
0,4515
0,4525
0,4535
0,4545
Como
1,7
calcular
0,4554
a probabilidade
0,4564
0,4573
de qualquer
0,4582
0,4591
distribuição
0,4599
Normal?
0,4608
0,4616
0,4625
0,4633
0,4641
0,4649
0,4656
0,4664
0,4671
0,4678
0,4686
0,4693
0,4699
0,4706
1,8
Para
1,9
determinar
0,4713
a probabilidade
0,4719
0,4726
utilizando
0,4732
a distribuição
0,4738
0,4744
Normal,0,4756
0,4750
devemos seguir
0,4761
os se-
0,4767
guintes
2
passos:0,4778
0,4783
0,4788
0,4793
0,4798
0,4803
0,4808
0,4812
0,4817
0,4772
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2
1º)0,4861
Determine0,4864
os valores
0,4868
da média0,4875
0,4871
μ e do 0,4878
desvio-padrão
0,4881
σ0,4884
e nomeie a distribuição
0,4887
0,4890
2,3
Normal:
0,4893
X~N(μ,
0,4896
σ 2)0,4898
0,4901
0,4904
0,4906
0,4909
0,4911
0,4913
0,4916
0,4918
0,4920
0,4922
0,4925
0,4927
0,4929
0,4931
0,4932
0,4934
0,4936
2,4
2,5
2º)0,4938
Enuncie 0,4940
0,4941
a probabilidade 0,4943
pedida.0,4945
0,4946
0,4948
0,4949
0,4951
0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,8
da0,4974
fórmula:
0,4975
0,4976
0,4977
0,4977
0,4978
0,4979
0,4979
0,4980
0,4981
0,4981
0,4982
0,4982
0,4983
0,4984
0,4984
0,4985
0,4985
0,4986
0,4986
2,9
X-μ
3
Z0,4987
= 0,4987
0,4987
0,4988
0,4988
0,4989
0,4989
0,4989
0,4990
0,4990
0,4990
σ 0,4991
0,4991
0,4991
0,4992
0,4992
0,4992
0,4992
0,4993
0,4993
3,1
0,4993
0,4993
0,4994
0,4994
0,4994
0,4994
0,4994
0,4995
0,4995
0,4995
3,2
4º)0,4995
Esboce0,4995
o gráfico das curvas
0,4995
0,4996
e destaque
0,4996
a região0,4996
0,4996
cuja área será investigada
0,4996
0,4996
para
0,4997
3,3
determinar
0,4997
a probabilidade
0,4997
0,4997
pedida.0,4997
0,4997
0,4997
0,4997
0,4997
0,4998
0,4997
3,4
3,5
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
3,6
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
3,7
201
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
3,8
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
3,9
Importante
Este passo é o mais importante, pois com o desenho não precisamos ficar de-
corando se devemos somar 0,5, diminuir 0,5, ou não fazer nada. Apenas com-
paramos o desenho da área obtida na tabela e o desenho do que queremos
determinar para concluirmos o que temos que fazer.
6º) Finalize com o valor da área sob a curva e o desenho do item 4, faça os ajustes
necessários e determine a probabilidade solicitada.
Essa parte é importante, pois a maioria dos problemas de probabilidades poderão ser
resolvidos ou aproximados pela distribuição Normal.
Exemplo 1
Pergunta-se:
Qual é a probabilidade de um brasileiro, escolhido aleatoriamente, ter passado menos de
50 horas conectado à internet em agosto de 2020?
Resolução:
202
2º) Enuncie a probabilidade pedida: P(X ≤ 50) = ?
4º) Desenhe as curvas e destaque a região cuja área será investigada para determinar
a probabilidade pedida.
σ=20 σ=1
50 μ=77 -1,35 0
Distribuição Normal Distribuição Normal Padronizada
DISTRIBUIÇÃO
NORMAL
–
ÁREA
DE
0
até
K
=>
probabilidade
da
variável
z
estar
entre
0
e
k
z
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0
0,0040
0,0080
0,0120
0,0160
0,0199
0,0239
0,0279
0,0319
0,0359
0
0,0398
0,0438
0,0478
0,0517
0,0557
0,0596
0,0636
0,0675
0,0714
0,0753
0,1
0,2
0,0793
0,0832
0,0871
0,0910
0,0948
0,0987
0,1026
0,1064
0,1103
0,1141
0,1179
0,1217
0,1255
0,1293
0,1331
0,1368
0,1406
0,1443
0,1480
0,1517
0,3
0,1554
0,1591
0,1664
0,1664
0,1700
0,1736
0,1772
0,1808
0,1844
0,1879
0,4
0,1915
0,1950
0,1985
0,2019
0,2054
0,2088
0,2123
0,2157
0,2190
0,2224
0,5
0,2257
0,2291
0,2324
0,2357
0,2389
0,2422
0,2454
0,2486
0,2517
0,2549
0,6
0,2580
0,2611
0,2642
0,2673
0,2704
0,2734
0,2764
0,2794
0,2823
0,2852
0,7
0,2881
0,2910
0,2939
0,2967
0,2995
0,3023
0,3051
0,3078
0,3106
0,3133
0,8
0,3159
0,3186
0,3212
0,3238
0,3264
0,3289
0,3315
0,3340
0,3365
0,3389
0,9
0,3413
0,3438
0,3461
0,3485
0,3508
0,3531
0,3554
0,3577
0,3599
0,3621
1
1,1
0,3643
0,3665
0,3686
0,3708
0,3729
0,3749
0,3770
0,3790
0,3810
0,3830
0,3849
0,3869
0,3888
0,3907
0,3925
0,3944
0,3962
0,3980
0,3997
0,4015
1,2
0,4032
0,4049
0,4066
0,4082
0,4099
0,4115
0,4115 0,4131
0,4147
0,4162
0,4177
1,3
0,4192
0,4207
0,4222
0,4236
0,4251
0,4265
0,4279
0,4292
0,4306
0,4319
1,4
0,4332
0,4345
0,4357
0,4370
0,4382
0,4394
0,4406
0,4418
0,4429
0,4441
1,5
1,6
0,4452
0,4463
0,4474
0,4484
203
0,4495
0,4505
0,4515
0,4525
0,4535
0,4545
0,4554
0,4564
0,4573
0,4582
0,4591
0,4599
0,4608
0,4616
0,4625
0,4633
1,7
σ=1
Área tabelada
-1,35 0
Distribuição Normal Padronizada
6º) Faça alguns ajustes para chegar à reposta correta, porque a área a ser determi-
nada é diferente da área tabelada. Como vimos, a área total sob a curva Normal é
igual a 1 e, pela simetria da curva, 0,5 antes da média e 0,5 depois da média.
Verificamos que:
Exemplo 2
204
Resolução:
X-μ 76 - 58
Z= = = 1,5
σ 12
4º) Desenhe as curvas e destaque a região cuja área será investigada para determi-
nar a probabilidade pedida.
σ=12 σ=1
μ=58 76 0 1,5
Distribuição Normal Distribuição Normal Padronizada
205
Tabela da Distribuição Normal
DISTRIBUIÇÃO
NORMAL
–
ÁREA
DE
0
até
K
=>
probabilidade
da
variável
z
estar
entre
0
e
k
z
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0
0,0040
0,0080
0,0120
0,0160
0,0199
0,0239
0,0279
0,0319
0,0359
0
0,0398
0,0438
0,0478
0,0517
0,0557
0,0596
0,0636
0,0675
0,0714
0,0753
0,1
0,2
0,0793
0,0832
0,0871
0,0910
0,0948
0,0987
0,1026
0,1064
0,1103
0,1141
0,1179
0,1217
0,1255
0,1293
0,1331
0,1368
0,1406
0,1443
0,1480
0,1517
0,3
0,1554
0,1591
0,1664
0,1664
0,1700
0,1736
0,1772
0,1808
0,1844
0,1879
0,4
0,1915
0,1950
0,1985
0,2019
0,2054
0,2088
0,2123
0,2157
0,2190
0,2224
0,5
0,2257
0,2291
0,2324
0,2357
0,2389
0,2422
0,2454
0,2486
0,2517
0,2549
0,6
0,2580
0,2611
0,2642
0,2673
0,2704
0,2734
0,2764
0,2794
0,2823
0,2852
0,7
0,2881
0,2910
0,2939
0,2967
0,2995
0,3023
0,3051
0,3078
0,3106
0,3133
0,8
0,3159
0,3186
0,3212
0,3238
0,3264
0,3289
0,3315
0,3340
0,3365
0,3389
0,9
0,3413
0,3438
0,3461
0,3485
0,3508
0,3531
0,3554
0,3577
0,3599
0,3621
1
1,1
0,3643
0,3665
0,3686
0,3708
0,3729
0,3749
0,3770
0,3790
0,3810
0,3830
0,3849
0,3869
0,3888
0,3907
0,3925
0,3944
0,3962
0,3980
0,3997
0,4015
1,2
0,4032
0,4049
0,4066
0,4082
0,4099
0,4115
0,4131
0,4147
0,4162
0,4177
1,3
0,4192
0,4207
0,4222
0,4236
0,4251
0,4265
0,4279
0,4292
0,4306
0,4319
1,4
0,4332
0,4332 0,4345
0,4357
0,4370
0,4382
0,4394
0,4406
0,4418
0,4429
0,4441
1,5
1,6
0,4452
0,4463
0,4474
0,4484
0,4495
0,4505
0,4515
0,4525
0,4535
0,4545
0,4554
0,4564
0,4573
0,4582
0,4591
0,4599
0,4608
0,4616
0,4625
0,4633
1,7
0,4641
0,4649
0,4656
0,4664
0,4671
0,4678
0,4686
0,4693
0,4699
0,4706
1,8
1,9
0,4713
0,4719
0,4726
0,4732
0,4738
0,4744
Área a0,4756
0,4750
ser determinada
0,4761
0,4767
0,4772
0,4778
0,4783
0,4788
0,4793
0,4798
0,4803
0,4808
0,4812
0,4817
2
Área tabelada σ=1
2,1
0,4821
0,4826
A = 0,4332
0,4830
0,4834
0,4838
0,4842
0,4846
0,4850
0,4854
0,4857
0,4861
0,4864
0,4868
0,4871
0,4875
0,4878
0,4881
0,4884
0,4887
0,4890
2,2
2,3
0,4893
0,4896
0,4898
0,4901
0,4904
0,4906
0,4909
0,4911
0,4332
0,5 0,4913
0,4916
0,4918
0,4920
0,4922
0,4925
0,4927
0,4929
0,4931
0,4932
0,4934
0,4936
2,4
0,4938
0,4940
0,4941
0,4943
0,4945
0,4946
0,4948
0,4949
0,4951
0,4952
2,5
μ=0 1,5 0,4957
μ=0 0,4963
1,5
2,6
0,4953
0,4955
0,4956
0,4959
0,4960
0,4961
0,4962
0,4964
Distribuição Normal Padronizada Distribuição Normal0,4973
Padronizada
2,7
0,4965
0,4966
0,4967
0,4968
0,4969
0,4970
0,4971
0,4972
0,4974
0,4974
0,4975
0,4976
0,4977
0,4977
0,4978
0,4979
0,4979
0,4980
0,4981
2,8
0,4981
0,4982
0,4982
0,4983
0,4984
0,4984
0,4985
0,4985
0,4986
0,4986
2,9
Fonte: Elaborada pela autora (2020).
0,4987
0,4987
0,4987
0,4988
0,4988
0,4989
0,4989
0,4989
0,4990
0,4990
3
0,4990
0,4991
0,4991
0,4991
0,4992
0,4992
0,4992
0,4992
0,4993
0,4993
3,1
6º) Como a área a ser determinada é diferente da área tabelada precisamos fazer
3,2
0,4993
0,4993
0,4994
0,4994
0,4994
0,4994
0,4994
0,4995
0,4995
0,4995
alguns ajustes para chegar à reposta correta.
0,4995
0,4995
0,4995
0,4996
0,4996
0,4996
0,4996
0,4996
0,4996
0,4997
3,3
0,4997
0,4997
0,4997
0,4997
0,4997
0,4997
0,4997
0,4997
0,4997
0,4998
3,4
Verificamos
0,4998
que:
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
3,5
0,4998
0,4998
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
3,6
Área
3,7
a ser determinada
0,4999
0,4999
0,4999
= 0,5 + área0,4999
0,4999
tabelada 0,4999
0,4999
0,4999
0,4999
0,4999
Área
3,8
a ser determinada
0,4999
0,4999
0,4999
= 0,5 +0,4332
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
Área
3,9
a ser determinada
0,5000
0,5000
0,5000
= 0,9332
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
4 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000
206
Logo, a probabilidade pedida será igual à área a ser determinada:
Exemplo 3
Resolução:
3º) Transforme a variável aleatória Normal para Normal padronizada a partir da fórmula:
X-μ 63,2 - 65,3
Z= = = - 0,38
σ 5,5
4º Desenhe as curvas e destaque a região cuja área será investigada para determi-
nar a probabilidade pedida.
207
σ=5,5 σ=1
Para Z = -0,38 usaremos z = 0,38, pois as áreas são idênticas para os dois valores.
A = 0,1480
Tabela da Distribuição Normal
DISTRIBUIÇÃO
NORMAL
–
ÁREA
DE
0
até
K
=>
probabilidade
da
variável
z
estar
entre
0
e
k
z
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0
0,0040
0,0080
0,0120
0,0160
0,0199
0,0239
0,0279
0,0319
0,0359
0
0,0398
0,0438
0,0478
0,0517
0,0557
0,0596
0,0636
0,0675
0,0714
0,0753
0,1
0,2
0,0793
0,0832
0,0871
0,0910
0,0948
0,0987
0,1026
0,1064
0,1103
0,1141
Área tabelada
0,6
0,2257
0,2291
σ=1
0,2324
0,2357
0,2389
0,2422
0,2454
0,2486
σ=1
0,2517
0,2549
A =0,7
0,1480 0,2580
0,2611
0,2642
0,2673
0,2704
0,2734
0,2764
0,2794
0,2823
Área
0,2852
a ser
0,8
0,2881
0,2910
0,2939
0,2967
0,2995
0,3023
0,3051
0,3078
0,3106
determinada
0,3133
0,3159
0,3186
0,3212
0,3238
0,3264
0,3289
0,3315
0,3340
0,3365
0,3389
0,9
0,3413
0,3438
0,3461
0,3485
0,3508
0,3531
0,3554
0,1480
0,3577
0,5
0,3599
0,3621
1
1,1
0,3643
0,3665
0,3686
0,3708
0,3729
0,3749
0,3770
0,3790
0,3810
0,3830
- 0,38 μ=0 - 0,38 μ=0
1,2
0,3849
0,3869
0,3888
0,3907
0,3925
0,3944
0,3962
0,3980
0,3997
0,4015
Distribuição Normal Padronizada Distribuição Normal Padronizada
1,3
0,4032
0,4049
0,4066
0,4082
0,4099
0,4115
0,4131
0,4147
0,4162
0,4177
0,4192
0,4207
0,4222
0,4236
0,4251
0,4265
0,4279
0,4292
0,4306
0,4319
1,4
0,4332
0,4345
0,4357
0,4370
0,4382
0,4394
0,4406
0,4418
0,4429
0,4441
1,5
1,6
0,4452
0,4463
0,4474
0,4484
0,4495
0,4505
0,4515
0,4525
0,4535
0,4545
Fonte: Elaborada pela autora (2020).
0,4554
0,4564
0,4573
0,4582
0,4591
0,4599
0,4608
0,4616
0,4625
0,4633
1,7
0,4641
0,4649
0,4656
0,4664
0,4671
0,4678
0,4686
0,4693
0,4699
0,4706
1,8
6º) Faça alguns ajustes para chegar à reposta correta, porque a área a ser0,4767
determi-
1,9
0,4713
0,4719
0,4726
0,4732
0,4738
0,4744
0,4750
0,4756
0,4761
nada é diferente
0,4772
0,4778
da0,4783
área tabelada.
0,4788
0,4793
0,4798
0,4803
0,4808
0,4812
0,4817
2
2,1
0,4821
0,4826
0,4830
0,4834
0,4838
0,4842
0,4846
0,4850
0,4854
0,4857
0,4861
0,4864
0,4868
0,4871
0,4875
0,4878
0,4881
0,4884
0,4887
0,4890
2,2
0,4893
0,4896
0,4898
0,4901
0,4904
0,4906
0,4909
0,4911
0,4913
0,4916
2,3
0,4918
0,4920
0,4922
0,4925
0,4927
0,4929
0,4931
0,4932
0,4934
0,4936
2,4
208
0,4938
0,4940
0,4941
0,4943
0,4945
0,4946
0,4948
0,4949
0,4951
0,4952
2,5
Verificamos que:
Exemplo 4
Resolução:
3º) Transforme a variável aleatória Normal para Normal padronizada a partir da fórmula:
X-μ 7000 - 5700
Z= = = 0,87
σ 1500
4º) Desenhe as curvas e destaque a região cuja área será investigada para determi-
nar a probabilidade pedida.
209
σ=1500 σ=1
DISTRIBUIÇÃO
NORMAL
–
ÁREA
DE
0
até
K
=>
probabilidade
da
variável
z
estar
entre
0
e
k
z
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0
0,0040
0,0080
0,0120
0,0160
0,0199
0,0239
0,0279
0,0319
0,0359
0
0,0398
0,0438
0,0478
0,0517
0,0557
0,0596
0,0636
0,0675
0,0714
0,0753
0,1
0,2
0,0793
0,0832
0,0871
0,0910
0,0948
0,0987
0,1026
0,1064
0,1103
0,1141
0,1179
0,1217
0,1255
0,1293
0,1331
0,1368
0,1406
0,1443
0,1480
0,1517
0,3
0,1554
0,1591
0,1664
0,1664
0,1700
0,1736
0,1772
0,1808
0,1844
0,1879
0,4
0,1915
0,1950
0,1985
0,2019
0,2054
0,2088
0,2123
0,2157
0,2190
0,2224
0,5
0,2257
0,2291
0,2324
0,2357
0,2389
0,2422
0,2454
0,2486
0,2517
0,2549
0,6
0,2580
0,2611
0,2642
0,2673
0,2704
0,2734
0,2764
0,2794
0,2823
0,2852
0,7
0,2881
0,2910
0,2939
0,2967
0,2995
0,3023
0,3051
0,3078
0,3106
0,3133
0,8
0,3078
0,3159
0,3186
0,3212
0,3238
0,3264
0,3289
0,3315
0,3340
0,3365
0,3389
0,9
0,3413
0,3438
0,3461
0,3485
0,3508
0,3531
0,3554
0,3577
0,3599
0,3621
1
1,1
0,3643
0,3665
0,3686
0,3708
Área tabelada
0,3729
0,3749
= 0,30780,3790
0,3770
0,3810
0,3830
0,3849
0,3869
0,3888
0,3907
0,3925
0,3944
0,3962
0,3980
0,3997
0,4015
1,2
Área a ser
0,4032
0,4049
0,4066
0,4082
0,4099
0,4115
0,4131
0,4147
0,4162
0,4177
1,3
determinada
0,4192
0,4207
0,4222
0,4236
0,4251
0,4265
0,4279
0,4292
0,4306
0,4319
1,4
0,4332
0,4345
0,4357
0,4370
0,4382
0,4394
0,4406
0,4418
0,4429
0,4441
1,5
1,6
0,4452
0,4463
0,4474
0,4484
0,4495
0,4505
0,4515
0,4525
0,4535
0,4545
0,4554
0,4564
0,4573
0,4582
0,4591
0,4599
0,4608
0,4616
0,4625
0,4633
1,7
μ=0 0,87
0,4641
0,4649
0,4656
0,4664
0,4671
0,4678
0,4686
0,4693
0,4699
0,4706
1,8
0,4713
0,4719
0,4726
Distribuição
0,4732
Normal 0,4744
0,4738
Padronizada
0,4750
0,4756
0,4761
0,4767
1,9
0,4772
0,4778
0,4783
0,4788
0,4793
0,4798
0,4803
0,4808
0,4812
0,4817
2
Fonte: Elaborada pela autora (2020).
2,1
0,4821
0,4826
0,4830
0,4834
0,4838
0,4842
0,4846
0,4850
0,4854
0,4857
0,4861
0,4864
0,4868
0,4871
0,4875
0,4878
0,4881
0,4884
0,4887
0,4890
2,2
2,3
0,4893
0,4896
0,4898
0,4901
210
0,4904
0,4906
0,4909
0,4911
0,4913
0,4916
0,4918
0,4920
0,4922
0,4925
0,4927
0,4929
0,4931
0,4932
0,4934
0,4936
2,4
6º) Como a área a ser determinada é diferente da área tabelada precisamos fase
alguns ajustes para chegar à reposta correta.
Verificamos que:
Podemos concluir que a probabilidade que uma família selecionada ao acaso tenha
gasto mensal superior a R$ 7.000,00 é igual a 19,22%.
Exemplo 5
Exemplifica o cálculo da probabilidade em que a z-score está entre dois valores determi-
nados antes da média.
Enunciado: A quantia média anual que os moradores da cidade do Rio de Janeiro gastam
por ano em aplicativos de transportes individuais R$ 1.649,00. Suponha que a quantia
gasta tenha uma distribuição normal com desvio-padrão igual a R$ 843,00.
Resolução:
3º) Transforme a variável aleatória Normal para Normal padronizada a partir da fórmula:
211
X-μ 1568 - 1649
Para X=1568 Z2 = = = - 0,10
σ 843
4º) Desenhe as curvas e destaque a região cuja área será investigada para determi-
nar a probabilidade pedida.
σ=843 σ=1
5º) Utilize a tabela da distribuição Normal padronizada e busque o valor das áreas.
Primeiramente para Z=-0,72 ou Z=0,72 já que as duas áreas são idênticas para esses
valores A = 0,2642Tabela da Distribuição Normal
DISTRIBUIÇÃO
NORMAL
–
ÁREA
DE
0
até
K
=>
probabilidade
da
variável
z
estar
entre
0
e
k
z
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0
0,0040
0,0080
0,0120
0,0160
0,0199
0,0239
0,0279
0,0319
0,0359
0
0,0398
0,0438
0,0478
0,0517
0,0557
0,0596
0,0636
0,0675
0,0714
0,0753
0,1
0,2
0,0793
0,0832
0,0871
0,0910
0,0948
0,0987
0,1026
0,1064
0,1103
0,1141
0,1179
0,1217
0,1255
0,1293
0,1331
0,1368
0,1406
0,1443
0,1480
0,1517
0,3
0,1554
0,1591
0,1664
0,1664
0,1700
0,1736
0,1772
0,1808
0,1844
0,1879
0,4
0,1915
0,1950
0,1985
0,2019
0,2054
0,2088
0,2123
0,2157
0,2190
0,2224
0,5
0,2257
0,2291
0,2324
0,2357
0,2389
0,2422
0,2454
0,2486
0,2517
0,2549
0,6
0,2580
0,2611
0,2642
0,2673
0,2704
0,2734
0,2764
0,2794
0,2823
0,2852
0,7
0,2642
0,2881
0,2910
0,2939
0,2967
0,2995
0,3023
0,3051
0,3078
0,3106
0,3133
0,8
0,3159
0,3186
0,3212
0,3238
0,3264
0,3289
0,3315
0,3340
0,3365
0,3389
0,9
0,3413
0,3438
0,3461
0,3485
0,3508
0,3531
0,3554
0,3577
0,3599
0,3621
1
1,1
0,3643
0,3665
0,3686
0,3708
0,3729
0,3749
0,3770
0,3790
0,3810
0,3830
0,3849
0,3869
0,3888
0,3907
0,3925
0,3944
0,3962
0,3980
0,3997
0,4015
1,2
0,4032
0,4049
0,4066
0,4082
0,4099
0,4115
0,4131
0,4147
0,4162
0,4177
1,3
212
0,4192
0,4207
0,4222
0,4236
0,4251
0,4265
0,4279
0,4292
0,4306
0,4319
1,4
0,4332
0,4345
0,4357
0,4370
0,4382
0,4394
0,4406
0,4418
0,4429
0,4441
Agora para Z = -0,10 ou Z = 0,10 já que as duas áreas são idênticas para esses valo-
Tabela da Distribuição Normal
res A = 0,0398
DISTRIBUIÇÃO
NORMAL
–
ÁREA
DE
0
até
K
=>
probabilidade
da
variável
z
estar
entre
0
e
k
z
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0
0,0040
0,0080
0,0120
0,0160
0,0199
0,0239
0,0279
0,0319
0,0359
0
0,0398
0,0438
0,0478
0,0517
0,0557
0,0596
0,0636
0,0675
0,0714
0,0753
0,1
0,0398
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,1179
0,1217
0,1255
0,1293
0,1331
0,1368
0,1406
0,1443
0,1480
0,1517
0,3
Área tabelada Área tabelada 0,1772
Área0,1808
a ser
0,4
0,1554
0,1591
0,1664
0,1664
0,1700
0,1736
0,1844
0,1879
para Z = 0,72 para Z = 0,10 determinada
0,1915
0,1950
0,1985
0,2019
0,2054
0,2088
0,2123
0,2157
0,2190
0,2224
A =0,5
0,2642 A = 0,0398
0,2257
0,2291
0,2324
0,2357
0,2389
0,2422
0,2454
0,2486
0,2517
0,2549
0,6
σ=1 σ=1 σ=1
0,2580
0,2611
0,2642
0,2673
0,2704
0,2734
0,2764
0,2794
0,2823
0,2852
0,7
0,2881
0,2910
0,2939
0,2967
0,2995
0,3023
0,3051
0,3078
0,3106
0,3133
0,8
0,3159
0,3186
0,3212
0,3238
0,3264
0,3289
0,3315
0,3340
0,3365
0,3389
0,9
0,3413
0,3438
0,3461
0,3485
0,3508
0,3531
0,3554
0,3577
0,3599
0,3621
1
- 0,72 - 0,10 - 0,72 - 0,10 - 0,72 - 0,10
1,1
0,3643
0,3665
0,3686
0,3708
0,3729
0,3749
0,3770
0,3790
0,3810
0,3830
μ=0 μ=0 μ=0
1,2
0,3849
0,3869
0,3888
0,3907
0,3925
0,3944
0,3962
0,3980
0,3997
0,4015
0,4032
0,4049
0,4066
0,4082
0,4099
0,4115
0,4131
0,4147
0,4162
0,4177
1,3
Distribuição Normal Distribuição Normal Distribuição Normal
1,4
Padronizada
0,4192
0,4207
0,4222
0,4236
Padronizada
0,4251
0,4265
0,4279
0,4292
Padronizada
0,4306
0,4319
0,4332
0,4345
0,4357
0,4370
0,4382
0,4394
0,4406
0,4418
0,4429
0,4441
1,5
Fonte: Elaborada pela autora (2020).
1,6
0,4452
0,4463
0,4474
0,4484
0,4495
0,4505
0,4515
0,4525
0,4535
0,4545
0,4554
0,4564
0,4573
0,4582
0,4591
0,4599
0,4608
0,4616
0,4625
0,4633
1,7
6º) 0,4641
Observe0,4649
o colorido
0,4656
a área A1. Se
0,4664
apagarmos
0,4671
0,4678
em A1 a área
0,4686
0,4693
A2, 0,4699
vamos ficar
0,4706
exa-
1,8
tamente
1,9
0,4713
com a área
0,4719
a ser determinada.
0,4726
0,4732
0,4738
Portanto:
0,4744
0,4750
0,4756
0,4761
0,4767
0,4772
0,4778
0,4783
0,4788
0,4793
0,4798
0,4803
0,4808
0,4812
0,4817
2
Área
2,1
a ser determinada=
0,4821
0,4826
0,4830
área tabelada
0,4834
0,4838
1 - área
0,4842
tabelada
0,4846
2 0,4850
0,4854
0,4857
Area
2,2
a ser determinada
0,4861
0,4864
0,4868
= 02642
0,4871
– 0,4875
0,0398 0,4878
0,4881
0,4884
0,4887
0,4890
Área
2,3
a ser determinada
0,4893
0,4896
0,4898
= 0,2244
0,4901
0,4904
0,4906
0,4909
0,4911
0,4913
0,4916
0,4918
0,4920
0,4922
0,4925
0,4927
0,4929
0,4931
0,4932
0,4934
0,4936
2,4
0,4938
0,4940
0,4941
0,4943
0,4945
0,4946
0,4948
0,4949
0,4951
0,4952
2,5
Logo, a probabilidade pedida será igual a área a ser determinada:
2,6
0,4953
0,4955
0,4956
0,4957
0,4959
0,4960
0,4961
0,4962
0,4963
0,4964
0,4965
0,4966
0,4967
0,4968
0,4969
0,4970
0,4971
0,4972
0,4973
0,4974
2,7
P(1042 < X < 1568) = P(-0,72 < Z<-0,10) = 0,2244 = 22,44%
0,4974
0,4975
0,4976
0,4977
0,4977
0,4978
0,4979
0,4979
0,4980
0,4981
2,8
0,4981
0,4982
0,4982
0,4983
0,4984
0,4984
0,4985
0,4985
0,4986
0,4986
2,9
Então, a probabilidade
0,4987
0,4987
de uma
0,4987
pessoa
0,4988
selecionada
0,4988
0,4989
ao acaso0,4989
0,4989
gastar entre
0,4990
R$0,4990
1.042,00
3
e R$ 1.568,00
0,4990
em aplicativos
0,4991
0,4991
de transporte
0,4991
0,4992
é igual a0,4992
0,4992
22,44% 0,4992
0,4993
0,4993
3,1
0,4993
0,4993
0,4994
0,4994
0,4994
0,4994
0,4994
0,4995
0,4995
0,4995
3,2
Exemplo 6
3,3
0,4995
0,4995
0,4995
0,4996
0,4996
0,4996
0,4996
0,4996
0,4996
0,4997
0,4997
0,4997
0,4997
0,4997
0,4997
0,4997
0,4997
0,4997
0,4997
0,4998
3,4
Exemplifica
3,5
0,4998
o cálculo
0,4998
da0,4998
probabilidade
0,4998
em que a0,4998
0,4998
z-score0,4998
está entre
0,4998
dois0,4998
valores0,4998
determi-
nados
3,6
que contenham a média.
0,4998
0,4998
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
3,7
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
3,8
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
3,9
213
4
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
Vamos resolver o exemplo que apresentamos no início do estudo da distribuição Normal,
que foi determinado com a resolução da integral. Agora, vamos resolvê-lo com o uso da
tabela da distribuição normal padronizada.
Enunciado: Supondo que uma variável aleatória Normal apresente a média igual a 5 e a
variância igual a 4, determine a probabilidade de a variável aleatória estar entre 3 e 6.
Resolução:
3º) Transforme a variável aleatória Normal para Normal padronizada a partir da fórmula:
X-μ 3-5
Para X = 3 Z1 = = =-1
σ 2
X-μ 6-5
Para X = 6 Z2 = = = - 0,5
σ 2
4º) Desenhe as curvas e destaque a região cuja área será investigada para determi-
nar a probabilidade pedida.
σ=1
-1 μ=0 0,5
Distribuição Normal Padronizada
5º) Utilize a tabela da distribuição Normal padronizada e busque o valor das áreas.
Primeiramente para Z=-1 ou Z=1. Com duas casas decimais Z = 1,00 A=0,3413
214
Tabela da Distribuição Normal
DISTRIBUIÇÃO
NORMAL
–
ÁREA
DE
0
até
K
=>
probabilidade
da
variável
z
estar
entre
0
e
k
z
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0
0,0040
0,0080
0,0120
0,0160
0,0199
0,0239
0,0279
0,0319
0,0359
0
0,0398
0,0438
0,0478
0,0517
0,0557
0,0596
0,0636
0,0675
0,0714
0,0753
0,1
0,2
0,0793
0,0832
0,0871
0,0910
0,0948
0,0987
0,1026
0,1064
0,1103
0,1141
0,1179
0,1217
0,1255
0,1293
0,1331
0,1368
0,1406
0,1443
0,1480
0,1517
0,3
0,1554
0,1591
0,1664
0,1664
0,1700
0,1736
0,1772
0,1808
0,1844
0,1879
0,4
0,1915
0,1950
0,1985
0,2019
0,2054
0,2088
0,2123
0,2157
0,2190
0,2224
0,5
0,2257
0,2291
0,2324
0,2357
0,2389
0,2422
0,2454
0,2486
0,2517
0,2549
0,6
0,2580
0,2611
0,2642
0,2673
0,2704
0,2734
0,2764
0,2794
0,2823
0,2852
0,7
0,2881
0,2910
0,2939
0,2967
0,2995
0,3023
0,3051
0,3078
0,3106
0,3133
0,8
0,3159
0,3186
0,3212
0,3238
0,3264
0,3289
0,3315
0,3340
0,3365
0,3389
0,9
0,3413
0,3413 0,3438
0,3461
0,3485
0,3508
0,3531
0,3554
0,3577
0,3599
0,3621
1
1,1
0,3643
0,3665
0,3686
0,3708
0,3729
0,3749
0,3770
0,3790
0,3810
0,3830
0,3849
0,3869
0,3888
0,3907
0,3925
0,3944
0,3962
0,3980
0,3997
0,4015
1,2
1,3
Agora para0,4049
0,4032
Z=0,5 . Com Tabela
0,4066
duas da
casas
0,4082
Distribuição
decimais
0,4099
Z=Normal
0,4115
0,50 A=0,1915
0,4131
0,4147
0,4162
0,4177
0,4192
0,4207
0,4222
0,4236
0,4251
0,4265
0,4279
0,4292
0,4306
0,4319
1,4
1,5
0,4332
0,4345
0,4357
0,4370
0,4382
0,4394
0,4406
0,4418
0,4429
0,4441
DISTRIBUIÇÃO
N ORMAL
–
Á REA
D E
0
a té
K
= >
p robabilidade
d a
v ariável
z
e star
e ntre
0
e
k
1,6
0,4452
0,4463
0,4474
0,4484
0,4495
0,4505
0,4515
0,4525
0,4535
0,4545
z
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
1,7
0,4554
0
0,4564
0,0040
0,4573
0,0080
0,4582
0,0120
0,4591
0,0160
0,4599
0,0199
0,4608
0,0239
0,4616
0,0279
0,4625
0,0319
0,4633
0,0359
0
1,8
0,4641
0,4649
0,4656
0,4664
0,4671
0,4678
0,4686
0,4693
0,4699
0,4706
0,1
0,0398
0,0438
0,0478
0,0517
0,0557
0,0596
0,0636
0,0675
0,0714
0,0753
1,9
0,4713
0,4719
0,4726
0,4732
0,4738
0,4744
0,4750
0,4756
0,4761
0,4767
0,2
0,0793
0,4772
0,0832
0,4778
0,0871
0,4783
0,0910
0,4788
0,0948
0,4793
0,0987
0,4798
0,1026
0,4803
0,1064
0,4808
0,1103
0,4812
0,1141
0,4817
2
0,3
0,1179
0,4821
0,1217
0,4826
0,1255
0,4830
0,1293
0,4834
0,1331
0,4838
0,1368
0,4842
0,1406
0,4846
0,1443
0,4850
0,1480
0,4854
0,1517
0,4857
2,1
0,1554
0,1591
0,1664
0,1664
0,1700
0,1736
0,1772
0,1808
0,1844
0,1879
0,4
0,4861
0,4864
0,4868
0,4871
0,4875
0,4878
0,4881
0,4884
0,4887
0,4890
2,2
0,1915
0,1915 0,1950
0,1985
0,2019
0,2054
0,2088
0,2123
0,2157
0,2190
0,2224
0,5
0,4893
0,4896
0,4898
0,4901
0,4904
0,4906
0,4909
0,4911
0,4913
0,4916
2,3
0,2257
0,2291
0,2324
0,2357
0,2389
0,2422
0,2454
0,2486
0,2517
0,2549
0,6
0,4918
0,4920
0,4922
0,4925
0,4927
0,4929
0,4931
0,4932
0,4934
0,4936
2,4
0,2580
0,2611
0,2642
0,2673
0,2704
0,2734
0,2764
0,2794
0,2823
0,2852
0,7
0,4938
0,4940
0,4941
0,4943
0,4945
0,4946
0,4948
0,4949
0,4951
0,4952
2,5
Área tabelada 0,3078
Área tabelada
0,8
0,2881
0,4953
0,2910
0,4955
0,2939
0,4956
0,2967
0,4957
0,2995
0,4959
0,3023
0,4960
0,3051
0,4961
0,4962
0,3106
0,4963
0,3133
0,4964
2,6
para z = -10,3186
para
0,3365
z = 0,5
0,9
0,3159
0,4965
0,4966
0,3212
0,4967
0,3238
0,4968
0,3264
0,4969
0,3289
0,4970
0,3315
0,4971
0,3340
0,4972
0,4973
0,3389
0,4974
2,7
0,3413
0,3438
0,3461
0,3485
0,3508
0,3531
0,3554
0,3577
0,3599
0,3621
1
2,8
0,4974
0,4975
0,4976
0,4977
0,4977
0,4978
0,4979
0,4979
0,4980
0,4981
1,1
0,3643
0,3665
0,3686
0,3708
0,3729
0,3749
0,3770
0,3790
0,3810
0,3830
2,9
0,4981
0,4982
0,4982
0,4983
0,4984
0,4984
0,4985
0,4985
0,4986
0,4986
1,2
0,3849
0,3869
0,4987
0,3413
0,4987
0,3888
0,4987
0,3907
0,4988
0,3925
0,4988
0,3944
0,4989
0,3962
0,4989
0,3980
0,4989
0,1915
0,3997
0,4990
0,4015
0,4990
3
1,3
0,4032
0,4049
0,4066
0,4082
0,4099
0,4115
0,4131
0,4147
0,4162
0,4177
3,1
0,4990
0,4991
0,4991
0,4991
0,4992
0,4992
0,4992
0,4992
0,4993
0,4993
1,4
0,4192
0,4207
0,4222
0,4236
0,4251
0,4265
0,4279
0,4292
0,4306
0,4319
3,2
0,4993
-1
0,4993
μ=0 0,5
0,4994
0,4994
0,4994
0,4994
0,4994
0,4995
0,4406
-1 0,4418
μ=0 0,4429
0,4995
0,4995
0,5 0,4441
1,5
0,4332
0,4345
0,4357
0,4370
0,4382
0,4394
3,3
0,4995
0,4995
0,4995
0,4996
0,4996
0,4996
0,4996
0,4996
0,4996
0,4997
1,6
0,4452
0,4997
0,4463
0,4997
0,4474
0,4997
0,4484
0,4997
0,4495
0,4997
0,4505
0,4997
0,4515
0,4997
0,4525
0,4997
0,4535
0,4997
0,4545
0,4998
Distribuição Normal
3,4
Padronizada 0,4599
Distribuição Normal0,4625
Padronizada
1,7
0,4554
0,4564
0,4573
0,4582
0,4591
0,4608
0,4616
0,4633
3,5
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
1,8
0,4641
0,4649
0,4656
0,4664
0,4671
0,4678
0,4686
0,4693
0,4699
0,4706
3,6
0,4998
0,4998
0,4999
Fonte:
0,4999
Elaborada
0,4999
0,4738
pela 0,4744
0,4999
0,4999
autora (2020).
0,4999
0,4999
0,4999
1,9
0,4713
0,4719
0,4726
0,4732
0,4750
0,4756
0,4761
0,4767
3,7
0,4999
0,4772
0,4999
0,4778
0,4999
0,4783
0,4999
0,4788
0,4999
0,4793
0,4999
0,4798
0,4999
0,4803
0,4999
0,4808
0,4999
0,4812
0,4999
0,4817
2
3,8
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
2,1
0,4821
0,4826
0,4830
0,4834
0,4838
0,4842
0,4846
0,4850
0,4854
0,4857
3,9
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
2,2
0,4861
0,5000
0,4864
0,5000
0,4868
0,5000
0,4871
0,5000
0,4875
0,5000
0,4878
0,5000
0,4881
0,5000
0,4884
0,5000
0,4887
0,5000
0,4890
0,5000
4
2,3
0,4893
0,4896
0,4898
0,4901
0,4904
0,4906
0,4909
0,4911
0,4913
0,4916
0,4918
0,4920
0,4922
0,4925
0,4927
0,4929
0,4931
0,4932
0,4934
0,4936
2,4
215
0,4938
0,4940
0,4941
0,4943
0,4945
0,4946
0,4948
0,4949
0,4951
0,4952
2,5
2,6
0,4953
0,4955
0,4956
0,4957
0,4959
0,4960
0,4961
0,4962
0,4963
0,4964
Área a ser determinada
0,3413 0,1915
-1 μ=0 0,5
Distribuição Normal Padronizada
P( 3 ≤ X ≤ 6) = P(-1 ≤ Z ≤ 0,5)
6º) Como a área a ser determinada é exatamente a soma das duas áreas tabeladas
temos:
6 1 (x-5)2
∫3 e– 2 · 4
2 2π
porém com o cálculo de apenas uma adição de duas áreas. As tabelas simplificam sig-
nificativamente os cálculos.
Esse mesmo raciocínio do exemplo 6 será usado, caso seja preciso fazer o cálculo da
probabilidade em que a z-score está entre dois valores determinados depois da média.
Exemplo 7
É um exemplo inverso. Nesse caso, sabemos a probabilidade pela qual queremos deter-
minar o valor da variável aleatória.
216
Enunciado: As notas dos alunos de Estatística estão normalmente distribuídas com mé-
dia igual a 80 pontos e desvio-padrão igual a 5 pontos. A universidade vai premiar 10%
dos alunos que obtiverem as maiores notas na disciplina. Qual deve nota um aluno deve
obter para que seja premiado?
Resolução:
Observe que agora conhecemos a área sob a curva e precisamos determinar o z-score e
consequentemente o valor da variável aleatória.
σ=5 σ=1
μ=80 μ=0
Distribuição Normal Distribuição Normal Padronizada
??????? ???????
Como sabemos que a curva tem 50% das probabilidades antes da média e 50% depois
da média, então:
σ=5 σ=1
μ=80 μ=0
Distribuição Normal Distribuição Normal Padronizada
??????? ???????
217
Vamos buscar no corpo tabela de distribuição Normal padronizada o valor de z que gera
uma área igual a 0,4.
Tabela da Distribuição Normal
DISTRIBUIÇÃO
NORMAL
–
ÁREA
DE
0
até
K
=>
probabilidade
da
variável
z
estar
entre
0
e
k
z
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0
0,0040
0,0080
0,0120
0,0160
0,0199
0,0239
0,0279
0,0319
0,0359
0
0,0398
0,0438
0,0478
0,0517
0,0557
0,0596
0,0636
0,0675
0,0714
0,0753
0,1
0,2
0,0793
0,0832
0,0871
0,0910
0,0948
0,0987
0,1026
0,1064
0,1103
0,1141
0,1179
0,1217
0,1255
0,1293
0,1331
0,1368
0,1406
0,1443
0,1480
0,1517
0,3
0,1554
0,1591
0,1664
0,1664
0,1700
0,1736
0,1772
0,1808
0,1844
0,1879
0,4
0,1915
0,1950
0,1985
0,2019
0,2054
0,2088
0,2123
0,2157
0,2190
0,2224
0,5
0,2257
0,2291
0,2324
0,2357
0,2389
0,2422
0,2454
0,2486
0,2517
0,2549
0,6
0,2580
0,2611
0,2642
0,2673
0,2704
0,2734
0,2764
0,2794
0,2823
0,2852
0,7
0,2881
0,2910
0,2939
0,2967
0,2995
0,3023
0,3051
0,3078
0,3106
0,3133
0,8
0,3159
0,3186
0,3212
0,3238
0,3264
0,3289
0,3315
0,3340
0,3365
0,3389
0,9
0,3413
0,3438
0,3461
0,3485
0,3508
0,3531
0,3554
0,3577
0,3599
0,3621
1
1,1
0,3643
0,3665
0,3686
0,3708
0,3729
0,3749
0,3770
0,3790
0,3810
0,3830
0,3849
0,3869
0,3888
0,3907
0,3925
0,3944
0,3962
0,3980
0,3997
0,4015
1,2
0,3997
0,4032
0,4049
0,4066
0,4082
0,4099
0,4115
0,4131
0,4147
0,4162
0,4177
1,3
0,4192
0,4207
0,4222
0,4236
0,4251
0,4265
0,4279
0,4292
0,4306
0,4319
Com
1,4
isso, descobrimos o valor do z-score, Z=1,28
0,4332
0,4345
0,4357
0,4370
0,4382
0,4394
0,4406
0,4418
0,4429
0,4441
1,5
0,4452
0,4463
0,4474
0,4484
0,4495
0,4505
1,6
determinarmos o valor da variável aleatória X, basta substituir os valores na fórmula: 0,4515
0,4525
0,4535
0,4545
Para
0,4554
0,4564
0,4573
0,4582
0,4591
0,4599
0,4608
0,4616
0,4625
0,4633
1,7
0,4641
0,4649
0,4656
0,4664
0,4671
0,4678
0,4686
0,4693
0,4699
0,4706
1,8
X-μ
Z1,9
= 0,4713
0,4719
0,4726
0,4732
0,4738
0,4744
0,4750
0,4756
0,4761
0,4767
2
σ
0,4772
0,4778
0,4783
0,4788
0,4793
0,4798
0,4803
0,4808
0,4812
0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2
X-
0,4861
800,4864
0,4868
0,4871
0,4875
0,4878
0,4881
0,4884
0,4887
0,4890
1,28 =
2,3
0,4893
5 0,4896
0,4898
0,4901
0,4904
0,4906
0,4909
0,4911
0,4913
0,4916
0,4918
0,4920
0,4922
0,4925
0,4927
0,4929
0,4931
0,4932
0,4934
0,4936
2,4
0,4938
0,4940
0,4941
0,4943
0,4945
0,4946
0,4948
0,4949
0,4951
0,4952
2,5
1,28 · 5 = X - 80
2,6
0,4953
0,4955
0,4956
0,4957
0,4959
0,4960
0,4961
0,4962
0,4963
0,4964
0,4965
0,4966
0,4967
0,4968
0,4969
0,4970
0,4971
0,4972
0,4973
0,4974
6,42,7
= X - 80
0,4974
0,4975
0,4976
0,4977
0,4977
0,4978
0,4979
0,4979
0,4980
0,4981
2,8
0,4981
0,4982
0,4982
0,4983
0,4984
0,4984
0,4985
0,4985
0,4986
0,4986
2,9
6,4 + 800,4987
=X 0,4987
0,4987
0,4988
0,4988
0,4989
0,4989
0,4989
0,4990
0,4990
3
0,4990
0,4991
0,4991
0,4991
0,4992
0,4992
0,4992
0,4992
0,4993
0,4993
3,1
86,4 = X0,4993
3,2
0,4993
0,4994
0,4994
0,4994
0,4994
0,4994
0,4995
0,4995
0,4995
0,4995
0,4995
0,4995
0,4996
0,4996
0,4996
0,4996
0,4996
0,4996
0,4997
3,3
Logo,
3,4
podemos
0,4997
concluir0,4997
0,4997
que os 0,4997
estudantes0,4997
com notas iguais
0,4997
0,4997
ou superiores
0,4997
0,4997
a 86,4 serão
0,4998
0,4998
0,4998
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
3,6
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
3,7
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
3,8
3,9
0,5000
0,5000
0,5000
0,5000
218
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
4
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
Distribuições de Probabilidades com o Excel
x: número de tentativas
bem-sucedidas.
n: número de repetições.
p = probabilidade de sucesso
Binomial = DISTRBIONOM (x; n; p; cumulativo) em cada tentativa.
x: número de eventos.
μ: média aritmética da
distribuição.
219
Agora, com o auxílio da planilha eletrônica Excel resolveremos alguns dos exemplos prá-
ticos apresentados anteriormente.
Exemplo 1
COMANDO RESPOSTA
COMANDO RESPOSTA
COMANDO RESPOSTA
= 10.0,2 2
220
d) O que podemos concluir de um aluno que não estuda e “chuta” as questões
da avaliação?
COMANDO RESPOSTA
Exemplo 2
Intervalo de tempo
COMANDO RESPOSTA
COMANDO RESPOSTA
221
Exemplo 3
COMANDO RESPOSTA
Exemplo 4
COMANDO RESPOSTA
Exemplo 5
Supondo que uma variável aleatória Normal apresente a média igual a 5 e a variância
igual a 4.
222
COMANDO RESPOSTA
Confira as respostas que estão no final do livro e, se tiver alguma dúvida, fale
com o seu tutor pelo Fórum de Dúvidas – Fale com o Tutor.
223
MIDIATECA
NA PRÁTICA
Suponha que a Grear Tire Company tenha desenvolvido um pneu radial com
cinturão de aço, que será vendido por meio de uma cadeia nacional de discount
stores. Uma vez que esse tipo de pneu é um novo produto, os gerentes da Grear
acreditam que a durabilidade (em termos de milhas rodadas) oferecida com o
pneu será um fator importante na aceitação do produto. Antes de definirem os
termos do contrato de garantia de durabilidade do pneu, os gerentes da Grear
desejam obter informações de probabilidade a respeito do número de milhas
que os pneus durarão.
224
Qual deve ser o número de milhas coberto pela garantia, levando-se em conta
que a Grear quer que não mais do que 10% dos pneus sejam habilitados à
garantia do desconto?
Fonte:
SWEENEY, D. J.; WILLIAMS, T. A.; ANDERSON, D. R. Estatística aplicada à ad-
ministração e economia. 3. ed. São Paulo: Cengage Learning, 2013.
225
Resumo da Unidade 3
226
Referências
227
UNIDADE 4
Intervalos de confiança e
Relação entre variáveis
INTRODUÇÃO
Iniciamos os estudos desta disciplina falando da Estatística Descritiva, com suas técni-
cas para resumir um conjunto de dados por meio de tabelas, criar e apresentar gráficos
e ainda para calcular as medidas de posição e dispersão. Depois, vimos a teoria da pro-
babilidade e os modelos probabilísticos, discretos ou contínuos.
OBJETIVO
229
Intervalos de confiança
Parâmetros
Estimadores
Estimativa
É valor numérico assumido por um estimador. Pode ser por ponto (um único valor) ou in-
tervalar (um intervalo de valores possíveis) de um parâmetro populacional desconhecido.
230
Agora que já entendemos sobre os conceitos basilares falaremos de Intervalo de Confiança.
Intervalo de confiança
Para construirmos esse intervalo de confiança devemos seguir cinco passos. Vejamos:
1º) Verificar se a população obedece aos princípios de uma distribuição normal, ou asse-
gurar que o tamanho da amostra seja suficientemente grande, ou seja, n > 30.
231
σ
σx =
n
Em que:
σ x = desvio-padrão da média
σ = desvio-padrão populacional
n = tamanho da amostra
4º) Determinar com auxílio da tabela de distribuição normal padronizada o valor de Z-s-
core em função do nível de confiança. Como vimos na Unidade 3, existem vários tipos
de tabela normal padronizada e por isso temos que ter bastante cuidado nessa etapa.
Na tabela disponibilizada em nosso curso, buscamos a metade no nível de confiança, no
corpo da tabela, para determinar Z-score.
IC = X̅ ± Zscore ∙ σ x
Exemplo 1:
Considere que a altura dos alunos de Estatística estejam normalmente distribuídas com
o desvio-padrão populacional igual a 15 cm. Foi retirada uma amostra aleatoriamente,
composta de 100 alunos, e obteve-se a média amostral igual a 1,75 cm.
Determine o intervalo com 95% de confiança que contenha a verdadeira altura média
dos alunos de Estatística.
Resolução:
Vamos, então, determinar os cinco passos para construir esse intervalo de confiança, para
média μ, ao nível de confiança de 95%, com o desvio-padrão populacional conhecido:
Etapas Respostas
232
σ = 15 cm
2º) Identificar o valor numérico do desvio-pa-
drão populacional (σ); da média amostral ( X̅ ) X̅ = 175 m
e o tamanho da amostra (n);
n = 100
sa etapa. Na tabela disponibilizada DISTRIBUIÇÃO NORMAL – ÁREA DE 0 até K => probabilidade da variável z estar entre 0 e k
0,0793
0,0438
0,0832
0,0478
0,0871
0,0517
0,0910
0,0557
0,0948
0,0596
0,0987
0,0636
0,1026
0,0675
0,1064
0,0714
0,1103
0,0753
0,1141
0,1554
0,1217
0,1591
0,1255
0,1664
0,1293
0,1664
0,1331
0,1700
0,1368
0,1736
0,1406
0,1772
0,1443
0,1808
0,1480
0,1844
0,1517
0,1879
0,1915
0,1950
0,1985
0,2019
0,2054
0,2088
0,2123
0,2157
0,2190
0,2224
0,5
0,2257
0,2291
0,2324
0,2357
0,2389
0,2422
0,2454
0,2486
0,2517
0,2549
0,6
0,2580
0,2611
0,2642
0,2673
0,2704
0,2734
0,2764
0,2794
0,2823
0,2852
0,7
0,2881
0,2910
0,2939
0,2967
0,2995
0,3023
0,3051
0,3078
0,3106
0,3133
0,8
0,3159
0,3186
0,3212
0,3238
0,3264
0,3289
0,3315
0,3340
0,3365
0,3389
0,9
0,3413
0,3438
0,3461
0,3485
0,3508
0,3531
0,3554
0,3577
0,3599
0,3621
1
1,1
0,3643
0,3665
0,3686
0,3708
0,3729
0,3749
0,3770
0,3790
0,3810
0,3830
0,3849
0,3869
0,3888
0,3907
0,3925
0,3944
0,3962
0,3980
0,3997
0,4015
1,2
0,4032
0,4049
0,4066
0,4082
0,4099
0,4115
0,4131
0,4147
0,4162
0,4177
1,3
0,4192
0,4207
0,4222
0,4236
0,4251
0,4265
0,4279
0,4292
0,4306
0,4319
1,4
0,4332
0,4345
0,4357
0,4370
0,4382
0,4394
0,4406
0,4418
0,4429
0,4441
1,5
1,6
0,4452
0,4463
0,4474
0,4484
0,4495
0,4505
0,4515
0,4525
0,4535
0,4545
0,4554
0,4564
0,4573
0,4582
0,4591
0,4599
0,4608
0,4616
0,4625
0,4633
1,7
0,4641
0,4649
0,4656
0,4664
0,4671
0,4678
0,4686
0,4693
0,4699
0,4706
1,8
0,4713
0,4719
0,4726
0,4732
0,4738
0,4744
0,4750
0,4756
0,4761
0,4767
1,9
0,4772
0,4778
0,4783
0,4788
0,4793
0,4798
0,4803
0,4808
0,4812
0,4817
2
2,1
0,4821
0,4826
0,4830
0,4834
0,4838
0,4842
0,4846
0,4850
0,4854
0,4857
0,4861
0,4864
0,4868
0,4871
0,4875
0,4878
0,4881
0,4884
0,4887
0,4890
2,2
0,4893
0,4896
0,4898
0,4901
0,4904
0,4906
0,4909
0,4911
0,4913
0,4916
2,3
Fonte: http://ead.uva.br///recurso/DEF/EST/u3_
2,4
0,4918
0,4920
0,4922
0,4925
0,4927
0,4929
0,4931
0,4932
0,4934
0,4936
c3_r1/anexo/Tabela-da-Distribuicao-Normal.pdf
2,5
0,4938
0,4940
0,4941
0,4943
0,4945
0,4946
0,4948
0,4949
0,4951
0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
0,4965
0,4966
0,4967
0,4968
0,4969
0,4970
0,4971
0,4972
0,4973
0,4974
2,7
0,4974
0,4975
0,4976
0,4977
0,4977
0,4978
0,4979
0,4979
0,4980
0,4981
2,8
0,4981
0,4982
0,4982
0,4983
0,4984
0,4984
0,4985
0,4985
0,4986
0,4986
2,9
0,4987
0,4987
0,4987
0,4988
0,4988
0,4989
0,4989
0,4989
0,4990
0,4990
3
0,4990
0,4991
0,4991
0,4991
0,4992
0,4992
0,4992
0,4992
0,4993
0,4993
3,1
0,4993
0,4993
0,4994
0,4994
0,4994
0,4994
0,4994
0,4995
0,4995
0,4995
3,2
233 3,3
0,4995
0,4995
0,4995
0,4996
0,4996
0,4996
0,4996
0,4996
0,4996
0,4997
0,4997
0,4997
0,4997
0,4997
0,4997
0,4997
0,4997
0,4997
0,4997
0,4998
3,4
3,5
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
3,6
Depois de identificado o valor da metade do
nível de confiança no corpo da tabela, de-
terminamos o Z-score usando na primeira
coluna correspondente o valor da parte in-
teira e da primeira casa decimal (1,9) e na
primeira linha o valor da segunda casa de-
cimal (0,06): Tabela da Distribuição Normal
DISTRIBUIÇÃO
NORMAL
–
ÁREA
DE
0
até
K
=>
probabilidade
da
variável
z
estar
entre
0
e
k
z
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0
0,0040
0,0080
0,0120
0,0160
0,0199
0,0239
0,0279
0,0319
0,0359
0
0,0398
0,0438
0,0478
0,0517
0,0557
0,0596
0,0636
0,0675
0,0714
0,0753
0,1
0,2
0,0793
0,0832
0,0871
0,0910
0,0948
0,0987
0,1026
0,1064
0,1103
0,1141
0,1179
0,1217
0,1255
0,1293
0,1331
0,1368
0,1406
0,1443
0,1480
0,1517
0,3
0,1554
0,1591
0,1664
0,1664
0,1700
0,1736
0,1772
0,1808
0,1844
0,1879
0,4
0,1915
0,1950
0,1985
0,2019
0,2054
0,2088
0,2123
0,2157
0,2190
0,2224
0,5
0,2257
0,2291
0,2324
0,2357
0,2389
0,2422
0,2454
0,2486
0,2517
0,2549
0,6
0,2580
0,2611
0,2642
0,2673
0,2704
0,2734
0,2764
0,2794
0,2823
0,2852
0,7
0,2881
0,2910
0,2939
0,2967
0,2995
0,3023
0,3051
0,3078
0,3106
0,3133
0,8
0,3159
0,3186
0,3212
0,3238
0,3264
0,3289
0,3315
0,3340
0,3365
0,3389
0,9
0,3413
0,3438
0,3461
0,3485
0,3508
0,3531
0,3554
0,3577
0,3599
0,3621
1
1,1
0,3643
0,3665
0,3686
0,3708
0,3729
0,3749
0,3770
0,3790
0,3810
0,3830
0,3849
0,3869
0,3888
0,3907
0,3925
0,3944
0,3962
0,3980
0,3997
0,4015
1,2
0,4032
0,4049
0,4066
0,4082
0,4099
0,4115
0,4131
0,4147
0,4162
0,4177
1,3
0,4192
0,4207
0,4222
0,4236
0,4251
0,4265
0,4279
0,4292
0,4306
0,4319
1,4
0,4332
0,4345
0,4357
0,4370
0,4382
0,4394
0,4406
0,4418
0,4429
0,4441
1,5
1,6
0,4452
0,4463
0,4474
0,4484
0,4495
0,4505
0,4515
0,4525
0,4535
0,4545
0,4554
0,4564
0,4573
0,4582
0,4591
0,4599
0,4608
0,4616
0,4625
0,4633
1,7
0,4641
0,4649
0,4656
0,4664
0,4671
0,4678
0,4686
0,4693
0,4699
0,4706
1,8
0,4713
0,4719
0,4726
0,4732
0,4738
0,4744
0,4750
0,4756
0,4761
0,4767
1,9
0,4772
0,4778
0,4783
0,4788
0,4793
0,4798
0,4803
0,4808
0,4812
0,4817
2
2,1
0,4821
0,4826
0,4830
0,4834
0,4838
0,4842
0,4846
0,4850
0,4854
0,4857
0,4861
0,4864
0,4868
0,4871
0,4875
0,4878
0,4881
0,4884
0,4887
0,4890
2,2
0,4893
0,4896
0,4898
0,4901
0,4904
0,4906
0,4909
0,4911
0,4913
0,4916
2,3
0,4918
0,4920
0,4922
Logo,
0,4925
Z0,4927
= 1,960,4931
2,4
score 0,4929
0,4932
0,4934
0,4936
0,4938
0,4940
0,4941
0,4943
0,4945
0,4946
0,4948
0,4949
0,4951
0,4952
2,5
2,6
0,4953
0,4955
0,4956
0,4957
0,4959
0,4960
0,4961
0,4962
0,4963
0,4964
0,4965
0,4966
0,4967
0,4968
0,4969
0,4970
0,4971
0,4972
0,4973
0,4974
2,7
0,4974
0,4975
0,4976
0,4977
0,4977
0,4978
0,4979
0,4979
0,4980
0,4981
2,8
0,4981
0,4982
0,4982
0,4983
0,4984
0,4984
0,4985
0,4985
0,4986
0,4986
2,9
0,4987
0,4987
0,4987
0,4988
0,4988
0,4989
0,4989
0,4989
0,4990
0,4990
3
3,1
3,2
0,4990
0,4993
0,4991
0,4993
IC = X̅ ± Zscore ∙ σx
0,4991
0,4994
0,4991
0,4994
0,4992
0,4994
0,4992
0,4994
0,4992
0,4994
0,4992
0,4995
0,4993
0,4995
0,4993
0,4995
0,4995
0,4995
0,4995
0,4996
0,4996
0,4996
0,4996
0,4996
0,4996
0,4997
3,3
0,4997
0,4997
0,4997
0,4997
0,4997
0,4997
0,4997
0,4997
0,4997
0,4998
3,4
3,5
0,4998
0,4998
IC = 175 ± 1,96 ∙ 1,5
0,4998
0,4998
0,4998
0,4999
0,4998
0,4999
0,4998
0,4999
0,4998
0,4999
0,4998
0,4999
0,4998
0,4999
0,4998
0,4999
0,4998
0,4999
4 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000
Exemplo 2:
Deseja-se estimar a quantia que cada cliente gasta para jantar em um famoso restauran-
te do Rio de Janeiro. Para isso, foram coletados dados de uma amostra de 40 clientes,
cuja média de gastos foi igual a R$ 173,88. Sabe-se que há dados históricos que nos
permitem obter uma boa estimativa do desvio-padrão populacional, que, neste caso, é
igual a R$ 10,00.
234
Construa um intervalo de confiança de 99% para o verdadeiro valor dos gastos mé-
dios dos clientes desse famoso restaurante por jantar, sabendo que esses gastos
estão normalmente distribuídos.
Etapas Respostas
235
Buscamos, então, no corpo da tabela de
distribuição normal padronizada
Tabela da Distribuição Normal esse valor:
DISTRIBUIÇÃO
NORMAL
–
ÁREA
DE
0
até
K
=>
probabilidade
da
variável
z
estar
entre
0
e
k
z
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0
0,0040
0,0080
0,0120
0,0160
0,0199
0,0239
0,0279
0,0319
0,0359
0
0,0398
0,0438
0,0478
0,0517
0,0557
0,0596
0,0636
0,0675
0,0714
0,0753
0,1
0,2
0,0793
0,0832
0,0871
0,0910
0,0948
0,0987
0,1026
0,1064
0,1103
0,1141
0,1179
0,1217
0,1255
0,1293
0,1331
0,1368
0,1406
0,1443
0,1480
0,1517
0,3
0,1554
0,1591
0,1664
0,1664
0,1700
0,1736
0,1772
0,1808
0,1844
0,1879
0,4
0,1915
0,1950
0,1985
0,2019
0,2054
0,2088
0,2123
0,2157
0,2190
0,2224
0,5
0,2257
0,2291
0,2324
0,2357
0,2389
0,2422
0,2454
0,2486
0,2517
0,2549
0,6
0,2580
0,2611
0,2642
0,2673
0,2704
0,2734
0,2764
0,2794
0,2823
0,2852
0,7
0,2881
0,2910
0,2939
0,2967
0,2995
0,3023
0,3051
0,3078
0,3106
0,3133
0,8
0,3159
0,3186
0,3212
0,3238
0,3264
0,3289
0,3315
0,3340
0,3365
0,3389
0,9
0,3413
0,3438
0,3461
0,3485
0,3508
0,3531
0,3554
0,3577
0,3599
0,3621
1
1,1
0,3643
0,3665
0,3686
0,3708
0,3729
0,3749
0,3770
0,3790
0,3810
0,3830
0,3849
0,3869
0,3888
0,3907
0,3925
0,3944
0,3962
0,3980
0,3997
0,4015
1,2
0,4032
0,4049
0,4066
0,4082
0,4099
0,4115
0,4131
0,4147
0,4162
0,4177
1,3
0,4192
0,4207
0,4222
0,4236
0,4251
0,4265
0,4279
0,4292
0,4306
0,4319
1,4
0,4332
0,4345
0,4357
0,4370
0,4382
0,4394
0,4406
0,4418
0,4429
0,4441
1,5
1,6
0,4452
0,4463
0,4474
0,4484
0,4495
0,4505
0,4515
0,4525
0,4535
0,4545
0,4554
0,4564
0,4573
0,4582
0,4591
0,4599
0,4608
0,4616
0,4625
0,4633
1,7
0,4641
0,4649
0,4656
0,4664
0,4671
0,4678
0,4686
0,4693
0,4699
0,4706
1,8
0,4713
0,4719
0,4726
0,4732
0,4738
0,4744
0,4750
0,4756
0,4761
0,4767
1,9
0,4772
0,4778
0,4783
0,4788
0,4793
0,4798
0,4803
0,4808
0,4812
0,4817
2
2,1
0,4821
0,4826
0,4830
0,4834
0,4838
0,4842
0,4846
0,4850
0,4854
0,4857
0,4861
0,4864
0,4868
0,4871
0,4875
0,4878
0,4881
0,4884
0,4887
0,4890
2,2
0,4893
0,4896
0,4898
0,4901
0,4904
0,4906
0,4909
0,4911
0,4913
0,4916
2,3
2,4
Fonte:
0,4918
http://ead.uva.br///recurso/DEF/EST/u3_
0,4920
0,4922
0,4925
0,4927
0,4929
0,4931
0,4932
0,4934
0,4936
0,4938
0,4940
0,4941
0,4943
0,4945
0,4946
0,4948
0,4949
0,4951
0,4952
2,5
2,6
c3_r1/anexo/Tabela-da-Distribuicao-Normal.pdf
0,4953
0,4955
0,4956
0,4957
0,4959
0,4960
0,4961
0,4962
0,4963
0,4964
0,4965
0,4966
0,4967
0,4968
0,4969
0,4970
0,4971
0,4972
0,4973
0,4974
2,7
0,4974
0,4975
0,4976
0,4977
0,4977
0,4978
0,4979
0,4979
0,4980
0,4981
2,8
Não
2,9
3
encontramos o valor exato 0,495. En-
0,4981
0,4987
0,4982
0,4987
0,4982
0,4987
0,4983
0,4988
0,4984
0,4988
0,4984
0,4989
0,4985
0,4989
0,4985
0,4989
0,4986
0,4990
0,4986
0,4990
0,4993
0,4991
0,4993
0,4991
0,4994
0,4991
0,4994
0,4992
0,4994
0,4992
0,4994
0,4992
0,4994
0,4992
0,4995
0,4993
0,4995
0,4993
0,4995
3,2
ximos
3,3
pela falta e pelo excesso, que são
0,4995
0,4995
0,4995
0,4996
0,4996
0,4996
0,4996
0,4996
0,4996
0,4997
0,4949 e 0,4951.
0,4997
0,4997
0,4997
0,4997
0,4997
0,4997
0,4997
0,4997
0,4997
0,4998
3,4
3,5
Tabela da Distribuição Normal
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
3,6
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
3,7
DISTRIBUIÇÃO
NORMAL
–
ÁREA
DE
0
até
K
=>
probabilidade
da
variável
z
estar
entre
0
e
k
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
z
3,8
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0
3,9
0
0,0040
0,0080
0,0120
0,0160
0,0199
0,0239
0,0279
0,0319
0,0359
4
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,0398
0,0438
0,0478
0,0517
0,0557
0,0596
0,0636
0,0675
0,0714
0,0753
0,1
0,2
0,0793
0,0832
0,0871
0,0910
0,0948
0,0987
0,1026
0,1064
0,1103
0,1141
0,1179
0,1217
0,1255
0,1293
0,1331
0,1368
0,1406
0,1443
0,1480
0,1517
0,3
0,1554
0,1591
0,1664
0,1664
0,1700
0,1736
0,1772
0,1808
0,1844
0,1879
0,4
0,1915
0,1950
0,1985
0,2019
0,2054
0,2088
0,2123
0,2157
0,2190
0,2224
0,5
0,2257
0,2291
0,2324
0,2357
0,2389
0,2422
0,2454
0,2486
0,2517
0,2549
0,6
0,2580
0,2611
0,2642
0,2673
0,2704
0,2734
0,2764
0,2794
0,2823
0,2852
0,7
0,2881
0,2910
0,2939
0,2967
0,2995
0,3023
0,3051
0,3078
0,3106
0,3133
0,8
0,3159
0,3186
0,3212
0,3238
0,3264
0,3289
0,3315
0,3340
0,3365
0,3389
0,9
0,3413
0,3438
0,3461
0,3485
0,3508
0,3531
0,3554
0,3577
0,3599
0,3621
1
1,1
0,3643
0,3665
0,3686
0,3708
0,3729
0,3749
0,3770
0,3790
0,3810
0,3830
0,3849
0,3869
0,3888
0,3907
0,3925
0,3944
0,3962
0,3980
0,3997
0,4015
1,2
0,4032
0,4049
0,4066
0,4082
0,4099
0,4115
0,4131
0,4147
0,4162
0,4177
1,3
0,4192
0,4207
0,4222
0,4236
0,4251
0,4265
0,4279
0,4292
0,4306
0,4319
1,4
0,4332
0,4345
0,4357
0,4370
0,4382
0,4394
0,4406
0,4418
0,4429
0,4441
1,5
1,6
0,4452
0,4463
0,4474
0,4484
0,4495
0,4505
0,4515
0,4525
0,4535
0,4545
0,4554
0,4564
0,4573
0,4582
0,4591
0,4599
0,4608
0,4616
0,4625
0,4633
1,7
0,4641
0,4649
0,4656
0,4664
0,4671
0,4678
0,4686
0,4693
0,4699
0,4706
1,8
0,4713
0,4719
0,4726
0,4732
0,4738
0,4744
0,4750
0,4756
0,4761
0,4767
1,9
0,4772
0,4778
0,4783
0,4788
0,4793
0,4798
0,4803
0,4808
0,4812
0,4817
2
2,1
0,4821
0,4826
0,4830
0,4834
0,4838
0,4842
0,4846
0,4850
0,4854
0,4857
0,4861
0,4864
0,4868
0,4871
0,4875
0,4878
0,4881
0,4884
0,4887
0,4890
2,2
0,4893
0,4896
0,4898
0,4901
0,4904
0,4906
0,4909
0,4911
0,4913
0,4916
2,3
0,4918
0,4920
0,4922
0,4925
0,4927
0,4929
0,4931
0,4932
0,4934
0,4936
2,4
0,4938
0,4940
0,4941
0,4943
0,4945
0,4946
0,4948
0,4949
0,4951
0,4952
2,5
2,6
0,4953
0,4955
0,4956
0,4957
0,4959
0,4960
0,4961
0,4962
0,4963
0,4964
0,4965
0,4966
0,4967
0,4968
0,4969
0,4970
0,4971
0,4972
0,4973
0,4974
2,7
0,4974
0,4975
0,4976
0,4977
0,4977
0,4978
0,4979
0,4979
0,4980
0,4981
2,8
0,4981
0,4982
0,4982
0,4983
0,4984
0,4984
0,4985
0,4985
0,4986
0,4986
2,9
0,4987
0,4987
0,4987
0,4988
0,4988
0,4989
0,4989
0,4989
0,4990
0,4990
3
0,4993
0,4991
0,4993
0,4991
0,4994
0,4991
0,4994
0,4992
0,4994
0,4992
0,4994
0,4992
0,4994
0,4992
0,4995
0,4993
0,4995
0,4993
0,4995
0,4997
0,4995
0,4997
0,4995
0,4997
0,4996
0,4997
0,4996
0,4997
0,4996
0,4997
0,4996
0,4997
0,4996
0,4997
0,4996
0,4997
0,4997
0,4998
3,4
determinamos o Z-score buscando na pri-
3,5
0,4998
0,4998
0,4998
0,4998
0,4998
0,4999
0,4998
0,4999
0,4998
0,4999
0,4998
0,4999
0,4998
0,4999
0,4998
0,4999
0,4998
0,4999
0,4998
0,4999
3,6
meira coluna correspondente o valor da
3,7
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
3,8
parte inteira e da primeira casa decimal
3,9
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
4 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000
236
(2,5) e na primeira linha os dois valores
da segunda casa decimal e calculamos a
média desses dois valores. (0,08 e 0,07,
cuja média é 0,075):
IC = X̅ ± Zscore ∙ σx
IC = X̅ ± Zscore ∙ σx
Podemos afirmar, com 95% de confiança
que o intervalo (169,81;177,95) contém o
verdadeiro valor dos gastos médios dos
clientes.
1º) Verificar se a população obedece aos princípios de uma distribuição normal, ou asse-
gurar que o tamanho da amostra seja suficientemente pequeno, ou seja, n ≤ 30.
237
2º) Identificar o valor numérico do desvio-padrão amostral (s); da média amostral ( X̅ ) e
o tamanho da amostra (n);
s
Sx =
n
Em que:
238
9 0,7027 1,3830 1,8331 2,2622 2,8214 3,2498
239
Student é o pseudônimo do químico e matemático inglês William Sealy Gos-
set (1876-1937), funcionário da cervejaria irlandesa Guinness Brewing Com-
pany, em Dublin, no início do século XX, criador da Distribuição t.
Fonte: http://ead.uva.br////recurso/DEF/EST/u4_c1_r1/index.htm
Observe que, para utilizarmos essa tabela, precisamos da metade do nível de signifi-
cância e dos graus de liberdade.
Para determinarmos metade do nível de significância basta fazer 100% - Nível de Con-
fiança e dividir por 2.
IC = X̅ + t score ∙ Sx
Importante
Exemplo
Concurso: Colégio Pedro II - 2017
(Fonte: https://www.tecconcursos.com.br/questoes/720037).
240
Para isso, ela coleta uma amostra com 25 mensagens e observa uma média de 52,4
mensagens por segundo e um desvio-padrão de 2,1 mensagens por segundo. O intervalo
de confiança de 95% para a taxa média e a conclusão da agência controladora foram:
Etapas Respostas
σ = desconhecido
S = 2,1
241
Então, a metade do nível de significância
é igual a
5%
= 2,5%
2
242
IC = X̅ ± tscore ∙ Sx
[51,53;53,27] -
5º) Substituir os valores já conheci-
dos na fórmula do intervalo de con- Podemos afirmar, com 95% de confiança,
fiança: que o intervalo (51,53;53,27) contém o
verdadeiro valor da taxa média de propa-
gação das mensagens por segundo.
IC = X̅ ± tscore ∙ ∙ Sx
Verificamos que esse intervalo não con-
tém a taxa média de 54 mensagens envia-
das por segundo que foi anunciada pela
operadora. Logo, não existem evidências
de que essa afirmação seja verdadeira.
Importante
Logo, um nível de confiança de 90% significa que 90% dos intervalos de confian-
ça, construídos a partir das amostras aleatórias, contêm o valor verdadeiro do
parâmetro, ou seja, se retirarmos inúmeras amostras da população, em 90% des-
sas amostras encontraremos o verdadeiro valor do parâmetro nesse intervalo.
243
Não é somente para as médias que podemos estabelecer estimativas intervalares.
p ∙ (1 – p)
px =
n
IC = p ± Zscore ∙ px
Em que:
p = proporção
n = tamanho da amostra
px = desvio-padrão da proporção
244
Ampliando o foco
Para colocar em prática o conteúdo visto nesta unidade, visite a Biblioteca Vir-
tual, escolha um livro de Estatística, selecione e faça alguns exercícios do livro
para reforçar o conhecimento sobre a construção de intervalos de confiança.
Confira as respostas que estão no final do livro e, se tiver alguma dúvida, fale
com o seu tutor pelo Fórum de Dúvidas – Fale com o Tutor.
Tamanho da amostra
É importante em qualquer pesquisa determinar o tamanho da amostra para que ela seja
representativa da população.
Como já vimos a tabela normal, agora podemos apresentar os conceitos para o cálculo
do tamanho da amostra.
Zscore ∙ σ
n=
ε
Em que:
245
3. Comparação com estudos semelhantes.
4. A partir de dados históricos.
ε = erro amostral. É a máxima diferença que o pesquisador admite que ocorra entre a
média populacional (μ) e a média amostral (X). É expresso em decimais.
Zscore2 ∙ σ2 ∙ ∙ N
n=
ε2 ∙ (N – 1) + Zscore2 ∙ σ2
Em que:
- Cálculo do tamanho da amostra para estimar a proporção (p) de uma população infinita
Se a variável escolhida for qualitativa, ordinal ou nominal, e a população considerada infi-
nita, o tamanho da amostra será calculado por meio da fórmula:
Z 2 ∙p̂ ∙ q̂
n=
ε2
Em que:
246
p̂ = estimativa da verdadeira proporção, expresso em decimais. Caso não se tenham es-
timativas prévias para p, admitimos, então, p̂ = 0,5.
q̂ = 1 - p̂
- Cálculo do tamanho da amostra para estimar a proporção (p) de uma população finita
Se a variável escolhida for qualitativa, ordinal ou nominal e a população considerada fini-
ta, o tamanho da amostra será calculado por meio da fórmula:
Z 2 ∙ p̂ ∙ q̂ ∙ N
n=
ε2 (N – 1) + Z 2 ∙ p̂ ∙ q̂
Em que:
Exemplo 1
Determine o tamanho da amostra que devemos obter para estimar a média da altura
de todos os estudantes da Universidade Veiga de Almeida, com 95% de confiança e a
tolerância de 2cm para mais ou para menos. Sabe-se, por estudos anteriores, que o des-
vio-padrão da altura dos estudantes é igual a 20cm.
Resolução:
Sabemos que:
n=?
Zscore – buscando no corpo da tabela a metade do nível de confiança, ou seja, 0,95/2 =
0,475.
247
Obtemos:
Zscore= 1,96
σ =20 cm
ε = 2cm
2 2
Zscore ∙ σ 1,96 ∙ 20
n= = = 385 alunos
ε 2
Exemplo 2
Uma empresa administradora de cartões de crédito deseja estimar a proporção de clien-
tes que não fizeram o pagamento integral da fatura no final de um mês. Suponha que a
margem de erro desejada seja de três pontos percentuais, com 98% de confiança.
Determine o tamanho da amostra: deve ser selecionado para estimar essa proporção?
Resolução:
Sabemos que:
n=?
Zscore = buscando no corpo da tabela a metade do nível de confiança, ou seja, 0,98/2 =
0,49,
248
Correlação
É um termo estatístico que indica a relação entre duas ou mais variáveis. Um dos propó-
sitos dos pesquisadores é verificar a associação entre as variáveis estudadas. A possível
existência de um relacionamento entre variáveis é fundamental para análises e conclu-
sões do estudo que está sendo realizado. Intuitivamente, muitas vezes consideramos
que há uma relação de associação entre o comportamento de variáveis, como:
Neste tópico vamos apresentar um indicador que nos revela o quão forte ou fraca é essa
associação entre as variáveis, chamado de coeficiente de correlação do produto de
momentos de Pearson ou simplesmente coeficiente de correlação de Pearson. Além
de representar graficamente o relacionamento entre duas variáveis, por meio do diagra-
ma de dispersão, para visualmente inferirmos sobre a correlação existente.
Representado pela letra “r” tendo como uma das suas fórmulas:
Em que:
n = tamanho da amostra.
∑(xi ∙ y i) = somatório do produto das variáveis.
∑xi = somatório dos valores da variável independente x.
∑y i = somatório dos valores da variável dependente y.
(∑x i)2 = quadrado do somatório dos valores da variável independente x.
(∑yi)2 = quadrado do somatório dos valores da variável dependente y.
249
∑x i2 = somatório dos quadrados dos valores da variável independente x.
∑yi2 = somatório dos quadrados dos valores da variável independente y.
• Se r > 0, correlação positiva, indicando uma reta crescente, isto é, à medida que os
valores de uma variável aumentam, os valores da outra também aumentam.
• Se r < 0, correlação negativa, indicando uma reta decrescente, isto é, à medida que
os valores de uma variável aumentam, os valores da outra variável diminuem.
Importante
250
Vejamos:
Exemplo 1
horas de estudo X notas
Queremos verificar o quanto estão associadas as variáveis notas das avaliações em Es-
tatística e o tempo de estudo em horas dos alunos. Para isso, coletamos as informações
com uma amostra composta de 22 alunos, que estão apresentadas na tabela a seguir:
1 7,5 8,5
2 2 1
3 9 5
4 1,5 3
5 6 7
6 8,5 9
7 3 2
8 4,5 5
9 3,5 4
10 10 9,5
11 8 9
12 4 5
13 5,5 7
14 6,5 7
15 5,5 5,5
251
16 1 2
17 3 2
18 5 8
19 2 1
20 4 3
21 5 6
22 7 8
Resolução
Vamos definir:
X = número de horas de estudo.
Y= rendimento na avaliação.
Horas de
Aluno Notas (Y) X.Y X² Y²
Estudo (X)
2 2 2 4 4 4
3 9 9 81 81 81
4 1,5 2 3 2,25 4
5 6 7 42 36 49
6 8,5 8 68 72,25 64
7 3 3 9 9 9
252
8 4,5 5 22,5 20,25 25
9 3,5 4 14 12,25 16
11 8 9 72 64 81
12 4 5 20 16 25
15 5,5 6 33 30,25 36
16 1 1 1 1 1
17 3 2 6 9 4
18 5 7 35 25 49
19 2 1 2 4 1
20 4 3 12 16 9
22 7 8 56 49 64
16274,50 – 13160
r=
2966 ∙ 3546,25
253
3114,5
r=
10518177,5
3114,5
r=
3243,173985
r ≅ 0,96
Exemplo 2
massa muscular X idade
Acredita-se que, com o passar dos anos, as mulheres vão perdendo massa muscular sig-
nificativamente. Para avaliar essa hipótese foi feita uma pesquisa em uma amostra de 30
pacientes do sexo feminino, quando foi observada a massa muscular e a idade. O cálculo
da massa muscular pode ser feito pela avaliação das dobras cutâneas e também pela
fórmula da área muscular do braço. O resultado está apresentado na tabela seguinte.
1 45 97
2 56 90
3 65 74
4 58 80
5 49 105
6 62 68
7 51 83
8 53 79
9 71 68
254
10 69 73
11 58 95
12 73 63
13 53 100
14 45 116
15 76 65
16 69 68
17 74 65
18 67 65
19 56 82
20 63 92
21 44 102
22 72 65
23 78 77
24 68 78
25 67 88
26 39 105
27 51 102
28 64 71
29 60 87
30 40 119
255
Resolução
Vamos definir:
X = idade da paciente.
Y= massa muscular.
Massa
Paciente Idade x. y x² y²
muscular
256
16 69 68 4692 4761 4624
–134212
r=
106664 ∙ 228716
257
–134212
r=
24395763424
r ≅ –0,86
Como o valor de “r” foi maior do que 0,6 podemos concluir que há forte correlação li-
near entre as variáveis massa muscular e idade. Ainda observando o sinal negativo de
“r”, podemos dizer que à medida que a idade da paciente aumenta, sua massa muscu-
lar diminui.
Exemplo 3
Pesquisas sugerem que o tamanho do cérebro de uma pessoa pode estar relacionado
com seu grau de inteligência. Para investigar essa hipótese foi feita uma pesquisa com
uma amostra aleatória de 40 alunos de um curso autodidata de matemática. A tabela
a seguir mostra o tamanho do cérebro em cm³, obtido por ressonância magnética, que
será representada pela variável independente (x) e seu respectivo escore de Quociente de
Inteligência (QI), que será representado pela variável dependente (y).
Volume cerebral
Observação Escores de QI
(cm³)
1 1270 131
2 1341 138
3 1265 137
4 1233 131
5 1310 135
6 1242 97
7 1251 136
258
8 1337 90
9 1302 87
10 1347 131
11 1238 130
12 1339 139
13 1346 133
14 1344 138
15 1228 94
16 1340 81
17 1278 130
18 1303 98
19 1336 99
20 1326 78
21 1200 81
22 1329 95
23 1282 133
24 1348 137
25 1347 89
26 1267 139
27 1237 83
28 1318 101
259
29 1238 75
30 1329 128
31 1240 131
32 1308 142
33 1320 101
34 1306 88
35 1341 81
36 1280 131
37 1348 138
38 1241 86
39 1266 79
40 1299 87
Resolução
Vamos definir:
X = volume cerebral.
Y = Coeficiente de inteligência.
volume
Observação QI (Y) X.Y X² Y²
cerebral (X)
260
3 1265 137 173305 1600225 18769
261
24 1348 137 184676 1817104 18769
262
214920
r=
2978640 ∙ 904716
214920
r=
2694823266240
214920
r=
1641591,687
r = 0,13
Observamos que existe uma fraca correlação entre o volume cerebral e a inteligência,
pois o valor de r < 0,3.
Ampliando o foco
Philipp Koellinger destaca que, além da questão do tamanho, que conta apenas
2% para a inteligência, existirão vários fatores que explicam os outros 98% na
variação de desempenho.
263
exemplo, parece existir uma diferença significativa no tamanho do cérebro en-
tre homens e mulheres, mas isso não se traduz em diferenças no desempenho.
Fonte: https://www.dn.pt/vida-e-futuro/tamanho-do-cerebro-conta-pouco-para-a-in-
teligencia-10267115.html
Podemos verificar visualmente o relacionamento entre duas variáveis a partir dos gráfi-
cos de dispersão, também conhecidos como Scatter Plot.
Para traçar um gráfico de dispersão, vamos marcar, no eixo das abscissas, as horas de
estudo e, no eixo das ordenadas, a nota na avaliação. Marcamos um ponto cartesiano
para cada aluno, relacionando suas horas de estudo com seu rendimento na avaliação.
8 20
7
6 15
4 10
3
5
2
1
0
0 0 5 10 15 20 25
0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 6 6,5 7 7,5 8 8,5 9 9,5 10 10,5
264
Podemos verificar que os dados apresen-
Podemos verificar que os dados apresen-
tam uma tendência de alinhamento em
tam uma tendência de alinhamento em
torno de uma reta crescente, indicando
torno de uma reta decrescente, indicando
que, à medida que o valor de uma variável
que, à medida que o valor de uma variável
aumenta, o valor da outra variável tam-
aumenta, o valor da outra variável diminui.
bém aumenta.
16 10
12,8 8
9,6 6
6,4 4
3,2 2
0
1,45 1,55 1,65 1,75 1,85 1,95
0 5 10 15 20 25 30 35 40 45
265
Exemplo 1: horas de estudo x notas
Horas de
Aluno Notas
Estudo (X)
1 7,5 8,5
2 2 2
3 9 9
4 1,5 2
5 6 7
6 8,5 8
7 3 3
8 4,5 5
9 3,5 4
10 10 9,5
11 8 9
12 4 5
13 5,5 5
14 6,5 7
15 5,5 6
16 1 1
17 3 2
18 5 7
19 2 1
20 4 3
21 5 5,5
22 7 8
266
Dispersão "Horas de Estudo" x "Nota"
10
0
0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 6 6,5 7 7,5 8 8,5 9 9,5 10 10,5
1 45 97
2 56 90
3 65 74
4 58 80
5 49 105
6 62 68
7 51 83
8 53 79
9 71 68
10 69 73
11 58 95
267
12 73 63
13 53 100
14 45 116
15 76 65
16 69 68
17 74 65
18 67 65
19 56 82
20 63 92
21 44 102
22 72 65
23 78 77
24 68 78
25 67 88
26 39 105
27 51 102
28 64 71
29 60 87
30 40 119
80
70
60
50
40
30
20
10
0
40 60 80 100 120 140
268
Analisando o comportamento do gráfico podemos verificar que os pontos estão alinha-
dos em uma reta decrescente, o que indica que, `s medida que uma variável aumenta, a
outra irá diminuir.
Volume cerebral
Observação Escores de QI
(cm³) (X)
1 1270 131
2 1341 138
3 1265 137
4 1233 131
5 1310 135
6 1242 97
7 1251 136
8 1337 90
9 1302 87
10 1347 131
11 1238 130
12 1339 139
13 1346 133
14 1344 138
15 1228 94
16 1340 81
17 1278 130
18 1303 98
19 1336 99
20 1326 78
21 1200 81
22 1329 95
23 1282 133
269
24 1348 137
25 1347 89
26 1267 139
27 1237 83
28 1318 101
29 1238 75
30 1329 128
31 1240 131
32 1308 142
33 1320 101
34 1306 88
35 1341 81
36 1280 131
37 1348 138
38 1241 86
39 1266 79
40 1299 87
Analisando o comportamento do gráfico podemos verificar que os pontos não estão ali-
nhados, o que indica que as variáveis não estão correlacionadas linearmente.
270
Ampliando o foco
∑fi
[X̅ – S ; X̅ + S] → ≅ 0 ,68
n
∑fi
[X̅ – 2 ∙ S ; X̅ + 2 ∙ S] → ≅ 0,95 para amostras
n
∑fi
[X̅ – 3 ∙ S ; X̅ + 3 ∙ S] → ≅ 0,997
n
ou
∑fi
[μ – σ ; μ + σ] → ≅ 0,68
n
∑fi
[μ – 2 ∙ σ ; μ + 2 ∙ σ] → ≅ 0,95 para população
n
∑fi
[μ – 3 ∙ σ ; μ + 3 ∙ σ] → ≅ 0,997
n
271
Se os resultados estiverem próximos desses valores, então a normalidade parece razoável.
Exemplo:
Feita uma pesquisa sobre os gastos mensais com transporte com 20 alunos da Universi-
dade Veiga de Almeida, as respostas já ordenadas estão apresentadas a seguir. Verifique
se os dados obtidos obedecem a uma distribuição normal.
23 29 30 31 35 39 41 42 42 46 47 47 49 50 50 51 56 56 64 67
5 5 0 0 6 9 6 1 7 5 6 7 8 3 9 9 0 8 5 0
Resolução:
1) Análise do histograma:
Vamos agrupar os dados em uma tabela de distribuição de frequências:
Gastos R$ Frequência
Total 20
272
Histograma
8
7
6
5
4
3
2
1
0
200 300 400 500 600 700
Histograma
8
7
6
5
4
3
2
1
0
200 300 400 500 600 700
Pelo formato do histograma parece razoável dizer que os dados seguem uma distribui-
ção normal.
∑fi
[X̅ – S ; X̅ + S] → ≅ 0 ,68
n
273
∑fi
[X̅ – 2 ∙ S ; X̅ + 2 ∙ S] → ≅ 0,95
n
∑fi
[X̅ – 3 ∙ S ; X̅ + 3 ∙ S] → ≅ 0,997
n
14
[452 – 116 ; 452 + 116] = [336;568] → = 0,7 ≅ 0,68
20
20
[452-2 ∙116 ; 452 + 2 ∙ 116] = [220;684] → = 1 ≅ 0,95
20
20
[452 – 3 ∙ 116 ; 452 + 3 ∙ 116] = [104;800] → = 1≅ 0,997
20
Como os quocientes estão próximos dos valores desejáveis, podemos dizer que parece
razoável admitir a normalidade dos dados.
235 -1,89
295 -1,37
300 -1,32
310 -1,23
356 -0,83
399 -0,46
416 -0,31
421 -0,27
427 -0,22
465 0,11
274
476 0,21
477 0,22
498 0,40
503 0,44
509 0,50
519 0,58
560 0,94
568 1,01
645 1,68
670 1,90
Podemos concluir que todos os três métodos nos mostram que não há evidências para
rejeitar a normalidade. Isso não significa que podemos dizer com certeza que os dados
sejam provenientes de uma distribuição normal.
275
Ampliando o foco
Para colocar em prática o conteúdo visto nesta unidade, visite a Biblioteca Vir-
tual, escolha um livro de Estatística, selecione e faça alguns exercícios do livro
para reforçar o conhecimento sobre o cálculo do coeficiente de correlação li-
near de Pearson.
Confira as respostas que estão no final do livro e se tiver alguma dúvida fale
com o seu tutor pelo Fórum de Dúvidas – Fale com o Tutor.
276
Regressão linear
A análise de regressão é uma ferramenta estatística usada para prever os valores fu-
turos com base no comportamento de valores passados. Para isso, vamos construir
um modelo matemático capaz de descrever o relacionamento entre duas ou mais
variáveis quantitativas, de maneira que possamos estimar o valor de uma variável a
partir das outras.
O caso mais simples de regressão é quando temos duas variáveis e a relação entre elas
pode ser representada por uma linha reta. Essa reta é chamada de modelo de Regres-
são Linear Simples, cujo modelo matemático será representado por:
y = ax + b + εi
Em que:
277
b = também chamado de intercepto com o eixo-y, é o coeficiente linear da reta.
εi = erro aleatório de “y” para a observação i. É uma variável aleatória com valor esperado
igual a zero.
Importante
O método dos mínimos quadrados utiliza dados amostrais para determinar os valores de
“a” e “b”, que minimizam a soma dos quadrados dos desvios entre os valores observados
e os valores estimados da variável dependente.
Em que:
n = tamanho da amostra.
∑(x i ∙ yi) = somatório do produto das variáveis.
278
∑x i= somatório dos valores da variável independente x.
∑yi = somatório dos valores da variável dependente y.
(∑x i)2 = quadrado do somatório dos valores da variável independente x.
∑x i2 = somatório dos quadrados dos valores da variável independente x.
y̅ = média dos valores da variável dependente.
x̅ = média dos valores da variável independente.
∑(x i – x̅ ) ∙ (∑yi – y̅ )
a=
∑(x i – x̅ )2
Para determinar rapidamente o modelo de regressão linear com auxílio da planilha ele-
trônica Excel, basta clicar nos pontos do gráfico de dispersão; com o botão direito do
mouse clicar em “adicionar linha de tendência” e no menu “formatar linha de tendência”
selecionar “exibir equação no gráfico”.
Exemplo 1
Queremos verificar o quanto estão associadas as variáveis notas das avaliações em Es-
tatística e o tempo de estudo em horas dos alunos. Para isso, coletamos as informações
com uma amostra composta de 22 alunos, que estão apresentadas na tabela a seguir:
279
Aluno Horas de Estudo Notas
1 7,5 8,5
2 2 2
3 9 9
4 1,5 2
5 6 7
6 8,5 8
7 3 3
8 4,5 5
9 3,5 4
10 10 9,5
11 8 9
12 4 5
13 5,5 5
14 6,5 7
15 5,5 6
16 1 1
17 3 2
18 5 7
19 2 1
20 4 3
21 5 5,5
22 7 8
Determine o modelo de regressão linear para as variáveis notas das avaliações em Esta-
tística e o tempo de estudo em horas dos alunos.
280
Resolução
Precisamos, então, calcular o coeficiente angular e o coeficiente linear da reta. Pelo mé-
todo dos mínimos quadrados temos:
b = y̅ – a ∙ x̅
Horas de
Aluno Notas (Y) X.Y X² Y²
Estudo (X)
2 2 2 4 4 4
3 9 9 81 81 81
4 1,5 2 3 2,25 4
5 6 7 42 36 49
6 8,5 8 68 72,25 64
7 3 3 9 9 9
9 3,5 4 14 12,25 16
281
11 8 9 72 64 81
12 4 5 20 16 25
15 5,5 6 33 30,25 36
16 1 1 1 1 1
17 3 2 6 9 4
18 5 7 35 25 49
19 2 1 2 4 1
20 4 3 12 16 9
22 7 8 56 49 64
b = y̅ – a ∙ x̅
117,5 112
b= – 148,5 ∙
22 22
282
b = 5,34090909 – 1,0501 ∙ 5,09090909
b = 5,34090909 – 5,345797734 = 0,049
Exemplo 2
Acredita-se que, com o passar dos anos, as mulheres vão perdendo massa muscular
significativamente. Para avaliar essa hipótese foi feita uma pesquisa em uma amostra de
30 pacientes do sexo feminino, quando foram observadas a massa muscular e a idade. O
cálculo da massa muscular pode ser feito pela avaliação das dobras cutâneas e também
pela fórmula da área muscular do braço. O resultado está apresentado na tabela a seguir.
1 45 97
2 56 90
3 65 74
4 58 80
5 49 105
6 62 68
7 51 83
8 53 79
9 71 68
10 69 73
11 58 95
12 73 63
13 53 100
14 45 116
283
15 76 65
16 69 68
17 74 65
18 67 65
19 56 82
20 63 92
21 44 102
22 72 65
23 78 77
24 68 78
25 67 88
26 39 105
27 51 102
28 64 71
29 60 87
30 40 119
Resolução
Precisamos, então, calcular o coeficiente angular e o coeficiente linear da reta. Pelo mé-
todo dos mínimos quadrados temos:
b = y̅ – a ∙ x̅
284
Calculando o coeficiente angular “a”:
Massa
Paciente Idade x. y x² y²
muscular
285
20 63 92 5796 3969 8464
–134212
a= = 1,2583
106664
b = y̅ – a ∙ x̅
286
2522 1796
b= –(–1,2583) ∙
30 30
b = 84,0666666667+75,33022667
b = 159,40
Ampliando o foco
Para colocar em prática o conteúdo visto nesta unidade, visite a Biblioteca Virtual,
escolha um livro de Estatística, selecione e faça alguns exercícios do livro para
reforçar o conhecimento sobre a determinação do modelo de Regressão Linear.
Confira as respostas que estão no final do livro e se tiver alguma dúvida fale
com o seu tutor pelo Fórum de Dúvidas – Fale com o Tutor.
MIDIATECA
287
NA PRÁTICA
Nível de Ruído
75 110 73 52 58 77 56 57 28 4
(dB)
288
Título do Gráfico y = -0,542x + 90,546
R2 = 0,7777
120
100
80
60
40
20
0
0 20 40 60 80 100 120 140 160
y = -0,542x + 90,546
289
Resumo da Unidade 4
Acreditamos, fortemente, que ao chegar até aqui você esteja familiarizado com os con-
ceitos fundamentais, tanto da Estatística Descritiva quanto da Estatística Indutiva. Ainda
temos uma vasta gama de conceitos, mas com as ferramentas adquiridas nesse curso
você conseguirá facilmente assimilar os novos conhecimentos.
Saudações!
290
Referências
NEXO Jornal. Como funciona uma pesquisa eleitoral. YouTube. Disponível em: https://
youtu.be/igi7E1OY7gs. Acesso em: 19 set. 2020.
TEC Concursos. Intervalo de confiança para a média. #720037 Pró-Reitoria GP CP2 - Esta-
tístico (CP II)/2017. Disponível em: https://www.tecconcursos.com.br/questoes/720037.
Acesso em: 5 out. 2020.
291