Bizu Estratégico de Estatística

Bizu Estratégico de
Estatística
Bizu Estratégico p/ Receita Federal
(Auditor Fiscal)
Autor:
Bizu Estratégico de Estatística
3 de Novembro de 2020
20368023036 - Henrique Souza Lima

BIZU ESTRATÉGICO – ESTATÍSTICA – RECEITA FEDERAL

Olá, pessoal. Tudo bem?
Neste material, trazemos uma seleção de bizus da disciplina de Estatística para o concurso para Auditor
Fiscal da Receita Federal.
Nosso objetivo é trazer um material conciso, com os principais pontos dos assuntos exigidos no edital, para
uma revisão eficaz próximo à prova.
Os bizus destinam-se a alunos que já estejam na fase final de revisão (que já estudaram bastante o conteúdo
teórico da disciplina e, nos últimos dias, precisam revisar por algum material bem curto e objetivo).
1835287
Estatística (Receita Federal)

Assunto Bizus Caderno de Questões
Medidas de Posição 1a7 https://questoes.estrategiaconcursos.com.br/cadernos/d5854c23-42de-47dd-bd30-d710449aca28
Medidas de Dispersão 8 a 11 https://questoes.estrategiaconcursos.com.br/cadernos/455e4212-ce95-495d-b356-23c93743b4fe
Probabilidade 12 a 14 https://questoes.estrategiaconcursos.com.br/cadernos/542ca5ae-4f10-4656-865a-d3cb8e4df0a6
Distribuições Discretas 15 a 23 https://questoes.estrategiaconcursos.com.br/cadernos/b12245df-07d9-4b81-ab1d-6b801d7cc4b5
Distribuições Contínuas 24 a 26 https://questoes.estrategiaconcursos.com.br/cadernos/5d873ce5-b8df-463f-b575-dd012fbe8850
Amostragem e Estimadores 27 a 32 https://questoes.estrategiaconcursos.com.br/cadernos/b0e74bfa-9728-4d3f-8bdf-269e002369c3
Intervalos de Confiança e Testes de

33 a 35 https://questoes.estrategiaconcursos.com.br/cadernos/800ce728-de27-4902-b12e-def650a56dbd
Hipóteses
Regressão Linear 36 a 38 https://questoes.estrategiaconcursos.com.br/cadernos/be472af7-8b41-42df-9cca-614928b794ff
Coach Roberto Cambraia

Coach Leonardo Mathias
Observação: Os cadernos de questões foram montados utilizando questões específicas de Auditor Fiscal e
Analista de concursos da Banca CESPE, FCC e FGV nos últimos anos.
Bizu Estratégico p/ Receita Federal (Auditor Fiscal)

www.estrategiaconcursos.com.br

1835287
ANÁLISE ESTATÍSTICA
Galera, para sabermos quais são os assuntos mais exigidos pelas Bancas CESPE (CEBRASPE), FGV e FCC (que
são as mais cotadas para a realização desse concurso) na disciplina de Estatística nos últimos anos e também
considerando os últimos editais da área fiscal. Vejamos a seguinte análise estatística realizada em questões
já aplicadas:
Estatística (Receita Federal)
Assunto %
Distribuições de Probabilidade 23,03%
Probabilidade 14,61%
Regressão Simples e Múltipla 13,20%
Medidas de Posição 11,52%
Estimação 9,27%
Testes de Hipóteses 8,99%
Intervalos de Confiança 8,71%
Medidas de Dispersão 6,46%
Amostragem 2,81%
Conceitos Iniciais de Estatística 0,84%
Números índices 0,28%
Formas de Apresentação de Dados 0,28%
Com essa análise podemos verificar quais são os temas mais cobrados pelas Bancas CESPE (CEBRASPE), FCC
e FGV e, com isso, focar nos principais pontos para revisar e detonar na prova!!
Vamos para a nossa missão, futuros (as) Auditores (as) Fiscais da Receita Federal!
Qualquer dúvida estamos à disposição.
Por fim, farei uma breve apresentação sobre a minha jornada no “mundo dos concursos”.
2


1835287
APRESENTAÇÃO
Antes de mais nada, permitam-me uma breve apresentação para quebrarmos o gelo:
Meu nome é Roberto Cambraia, tenho 26 anos e sou natural de Guaraciaba do Norte, interior do Ceará.
Sou graduado em Matemática e atualmente sou professor nessa área. Além disso, sou pós-graduado em
Administração Pública.
Meu contato com o “mundo” de concursos públicos começou em 2013, quando fui
aprovado em alguns certames para o cargo de professor de matemática. Após quase 5 anos
na carreira, decidi buscar novos horizontes e voltei a estudar para concursos públicos.
Dessa vez concursos da área fiscal, tendo a felicidade de ser aprovado em alguns deles, dois
em 1° lugar inclusive.
Superei os percalços, dediquei-me e colhi os louros da vitória. Que tal seguirmos juntos
nessa empreitada para que você, também, possa experimentar algo que é para poucos, o
sabor da vitória!?
Utilizarei da minha experiência, adquirida ao longo dessa jornada, para auxiliá-lo na

disciplina de Estatística, umas das mais importantes seja qual for o concurso que você irá
prestar.
Serei o responsável pelo Bizu Estratégico de Estatística e, com ele, pretendo abordar os
tópicos mais cobrados nesta disciplina, de maneira concisa e objetiva, por meio de uma
linguagem bem clara!
Vamos juntos?
"Destino não é uma questão de sorte, mas uma questão de escolha; não é uma coisa que se espera, mas
que se busca." (William Jennings Bryan)
Roberto Cambraia Leonardo Mathias

@profrobertocambraia @profleomathias


1835287
Medidas de Posição
1. Média Aritmética
➢ A média aritmética preserva a soma da lista de números

➢ Para calcular a média aritmética, basta somar todos os elementos e dividir pela quantidade de
elementos.
𝒙𝟏 + 𝒙𝟐 + 𝒙𝟑 + ⋯ + 𝒙𝒏
𝑀é𝑑𝑖𝑎 =
𝒏
➢ Se um problema simplesmente pedir para calcular a média sem especificar qual o tipo de média, você
deverá calcular a média aritmética.
➢ Se é dada a média de um conjunto, basta multiplicar a média pela quantidade de termos para calcular
==1c0117==
a soma total.
✓ Por exemplo, se a média salarial de 8 pessoas é de 1.500 reais, então, juntos, eles recebem 8
x 1.500 = 12.000 reais.
➢ Média para dados agrupados por valor:

✓ Para calcular a média, vamos multiplicar cada valor pela sua respectiva frequência, somar tudo e
dividir pela soma das frequências, que é o total de itens.
➢ Média para dados agrupados por classe:

✓ Multiplicar cada ponto médio pela sua respectiva frequência, somar os resultados e dividir pela
soma de todas as frequências.
2. Média Ponderada
➢ Se temos um lista de números (𝑥1 , 𝑥2 , 𝑥3 , . . . , 𝑥𝑛 ) com pesos respectivos (𝑝1 , 𝑝2 , 𝑝3 , . . . , 𝑝𝑛 ), então a

média ponderada é dada por:
𝒙𝟏 𝒑𝟏 + 𝒙𝟐 𝒑𝟐 + 𝒙𝟑 𝒑𝟑 + ⋯ + 𝒙𝒏 𝒑𝒏
𝑀é𝑑𝑖𝑎 =
𝒑𝟏 + 𝒑𝟐 + 𝒑𝟑 + ⋯ + 𝒑𝒏
3. Média Geométrica
➢ Se temos uma lista de números (𝑥1 , 𝑥2 , 𝑥3 , . . . , 𝑥𝑛 ) então a média geométrica será dada por:
𝑮 = 𝒏√𝒙𝟏 . 𝒙𝟐 . 𝒙𝟑 . … . 𝒙𝒏
➢ Se temos uma lista de números (𝑥1 , 𝑥2 , 𝑥3 , . . . , 𝑥𝑛 ) então a média Harmônica será dada por:


1835287
4. Média Harmônica
𝒏
𝑯=
𝟏 𝟏 𝟏 𝟏
+ + + ⋯+
𝒙𝟏 𝒙𝟐 𝒙𝟑 𝒙𝒏
5. Desigualdade de Médias
➢ Se pelo menos um número de uma lista é diferente dos demais, a média aritmética será SEMPRE
maior que a média geométrica e esta será maior do que a média harmônica, ou seja:
𝑴𝑨 > 𝑴𝑮 > 𝑴𝑯
➢ Se todos os números forem iguais, então as médias serão iguais.
6. Mediana
➢ Medida de posição definida como número que se encontra no centro de uma série de números,
estando estes dispostos segundo uma ordem.
➢ Estando ordenados os dados numéricos e sendo n o número de elementos, o valor mediano será:
𝒏+𝟏
• O termo de ordem , se n por ímpar.
𝟐
𝒏 𝒏
• A média aritmética dos termos de ordem e + 𝟏, se n for par.
𝟐 𝟐
➢ O valor da mediana pode coincidir ou não com um elemento da série. Quando o número de
elementos da série é ímpar, há coincidência. O mesmo não acontece, porém quando esse número é
par.
➢ A mediana depende da posição e não é influenciada por valores extremos dos elementos na série
ordenada. Essa é uma das diferenças marcantes entre a mediana e a média (que se deixa influenciar,
e muito, pelos valores extremos, também chamados de outliers).
➢ Mediana para Dados Agrupados em Classes:
𝒏
+ 𝒇𝒂𝒄𝒂𝒏𝒕
𝑴𝒅 = 𝒍𝒊 + [𝟐 ].𝒉
𝒇𝒊
Em que:
• 𝒍𝒊 é o limite inferior da classe mediana.
• 𝒇𝒂𝒄𝒂𝒏𝒕 é a frequência acumulada da classe anterior à classe mediana.
• 𝒇𝒊 é a frequência simples da classe mediana.
• 𝒉 é a amplitude da classe mediana.


1835287
7. Moda
➢ A moda é definida como sendo aquele valor ou valores que ocorrem com maior frequência em um
rol.
➢ Baseado neste contexto, um conjunto de valores pode apresentar mais de uma moda. Nesse caso,
dizemos ser plurimodal (ou polimodal), caso contrário, será unimodal (apenas uma moda), ou
ainda, amodal (quando todos os valores das variáveis em estudo apresentarem uma mesma
frequência).
➢ Moda para Dados Não-Agrupados:

✓ Para a identificação da moda em um conjunto ordenado de valores não agrupados em
classe, basta verificar, no conjunto, aquele valor que aparece com maior frequência.
➢ Moda para Dados Agrupados Sem Intervalos de Classe:

✓ Quando os dados estiverem dispostos em uma tabela com frequências, não agrupados em
classes, a localização da moda é imediata, bastando para isso, verificar na tabela, qual o
valor associado à maior frequência.
Medidas de dispersão
8. Conceitos Iniciais
➢ Também chamadas de Medidas de Variabilidade, procuram descrever o quão homogêneo
ou não são os dados de um conjunto. São medidas que analisam o afastamento dos
valores em uma sequência. Algumas são bem simples:
✓ Amplitude (Total): é a diferença entre o maior e menor número da sequência.

Não considera nenhum outro valor. Para dados agrupados em classe, é a diferença
entre o limite inferior da primeira classe, e o limite superior da última.
✓ Amplitude Interquartílica: é a diferença entre o Terceiro e Primeiro Quartil.

Não confunda com desvio quartílico ou amplitude semi-quartílica, que são a
metade desse valor.


1835287
9. Desvio
➢ O desvio é basicamente a diferença de um número, em relação a outro. É bastante
comum, calcular a diferença de cada elemento X da sequência em relação à média desse
conjunto de dados. Nesse caso particular, temos a seguintes consequências:
✓ A soma de todos os desvios em relação à média e nula.
✓ A soma dos quadrados dos desvios em relação à média é mínima, quando

comparado aos desvios em relação a outros números.
➢ Chamamos de Desvio Absoluto Médio a soma dos módulos de todos os desvios em

relação à média, divididos pelo número de termos:
̅
𝚺|𝒙𝒊 − 𝒙|
𝑫𝑴 =
𝒏
10. Variância e Desvio Padrão
➢ A variância é a média aritmética dos quadrados dos desvios (diferenças em relação à média).
➢ Em outras palavras, para calcular a variância, devemos elevar cada um dos desvios ao quadrado,
somar todos os valores, e dividir por n, que é quantidade de elementos.
∑(𝒙𝒊 − 𝒙
̅)²
𝝈𝟐 =
𝒏
➢ O desvio padrão é a raiz quadrada da variância.
➢ Símbolos para variância e desvio padrão

• Variância populacional: 𝝈𝟐
• Variância Amostral: 𝑺𝟐
• Desvio padrão populacional: 𝝈
• Desvio padrão Amostral: 𝑺
➢ Variância Populacional:
∑(𝒙𝒊 − 𝒙
̅)²
𝝈𝟐 =
𝒏
➢ Variância Amostral:
∑(𝒙𝒊 − 𝒙
̅)²
𝑺𝟐 =
𝒏−𝟏


1835287
11. Coeficiente de Variação
➢ O coeficiente de variação é a razão entre o desvio padrão e a média, ou seja:
𝝈
𝑪𝒗 =
̅
𝒙
Probabilidade
12. Definições de probabilidade
➢ Espaço amostral é o conjunto de todos os resultados possíveis de um experimento aleatório.

➢ Evento é todo subconjunto do espaço amostral.
➢ Definição Clássica de Probabilidade:
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟á𝑣𝑒𝑖𝑠

𝑷𝒓𝒐𝒃𝒂𝒃𝒊𝒍𝒊𝒅𝒂𝒅𝒆 =
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑠í𝑣𝑒𝑖𝑠
➢ Combinações de eventos:
✓ União de dois eventos: Considere dois eventos A e B. O evento união ocorre se e somente se
A ou B (ou ambos) ocorrerem.
✓ A intersecção de dois eventos: Considere dois eventos A e B. O evento interseção ocorre se
e somente se os dois eventos ocorrerem (A e B ocorrerem)
✓ Complementar de um evento: Considere um evento A. O evento complementar de A ocorre
se e somente se não ocorre A.
✓ Se 𝑨 ∪ 𝑩 = 𝑼, dizemos que A e B são eventos exclusivos.
✓ Se 𝑨 ∩ 𝑩 = ∅ , dizemos que A e B são eventos mutuamente exclusivos (ou excludentes).
➢ Definição Axiomática de Probabilidade:

✓ 𝑃(𝐴) ≥ 0
✓ 𝑃(𝑈) = 1
✓ Se A e B são eventos mutuamente excludentes (𝐴 ∩ 𝐵 = ∅), então 𝑷(𝑨 ∪ 𝑩) = 𝑷(𝑨) +
𝑷(𝑩).
13. Probabilidade Condicional


1835287
➢ A probabilidade de que um evento B ocorra, sabendo que um evento A ocorreu é dada por:
𝑷(𝑨 ∩ 𝑩)
𝑷(𝑩 ∖ 𝑨) =
𝑷(𝑨)
➢ Se a ocorrência do evento A não influir no cálculo da probabilidade do evento B, os eventos são ditos
independentes e neste caso tem-se:
𝑷(𝑨 ∩ 𝑩) = 𝑷(𝑨) . 𝑷(𝑩)
14. Teorema de Bayes
➢ Esse é um assunto bem teórico, difícil de ser explicado e bem compreendido mesmo quando
temos mais tempo. Mas na prática fica bem mais simples de aplicá-lo. A "fórmula" do
teorema é a seguinte:
𝑷(𝑬𝒊 ) . 𝑷(𝑩|𝑬𝒊 )
𝑷(𝑬𝒊 |𝑩) =
∑ 𝑷(𝑬𝒊 ) . 𝑷(𝑩|𝑬𝒊 )
➢ Estranha né?! Não se preocupe, você não precisa decorá-la. Para dominar bem esse assunto,
aprenda através de alguma questão resolvida. Se você sabe como montar aqueles
"diagramas" saberá responder praticamente qualquer questão sobre Teorema de Bayes e
Probabilidade Total.
Distribuições Discretas de Probabilidade
15. Variáveis Aleatórias
➢ Variável aleatória (v.a.) é uma variável que é associada a uma distribuição de probabilidade. Ela
pode assumir valores de uma maneira completamente aleatória, ou seja, não temos como prever o
seu resultado. Por outro lado, podemos associar valores de probabilidade a cada um dos possíveis
resultados.
➢ Uma variável aleatória discreta pode assumir apenas certos valores, usualmente números racionais,
e resultam basicamente de contagens.
➢ Uma variável aleatória contínua é aquela que resulta de uma medida e pode assumir qualquer valor
dentro de um dado intervalo.


1835287
16. Esperança Matemática
➢ A esperança matemática (também chamada de expectância, valor médio ou média) é, por definição,
o número:
𝝁 = 𝑬(𝑿) = ∑ 𝑿𝒊 . 𝑷( 𝑿𝒊 )
𝒊=𝟏
• Esta expressão significa que, para calcular a esperança de uma variável aleatória, devemos
multiplicar cada valor da variável pela sua respectiva probabilidade e depois somar tudo.
17. Variância e Desvio Padrão
➢ A variância de uma variável aleatória é, por definição, 𝝈𝟐 = 𝑬(𝑿 − 𝝁)𝟐.

➢ Desenvolvendo essa expressão, temos 𝝈𝟐 = 𝑬(𝑿𝟐) − 𝝁𝟐
18. Distribuição Uniforme Discreta
➢ A distribuição uniforme discreta é aquela em que todos os elementos têm a mesma probabilidade
de ocorrer.
➢ Em uma distribuição uniforme discreta, a esperança é a média aritmética dos valores.
∑ 𝑿𝒊
𝑬(𝑿) =
𝒏
19. Distribuição de Bernoulli
➢ A distribuição de Bernoulli se caracteriza pela existência de apenas dois eventos, mutuamente

exclusivos, que denominaremos de sucesso e fracasso, em um experimento que é realizado uma
única vez.
➢ Em resumo, a distribuição de Bernoulli pode assumir os valores 0 e 1 (fracasso e sucesso,
respectivamente) em um experimento que é realizado uma única vez.
➢ A probabilidade de ocorrer um sucesso é 𝑝 e a probabilidade de ocorrer um fracasso é igual a 𝑞, tal
que 𝑝 + 𝑞 = 1.
𝐸(𝑋) = 𝑝
𝑉𝑎𝑟(𝑋) = 𝑝𝑞
10


1835287
20. Distribuição Binomial
➢ A diferença da distribuição binomial para a distribuição de Bernoulli é que no caso anterior o

experimento seria realizado apenas uma vez. Aqui na distribuição binomial realizaremos o
experimento n vezes.
➢ Consideremos um experimento constituído por 𝑛 ensaios INDEPENDENTES de Bernoulli. Cada
ensaio pode resultar em um de dois eventos mutuamente excludentes.
➢ A probabilidade de ocorrer o resultado favorável (sucesso) em cada ensaio é 𝑝 e a probabilidade de
ocorrer o resultado desfavorável (fracasso) em cada ensaio é 𝑞 = 1 − 𝑝.
➢ 𝑋 é o número de sucessos em 𝑛 ensaios. Assim, 𝑿 é no mínimo 0 e no máximo n.
➢ 𝑋 tem distribuição binomial com parâmetros 𝑛 e 𝑝.
➢ A probabilidade de ocorrerem 𝑘 sucessos em 𝑛 ensaios é:
𝒏
( ) 𝒑𝒌 . 𝒒𝒏−𝒌
𝒌
➢ A média do número X de resultados favoráveis em uma distribuição binomial é 𝑛𝑝 e a variância é
𝑛𝑝𝑞.
21. Distribuição Geométrica
➢ A distribuição geométrica também se refere a sucessos e fracassos, mas, diferentemente da binomial,

é a probabilidade de que o sucesso ocorra exatamente no k-ésimo ensaio.
➢ Aqui, a probabilidade de ocorrer o resultado favorável (sucesso) em cada ensaio também é 𝑝.
➢ Nesta distribuição:
𝟏
𝑬(𝑿) =
𝒑
𝒒
𝑽𝒂𝒓(𝑿) =
𝒑²
22. Distribuição Hipergeométrica
➢ A distribuição hipergeométrica refere-se à probabilidade de, ao retirarmos, sem reposição, 𝑛

elementos de um conjunto com 𝑁 elementos, saiam 𝑘 elementos com o atributo sucesso,
considerando-se que, do total de 𝑁 elementos, 𝑠 possuem esse atributo e, portanto, 𝑁 – 𝑠 possuem
o atributo fracasso.
➢ Resumindo:
11


1835287
• Temos um conjunto com N elementos dos quais 𝑠 possuem o atributo sucesso e 𝑁 – 𝑠

possuem o atributo fracasso.
• Serão retirados 𝑛 elementos do conjunto sem reposição.
• Queremos calcular a probabilidade de obtermos 𝑘 sucessos.
➢ Assim, a probabilidade de obtermos um sucesso (no primeiro experimento) é igual a 𝑝 = s/N.
Queremos calcular a probabilidade de que, retirando-se n elementos, k possuam o atributo sucesso
e 𝒏 − 𝒌 possuam o atributo fracasso.
➢ Esta probabilidade é dada por:
𝒔 𝑵−𝒔
( )( )
𝒌 𝒏−𝒌
𝑷(𝑿 = 𝒌) =
𝑵
(𝒏)
➢ A média da distribuição hipergeométrica é dada por:
𝑬(𝑿) = 𝒏𝒑
➢ A variância da distribuição hipergeométrica é dada por:
𝑵−𝒏
𝑽𝒂𝒓(𝑿) = 𝒏𝒑𝒒.
𝑵−𝟏
23. Distribuição de Poisson
➢ Para explicar essa distribuição, vamos utilizar como exemplo um objeto muito utilizado no cotidiano:
o telefone. Talvez até sejamos capazes de dizer quantas vezes, em média, nosso telefone toca por
dia. Mas quantas vezes o telefone não toca? Essa pergunta é muito difícil de responder. Quando uma
variável aleatória tem um comportamento parecido com esse, dizemos que ela segue uma
distribuição de Poisson.
➢ Se considerarmos que sucesso é tocar o telefone, é muito difícil calcular p, a probabilidade de isso
ocorrer, já que não temos como calcular a não-ocorrência do evento.
➢ A solução é imaginar que p é muito pequeno (𝑝 → 0), já que o toque do telefone dura apenas
alguns segundos em um dia de 24 horas (86.400 segundos). Dessa forma, o número de vezes que o
experimento é realizado (telefone toca ou não toca), que é o n da distribuição binomial, é realizado
muitas vezes (𝑛 → ∞).
➢ É assim que modelamos a distribuição de Poisson: partimos de uma distribuição binomial,
considerando que p é muito pequeno (tende a zero) e que n é muito grande (tende a infinito).
➢ A média da distribuição de Poisson é dada por:
𝝀 = 𝒏𝒑
12


1835287
➢ Esse número 𝜆 é exatamente o número médio de vezes que o evento ocorre. No exemplo do telefone,
é o número de vezes que o telefone toca por dia.
➢ A variância da distribuição de Poisson é dada por:
𝝈𝟐 = 𝝀
➢ A probabilidade nessa distribuição é:
𝒆−𝝀 . 𝝀𝒌
𝑷(𝑿 = 𝒌) =
𝒌!
• Em que e é uma constante (número de Euler) e vale aproximadamente 2,718....
Distribuições Contínuas de Probabilidade
24. Distribuição Uniforme Contínua
➢ Este é o modelo mais simples de variável aleatória contínua. Sua função densidade de
probabilidade é representada através de um segmento de reta horizontal. É igual a zero em
toda a reta real, com exceção de um dado intervalo, onde assume um valor constante. Se o
intervalo em que a função é constante for limitado pelos números “a” e “b”, seu gráfico terá
a seguinte representação.
➢ A função densidade de probabilidade de uma variável uniforme contínua X no intervalo [𝑎,

𝟏
𝑏] é igual a no intervalo e igual a 0 fora do intervalo.
𝒃−𝒂
𝒂+𝒃
➢ A média é igual ao ponto médio do intervalo, ou seja, 𝐸(𝑋) = .
𝟐
(𝒃−𝒂)²
➢ A variância é dada por 𝝈 = .
𝟏𝟐
13


1835287
25. Distribuição Exponencial
➢ Uma variável aleatória contínua X, que tome todos os valores não-negativos, terá uma distribuição
exponencial com parâmetro 𝜆 > 0, se a sua função densidade de probabilidade for dada por:
𝑓(𝑥) = 𝜆 ∙ 𝑒 −𝜆𝑥 𝑠𝑒 𝑥 ≥ 0
𝑓(𝑥) = 0, 𝑠𝑒 𝑥 < 0
➢ A esperança ou valor médio desta variável aleatória é dada por:
𝟏
𝐸(𝑥) =
𝝀
➢ A variância desta variável aleatória é dada por:
𝟏
𝑉𝐴𝑅(𝑋) =
𝝀²
26. Distribuição Normal
➢ A distribuição normal (também conhecida como Distribuição de Gauss ou Distribuição Gaussiana).

➢ A distribuição normal pode ser usada como aproximação para muitos tipos de distribuições em
grandes amostras.
➢ A distribuição N(0,1) de média 0 e variância 1 é muito importante e recebe um nome especial:
distribuição normal padrão ou distribuição normal reduzida.
➢ O gráfico da distribuição normal tem o seguinte aspecto:
✓ O gráfico se apresenta em forma de um sino, perfeitamente simétrica em relação à

ordenada principal (𝜇 = 𝑀o = 𝑀d).
✓ Tudo que acontecer do lado esquerdo, também acontecerá do lado direito.
➢ Na Distribuição Normal, a média, a moda e a mediana são iguais e a área total abaixo da curva é
igual a 1. Além disso, a curva se aproxima do eixo X, mas nunca o toca.
➢ Se uma variável aleatória X tem distribuição normal com média 𝝁 e variância 𝝈𝟐 , então a variável
𝑿−𝝁
𝑍 = 𝝈 tem distribuição normal com média 0 e variância 1.
Amostragem e Estimadores
27. Conceitos Iniciais

➢ Realizar o estudo de toda uma população pode ser bastante custoso. A estatística nos dá
ferramentas para, analisando parte do todo, ou seja, uma amostra, tirarmos conclusões
14


1835287
confiáveis a respeito de todos os elementos.
➢ O número de formas que podemos "selecionar" os elementos de uma população de

tamanho N para formar uma amostra de tamanho n é:
✓ 𝑵𝒏 se o processo for feito com reposição
𝑁
✓ CN,n ou 𝐶𝑁𝑛 ou ( ) se o processo for feito sem reposição. Todos esses
𝑛
𝑵!
símbolos significam combinação de N elementos n a n. = (𝑵−𝒏)!∗𝒏!
➢ O objetivo de se realizar uma amostragem estatística é garantir que ela represente, de

forma satisfatória, a população.
28. Tipos de Amostragem
➢ Há diferentes formas de se selecionar uma amostra, vamos apresentar algumas:

✓ Aleatória Simples: elementos são "escolhidos" ao acaso, a probabilidade de um ser
escolhido é a mesma dos outros. Ex.: sorteio dos 6 números da mega-sena.
✓ Por Estratificação: analisa-se a população dividindo-a em subconjuntos (estratos)
com elementos homogêneos, de cada estrato são retiradas amostras aleatórias
simples. As amostras podem ser formadas por uma:
▪ Alocação proporcional: a ideia e tentar ainda mais manter a "cara da
população" na amostra. Ex.: separamos a população dos alunos de uma
escola em meninos e meninas, e formamos uma amostra respeitando a
proporcionalidade da população.
▪ Alocação simples: os estratos possuirão a mesma quantidade de elementos.
Ex.: se a amostra tiver 200 alunos, 100 serão meninos e 100 serão meninas.
✓ Por Conglomerados: parece, mas não é igual a por estratificação. Aqui também
dividimos a população em subconjuntos, mas os elementos dos subconjuntos não
mais se parecem entre si, a homogeneidade se dá entre um subconjunto e outro.
Ex. Se a população é formada pelos vários funcionários de 5 fábricas de celulares. A
amostragem "pegaria" os funcionários de uma dessas fábricas.
✓ Sistemática: os elementos são colocados em alguma espécie de "ordem" e
selecionam-se elementos a cada "x". Ex.: Se tivéssemos uma lista com 5 mil nomes
de pessoas, e selecionássemos os nomes para amostra nas posições múltiplas de 10.
✓ Por Conveniência: não há critério na seleção dos elementos, selecionam-se os mais
"fáceis". Ex.: um repórter quer saber o que as pessoas estão achando do
atendimento num hospital, vai entrevistar alguém, e escolhe o primeiro que passar
perto dele.
15


1835287
✓ Por Julgamento: o elemento é escolhido por alguma razão. Ex.: O mesmo repórter
escolhe para entrevistar uma pessoa que ele percebeu estar revoltada com a falta
de leitos.
✓ Por cotas: a proporcionalidade entre os "tipos" de elementos na amostra é mantida
em relação às da população. a diferença para amostragem estratificada é que os
elementos não são selecionados por uma amostragem aleatória simples. Ex.: no
exemplo da escola, manteríamos a proporção meninos / meninas, mas
escolheríamos propositalmente os melhores alunos.
29. Amostragem Probabilística x Não Probabilística

➢ Na amostragem probabilística, não há interferência do responsável na seleção da amostra
(imparcialidade). Há como calcular a probabilidade de cada elemento da população
pertencer a amostra.
➢ Na amostragem não probabilística, há parcialidade do responsável, também é chamada

de amostra determinística.
➢ O ideal é que, pelas características do tipo de amostra, você consiga determinar se ela é
probabilística ou não. De qualquer forma os exemplos são:
✓ Probabilística: amostragem aleatória simples, por estratos, por

conglomerados e sistemática.
✓ Não Probabilística: amostragem por conveniência, julgamento e cotas.
➢ Há situações em que o ideal é uma amostragem Probabilística, e outras em que se encaixa

melhor uma amostra Não Probabilística.
30. Distribuição Amostral da Média

➢ Se a população é infinita ou se a amostragem é feita com reposição, os diversos valores
da amostra são considerados valores de variáveis aleatórias independentes, com a mesma
distribuição de probabilidades da população, ou seja, com a mesma média 𝜇 e a mesma
variância 𝜎² da população.
➢ Considere uma amostra aleatória 𝒙𝟏, 𝒙𝟐, … , 𝒙𝒏 retirada de uma população infinita ou
retirada com reposição de uma população finita.
➢ 𝑥1, 𝑥2, … , 𝑥𝑛 são variáveis aleatórias independentes e identicamente distribuídas à
população. Assim
𝑬(𝒙𝒊) = 𝝁 e 𝑽𝒂𝒓(𝒙𝒊) = 𝝈².
16


1835287
➢ A média amostral 𝑥̅ é uma variável aleatória.

➢ A esperança de 𝑥̅ é igual à média populacional, ou seja, 𝐸(𝒙
̅) = 𝜇.
𝟐 𝛔²
➢ A variância de 𝑥̅ é igual à variância populacional dividida por 𝑛, ou seja, 𝜎𝒙 = .
𝒏
31. Características da Média Amostral
➢ Como a esperança de 𝒙 ̅ é igual à média populacional, dizemos que 𝒙

̅ é um estimador não
tendencioso da média populacional.
➢ 𝒙
̅ é um estimador de variância mínima.
➢ 𝒙
̅ é um estimador de mínimos quadrados.
➢ Se a variável X tem distribuição normal, então 𝒙
̅ é um estimador de máxima verossimilhança.
➢ 𝒙
̅ é um estimador consistente.
32. Distribuição Amostral da Variância
Intervalos de Confiança e Testes de Hipóteses
33. Teoria da Estimação
➢ A estimação é uma técnica utilizada para determinar estimativas de parâmetros populacionais.

Neste método, utiliza-se dados amostrais para prever valores de parâmetros populacionais que
ainda não são conhecidos.
✓ ESTIMAÇÃO PONTUAL
▪ Nesta estimação o parâmetro populacional é obtido através de um único número.
Este número tende a ser bem próximo do verdadeiro valor do parâmetro.
▪ Existem dois tipos de estimação de um parâmetro populacional: estimação por
ponto e a estimação por intervalo.
17


1835287
▪
Como é uma estimativa baseada em um único ponto, não é possível julgar a
magnitude do erro que podemos estar cometendo.
✓ ESTIMAÇÃO POR INTERVALO
▪ Essa estimativa busca determinar um intervalo que possua o valor do parâmetro
populacional, obtendo através desta uma margem de segurança razoável, onde é
possível julgar se estamos ou não cometendo um erro de amostragem.
✓ INTERVALO DE CONFIANÇA
▪ Na estimativa por intervalo de confiança é possível determinar dois limites para a
amostragem populacional, ou seja, temos aqui uma margem de erro conhecida.
▪ Quando a margem de erro é baixa, temos que o nível de confiança daquela pesquisa
ou amostra é alto. Caso a margem de erro seja alta, a confiança tende a ser menor.
▪ Geralmente esses intervalos de confiança são expressos assim: (1 – a), onde a é o
grau de desconfiança.
▪ Encontramos em nosso dia a dia, desta forma α = grau de desconfiança, nível de
incerteza ou nível de significância. 1-α = coeficiente de confiança ou nível de
confiabilidade;
34. Teste de Hipóteses
➢ O teste de Hipótese é utilizado no dia a dia para a tomada de decisões. Quando estamos diante de
um teste de hipóteses, devemos examinar as duas possibilidades possíveis que fará com que se
aceite ou rejeite uma alegação sobre determinada população de acordo com as evidências obtidas
por uma amostra de dados.
➢ Dentro do teste de hipóteses temos as hipóteses estatísticas, o qual podemos definir como uma
suposição de um parâmetro populacional, ou seja, iremos pegar uma amostra e buscar os
parâmetros daquela amostra. Iremos calcular através da amostra se esta hipótese deve ser aceita
ou rejeitada.
➢ Para testarmos um parâmetro populacional, teremos uma hipótese que seja falsa e outra que seja
verdadeira. Essas duas hipóteses são chamadas de hipótese nula e hipótese alternativa.
✓ HIPÓTESE NULA
▪ É a hipótese que possui uma afirmação de igualdade, ou seja: <, =, >.
▪ Só poderemos montar hipóteses nulas com estes três símbolos.
✓ HIPÓTESE ALTERNATIVA
▪ Utilizado como complemento da Hipótese nula, sendo a afirmação que deve ser
verdadeira se H0 for falsa. Na hipótese alternativa, teremos uma afirmação de
desigualdade. Devemos utilizar os seguintes símbolos.
▪ <, >, ≠
➢ Teremos os seguintes testes:
✓ 1 – Teste Bilateral ou Bicaudal
✓ 2 – Testes unilaterais ou unicaudal
18


1835287
➢ Para qualquer teste de hipóteses devemos montar a hipótese nula e a hipótese alternativa.
➢ Cada teste geralmente irá te fornecer uma fórmula, que você saberá o valor observado.
35. Tipos de Erros
➢ Quando estamos diante da decisão de optarmos pela hipótese nula ou pela alternativa, existem
dois tipos de erros. Se rejeitarmos uma hipótese nula verdadeira, estaremos cometendo o erro de
tipo I, já se rejeitar a hipótese alternativa verdadeira, estaremos cometendo o erro tipo II.
➢ A probabilidade de rejeitar a hipótese nula quando ela é falsa é igual a 1–β. Esse valor é a potência
do teste. E a probabilidade de cometer um erro de tipo II é β.
19


1835287
REGRESSÃO LINEAR
36. Equação da Reta
➢ Estamos interessados em calcular a expressão matemática que relaciona 𝑌 em função de 𝑋.

➢ A equação de uma reta pode ser escrita como:
𝑦 = 𝑝 + 𝑚𝑥
➢ O coeficiente 𝑝 é o coeficiente linear da reta (indica onde a reta corta o eixo 𝑦) e o coeficiente 𝑚 é
chamado de taxa de variação (ou coeficiente angular da reta). O coeficiente 𝑚 indica se a função é
crescente (𝑚 > 0), decrescente (𝑚 < 0) ou constante (𝑚 = 0).
➢ O coeficiente 𝑚 é a taxa de variação (também conhecido como “coeficiente angular” da reta). Se a
reta passa pelos pontos (𝑥1 , 𝑦1 ) e (𝑥2 , 𝑦2 ), então a taxa de variação é dada por:
∆𝒚 𝒚𝟐 − 𝒚𝟏
𝒎= =
∆𝒙 𝒙𝟐 − 𝒙𝟏
37. Modelo Estatístico de Uma Regressão Linear Simples
➢ O modelo estatístico de uma regressão linear simples entre 𝑋 e 𝑌 é dado por:
𝒀𝒊 = 𝛼 + 𝛽𝑿𝒊 + 𝒖𝒊
✓ Com 𝑖 = 1, 2, 3, … , 𝑛.
✓ Nesse modelo, a expressão 𝛼 + 𝛽𝑿𝒊 é o componente de 𝑌𝑖 que varia linearmente com 𝑋𝑖 ,
enquanto que 𝒖𝒊 é o componente aleatório de 𝑌𝑖 (também chamado de erro ou desvio). Em
outras palavras, 𝑢𝑖 é a variável aleatória que descreve o erro cometido quando tentamos
aproximar a relação entre 𝑋 e 𝑌 por uma reta.
✓ Nesse modelo, dizemos que 𝑿𝒊 é a variável explanatória (ou independente) e 𝒀𝒊 é a variável
dependente. A variável dependente Y é a variável que desejamos prever ou explicar. É
também chamada de variável resposta.
✓ A variável independente X é também chamada de variável explicativa.
➢ O método usual para a obtenção dos estimadores de 𝛼 e 𝛽 é denominado método de mínimos
quadrados.
➢ O método dos mínimos quadrados é aquele que determina as estimativas 𝑎 e 𝑏 dos parâmetros
minimizando a soma dos quadrados dos desvios.
➢ Por esse método, o valor de 𝑏 é dado por:
20


1835287
➢ Depois de obtido o valor de 𝑏, podemos calcular o valor de 𝑎 substituindo o valor de 𝑏 na equação:
38. Análise da Variância da Regressão
21


Bizu Estratégico de Estatística

Enviado por

Direitos autorais:

Formatos disponíveis

Bizu Estratégico de Estatística

Enviado por

Dados do documento

Descrição original:

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Bizu Estratégico de Estatística

Enviado por

Direitos autorais:

Formatos disponíveis

Bizu Estratégico de

Bizu Estratégico de Estatística

20368023036 - Henrique Souza Lima

BIZU ESTRATÉGICO – ESTATÍSTICA – RECEITA FEDERAL

Estatística (Receita Federal)

Medidas de Dispersão 8 a 11 https://questoes.estrategiaconcursos.com.br/cadernos/455e4212-ce95-495d-b356-23c93743b4fe

Distribuições Discretas 15 a 23 https://questoes.estrategiaconcursos.com.br/cadernos/b12245df-07d9-4b81-ab1d-6b801d7cc4b5

Distribuições Contínuas 24 a 26 https://questoes.estrategiaconcursos.com.br/cadernos/5d873ce5-b8df-463f-b575-dd012fbe8850

Amostragem e Estimadores 27 a 32 https://questoes.estrategiaconcursos.com.br/cadernos/b0e74bfa-9728-4d3f-8bdf-269e002369c3

Intervalos de Confiança e Testes de

Coach Roberto Cambraia

Bizu Estratégico p/ Receita Federal (Auditor Fiscal)

20368023036 - Henrique Souza Lima

Estatística (Receita Federal)

Regressão Simples e Múltipla 13,20%

Medidas de Posição 11,52%

Testes de Hipóteses 8,99%

Intervalos de Confiança 8,71%

Medidas de Dispersão 6,46%

Conceitos Iniciais de Estatística 0,84%

Números índices 0,28%

Formas de Apresentação de Dados 0,28%

Qualquer dúvida estamos à disposição.

Bizu Estratégico p/ Receita Federal (Auditor Fiscal)

20368023036 - Henrique Souza Lima

Utilizarei da minha experiência, adquirida ao longo dessa jornada, para auxiliá-lo na

Roberto Cambraia Leonardo Mathias

Bizu Estratégico p/ Receita Federal (Auditor Fiscal)

20368023036 - Henrique Souza Lima

➢ A média aritmética preserva a soma da lista de números

➢ Média para dados agrupados por valor:

➢ Média para dados agrupados por classe:

➢ Se temos um lista de números (𝑥1 , 𝑥2 , 𝑥3 , . . . , 𝑥𝑛 ) com pesos respectivos (𝑝1 , 𝑝2 , 𝑝3 , . . . , 𝑝𝑛 ), então a

Bizu Estratégico p/ Receita Federal (Auditor Fiscal)

20368023036 - Henrique Souza Lima

➢ Se todos os números forem iguais, então as médias serão iguais.

➢ Mediana para Dados Agrupados em Classes:

Bizu Estratégico p/ Receita Federal (Auditor Fiscal)

20368023036 - Henrique Souza Lima

➢ Moda para Dados Não-Agrupados:

➢ Moda para Dados Agrupados Sem Intervalos de Classe:

✓ Amplitude (Total): é a diferença entre o maior e menor número da sequência.

✓ Amplitude Interquartílica: é a diferença entre o Terceiro e Primeiro Quartil.

Bizu Estratégico p/ Receita Federal (Auditor Fiscal)

20368023036 - Henrique Souza Lima

✓ A soma de todos os desvios em relação à média e nula.

✓ A soma dos quadrados dos desvios em relação à média é mínima, quando

➢ Chamamos de Desvio Absoluto Médio a soma dos módulos de todos os desvios em

10. Variância e Desvio Padrão

➢ O desvio padrão é a raiz quadrada da variância.

➢ Símbolos para variância e desvio padrão

Bizu Estratégico p/ Receita Federal (Auditor Fiscal)

20368023036 - Henrique Souza Lima

11. Coeficiente de Variação

➢ O coeficiente de variação é a razão entre o desvio padrão e a média, ou seja:

12. Definições de probabilidade

➢ Espaço amostral é o conjunto de todos os resultados possíveis de um experimento aleatório.

➢ Definição Clássica de Probabilidade:

𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟á𝑣𝑒𝑖𝑠