Delfim 2019
Delfim 2019
Delfim 2019
Fique Ligado
Você sabia?
Vamos refletir
Hora de Praticar
Atividades
Glossário
Sumário
UNIDADE 1 - FUNDAMENTOS DO MÉTODO ESTATÍSTICO I
Estatística na prática 7
Conceituando a estatística 14
Interpretação de gráficos 18
Grupos de estatística 33
Métodos de pesquisa 35
Glossário 266
Referências 270
Ficha Técnica 272
Minicurrículo dos Autores 273
Unidade 1: Fundamentos do método estatístico I
Introdução EDA
Fonte: https://www.ifb.edu.br/reitori/10657-ifb-lanca-plataforma-ifb-em-numeros
Informações complementares do
gráfico:
Gabarito:
Os gráficos são utilizados para apresentar os dados estatísticos e o objetivo do uso deles é
produzir no investigador, ou no público em geral, uma impressão mais rápida e lúdica do
fenômeno em estudo.
Interpretação de gráficos
ENEM 2018) A raiva é uma doença viral e infecciosa, transmitida por mamíferos. A
campanha nacional de vacinação anti-rábica tem objetivo de controlar a circulação
do vírus da raiva canina e felina, prevenindo a raiva humana. O gráfico mostra a
cobertura (porcentagem de vacinados) da campanha, em cães, nos anos de 2013,
2015 e 2017, no município de Belo Horizonte, em Minas Gerais. Os valores das
coberturas dos anos de 2014 e 2016 não estão informados no gráfico e deseja-se
estimá-los. Para tal, levou-se em consideração que a vacinação na cobertura de
vacinação da campanha anti-rábica, nos períodos de 2013 a 2015 e de 2015 a
2017, deu-se de forma linear.
Qual teria sido a cobertura dessa
campanha no ano de 2014?
a) 62,3%
b) 63,0%
c) 63,5%
d) 64,0%
e) 65,5%
Interpretação de gráficos
Resolvendo...
É a representação gráfica
Pictogramas mais lúdica, com a
complementação de
figuras e símbolos.
Vou explicar para você sobre cada um desses gráficos, ok? Continue comigo!
Tipos de Gráficos
Diagramas
Este grupo é composto pelos seguintes Você já deve conhecer alguns desses gráficos,
tipos de gráficos: mas vou te mostrar alguns exemplos.
Tornando-se um pesquisador...
Maria dos Remédios construiu uma horta no quintal de sua casa; plantou alface, couve,
cenoura, cebola e coentro. Estava dando tudo certo, mas alguns insetos insistiam em danificar
suas plantas. Maria não sabia o que fazer para proteger sua horta de maneira natural, mas já
estava estudando alternativas. Em poucos dias, Maria percebeu que nasceram calêndulas
próximas à horta, achou interessante e continuou sua vida; contudo, com o passar dos dias, ela
observou que a quantidade de insetos na horta havia reduzido e ficou se perguntando sobre o
que poderia ter acontecido. Foi nesta hora que Maria criou a hipótese de que os insetos
preferem as flores da calêndula a sua horta. Ela então resolveu fazer um experimento: plantou
calêndulas em lugares estratégicos, próximos à horta e, dia após dia, sem mudar sua rotina,
observou, anotou e, então, fez uma análise sobre a quantidade de insetos na horta e a
quantidade de insetos nas flores da calêndula.
Métodos de pesquisa
Então, Maria dos Remédios chegou à conclusão de que havia uma alternativa natural para o
controle de pragas na sua horta, já que os insetos preferiam as flores às hortaliças. Maria,
sem perceber, tinha se tornado uma pesquisadora.
Observe que Maria dos Remédios seguiu um fluxo, um caminho que chamaremos de
método.
Método experimental
Consiste em manter constantes todas as causas (fatores), menos uma, e variar esta causa
de modo que o pesquisador possa descobrir seus efeitos, caso existam. (CRESPO 2009
p.2).
Método estatístico
Diante da impossibilidade de manter as causas constantes, admitem todas essas causas
presentes variando-as, registrando essas variações e procurando determinar, no resultado
final, que influências cabem a cada uma delas. (CRESPO 2009 p.3).
Hora de Revisar!
Olá! Estudante,
Ao lermos o texto acima, percebemos que o IBGE já se preparou para o Censo Demográfico
2020, mas antes de analisar as variáveis desta pesquisa, vamos tratar um pouco mais do
conceito de Censo.
Censo ou Recenseamento
O que é Censo?
Fonte: https://pixabay.com/pt/photos/confundido-m%C3%A3os-at%C3%A9-d%C3%BAvidas-2681507/
https://censo2010.ibge.gov.br/images/pdf/censo2010/questionarios/qu
estionario_basico_cd2010.pdf
Para deixar isso mais claro para você, observe o estudo de caso a
seguir.
Estudo de caso
José Carlos vive em uma comunidade rural chamada Pequeno Rio e é produtor com foco na
agricultura familiar. José Carlos percebeu que existe uma vontade nas pessoas em se
qualificar para melhorar ou aprender novas técnicas de produção. Alguns falam que
gostariam de aprender sobre apicultura, outros falam em floricultura, alguns também falam
de piscicultura. José percebeu que pode ajudar sua comunidade e foi buscar apoio em uma
instituição de ensino pública da área. Chegando lá, recebeu a seguinte missão: identificar o
perfil das pessoas da comunidade e quais os seus interesses.
Estudo de caso
Então, José criou o seguinte questionário* como instrumento de coleta de dados para a sua
pesquisa:
Observe que no questionário de José tem variáveis que são descritas a partir de números
(quantidades) e também aquelas que são descritas por nomes (qualidades).
Observe que todas essas variáveis acima são representadas a partir de números, às vezes,
números inteiros, às vezes, números decimais, o que nos leva a separação desse grupo
em variáveis quantitativas discretas e quantitativas contínuas.
Então, vamos conversar um pouco mais sobre esse tipo de variável para
que você compreenda assim como compreendeu a variável quantitativa.
Variáveis estatísticas
A variável qualitativa está relacionada a uma qualidade, atributo ou qualquer outra
característica cuja forma de se classificar seja a partir de um nome.
Ah, professor, você poderia exemplificar essas variáveis qualitativas para ficar mais claro
para mim? Claro! Eu te mostro aqui!
●
●
●
●
●
Variáveis estatísticas
Observe que todas essas variáveis que mostrei
no exemplo são representadas a partir de
nomes; às vezes, esses nomes estão ordenados
ou hierarquizados, às vezes, não, o que nos leva
a separação desse grupo em dois tipos de
variáveis qualitativas: variável qualitativa
ordinal e qualitativa nominal.
Variáveis estatísticas
A variável qualitativa se subdivide em dois tipos:
Você pode estar pensando: nossa, professor, quanta classificação! Mas não se preocupe! O
importante é que você compreenda o que cada uma significa e saiba diferenciá-las.
Ao final deste estudo sobre as variáveis, eu vou te apresentar um desenho que vai te ajudar
a resumir todas essas classificações.
Então, vamos lá! Vou agora apresentar a classificação das variáveis qualitativas.
Variáveis estatísticas
A variável ordinal, como o próprio nome indica,
“ordem”, ‘sequência”; ela define categorias, isto é,
mesmo não sendo números, estas podem ser
ordenadas, vejamos alguns exemplos:
Fonte: https://www.freepik.com/free-photos-vectors/people
People photo created by rawpixel.com - www.freepik.com
Variáveis estatísticas
Observe que existe uma hierarquização das categorias, o que não acontece com a variável
qualitativa nominal que não necessita de uma ordenação subjetiva, vejamos alguns
exemplos:
Veja o gabarito: N N O O O
Variáveis estatísticas
Bom, como eu falei anteriormente, para te ajudar a fixar a classificação das variáveis, eu
elaborei uma imagem que ilustra um resumo dessa classificação. Ao olhar para a imagem a
seguir, tente relembrar das características de cada variável.
Vem comigo!
Técnicas de amostragem e coleta de dados
Você ainda se lembra do José que está fazendo um levantamento do perfil da sua
comunidade? Então, ele está muito empenhado e para que tudo dê certo ele segue um
planejamento. José já pensou em como serão realizadas as fases seguintes, já
determinou o objetivo da pesquisa e os métodos que serão utilizados para, dessa
forma, iniciar a coleta dos dados. Como lembrete, temos no planejamento a definição
dos objetivos, das características da amostra, do método de aquisição e do
processamento de dados.
Para Vieira (2008), definir qual deve ser o tamanho de uma amostra é uma das principais
dificuldades encontradas nos trabalhos de levantamento amostral; segundo a autora, o
tamanho da amostra é independente do tamanho da população, já que o tamanho da
amostra, por si só, não determina se ela é boa ou de má qualidade; o que mais importa em
uma amostra é o seu grau de similaridade com a população.
Técnicas de amostragem e coleta de dados
Para o cálculo do tamanho da amostra, deve-se levar em consideração os seguintes fatores:
● o nível de confiança;
● a precisão desejada para os resultados obtidos;
● a variabilidade dos dados (o quanto estão dispersos em relação à característica em
estudo) e o custo.
Vem comigo!
Técnicas de amostragem e coleta de dados
A estatística está a serviço do pesquisador, entretanto, o pesquisador tem interesses ao
concluir uma pesquisa, isto é, comprovar sua hipótese; agora, pense um pouco mais, e se o
pesquisador quiser direcionar os resultados da pesquisa, ele pode? A resposta é sim. Quando
uma coleta é tendenciosa, propositalmente ou por descuido, dizemos que a amostra está
viciada.
Vejamos um exemplo:
Uma pesquisa de opinião sobre a descriminalização da maconha para uso pessoal foi realizada
no DF, entretanto, observou-se que os entrevistados eram, em sua maioria, pessoas com idade
acima dos 40 anos e com uma religião definida. Você acha que esses dados estão viciados? A
resposta é sim. E isso poderá gerar falsas conclusões, pois se o assunto é de interesse de toda
a população, logo, é necessário garantir a representatividade de todos os perfis e não
somente de um ou de outro. É disso que trata o estudo das técnicas de amostragem.
Quer aprender um pouco mais sobre pesquisa de opinião? Acesse o
seguinte link
https://www.institutophd.com.br/pesquisa-de-opiniao-o-que-e-como-funci
ona/
Ao realizar esse tipo de coleta, o pesquisador Ao realizar esse tipo de coleta, o pesquisador
escolhe um método simples, sistemático, escolhe de maneira deliberada os elementos
estratificado, por conglomerado e sabe que da amostra, utilizando seus próprios critérios
cada unidade amostral tem uma de escolha. O problema desse tipo de
probabilidade conhecida diferente de zero. amostragem é que não se conhece a
probabilidade de cada unidade amostral
pertencer à amostra.
Esses métodos são subjetivos, ou seja, o pesquisador define sua amostra com
intencionalidade, de maneira voluntária ou por acidente e deve deixar isso muito claro em
seus relatórios de pesquisa. Por exemplo, um pesquisador escolheu realizar a coleta de
dados em um hospital A, pois gosta da forma como os servidores trabalham. Percebe que
não há qualquer problema nisso?
Em pesquisas bem planejadas, acidentes em coleta de dados são raros, mas podem
acontecer, por exemplo, quando encontramos dados que não estavam elencados nos
objetivos da pesquisa, mas que podem ser analisados.
O destaque aqui é para a dificuldade ao fazer generalizações dos resultados, pois todo e
qualquer resultado da pesquisa se limita ao público escolhido e não à população que está
inserido.
Técnicas de amostragem e coleta de dados
Antes de aprofundarmos nos métodos probabilísticos, vejamos a organização que o professor
Alves (2013) fez sobre a classificação dos levantamentos amostrais.
1) Enumeramos as 80 pessoas.
2) Realizamos o sorteio de 20 números, de 1 a 80, pode ser no mesmo formato de um
bingo.
3) Após o sorteio, teremos as vinte pessoas selecionadas para compor a amostra, que
representa 25% da população.
População é agora vista como um conjunto de grupos e não como um todo. Vejamos o caso de
uma pesquisa que objetiva saber a opinião de homens e mulheres a respeito de um novo
produto. Sabe-se que em um grupo de 100 pessoas, há 40 mulheres e 60 homens. Em sua
opinião, as técnicas apresentadas anteriormente podem gerar uma amostra não viciada? Se
utilizarmos os métodos anteriores, corremos o risco de termos as seguintes situações:
Considere uma pesquisa que tem como objetivo A população foi dividida em
conhecer o perfil dos adolescentes brasileiros. Observe conglomerados (Estados);
que é inviável alcançar todos os adolescentes
brasileiros, desta forma, pode-se dividir a população em Cada conglomerado foi dividido em
estados ou regiões, por exemplo. outros menores, cidades;
Considere que o pesquisador escolheu agrupar esta
população por estado. Até aqui está tudo certo,
Seleciona-se uma amostra de
contudo, ainda assim, não será possível alcançar todos
conglomerados;
os adolescentes de cada estado, sendo assim,
devem-se selecionar amostras dentro dos
Observam-se todos os elementos dos
conglomerados.
conglomerados selecionados;
Para selecionar a amostra nos conglomerados, pode-se
realizar uma das metodologias já estudadas ou aplicar
Conclui-se a característica da
novamente a amostragem probabilística por
conglomerados, formando grupos menores, por população.
exemplo, cidades. Assim a amostra é selecionada. O
pesquisador que definirá o limite da divisão.
Técnicas de amostragem e coleta de dados
Existem duas formas para coletarmos dados de uma pesquisa: direta e indireta.
Vamos conhecer um pouco sobre cada uma delas!
Você percebeu que nas tabelas, assim como também acontece com os gráficos
em geral, os dados são apresentados de maneira organizada?
Segundo ALVES (2013), uma tabela deve apresentar a seguinte estrutura: cabeçalho, corpo e
rodapé. Veja a figura abaixo:
● série histórica;
● série específica ou categórica;
● série geográfica ou tabelas de dupla
entrada.
2009 642
(também conhecida como temporais ou
cronológicas) 2010 762
2011 1027
- Consiste em que o elemento
2012 1105
variável é o fator cronológico,
como no exemplo ao lado, em que 2013 1031
este é representado em anos.
2014 903
2015 1777
2016 2290
2017 2085
2018 2079
Total 13701
Empreendedorismo 10
Outros 0
Nesta unidade, estudamos sobre o IBGE, cuja missão institucional é "retratar o Brasil com
informações necessárias ao conhecimento de sua realidade e ao exercício da cidadania".
Foi tratado, também nesta unidade, dos estudos a respeito das técnicas de amostragem e
coleta de dados; estas são fundamentais para a realização de uma pesquisa, garantindo a
melhor utilização do tempo e recursos do pesquisador. Definimos o conceito de população e
amostra, sendo população o conjunto de elementos que têm, em comum, determinada
característica; e a amostra é todo subconjunto não vazio e com número menor de elementos
da população.
Hora de Revisar!
Vieira (2008) afirma que o tamanho de uma amostra é uma das principais dificuldades
encontradas nos trabalhos de levantamento amostral. Para a autora, o tamanho da amostra
independe do tamanho da população, já que o tamanho da amostra, por si só, não
determina se ela é boa ou de má qualidade; o que mais importa, numa amostra, é o seu
grau de similaridade com a população. Por isso, trabalhamos com algumas técnicas de
Amostragem: não probabilística e probabilística.
Após a coleta dos dados estatísticos, precisamos organizá-los e uma alternativa são as
tabelas estatísticas, entretanto, para cada tipo de gráfico existe um tipo de tabela
recomendada, são elas: tabelas de série histórica, de série específica ou categórica, de série
geográfica e tabelas de dupla entrada.
Chegou o momento de verificar sua aprendizagem.
Ficou com alguma dúvida? Retome a leitura.
Vamos lá?!
Unidade 3: Estatística descritiva I
Introdução EDA
Olá! Estudante,
Para facilitar o entendimento sobre este assunto, vamos acompanhar uma situação de
coleta e organização de dados com poucos elementos; pense, ainda, em uma mesma
situação com uma quantidade significativa de dados e pense, também, que existem
planilhas eletrônicas que auxiliam e facilitam a análise desses dados.
https://www.youtube.com/watch?v=1k8aY5P8J6A
Conceito de frequência
Voltamos!
E agora, melhorou? Eu acredito que sim, mas pode 65kg 65kg 75kg 75kg 75kg 75kg
melhorar ainda mais transformando essa tabela
primitiva em uma tabela de frequência.
75kg 75kg 75kg 80kg 80kg 80kg
Vamos fazer isso? Continue comigo nesse raciocínio! Fonte: elaborado pelo autor
Conceito de frequência
O que fizemos até aqui foi agregar as respostas
iguais e contar quantas vezes cada uma apareceu.
Chamamos isso de frequência, portanto…
Conceituamos frequência como:
As notas da avaliação de 70 alunos estão em rol, abaixo. Observe que quanto maior o
número de categorias, mais trabalhosa é a organização dos dados em uma tabela de
frequência. Cada nota pode ser tratada como categoria única, uma em cada linha, mas isso
torna o trabalho inviável, por isso, apresentamos o conceito de intervalo de classe para
categorias.
2,0 2,0 2,4 2,4 2,5 2,9 2,9 3,0 3,0 3,0 3,0 3,2 3,6 3,6
3,7 3,9 4,0 4,4 4,4 4,6 4,7 4,8 4,8 4,8 4,9 4,9 5,0 5,5
5,5 5,6 5,7 5,7 5,7 5,7 5,8 5,9 5,9 6,0 6,0 6,0 6,1 6,2
6,3 6,5 7,0 7,0 7,1 7,2 7,3 7,5 7,5 7,5 7,5 7,5 7,8 7,9
7,9 8,0 8,3 8,3 8,6 8,6 8,6 8,8 8,9 9,0 9,0 9,0 9,1 9,4
k = √n
Com :
k = número de classes.
n = o número total de observações na amostra.
http://professorguru.com.br/estatistica/estat%C3%ADstica%20
descritiva/constru%C3%A7%C3%A3o%20de%20classes%20-
%20quantidade%20e%20tamanho%20das%20classes.html
Hora de praticar!
1 3 0 1 1 8 2 3 1
1 2 5 0 3 4 1 2 0
As medidas de tendência central serão mais confiáveis quanto mais representativo for o
conjunto de elementos da amostra ou da população, isto é, se o conjunto de elementos for bem
selecionado, guardando características semelhantes da população que foi extraída e com o
tamanho da amostra ideal. Isso garantirá uma melhor aproximação com o que poderíamos
encontrar na população.
O resultado da pesquisa GEM, divulgado em 2010, mostra que o Brasil alcançou a maior Taxa
de Empreendedores em Estágio Inicial (TEA): 17,5% da população adulta, na faixa etária de 18
a 64 anos, estava exercendo, com até três anos e meio de existência, alguma atividade em
negócios.
(Empreendedorismo no Brasil 2010 - Elaborado por IBQP – GEM. Disponível em: <http://www.sebrae.com.br>.
Acesso em: 08 de mar.2012. Adaptado)
Considere o gráfico ao lado: evolução da Taxa de
Empreendedores Iniciais (TEA) Brasil - período de
2002 a 2010
De acordo com o gráfico, a média das Taxas de
Empreendedores Iniciais brasileiros, no período de
2002 a 2010, era, aproximadamente:
a) 14,4%.
b) 14,1%.
c) 13,9%.
d) 13,4%.
e) 12,8%.
O exercício pede, com base nos dados do gráfico, a
média das Taxas de Empreendedores Iniciais
brasileiros, no período de 2002 a 2010, ou seja, a
taxa média.
Utilizando a fórmula da média simples, temos:
Média Aritmética ( Média Ponderada )
A média aritmética ponderada, como o nome sugere, acrescenta o fator peso às categorias;
vejamos a fórmula para calcular a média ponderada.
Onde xp é a média aritmética ponderada de um conjunto de n valores (x1, x2, x3, x4, …, xn-1,
cujos pesos são respectivamente (p1, p2, p3, p4, …, pn-1, pn).
Exemplo 01 comentado
a) 9 meses
b) 10 meses
c) 12 meses Observe que o peso neste caso é a
d) 13 meses quantidade de crianças. Utilizando a
fórmula temos:
Exemplo 02 comentado
Oziel
Márcia
Vitória
UEG 2013/1 – (com adaptações) A professora Maria Paula registrou as notas de sete alunos,
obtendo os seguintes valores: 2, 7, 5, 3, 4, 7 e 8. A moda das notas desses alunos é:
a) 6
b) 7
c) 8
d) 9
Neste segundo caso, a mediana será dada pelos elementos centrais 3 e 5, o que pode ser feito
com uma média aritmética simples, isto é, mediana igual a 4.
Exemplo 01 comentado
Destacando os elementos centrais (já que temos uma quantidade par de elementos):
Destacando os elementos centrais (já que temos uma quantidade par de elementos):
Md=18°C
Mo= 13,5°C já que foi o elemento com maior frequência.
MEDIDAS DE DISPERSÃO
Enquanto que as medidas de tendência central indicam se os
dados tendem a concentrar-se em torno dele, as medidas de
dispersão indicam se aquelas possuem distorções.
Elas indicam e quantificam o espalhamento dos valores da
amostra ou da população em torno da medida de
centralidade. Acompanhe a seguinte situação.
MEDIDAS DE DISPERSÃO
Em um time, com três membros, apenas um irá competir na final representando a equipe.
Abaixo está apresentada a pontuação em cinco jogos da temporada.
Além do desvio médio, também é possível calcular o desvio padrão, a partir do resultado da
variância. As vantagens em utilizar o desvio padrão surge para conjuntos de dados com
números extensos e com muitos elementos (acima de 30). Ele elimina erros de
arredondamento. Dois novos conceitos apareceram certo? Vamos estudá-los agora.
Obs: outra forma de tornar a diferença entre xn-x sempre positiva ou nula sem a utilização do
módulo é elevando o resultado ao quadrado, xn- x2
MEDIDAS DE DISPERSÃO - Variância
A variância de um conjunto de n valores é dada pela média aritmética dos quadrados dos
desvios médios de cada valor em relação à média.
Fórmulas
Fórmula
Quanto mais próximo de zero estiver o desvio padrão, mais regular será o conjunto de valores,
ou seja, mais próximo da média estarão esses valores.
Dados:
Fogões
R$ 329,00; R$539,00; R$719,00; R$389,00; R$899,00; R$299,00 e R$ 319,00
Sanduicheiras
R$57,00; R$47,00; R$117,00; R$50,00; R$ 44,00; R$85,00 e R$67,00.
Definindo a amplitude de cada classe temos: (19,4 – 0,5)/7 = 18,9/7 = 2,7. Segue a tabela com
os intervalos.
⊢
⊢
⊢
⊢
⊢
⊢
⊢
Gabarito
Organizando os dados em ROL. Retornando a tabela e completando as
colunas das frequências temos:
⊢
⊢
⊢
⊢
⊢
⊢
⊢
Gabarito
3) Considerando (26 – 12) temos que a segunda classe, de maneira absoluta tem 14 elementos.
Letra a.
4) Dados:
Fogões
R$ 329,00; R$539,00; R$719,00; R$389,00; R$899,00; R$299,00 e R$ 319,00
Sanduicheiras
R$57,00; R$47,00; R$117,00; R$50,00; R$ 44,00; R$85,00 e R$67,00.
Calculando as médias
Gabarito
Calculando as variâncias das amostras - Fogão.
Gabarito
Calculando as variâncias das amostras -Sanduicheiras
Gabarito
Calculando os desvios padrão
Resposta: o preço do fogão foi o que mais variou, já que os preços ficaram mais
espalhados com relação à média, o que aconteceu em menor medida quando fizemos a
mesma análise para as sanduicheiras. Já o desvio padrão com relação à média para o
fogão foi de R$ 232,16, já para a sanduicheira foi de R$ 26,27.
Unidade 4: Probabilidade
Introdução EDA
Olá! Estudante,
Com valores entre 1 e 60, quantos jogos podemos fazer com combinações de 6 números?
Observe que até aqui não falamos em probabilidade, mas sim em combinações. Por isso,
vamos conceituar análise combinatória.
A análise combinatória
faz o estudo das
possibilidades de um
dado evento ocorrer sem
necessariamente
descrever todas elas.
Análise Combinatória
Antes de calcular todas as possibilidades de combinações de 6 elementos, tomados 60
elementos possíveis, vamos fortalecer a sua base e relembrar os principais conceitos da
análise combinatória. Para te ajudar a entender esse assunto ou a relembrar, para aqueles
que já conhecem, selecionei três vídeos que explicam de maneira bem simples.
Agora que você já assistiu as vídeo aulas, que tal praticar com os
exercícios formativos disponibilizados na unidade? São 8
questões a respeito dos conceitos apresentados.
Fonte;
https://tribunadovale.com.br/index.php/mega-sen
a-acumula-e-premio-pode-chegar-a-r-36-milhoes
-proxima-semana-tem-tres-sorteios/
Análise Combinatória
Atenção! Cinquenta
milhões, sessenta e três
mil e oitocentas e
sessenta possíveis
combinações, ou possíveis
jogos com seis números
distintos. É bastante!
Análise Combinatória
Para ter certeza de que um jogo - uma combinação - será
sorteado teremos que realizar 50.063.860 jogos. Se cada um
custa R$ 4,50, logo o investimento obrigatório deverá ser de
R$225.287.370,00.
Para inspirar
“Os que se encantam com a prática sem a ciência são como
os timoneiros que entram no navio sem timão nem bússola,
nunca tendo certeza do seu destino.”
Leonardo da Vinci
A história da probabilidade
Por que estudar probabilidade?
A teoria da probabilidade teve início, não exclusivamente, mas
fortemente, com os jogos que dependiam da sorte, como os jogos de
cartas, dados, tabuleiros, roletas.
Chevalier Méré, cidadão parisiense e típico jogador, propôs à Blaise
Pascal, matemático, questões sobre as possibilidades de um jogador
vencer um “jogo de sorte”. Pascal junto ao matemático Pierre de
Fermat estudaram e desenvolveram o estudo das incertezas, a
probabilidade. Isso aconteceu há muito tempo, porém o estudo deste
ramo da matemática não se limita ao estudo de jogos de sorte.
Por que estudar probabilidade?
Desta forma, um evento aleatório acontece quando o fenômeno realizado tem resultados
imprevisíveis, entre os possíveis desfechos, e possuem condições iguais para todas as
possibilidades.
Experimento aleatório
Vamos para um exemplo prático!
Vamos juntos!
Espaço amostral
a) 82,3
b) 85,5
c) 97,6
d) 98,2
Exercícios com o professor
Resolvendo:
Atenção: existem outros caminhos para chegar nesta mesma resposta, faça da
forma que for mais fácil para você.
Exercícios com o professor
a) 2%.
b) 22%
c) 28%
d) 44%
e) 56%
Exercícios com o professor
Resolvendo:
As chances de ganhar na Mega-Sena são quase nulas, mas não nulas. Observe que, apenas
para fins de comparação, temos mais chances de capturar um Pokémon Shiny, um dos mais
raros no Pokémon GO, do que ganhar na Mega-Sena. A probabilidade de encontrar um
Pokémon Shiny é de 1 em 8.192 (0,012%).
Se você gosta e quer saber mais sobre outras probabilidades no Pokémon GO, segue o link.
(https://www.tudocelular.com/curiosidade/noticias/n128622/pokemon-go-shiny-e-como-captu
rar.html)
Probabilidade de ganhar na Mega-Sena
Acesse o site:
http://loterias.caixa.gov.br/wps/portal/loterias/landing/megasena/
Probabilidade de união de eventos e probabilidade condicional
Agora vamos analisar alguns casos especiais da probabilidade e que são bem comuns no dia a
dia. O primeiro caso é a Probabilidade da união de eventos, para acontecimentos mutuamente
exclusivos ou não mutuamente exclusivos. Antes, para melhor compreender esses conteúdos
vamos relembrar dois conceitos de Conjuntos Numéricos.
Exemplo:
Probabilidade de união de eventos e probabilidade condicional
Para este caso, estamos tratando de Mas quantas pessoas cumprem com a
acontecimentos mutuamente exclusivos, característica “ser menor de 20 anos e
pois uma pessoa não pode ter mais e casada”? Vamos pensar e separar os
menos do que 20 anos ao mesmo tempo, grupos.
nem estar casada e solteira oficialmente I - Existem 500 pessoas, das quais:
ao mesmo tempo. Dizemos que dois 150 são menores de 20 anos e não se
eventos são mutuamente exclusivos sabe ainda o estado civil delas.
quando, na ocorrência de um, o outro não Consequentemente, 350 são maiores
pode ocorrer. Outro exemplo é o de 20 anos.
lançamento de uma moeda: ou ela será
II - Em relação ao estado Civil, sabe-se
cara ou coroa.
que 400 são casadas, porém foi
informado que ninguém acima de 20
anos é solteiro. Portanto, conclui-se que
todos maiores de 20 anos são casados,
isto é, 350 pessoas e
consequentemente 50 pessoas casadas
são menores de 20 anos.
Probabilidade
III – resumindo temos:
Exemplo: se existem pessoas que preferem alimentos doces, existem os que preferem
alimentos salgados, mas sabemos que existem aqueles que gostam dos dois, sem problemas,
esse último grupo representa o conceito de não mutuamente exclusivos.
Mulheres Homens
Total 80 60
Antes de iniciar o último tópico desta unidade, indicamos este material extra
para aqueles que estão com mais tempo ou mais vontade de estudar sobre
Teoria dos Conjuntos. São 4 aulas do professor Ferretto.
Link:https://www.youtube.com/playlist?list=PLTPg64KdGgYgTXWPsURDnPBd
7GUwPVBLx
Sim é isso mesmo que você está pensando. Como o nome sugere é um evento
condicionado à ocorrência de outro, isto é, dados dois eventos A e B de um
espaço amostral S, a probabilidade do evento A ocorrer quando B já tiver
ocorrido é chamada de probabilidade condicional de A em relação à B.
Probabilidade condicional
Para um melhor compreensão analisaremos um caso:
Em uma confraternização de 12 amigos, estava sendo sorteada uma caixa de chocolate entre
eles, e todos tinham iguais condições de ganhar. Sabe-se que o número sorteado foi ímpar.
Qual a probabilidade de o número sorteado ser maior que 6?
Você percebeu uma condição aí? Se não, pense bem, o espaço amostral foi delimitado, agora
somente os números ímpares fazem parte dele.
Antes do sorteio e dos eventos surgirem, o espaço amostral era {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11,
12} e as chances de cada um seriam facilmente calculadas por: P=1/12 ou 0,083 ou 8,3%.
Porém ao sortear um número, surgiu o primeiro evento A, que reduziu o espaço amostral aos
números ímpares, n(A)= {1, 3, 5, 7, 9, 11}, ao identificarmos a condição, além de ímpar, ser
também maior que 6, criou-se o evento B, portanto, n(B)= {7, 8, 9, 10, 11, 12}.
Probabilidade condicional
Desta forma, a resposta deve ser um número ímpar maior que 6; vamos aos cálculos! Ser ímpar
e maior que 6, isto é a interseção entre os conjuntos A e B, sendo assim temos n(A∩B) = {7,
9,11}. Calculando a probabilidade condicional temos:
Fonte;
https://www.freepik.com/free-photo/business-people-havin
g-meeting-office_2911112.htm#page=1&query=meeting&p
osition=48
Probabilidade condicional
Homens Mulheres
Administradores (as) 3 7
Engenheiros (as) 8 5
Economistas 9 8
Inicialmente já percebemos que o espaço amostral foi alterado, pois antes eram 40 pessoas
(homens e mulheres) e a partir da escolha de uma mulher, um evento A foi criado, que é o
total de mulheres (20). A questão pede a probabilidade de uma economista ser sorteada,
sabendo disso, podemos calcular a probabilidade de uma mulher economista ser sorteada:
Probabilidade condicional
Inicialmente já percebemos que o espaço amostral foi alterado. Observe que antes eram 40
pessoas (homens e mulheres), mas com com a escolha de ser uma mulher sorteada, o
evento A foi criado, com um total de 20 mulheres. A questão solicita a probabilidade de uma
que uma economista ser sorteada, ou seja, n(B)= 17 (todos os economistas), sendo 8
mulheres neste grupo. Calculando:
Probabilidades independentes
Você pode estar com uma dúvida: e se os eventos não tivessem nada em comum, sem relação
alguma um com o outro? Você pensou nisso? Se não, é importante pois para este caso teremos
as chamadas probabilidades independentes, vamos entender como funciona na prática?
Exemplo 1 - A probabilidade de um homem jovem ter cálculo renal daqui a 30 anos é 19% e
de sua mulher 5%. Qual é a probabilidade de que daqui a 30 anos:
Neste caso, precisaremos da probabilidade de o homem não ter cálculo renal, isto é 81%.
Neste caso, precisaremos da probabilidade de o homem não ter cálculo renal, isto é 81% e da
mulher também não ter, 95%.
Probabilidades independentes
d) Pelo menos 1 deles tenha cálculo renal?
Desta forma, basta somar todas as probabilidades: 18,05% + 4,5% + 0,95% = 23,05%.
No desenrolar do nosso dia a dia deparamo-nos com situações que nos obrigam a tomar
decisões as quais nem sempre temos certeza. Apenas temos indicações que nos permitem
decidir com alguma probabilidade de acertarmos. Quando estamos falando de probabilidade,
queremos identificar a chance de ocorrência de um determinado resultado de interesse em
situações controladas. Desta forma, trabalhamos com chances ou probabilidades.
Olá! Estudante,
Chegamos à última unidade deste curso! Já aprendemos muita coisa
até aqui e pretendemos avançar um pouco mais nesta unidade 5.
Na unidade 4, você recordou os principais conceitos da análise
combinatória, estudou sobre a teoria da probabilidade e aplicou esta
teoria em situações reais.
Agora, o foco será nas relações entre a estatística e a probabilidade,
assim, por meio do estudo desta unidade 5, esperamos que você
consiga alcançar os seguintes objetivos de aprendizagem:
Você consegue imaginar algum fenômeno nesse estilo? Caso não consiga, não se preocupe,
pois separei alguns exemplos e estudaremos sobre eles ao longo deste texto.
Esse evento é raro ou comum?
Já reparou que alguns eventos são mais raros do que outros? Se não pensou, irei te contar
alguns exemplos. O primeiro deles é com relação ao tamanho médio das pessoas. Segundo a
BBC Brasil, o homem brasileiro tem, em média, 1,73m, e a mulher, 1,60m. Para homens, o Brasil
é o 68º (sexagésimo oitavo) colocado em altura entre os países pesquisados - ficando acima de
nações como Portugal, México e Chile e abaixo da Romênia, Argentina e Jamaica.
A mulher brasileira alcançou a 71ª (septuagésima primeira) posição; mais alta que a mulher
turca, argentina ou chinesa e mais baixa que as espanholas, israelenses e inglesas. Nos Estados
Unidos, por exemplo, a altura dos cidadãos começou a atingir um limite nos anos de 1960 e
1970. Ao longo do último século, homens e mulheres cresceram apenas 6 cm e 5 cm,
respectivamente. A genética explica algumas variações de altura pelo planeta, mas os
estudiosos afirmam que nosso DNA pode não ser o fator principal (AMOS BBC Brasil 2016).
Análise de frequência
Esse evento é raro ou comum?
a) Quais as duas notas mais comuns, nesta avaliação, para esta população de alunos?
b) Quais as quatro notas mais raras, nesta avaliação, para esta população de alunos?
Análise de frequência
Você percebeu uma similaridade Pense comigo, a partir dos histogramas
entre os histogramas apresentados apresentados, poderíamos representá-los a partir
até agora? Tratamos, inicialmente, de uma curva? Avalie a curva abaixo.
sobre a distribuição de frequência
das alturas dos brasileiros e depois
das notas dos alunos do Campus
Planaltina na OBMEP 2019. Será
coincidência? Já adianto que não.
Esse tipo de distribuição de
frequência é muito comum nos
experimentos que tratam de variáveis
aleatórias, tão comum que achamos
normal histogramas com formatos
parecidos com os anteriores.
https://www.youtube.com/watch?v=Kq7e6cj
2nDw
Curva Gaussiana
A distribuição Gaussiana é a mais importante distribuição contínua por vários
motivos, dentre eles, o Teorema Central do Limite. Este Teorema é um resultado
fundamental em aplicações práticas e teóricas, pois ele garante que mesmo que um
conjunto de dados não seja normalmente distribuído, a sua média converge para
uma distribuição normal à medida que os dados aumentam. Segue um exemplo de
curva gerada por amostra de 100 elementos com média= 50 e Desvio Padrão=100.
Curva Gaussiana
Curiosidade
Leitura complementar
http://elaestaemtudo.ime.usp.br/?portfolio=new-mobile-app-3-2-2-5-2-2
Estatística e probabilidade
Iniciamos essa unidade tratando da distribuição de frequência de eventos
aleatórios. Por isso, antes de aprendermos mais sobre a distribuição de
frequências, vamos entender um pouco mais sobre a relação entre a
estatística e a probabilidade. Vamos lá?
Se uma variável aleatória assume somente os Exemplo: vamos supor que, em certa
valores zero e um, as probabilidades podem comunidade, a probabilidade de uma
ser apresentadas pela dupla 1-p e p, pessoa ter problemas de psicose seja
respectivamente, ou seja, sua distribuição é igual a 0,01. Se definimos:
dada por:
{1, se uma dada pessoa da comunidade
tem psicose, 0, em caso contrário.
Continuando ...
1 Pense no exemplo da avaliação com 10 questões, compare com o
seguinte conceito e depois verifique se estamos falando do mesmo
cenário. Vamos lá?
Gabarito do exercício 1
Distribuição Binomial
A Distribuição Binomial descreve a probabilidade num experimento que envolve certo número
𝑛 de ensaios de Bernoulli. Segundo Azevedo (2016), se uma variável aleatória X corresponde
ao número de sucessos em n repetições de um experimento binomial (k), sendo p a
probabilidade de sucesso em cada repetição, então, se diz que X tem distribuição binomial com
parâmetros n e p e a função de probabilidades é dada por:
Distribuição Binomial
a) acertar seis dos seis b) acertar cinco dos seis c) acertar quatro dos seis
problemas problemas problemas
Distribuição Binomial
Já temos as probabilidades para cada caso e todas elas nos servem, concorda?
Então, vamos somar todas elas. Some e confirme o resultado 0,54432, isto é, a
probabilidade desse estudante ser aprovado é de 54,43%.
Iniciamos essa unidade conversando sobre eventos raros, você se recorda? Agora, iremos
aprender sobre uma distribuição que está associada a eles, a distribuição de Poisson. Saiba
que, em muitas ocasiões, nos deparamos com a situação em que o número de ensaios n é
grande (n→∞) e p é pequeno (p→0), no cálculo da função binomial, o que nos leva a algumas
dificuldades, pois, como podemos analisar, para n muito grande e p pequeno, fica
relativamente difícil calcularmos a probabilidade de k sucessos a partir do modelo binomial,
isto é, utilizando a função de probabilidade (PORTAL ACTION, 2019).
Prazer em te conhecer!
Gabaritos
1)
Já temos as probabilidades para cada caso e todas elas nos servem, concorda? Então, vamos
somar todas elas. Some e confirme o resultado 0,45568, isto é, a probabilidade desse
estudante ser reprovado é de 45,57%. Mas atenção, o exercício pediu a probabilidade da
aprovação, ou seja, probabilidade desse estudante ser aprovado é de 54,43%.
Gabaritos
3) Calculando a probabilidade de serem vendidos exatamente 7 seguros.
Temos aqui a função probabilidade pela distribuição Poisson:
Aproximadamente 6%.
A probabilidade de em uma determinada hora serem vendidos menos que 3 seguros é o
mesmo que vender 0, 1 ou dois seguros em uma hora, vamos calcular as probabilidades
separadamente.
ALVES, Vilmar dos Santos. Estatística aplicada. Curso Técnico – Rede E- Tec. (IFRO). Cuiabá:
Ed.UFMT, 2013.
AMOS, Jonathan. Brasileiro cresce em altura nos últimos cem anos, mas ainda é 'baixinho';
conheça o ranking mundial. BBC New Brasil. (2016). Disponível em:
<https://www.bbc.com/portuguese/geral-36892772>. Acesso em: 20 de ago.2019.
AZEVEDO, Paulo Roberto Medeiros de. Introdução à estatística [recurso eletrônico] / Paulo Roberto
Medeiros de Azevedo. - 3. ed. - Natal, RN : EDUFRN, 2016.
BERQUÓ, E.S; Souza, J.M.P.; Gotlieb, S.L.D. Bioestatística. 2º Ed., Editora pedagógica e Universitária,
São Paulo, 1981, p.1-6.
CRESPO, Antônio Arnot. Estatística Fácil. 19.ed. atual – São Paulo: Saraiva, 2009.
Referências
Revisora de Conteúdo
Equipe DEaD Lidiane Szerwinski Camargos
Hênio Delfino
Iago Vaz