Unid 1
Unid 1
Unid 1
Nascido em São Paulo‑SP, é formado em Engenharia Mecânica pela Faculdade de Engenharia Industrial (FEI) e
pós‑graduado em Formação Didática do Ensino Superior. Desempenhou funções de gerente e diretor em diversas
empresas nacionais, nas áreas de Engenharia, Manutenção e Produção. É professor do Ensino Superior desde 1986,
atuando em diversas faculdades e universidades, lecionando disciplinas voltadas para a formação de administradores,
tanto na área da Matemática quanto na de Administração. Na UNIP, ministra aulas desde 1993, nas disciplinas de
Estatística, Administração da Produção e Materiais e Pesquisa Operacional.
CDU 519.2
© Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida por qualquer forma e/ou
quaisquer meios (eletrônico, incluindo fotocópia e gravação) ou arquivada em qualquer sistema ou banco de dados sem
permissão escrita da Universidade Paulista.
Prof. Dr. João Carlos Di Genio
Reitor
Comissão editorial:
Dra. Angélica L. Carlini (UNIP)
Dra. Divane Alves da Silva (UNIP)
Dr. Ivan Dias da Motta (CESUMAR)
Dra. Kátia Mosorov Alonso (UFMT)
Dra. Valéria de Carvalho (UNIP)
Apoio:
Profa. Cláudia Regina Baptista – EaD
Profa. Betisa Malaman – Comissão de Qualificação e Avaliação de Cursos
Projeto gráfico:
Prof. Alexandre Ponzetto
Revisão:
Juliana Maria Mendes
Amanda Casale
Sumário
Estatística
APRESENTAÇÃO.......................................................................................................................................................7
INTRODUÇÃO............................................................................................................................................................8
Unidade I
1 ANÁLISE EXPLORATÓRIA DE DADOS........................................................................................................ 13
1.1 Dados e variáveis estatísticas........................................................................................................... 13
1.2 Classificações das variáveis............................................................................................................... 15
1.3 Amostragem............................................................................................................................................ 17
2 PROCESSOS ESTATÍSTICOS............................................................................................................................ 20
2.1 Coletas de dados.................................................................................................................................... 21
3 REPRESENTAÇÃO DOS DADOS COLETADOS.......................................................................................... 23
3.1 Conceito de frequência....................................................................................................................... 23
3.2 Distribuições ou tabelas de frequências...................................................................................... 24
3.2.1 Dados isolados ou dados não agrupados em classes.............................................................. 24
3.2.2 Dados agrupados em classes............................................................................................................. 27
3.3 Frequências acumuladas.................................................................................................................... 31
4 REPRESENTAÇÕES GRÁFICAS...................................................................................................................... 34
4.1 Histogramas............................................................................................................................................. 35
4.2 Gráficos de colunas.............................................................................................................................. 36
4.3 Gráficos de barras................................................................................................................................. 37
4.4 Diagramas de ogiva.............................................................................................................................. 39
4.5 Setorgramas............................................................................................................................................ 43
4.6 Gráficos de dispersão........................................................................................................................... 46
Unidade II
5 MEDIDAS OU PARÂMETROS ESTATÍSTICOS........................................................................................... 54
5.1 Medidas de posição.............................................................................................................................. 54
5.1.1 Média............................................................................................................................................................ 54
5.1.2 Mediana...................................................................................................................................................... 60
5.1.3 Moda............................................................................................................................................................. 66
5.2 Medidas de dispersão.......................................................................................................................... 72
5.2.1 Medidas de dispersão absolutas....................................................................................................... 73
5.2.2 Medidas de dispersão relativas......................................................................................................... 83
6 RELAÇÕES GRÁFICAS ENTRE AS MEDIDAS ESTATÍSTICAS............................................................... 86
6.1 Assimetria................................................................................................................................................. 87
6.2 Curtose...................................................................................................................................................... 88
7 TEORIA ELEMENTAR DAS PROBABILIDADES......................................................................................... 92
7.1 Definições de probabilidades............................................................................................................ 92
7.2 Cálculos das probabilidades elementares.................................................................................... 94
7.3 Árvores de decisões.............................................................................................................................. 96
7.4 Análises combinatórias....................................................................................................................... 98
7.5 Experimentos aproximadamente aleatórios.............................................................................103
7.6 Eventos soma e Eventos produto.................................................................................................105
7.7 Eventos independentes e eventos vinculados.........................................................................108
8 REVISÃO TEÓRICA DOS CONCEITOS ESTUDADOS.............................................................................110
APRESENTAÇÃO
O administrador de empresas tem como uma das suas mais importantes funções, se não for a mais
importante, tomar decisões. O ideal é que essas decisões sejam tomadas da maneira mais racional
possível, com a maior quantidade de informações objetivas que conseguir. Evidentemente nem sempre
isso será possível. Administrar, normalmente, é trafegar num ambiente cambiante, que a cada momento
apresenta características diferentes. A Estatística, no entanto, colabora de maneira decisiva para
aumentar, a custos razoáveis, o grau de objetividade das decisões que tomamos ao longo da nossa vida
profissional.
Em qualquer atividade humana – e a Administração não é exceção–, lidamos com situações, com
problemas, com questões que apresentam algum grau de incerteza, algum grau de imprevisibilidade.
Evidentemente em profissões como Engenharia o grau de imprevisibilidade é muito menor do que em
Administração, por exemplo, mas também ocorre. Lidar com essas imprevisibilidades é a função mais
central da Estatística.
Imagine por um instante que necessitamos tomar uma decisão administrativa. Por exemplo, em que
tipo de aplicação investir o capital da nossa empresa, ou qual o melhor processo de fabricação do nosso
produto, ou, ainda, qual a melhor mídia para a campanha publicitária de lançamento de um novo produto?
Perceba como essas decisões estão submetidas a incertezas: não podemos “adivinhar” a valorização exata
de uma aplicação, nem a produtividade real de um processo e menos ainda a efetividade de uma campanha
publicitária, mas, se tivermos informações históricas de ocorrências similares anteriores, nós poderemos
decidir com um maior grau de confiança. Além disso, no caso de podermos saber até que ponto essas
ocorrências anteriores permanecem válidas, melhores ainda serão nossas decisões.
A Estatística vai nos ajudar nessas questões, primeiro coletando, organizando e “digerindo” as
informações históricas para, em seguida, extrapolar essas conclusões para situações futuras, para novos
cenários, para novos ambientes, permitindo que o administrador pise em chão mais firme.
Nosso curso foi montado exatamente considerando esse conceito. Primeiramente, nesta disciplina,
Estatística, iremos estudar o manuseio dos dados históricos em seus diversos ângulos. No futuro, na
disciplina Estatística Aplicada, nós veremos como esses estudos podem ser generalizados para outras
situações futuras ou em ambientes diferentes.
Uma situação que todos nós acompanhamos ciclicamente pode nos ajudar a entender o objetivo
deste curso e mesmo da disciplina Estatística. A cada dois anos, acompanhamos com interesse as eleições
para os diversos casos públicos. Quatro ou cinco meses antes da eleição, já desejamos saber quem será
o próximo Presidente da República, por exemplo. Claro está que isso não é, objetivamente falando,
possível antes que a eleição se consubstancie na data estabelecida, mas conseguimos nos aproximar
muito dos resultados por meio do processo conhecido como pesquisa eleitoral.
Como é feita essa pesquisa? Primeiro é escolhido um pequeno grupo de eleitores, algumas vezes,
menos de mil pessoas. A esses eleitores, pergunta‑se em quem votariam se a eleição fosse naquele
momento. As respostas coletas são organizadas e trabalhadas, e a partir desse trabalho os jornais e
7
as revistas publicam previsões do resultado da eleição. Obviamente esse resultado não é exato nem
imutável, mas nos dá uma boa ideia de como evolui a campanha eleitoral.
Esse processo é exatamente o que pretendemos abordar neste curso. A partir de informações
coletadas sobre determinado assunto, podemos prever o comportamento do ambiente, no futuro ou
em outro contexto. Claro que sempre tendo em vista que, para nós, a Estatística é mais uma ferramenta
para nosso uso como administradores.
Esperamos que, com este material, você tenha a oportunidade de aprender os conceitos básicos de
Estatística e esteja apto a continuar os estudos nessa área quando necessário for.
Observe que este texto foi produzido para apresentar os principais conceitos de Estatística da
maneira mais aproximada possível da prática administrativa, evitando‑se, portanto, aprofundamento
desnecessário na área de cálculo; é indispensável, no entanto, uma base matemática já adquirida em
disciplinas anteriores. Na medida do possível, procuramos rever os conceitos matemáticos necessários.
O estudo da Estatística, como o de todas as Ciências Exatas, obriga à repetição, o maior número de
vezes possível, de exercícios de fixação. No presente material, os cálculos definidos são mostrados uma
vez, como exemplo, e repetidos em alguns exercícios de fixação, mas o aluno deve se lembrar de que
terá à disposição, nos materiais complementares, uma grande quantidade de exercícios e problemas, e
de que o aprendizado somente será garantido caso estes sejam feitos em sua totalidade.
Bons estudos!
INTRODUÇÃO
O primeiro passo no nosso caminhar é entender o que é, como se divide e quais são os objetivos da
Estatística, algo que faremos imediatamente.
Deve‑se notar que a população estatística normalmente é muito numerosa, às vezes infinita e,
eventualmente, formada por elementos ainda não existentes. Assim, quando quisermos saber qual é
a expectativa de vida de um brasileiro, estaremos diante de uma população muito extensa (todos os
brasileiros) e formada por elementos prováveis, visto que as pessoas que estão sendo estudadas ainda
não morreram.
Em razão dessas características da população, o processo estatístico começa pelo estudo de uma
amostra, que é uma parcela da população, mas uma parcela coerente com esta, ou seja, que segue
todas as características dessa população. Assim, por exemplo, se determinada população tiver 62% de
mulheres, as amostras tiradas desta deverão ter 62% de mulheres, se o sexo for fator importante no
comportamento da característica estudada.
Uma amostra é finita e tem relativamente poucos elementos, de valores definidos. Desse modo, se
quisermos definir a expectativa de vida de todos os brasileiros, tomaremos uma amostra finita de poucos
brasileiros já falecidos. Assim, haveria poucos elementos a se estudar e de valor definido (a idade em que
morreram). Deve‑se ressaltar que essa amostra retirada deve reproduzir todas as condições importantes
para a duração da vida da população, tais como sexo, posição socioeconômica, educação etc.
Tanto os elementos das populações quanto os das amostras assumem valores para a característica
que estamos estudando; por exemplo, a população formada pelos seguidores religiosos pode apresentar
católicos, evangélicos, espíritas etc. Esses são alguns dos valores que a variável religião pode assumir.
Assim, a característica da população ou da amostra que estamos estudando pode ser expressa de acordo
com uma variável, que pode assumir diferentes valores. Podemos distinguir as variáveis em dois grupos:
• variáveis qualitativas: apresentam atributos como valor, por exemplo, cor de cabelos, opções
sexuais, times de futebol etc.;
• variáveis quantitativas: apresentam valores numéricos, tais como peso e idade de pessoas, número
de defeitos na produção de uma peça etc., podendo, ainda, ser divididas em duas categorias:
– discretas: são variáveis que podem apresentar apenas valores predeterminados em um conjunto,
ou seja, não existirão valores intermediários (exemplos: número de filhos de um casal, número de
defeitos numa linha de produção, quantidade de ações em alta numa bolsa de valores etc.); essas
variáveis estão ligadas às contagens;
Lembrete
A existência dos conceitos de população e de amostra nos conduz à diferenciação entre dois campos
da Estatística: a Estatística Descritiva e a Estatística Indutiva.
Observação
Vamos supor que queiramos determinar a expectativa de vida dos brasileiros. A população,
evidentemente, é correspondente a todos os brasileiros vivos. Isso nos conduz a dois entraves: a
quantidade de elementos da população é muito grande, e os valores da variável idade de morte são
prováveis não reais. A maneira de se contornar isso é por meio da amostragem: tomamos uma amostra
(segundo regras estatísticas que veremos) que represente a população brasileira, ou seja, mesma divisão
por sexos, classes sociais, regiões geográficas etc., e cujos elementos, já tendo falecido, permitam a
coleta das idades de morte. Essa coleta, bem como todo o tratamento posterior da amostra, é feita
mediante a Estatística Descritiva, e os resultados desse tratamento estatístico da amostra são estendidos
à população inteira, por meio de ferramentas da Estatística Indutiva. Dessa forma, podemos determinar
a expectativa de vida de todos os brasileiros, com algumas ressalvas:
• a indução vale para a população como uma totalidade homogênea; não é possível aplicá‑la a um
indivíduo específico;
10
• a previsão é de um valor provável, portanto sujeito a um erro estatístico, ou seja, a uma faixa de
incerteza, determinada estatisticamente, em torno do resultado esperado; esse erro depende das
condições da população e da amostra.
Quando tratamos de um resultado obtido para uma população, falamos em valor provável, e não
num valor exato. Isso nos remete ao campo da Matemática que estuda a Teoria das Probabilidades.
O estudo da Teoria das Probabilidades, com os estudos da Estatística Descritiva e da amostragem, são
as ferramentas necessárias para a utilização da Estatística Indutiva.
O curso de Estatística foi dividido em duas unidades. Na Unidade I, trataremos dos assuntos
referentes à seleção e à coleta de dados, ponto de partida para qualquer estudo estatístico. Em seguida,
verificaremos como esses dados coletados são inicialmente tratados por meio da tabulação, do resumo
e da representação dessas informações, tanto do ponto de vista gráfico quanto do analítico. A Unidade
II trata dos parâmetros ou das medidas estatísticas. Primeiro, das medidas de posição, e em seguida, das
medidas de dispersão. Essa unidade também abordará a Teoria Elementar das Probabilidades.
11
ESTATÍSTICA
Unidade I
1 ANÁLISE EXPLORATÓRIA DE DADOS
Saiba mais
Entendemos como conjunto de dados o objeto de trabalho da Estatística. Esses dados são valores
assumidos pelos elementos de um conjunto de indivíduos que apresentam em comum uma característica
estudada. Caso você olhe à sua volta na empresa em que trabalha, verá uma grande quantidade de
indivíduos, todos eles dotados de infinitas características, tais como cor dos olhos e dos cabelos, altura
e peso, salário e idade, time de futebol do coração ou religião. Dessas infinitas características, estaremos
atentos a uma delas, objeto do nosso estudo estatístico.
Digamos que estejamos, no momento, desejando entender como se comporta a remuneração dos
funcionários dessa sua empresa. Iremos então coletar dados relativos a essa remuneração, ou seja, os
salários. Salário, portanto, será a característica que estudaremos e que poderá assumir um determinado
valor em uma faixa lógica.
Dizemos, assim, que, nesse referido estudo, salário é a variável estudada. Perceba que todos os
funcionários da empresa têm uma série de outras características, mas a que nos interessa é o salário. As
outras poderão ter importância para nós, mas não serão nossa variável de estudo. Coletar dados é obter
os diversos valores que a variável estudada assume.
13
Unidade I
Outro fator importante a ser observado é a quantidade de elementos com que temos condição
de trabalhar e a possibilidade ou não de medirmos seu valor. Dependendo dessas duas observações,
deveremos utilizar ferramentas diferentes de organização e análise dos dados. Observe os seguintes
exemplos, para tornarmos mais claro o raciocínio:
• Desejamos saber se os chefes de família das casas da rua em que moramos são mais ou menos
altos em relação ao conjunto de brasileiros de modo geral. A primeira providência a se tomar seria
medir todos os chefes de família, para obter os valores da variável estudada (altura). Perceba que,
a não ser que moremos numa rua muito extensa, o processo de coleta de dados não será tão
trabalhoso assim, principalmente pelo fato de que todos saberão responder a altura que têm.
• No entanto, caso desejemos saber se os chefes de família de todas as casas de nossa cidade são mais
ou menos altos em relação aos brasileiros, passaremos a ter um primeiro inconveniente: a quantidade
de elementos que deverão ser medidos. Mesmo que moremos numa cidade pequena, a quantidade
de dados a serem coletados pode atingir facilmente a casa dos milhares. Perceba que o trabalho que
teremos em levantar esses dados possivelmente não será compensado pela informação obtida.
Perceba, pelos exemplos anteriores, que, dependendo da situação, teremos dificuldades (ou
facilidades) diferentes. Em Estatística, costumam‑se dividir as situações descritas em dois grandes
campos: amostra e população.
Amostra é um conjunto que tem relativamente poucos elementos, e o valor da variável estudada
para esses elementos é real e verificável. É o caso do primeiro item.
População é o conjunto que tem relativamente muitos elementos e/ou cujos valores da variável
estudada não são reais e verificáveis, casos do segundo e do terceiro item.
Observe que, para configurarmos uma amostra, é necessário que a quantidade de elementos seja
pequena e o valor seja real; caso contrário, nós estaremos configurando uma população. Situações
envolvendo amostras terão tratamentos diferentes daquelas envolvendo populações.
Lembrete
É importante também notar que, quando falamos em quantidades grandes ou pequenas, estamos
relativizando‑as, ou seja, trabalhar com mil elementos pode ser uma grande quantidade ou uma pequena
quantidade, dependendo dos recursos (monetários, de tempo, de espaço etc.) disponíveis.
Exemplificando: suponha que queiramos levantar as idades de todos os alunos que estão cursando
Estatística neste semestre. Caso nós tenhamos ao nosso dispor os cadastros dos alunos no sistema de
informação da instituição, a quantidade de alunos será relativamente pequena, pois temos recursos
suficientes, mas se tivermos de consultar um por um dos alunos, a quantidade será relativamente
grande, pois não teremos recursos para tanto.
De modo geral, podemos dizer que informações envolvendo amostras são obtidas por meio da
Estatística Descritiva, e aquelas envolvendo populações, por meio da Estatística Indutiva; e que, para
conhecermos o comportamento estatístico das populações, retiramos delas amostras para estudo.
Observação
Vimos anteriormente que entendemos por variável a característica envolvida em nosso estudo estatístico.
Variáveis podem ser de vários tipos diferentes, os quais determinarão os estudos estatísticos possíveis.
Algumas variáveis expressam atributos ou qualidades dos indivíduos, por exemplo, religião, sexo,
estado civil etc. São as chamadas variáveis qualitativas. Outras apresentam como resultado possíveis
valores numéricos, por exemplo, número de filhos, altura, salário, idade etc. São as chamadas variáveis
quantitativas.
As variáveis qualitativas podem ser divididas em duas categorias: variáveis qualitativas nominais,
quando não é possível fazer nenhum tipo de ordenação, e variáveis qualitativas ordinais, quando
alguma ordenação é possível. Podemos citar como exemplos as perguntas que seguem.
Ao questionarmos “Você pratica esportes?”, há duas respostas possíveis: sim e não. Trata‑se,
portanto, de uma variável qualitativa nominal. Caso a pergunta fosse “Com que intensidade você pratica
esportes?”, a resposta poderia ser: nenhuma, pequena, média ou grande. Estaríamos tratando de uma
variável qualitativa ordinal.
As variáveis quantitativas, por seu lado, também podem apresentar duas categorias. As variáveis
quantitativas discretas são aquelas em que os resultados formam um conjunto finito e previsível
de números, enquanto as variáveis quantitativas contínuas apresentam como resultados todos os
15
Unidade I
valores numéricos em um intervalo de números reais. A pergunta “Quantos irmãos você tem?” produz
uma variável quantitativa discreta (0, 1, 2, 3...). Já a pergunta “Quanto você pesa?” gera uma variável
quantitativa contínua (qualquer valor dentro de uma faixa lógica para um ser humano). Para simplificar,
costumamos dizer que, quando contamos, estamos diante de uma variável quantitativa discreta, e,
quando medimos, estamos diante de uma variável quantitativa contínua. Contamos o número de
irmãos que temos e medimos nossa massa numa balança.
Um exemplo simples deixa mais clara essa ideia: suponha que uma instituição de ensino deseje
avaliar seus docentes. Para tanto, irá arguir seus alunos, e essa arguição poderá ser feita de uma das
formas a seguir:
• Numa escala de zero a cinco, avalie o desempenho do docente considerado. Você pode atribuir
ao docente uma avaliação de 3,4, por exemplo; ou seja, estamos trabalhando com uma variável
quantitativa continua, e essa é a forma que nos trará mais informações.
Exemplo de Aplicação
1. Considerando que as variáveis qualitativas se dividem em nominais (N) e ordinais (O) e que as
variáveis quantitativas se dividem em discretas (D) e contínuas (C), assinale a alternativa que relaciona
correta e respectivamente as seguintes variáveis estatísticas: número de defeitos numa linha de produção;
tempo de casa dos funcionários de uma empresa; cores das camisetas de uma coleção de verão; vendas
anuais em reais dos produtos de uma empresa; satisfação dos clientes com nossos serviços; bairro em
que moramos:
A) C; C; N; C; O; N.
B) D; C; N; C; O; N.
16
ESTATÍSTICA
C) D; C; N; N; O; N.
D) D; C; N; C; N; N.
E) C; C; N; C; O; N.
1.3 Amostragem
Abordamos anteriormente que amostra e população são tratadas de maneira diversa na Estatística
e também que os elementos de um conjunto de indivíduos têm inúmeras características, uma das
quais está sendo estudada e é chamada de variável. Falta falarmos das demais características desses
elementos e de algumas relações entre populações e amostras.
Frequentemente, quando desejamos saber algo a respeito de uma população, utilizamos uma
amostra como campo de estudo do fenômeno e expandimos (extrapolamos) as conclusões para a
população. A situação mais conhecida e mais didática que podemos usar são as pesquisas eleitorais.
Meses ou dias antes de uma eleição, desejamos saber (antever, prever ou predizer) o resultado
dessa eleição. Isso é possível, com certa margem de erro, por meio de um processo conhecido como
amostragem. Esse processo se inicia no planejamento da amostra, que deve reproduzir em pequena
escala todas as características da população. A ideia é a mesma do enólogo (aquele que prova vinhos):
ele não precisa beber uma garrafa inteira (ou um tonel) para dizer se o vinho é bom ou ruim; basta
uma pequena dose, a amostra. Ocorre que o vinho é uma substância totalmente homogênea, todas
as partes dele são idênticas. Já se fosse uma feijoada, não teríamos a mesma homogeneidade. A
feijoada é heterogênea.
Isso significa que não podemos usar o mesmo princípio de amostragem do vinho para a feijoada? Não.
Podemos usar sim, mas com alguns cuidados. Na amostra de feijoada que iremos provar, é necessário
que todas as suas partes sejam representadas, ou seja, precisamos pegar um prato em que estejam
representados todos os componentes da feijoada (linguiças, paio, toucinho etc.). É mais fácil definir a
qualidade do vinho do que de uma feijoada, ou seja, termos maior margem de erro no teste da feijoada
que no do vinho. Por quê? Justamente em razão da heterogeneidade da feijoada. Anote isso; voltaremos
a esse assunto oportunamente.
17
Unidade I
Quando fazemos uma pesquisa eleitoral, queremos saber em quem o leitor irá votar, ou seja, a
característica que nos interessa é a intenção de voto. Portanto, a variável de uma pesquisa eleitoral é a
intenção de voto. Mas essa não é a única característica com a qual iremos nos preocupar.
Sabemos por experiência anterior que, por exemplo, homens e mulheres têm comportamentos
diferentes na hora de votar; em outras palavras, utilizam critérios diferentes para escolher suas preferências.
Dessa forma, quando tomarmos uma amostra, precisaremos tomar cuidado com a quantidade de homens
e mulheres que dela farão parte. Não podemos considerar uma amostra na qual só temos homens ou
mulheres. Digamos que vamos fazer uma pesquisa eleitoral na cidade, a partir de uma amostra de mil
eleitores. Essa amostra deverá ser formada por 482 homens (48,2% de 1.000) e por 518 mulheres (51,8%
de 1000). Do mesmo modo nós devemos nos comportar com relação às outras características que têm
importância na definição dos votos. Isso quer dizer que devemos manter a proporcionalidade de eleitores
com relação à idade e à classe econômica, características que sabidamente influem na definição de voto.
Caso não seja feito assim, introduziremos uma falha no nosso processo estatístico, um viés estatístico.
E a característica “time de futebol preferido”? Precisamos nos preocupar com ela? Evidentemente
não. A preferência por um time de futebol não interfere na opção de voto (a não ser em casos muito
especiais, dos quais a estatística não consegue se encarregar).
Podemos, portanto, dividir as características dos elementos de uma população ou de uma amostra
em três categorias: a(s) características(s) estudada(s), chamada(s) variável(eis) estatística(s); as
características principais, que definem a proporcionalidade das populações e suas amostras; e as
características secundárias, que não interferem nos nossos estudos estatísticos. Assim, é possível
assumir que, a partir de uma amostra corretamente estabelecida, é possível conhecer uma população,
18
ESTATÍSTICA
por maior que seja ou menos reais que sejam seus elementos. O princípio é o mesmo do enólogo.
Conhecermos o todo por uma pequena parte.
Claro que esse conhecimento não será composto de certezas absolutas; deverá haver alguma
incerteza; em outras palavras, certa tolerância com as nossas conclusões. Assim, se numa amostra
colhida para uma pesquisa eleitoral for revelada a preferência de 46% pelo candidato A, poderemos
afirmar que a população provavelmente também terá 46% de eleitores para esse candidato, mas isso
não é uma certeza: pode haver alguma variação, para mais ou para menos.
• grau de homogeneidade da população: quanto mais homogênea for uma população, menor será
a margem de erro;
• tamanho da amostra tomada: quantidade de elementos da qual é composta; dessa forma, uma
pesquisa com mil eleitores tem maior margem de erro do que uma feita com 5 mil eleitores;
• grau de confiabilidade com o qual queremos trabalhar: podemos optar por ter maior ou menor
confiança nas respostas obtidas; quanto maior confiança quiser ter, maior será a margem de erro.
Exemplo de Aplicação
I – Para que se possa estender para a população os resultados obtidos numa amostra, é necessário
que amostra e população sejam proporcionais, ou seja, tenham todas as características importantes
dos elementos representadas proporcionalmente.
II – Sempre que se induz uma conclusão da amostra para a população, ela será provável, ou seja,
dotada de uma margem de erro.
A) I; II.
B) I; III.
C) I; IV.
19
Unidade I
2 PROCESSOS ESTATÍSTICOS
Utilizando os conceitos dos itens anteriores, podemos definir os passos do processo estatístico.
• Definir objeto de estudo, populações e amostras envolvidas. Planejar amostras de modo que
representem corretamente, sem vieses, as populações de que foram retiradas.
• Coletar os dados amostrais, ou seja, medir a variável estatística de cada um dos elementos da
amostra.
• Tabular e representar os dados colhidos na forma de tabelas e gráficos, que permitam visualizar
de modo amigável as informações disponíveis.
• Cálculo dos parâmetros estatísticos. Esses parâmetros são medidas que “resumem” as informações
coletadas de modo mais imediato.
Os primeiros passos constituem o campo da Estatística Descritiva, objeto de estudo deste livro‑texto.
O último passo vale‑se dos anteriores e é o campo da estatística indutiva, assunto que veremos na
disciplina Estatística Aplicada.
Passaremos a nos preocupar com cada um dos passos descritos, visando percorrer todo o processo
estatístico.
Saiba mais
20
ESTATÍSTICA
A coleta de dados é uma operação típica de campo na qual identificamos os valores da variável
estatística para todos os elementos de uma amostra previamente definida. Frequentemente, essa amostra
tem seus elementos definidos por escolha aleatória, ou seja, sorteamos um elemento da população para
fazer parte da amostra. Como exemplo, imagine que um pesquisador de campo precise entrevistar
um eleitor com as seguintes características: mulher; classe econômica B; grau de instrução superior;
idade entre 30 e 35 anos; moradora da zona leste. Essa tarefa que lhe foi confiada teria origem no
planejamento da amostra feito de acordo com os conceitos vistos no item anterior.
Para cumprir sua tarefa, o pesquisador irá a um local em que mais provavelmente encontrará
alguém nessas condições e, após algumas pré‑entrevistas, determinará um elemento com exatamente
essas características. Esse elemento fará parte da amostra planejada e, para ele, o pesquisador fará as
perguntas necessárias, por exemplo, em quem o entrevistado pretende votar.
As respostas dos elementos escolhidos para a amostra constituirão os dados brutos ou rol do estudo,
ou seja, uma relação das respostas às questões sem nenhum tipo de ordenação, classificação ou elaboração.
A Tabela 2 exemplifica os dados brutos de uma pesquisa fictícia feita entre 42 alunos de uma
universidade a respeito de alguns assuntos:
21
Unidade I
Observe que as características arroladas na Tabela 2 são variáveis de diferentes tipos, como mostrado
no quadro a seguir:
22
ESTATÍSTICA
A Tabela 2 relaciona uma grande quantidade de dados que dificilmente poderão ser entendidos se
não forem agrupados, organizados, resumidos e apresentados de modo minimamente atraente.
As maneiras mais comuns de trabalharmos esses dados são o assunto do nosso próximo tópico.
Saiba mais
Trata‑se do número de vezes em que determinado valor (ou faixa de valores) se repete na amostra.
Inicialmente, podemos citar:
• Frequência simples (fi): é o número de vezes em que determinado valor aparece, contado diretamente.
O símbolo mencionado significa a frequência do iésimo valor, ou seja, de um determinado valor
que será numerado em sequência. Desse modo, o primeiro valor terá a frequência f1, o segundo,
a frequência f2 e assim por diante. Essa notação do iésimo termo será utilizada em todas as
definições posteriores. A somatória de todas as frequências gerará a frequência total (ft), que
corresponderá, evidentemente, ao número total de elementos da amostra (N). A fórmula
matemática envolvendo essas definições é:
23
Unidade I
n n
ft = ∑fi ouN = ∑fi
i=1 i=1
• Frequência relativa (fri): é a frequência simples dividida pela frequência total, ou seja, é o “peso” que
cada valor tem na amostra total. Pode ser apresentada em valor decimal ou em valor percentual.
A somatória das frequências relativas de todos os valores é igual a 1 ou 100%.
fi f
fri = ou fri % = i × 100
ft ft
Com essas duas definições, podemos começar a agrupar os dados coletados em tabelas mais
resumidas; são as chamadas tabelas ou distribuições de frequências.
Esse formato é utilizado quando estamos trabalhando com variáveis qualitativas ou com variáveis
quantitativas discretas. Os valores dos dados são tomados como foram colhidos, sem nenhum tipo de
agrupamento, relacionados à sua frequência. Já que os valores são exatamente como foram colhidos,
não há perda de precisão. O inconveniente é que pode ser gerada uma tabela de frequências com muitos
dados, o que dificulta o tratamento estatístico. A Tabela 3 mostra alguns exemplos de distribuições de
frequências desse tipo, produzidas a partir dos dados brutos constantes da Tabela 2. Essa tabela foi
construída unicamente pela contagem e pelo relacionamento dos dados coletados. Assim, por exemplo,
na tabela de frequências de estados civis os valores possíveis encontrados na Tabela 2 são: casados,
divorciados e solteiros. Estes foram mostrados na tabela apenas em ordem alfabética. A frequência
simples foi obtida pela simples contagem dos componentes de cada uma das categorias. A frequência
total é a soma das frequências simples, e as frequências relativas, a divisão das frequências simples
pela frequência total. Assim, existem 11 alunos casados num total de 42 alunos, o que significa uma
frequência relativa de:
fi 11 f 11
fri = = = 0, 262 ou fri % = i × 100 = × 100 = 26, 2%
ft 42 ft 42
Raciocínio semelhante foi feito para as demais variáveis qualitativas e quantitativas discretas, como
se vê na tabela que segue.
24
ESTATÍSTICA
25
Unidade I
Exemplo de aplicação
3 (ENADE 2006 – Adaptado). A tabela a seguir mostra como se distribui o tipo de ocupação dos
jovens de 16 a 24 anos que trabalham em cinco regiões metropolitanas e no Distrito Federal.
Assalariados Autônomos
Regiões Setor
metropolitanas Setor privado público Trabalha Trabalha Empregado Outros
e Distrito Total Total para o para doméstico
Federal Com Sem
Total carteira carteira público empresas
assinada assinada
Belo Horizonte 79,0 72,9 53,2 19,7 6,1 12,5 7,9 4,6 7,4 (1)
Distrito Federal 80,0 69,8 49,0 20,8 10,2 9,8 5,2 4,6 7,1 (1)
Porto Alegre 86,0 78,0 58,4 19,6 8,0 7,7 4,5 3,2 3,0 (1)
Recife 69,8 61,2 36,9 24,3 8,6 17,5 8,4 9,1 7,1 (1)
Salvador 71,6 64,5 39,8 24,7 7,1 18,6 14,3 4,3 7,2 (1)
São Paulo 80,4 76,9 49,3 27,6 3,5 11,3 4,0 7,4 5,3 (1)
Fonte: Convênio DIEESE/Seade, TEM/FAT e convênios regionais. PED – Pesquisa de Emprego e Desemprego. Elaboração: DIEESE.
I – A região metropolitana que apresenta maior percentual de jovens sem carteira assinada é a de
Recife.
II – A região metropolitana que apresenta menor percentual de jovens no setor público é a de São
Paulo.
III – Salvador é a região metropolitana em que existe a maior relação de autônomos sobre assalariados.
A) I; II.
B) I; III.
C) I; IV.
26
ESTATÍSTICA
Esse formato é o indicado quando trabalhamos com variáveis quantitativas contínuas. Neste caso, os
valores são agrupados por classes, o que reduz a quantidade de informações trabalhadas, mas provoca,
consequentemente, uma perda de precisão.
A construção dessa tabela é mais trabalhosa que a anterior e se justifica pelo fato de que apresenta
os dados de modo mais resumido. Caso não a utilizássemos, iríamos produzir uma tabela de frequências
muito extensa, com excesso de valores diferentes, cada um deles com baixa frequência. Para construí‑la,
necessitamos definir alguns conceitos e tomar algumas decisões.
A primeira providência é escolher o número de classes (n) em que iremos agrupar os dados. Devemos
notar que, se utilizarmos muitas classes, aumentaremos o trabalho no tratamento dos dados; se
utilizarmos poucas, prejudicaremos a precisão das conclusões. Existem muitas recomendações diferentes
para a adoção do número de classes; adotaremos a relação de Sturges:
n = 1 + 3,33 log N
Onde n é o número de classes recomendado e N é o número de total de elementos da nossa amostra.
Lembre‑se de que:
N = ft
Na Tabela 1, temos uma amostra de 42 alunos; portanto, caso queiramos montar a tabela de frequências
das rendas familiares deles (que é uma variável quantitativa contínua), deveremos usar sete classes:
Observação
Como não podemos usar 6,4 classes, optamos pelo valor inteiro mais
próximo, acima ou abaixo. Nesse caso, decidimos usar sete classes porque,
assim, teremos mais precisão do que com seis.
Lembrete
Essas sete classes devem abranger todos os valores do rol que está sendo estudado, desde o menor
até o maior; assim, devemos determinar esses valores, que são chamados, respectivamente, de limite
mínimo da distribuição (Lmin) e limite máximo da distribuição (Lmax).
Em tese, o valor do limite inferior da distribuição coincide com o valor inicial da primeira classe
da tabela – esses valores iniciais de cada classe são chamados de limites inferiores de classe (lii)
–, e o limite superior da distribuição coincide com o valor final da última classe da distribuição –
esses valores finais de cada classe são chamados de limites superiores de classe (lsi). Na prática,
pode ser necessário algum ajuste desses últimos dois valores para podermos trabalhar com dados
arredondados.
Entre o limite superior e o limite inferior de cada classe, existe um intervalo chamado de intervalo
de classe (h). Este deve ser determinado a partir da amplitude total (At), que é a diferença entre o maior
e o menor valor do rol e do número de classes, mediante as seguintes fórmulas:
At
h=
n
A t = Lmax − Lmin
Desse modo, o limite superior de cada classe será o valor inferior dela mesma mais a amplitude de
classe, ou seja:
lsi = lii + h
Podemos determinar o intervalo (ou a amplitude) de classes, desde que tenhamos a amplitude
total; para tanto, precisamos determinar os valores máximos e mínimos da distribuição, que, no nosso
exemplo, são, respectivamente:
Lmax = R$10.567, 00
Lmin = R$956, 00
28
ESTATÍSTICA
Observação
Os demais limites superiores de classe são obtidos somando‑se o limite inferior da classe com a
amplitude da classe. O limite inferior de uma classe tem o mesmo valor do limite superior da classe
inferior. Assim, o limite superior da primeira classe é dado por:
Devemos definir também qual dos limites será aberto e qual será fechado, de modo que não haja
possibilidade de algum valor ficar sem sua classe perfeitamente definida.
Entende‑se por limite fechado aquele que inclui o valor nominal, e por limite aberto aquele que não
o inclui. Uma barra vertical indica o limite fechado, e sua ausência, o limite aberto. A simbologia para
um e para outro é a seguinte:
Na Tabela 3, a primeira classe é limitada pelos valores 956 e 2329, sendo o valor 956 um limite
fechado, e 2329, aberto. Isso quer dizer que o valor 956 está incluído nessa classe, e o 2329, na classe
seguinte.
29
Unidade I
Podemos fixar de modo arbitrário os limites aberto ou fechado, desde que para cada valor exista
uma e apenas uma classe possível.
Definidas as classes, procedemos à contagem dos elementos abrangidos por cada uma delas. O
número de elementos encontrados em cada uma é a já definida frequência simples.
Renda familiar
Frequências relativas
Classe Limites de classes em R$ Contagem Frequência simples
Decimal Percentual
1 956 |‑‑‑‑‑ 2329 IIIII IIIII III 13 0,310 31,0%
2 2329 |‑‑‑‑‑ 3702 IIIII IIIII I 11 0,262 26,2%
3 3702 |‑‑‑‑‑ 5075 IIIII III 8 0,190 19,0%
4 5075 |‑‑‑‑‑ 6448 IIII 4 0,095 9,5%
5 6448 |‑‑‑‑‑ 7821 II 2 0,048 4,8%
6 7821 |‑‑‑‑‑ 9194 I 1 0,024 2,4%
7 9194 |‑‑‑‑‑ 10567 III 3 0,071 7,1%
Total ft 42 1,000 100,0%
Transformamos 42 informações em 7, o que nos poupará muito tempo e custo nos estudos
estatísticos, além de nos permitir uma melhor visualização dos dados.
Exercício de aplicação
4. Uma empresa relacionou, na tabela que segue, uma amostra dos valores líquidos pagos a quarenta
de seus funcionários:
30
ESTATÍSTICA
IV – Considerando que esses valores sejam distribuídos em cinco classes, a amplitude de classe seria
de R$ 380,80.
Raciocínio oposto se faz para a frequência acumulada abaixo de (ou frequência crescente).
Nesse caso, a frequência acumulada abaixo de uma classe (ou valor) é a somatória da quantidade de
31
Unidade I
elementos de menor valor, incluído a frequência da própria classe. Assim, a frequência acumulada
abaixo da primeira classe é a frequência dela mesma, a da segunda é a soma das frequências da
primeira e da segunda classe e assim por diante. A frequência acumulada abaixo da última classe é a
frequência total.
32
ESTATÍSTICA
Observação
Exemplo de aplicação
5. A tabela a seguir relaciona a idade (em anos) de alunos de uma classe de calouros de uma
universidade:
Tabela 9
Tabela 10
Idades (anos) Tabela I Idades (anos) Tabela II Idades (anos) Tabela III Idades (anos) Tabela IV
17 1,9% 17 4 17 206 17 4
18 3,9% 18 12 18 198 18 12
19 18,4% 19 50 19 160 19 50
20 21,8% 20 97 20 113 20 98
21 22,8% 21 142 21 68 21 142
22 18,4% 22 180 22 30 22 180
23 8,7% 23 197 23 12 23 197
24 3,9% 24 206 24 4 24 206
33
Unidade I
6. Uma empresa com muitos produtos em linha resumiu, no quadro a seguir, a quantidade de
produtos alinhados pelo total de vendas anuais:
Tabela 11
D) A frequência acumulada acima da classe E é 142, e a frequência acumulada abaixo da classe B é 153.
4 REPRESENTAÇÕES GRÁFICAS
34
ESTATÍSTICA
Lembrete
4.1 Histogramas
São dos mais simples e utilizados gráficos na Estatística. Representam, normalmente, a frequência
simples por meio de linhas verticais ou colunas cuja altura é proporcional à frequência do valor na qual
está centrada.
Para dados quantitativos não agrupados, utilizam‑se linhas verticais posicionadas no valor
correspondente e desenhadas sobre um plano cartesiano.
35
Unidade I
14
12
Frequência simples
10
8
6
4
2
0 0 1 2 3 4 5 6 8
Número de dependências por aluno
Figura 1 – Dependências
Para dados agrupados em classes, as linhas verticais transformam‑se em colunas cuja base tem
largura proporcional ao intervalo de classe. A Tabela 12 e a Figura 2 referem‑se à renda familiar dos
alunos da amostra relacionada na Tabela 2.
14
12
Frequência simples
10
8
6
4
2
0
956 2329 3702 5075 6448 7821 9194 10567
Renda Mensal
Muito semelhantes aos histogramas, mas normalmente utilizados para representar variáveis
qualitativas, nominais ou ordinais. A frequência continua a ser colocada no eixo vertical, mas no eixo
36
ESTATÍSTICA
horizontal são colocados os atributos. Além disso, como regra, as colunas são desenhadas separadas
umas da outras. A Tabela 13 e a Figura 3 são exemplos de gráficos de colunas, representando os cursos
em que os alunos da Tabela 2 estão matriculados.
18
16
Frequência simples
14
12
10
8
6
4
2
0
Administração Direito Engenharia Jornalismo Marketing
Cursos
Esses gráficos são uma variação dos gráficos de colunas e dos histogramas. Neles, as frequências
são representadas no eixo horizontal, e os atributos ou valores das variáveis são representados no eixo
vertical. As Figuras 4 e 5 e as Tabelas 14 e 15 representam, respectivamente, as variáveis sexo e idade dos
alunos relacionados na Tabela 2.
37
Unidade I
Feminino
Sexos
Masculino
0 5 10 15 20 25
Quantidade de aluno
Figura 4 – Sexos
Classe Frequência
Limites de classes em anos
número simples
li ls fi
1 18 |----- 21 13
2 21 |----- 24 11
3 24 |----- 27 6
4 27 |----- 30 8
5 30 |----- 33 1
6 33 |----- 36 3
33|----36
30|----33
27|----30
Idades
24|----27
21|----24
18|----21
0 2 4 6 8 10 12
Número de alunos
Figura 5 – Idades
Exercício de aplicação
7. O gráfico a seguir representa a produção (em toneladas) atingida ao longo dos meses por uma
empresa em suas três linhas de produtos:
38
ESTATÍSTICA
25
Quantidade de meses
20
15
Produto A
10
Produto B
5
Produto C
0
220 580 940 1300 1660 2020 2380
B) A produção de 2.020 toneladas foi atingida no mesmo número de meses pelos produtos B e C.
C) A produção de 940 toneladas foi atingida em dez meses ao longo desse período.
A ogiva é formada pela sucessão de segmentos de retas que unem os pontos coordenados
formados por valor, frequência, como no caso representado na Tabela 16 e na Figura 6, que informam o
comportamento acumulado da variável Quantidade de Dependências dos nossos já conhecidos alunos
da Tabela 2.
39
Unidade I
45
Quantidade de alunos
40
35
30
25
20
15
10
5
0
0 1 2 3 4 5 6 7 8 9
Quantidade de dependências
No gráfico anterior, por ser uma variável quantitativa discreta, cada ponto é facilmente determinado
pela sua coordenada y (quantidade de alunos) e pela coordenada x (quantidade de dependências), mas
se nós formos trabalhar com variáveis quantitativas contínuas, teremos dificuldades em identificar a
variável x porque ela não é mais um valor, mas uma faixa de valores.
Para resolver esse impasse, introduziremos um novo conceito que nos será importante sempre que
estivermos trabalhando com variáveis contínuas: o ponto médio de classe.
O ponto médio de classe é o valor intermediário em relação aos limites superior e inferior de classe, ou seja:
lsi + lii
pmi =
2
Na Tabela 17, estão calculados os pontos médios para as classes de rendas familiares dos nossos conhecidos
alunos, e a Figura 8 representa as frequências acumuladas acima de (ou decrescentes) da referida distribuição.
40
ESTATÍSTICA
45
Freq. acumulada de alunos
40
35
30
25
20
15
10
5
0
0 2000 4000 6000 8000 10000
Renda em R$
Evidentemente, do mesmo modo que temos ogivas de Galton crescentes, temos as decrescentes. A
título de ilustração, a seguir, nas Tabelas 18 e 19 e nos consequentes e respectivos gráficos (Figuras 9 e
10), são apresentadas as ogivas decrescentes para os casos dos dois exemplos anteriores.
41
Unidade I
45
Quantidade de alunos
40
35
30
25
20
15
10
5
0
0 1 2 3 4 5 6 7 8 9
Quantidade de dependências
Frequências
Classe Pontos médios
Limites de classes em R$ acumuladas acima
Número de classe de ou decrescentes
li ls pmi fac
1 956 |----- 2329 1642,5 42
2 2329 |----- 3702 3015,5 29
3 3702 |----- 5075 4388,5 18
4 5075 |----- 6448 5761,5 10
5 6448 |----- 7821 7134,5 6
6 7821 |----- 9194 8507,5 4
7 9194 10567 9880,5 3
45
Freq. acumulada de alunos
40
35
30
25
20
15
10
5
0
0 2000 4000 6000 8000 10000
Renda em R$
Exemplo de aplicação
8. O gráfico a seguir representa as vendas acumuladas em unidades por duas diferentes empresas,
ao longo do ano:
42
ESTATÍSTICA
A) As vendas da empresa ABC foram maiores do que as da empresa XYZ no segundo semestre do
ano.
B) As vendas da empresa XYZ foram maiores do que as da empresa ABC no segundo semestre do
ano.
C) No mês de abril as vendas da empresa ABC foram menores do que as da empresa XYZ.
D) No mês de outubro as vendas da empresa ABC foram maiores do que as da empresa XYZ.
E) Considerando o ano inteiro, as vendas das duas empresas foram muito próximas.
4.5 Setorgramas
São também chamados de gráficos de setores, ou, mais vulgarmente, de gráficos de pizza. São a
representação típica das frequências relativas, pois, como estas, mostram a participação da parte no
todo. O todo, no caso, é representado pelo círculo (a “pizza”), e cada valor ou classe de valores, por um
setor circular (a “fatia da pizza”) de ângulo proporcional à participação desse valor ou dessa classe de
valores. O cálculo do setor circular é feito por regra de três, ou seja, 100% estão para 360º assim como
x% está(ão) para yº.
43
Unidade I
Frequências relativas
Cursos Frequência simples Ângulo do setor circular aº
Decimal Percentual
Administração 17 0,405 40,5% 146
Direito 9 0,214 21,4% 77
Engenharia 8 0,190 19,0% 69
Jornalismo 4 0,095 9,5% 34
Marketing 4 0,095 9,5% 34
Total 42 1,000 100,0% 360
10%
10%
Administração
Direito
40%
Engenharia
19%
Jornalismo
Marketing
21%
Figura 12 – Cursos
44
ESTATÍSTICA
7%
3%
18 |---- 21
19% 21 |---- 24
24 |---- 27
31% 27 |---- 30
30 |---- 33
14%
33 |---- 36
26%
Figura 13 – Idades
Exemplo de aplicação
9. A empresa KWY comercializa seis produtos diferentes que contribuem para o faturamento da
empresa de acordo com o gráfico a seguir:
9%
18% Produto A
13% Produto B
Produto C
Produto D
15% Produto E
Produto F
25%
20%
São gráficos que relacionam duas variáveis numéricas diferentes, por exemplo, salários e idades.
Utilizaremos esses gráficos principalmente quando discutirmos regressão e correlação. Neste momento,
daremos apenas um exemplo, utilizando os dados da Tabela 22 e mostrando‑o no Figura 15.
R$ 9.000,00
R$ 8.000,00
R$ 7.000,00
Ganhos médios
R$ 6.000,00
R$ 5.000,00
R$ 4.000,00
R$ 3.000,00
R$ 2.000,00
R$ 1.000,00
R$ 0,00
0 2 4 6 8 10 12 14
Tempo de função
Como falado anteriormente, os gráficos têm uma ampla aplicação porque apresentam os dados
estatísticos de maneira agradável e impactante, permitindo que o leitor ou o assistente de uma
apresentação compreenda com facilidade e rapidez as informações apresentadas. Devemos, no entanto,
tomar cuidado para que essas informações sejam mostradas com qualidade, em especial, evitando os
seguintes vícios:
• ausência de escala correta, que induza o leitor a dar maior ou menor importância a determinado
elemento do gráfico do que a real;
46
ESTATÍSTICA
• eixos comprimidos, de modo que muitas informações fiquem concentradas em pequeno espaço
do gráfico;
• ausência da origem, ou seja, do ponto zero, que pode induzir o leitor a erro.
Observação
Saiba mais
Exemplo de aplicação
10. A tabela a seguir resume a vida útil de determinadas ferramentas de corte num processo
industrial de usinagem:
Número de
Horas transcorridas ferramentas
antes da reposição substituídas
0 |‑‑‑‑‑ 25 3
25 |‑‑‑‑‑ 50 6
50 |‑‑‑‑‑ 75 15
75 |‑‑‑‑‑ 100 36
100 |‑‑‑‑‑ 125 19
125 |‑‑‑‑‑ 150 6
150 |‑‑‑‑‑ 175 2
175 |‑‑‑‑‑ 200 1
A partir dessa tabela foram desenhados os gráficos que seguem. Qual deles corresponde realmente
aos dados informados?
47
Unidade I
a)
40
35
30
25
20
15
10
5
0
1 2 3 4 5 6 7 8
Figura 16
7 8 1
b)
2% 1% 3%
6 2
7% 7%
5 3
22% 17%
4
41%
Figura 17
6 7 8
c)
6% 2% 1%
1
5 13%
14% 2
15%
3
4 14%
35%
Figura 18
d) 25
20
15
10
5
0
1 2 3 4 5 6 7 8
Figura 19
48
ESTATÍSTICA
e) 90
80
70
60
50
40
30
20
10
90
1 2 3 4 5 6 7 8
Figura 20
11 (ENADE 2006 – Adaptado). A figura a seguir mostra o processo de absorção e eliminação do álcool
ingerido em função do tempo; mostra como o organismo de uma pessoa absorverá o álcool se ela ingerir,
rapidamente, de 1 a 4 latas de cerveja. A lei brasileira considera que um motorista estará dirigindo embriagado
se o álcool em sua corrente sanguínea superar a marca de 0,6 gramas de álcool por litro de sangue.
1,0
0,9
0,8 1 lata
Álcool no sangue (g/litro)
2 latas
0,7 3 latas
0,6 4 latas
0,5
0,4
0,3
0,2
0,1
0
0 1 2 3 4 5 6 7 8
Tempo (horas)
Figura 21
B) Uma pessoa que vai dirigir imediatamente após a ingestão da bebida pode consumir, no máximo,
duas latas de cerveja.
C) Se uma pessoa tomar rapidamente quatro latas de cerveja, o álcool contido na bebida só será
completamente eliminado após se passarem cerca de 7 horas da ingestão.
D) Apesar de esses gráficos serem estabelecidos por processos estatísticos e métodos científicos
rigorosos, não podemos ter certeza da aplicabilidade destes a qualquer pessoa. Podemos afirmar
apenas que esse é um comportamento provável.
E) Uma pessoa que toma rapidamente quatro latas de cerveja, após uma hora, terá mais do que 0,8
gramas de álcool por litro de sangue.
49
Unidade I
Resumo
50
ESTATÍSTICA
Exercícios
IV – Velocidade do vento.
Das afirmações, quais são variáveis aleatórias discretas e quais são contínuas?
Justificativa geral: toda vez que uma variável é influenciada pelo acaso, diz-se que é uma variável aleatória.
É a função que associa um número real a cada elemento do espaço amostral. A variável aleatória diz respeito à
característica do experimento que queremos estudar. As variáveis aleatórias podem ser discretas ou contínuas. A
51
Unidade I
variável aleatória é discreta quando só assume valores que podem ser associados aos números naturais (1, 2, 3,
4, ...). Admite um número finito de valores ou tem uma quantidade enumerável destes. Exemplos: o número de
pacientes atendidos, por dia, em uma clínica; o número de espectadores que assistem a um filme. As variáveis
aleatórias contínuas assumem infinitos valores em um dado intervalo. Exemplos: o peso corporal é uma variável
aleatória contínua porque, em princípio, pode assumir infinitos valores em um dado intervalo (na prática, o
número de valores de peso que pode ser distinguidos em um dado intervalo é limitado pela precisão da balança);
e a voltagem na pilha de um detector de fumaça que pode ter qualquer valor entre 0 e 9 volts.
Pelas definições dadas, no problema, as variáveis aleatórias discretas são os itens I, III e V, e as
variáveis aleatórias contínuas são os itens II, IV e IV.
Questão 2. Foram feitas coletas de sangue em pacientes para verificar o HDL (mg/dl). O gráfico é
dado a seguir.
4
Frequência
0
40 45 50 55 60 65 70
HDL (mg/dL)
Figura 22
III – Os valores 42,5; 47,5; 52,5; 57,5; 62,5 e 67,5 são os pontos médios de cada classe.
52
ESTATÍSTICA
A) I.
B) III.
C) II e IV.
D) I, II e IV.
53