Livro Estatistica
Livro Estatistica
Livro Estatistica
ESTATSTICA
autor do original
1 edio
SESES
rio de janeiro 2015
Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida
por quaisquer meios (eletrnico ou mecnico, incluindo fotocpia e gravao) ou arquivada em
qualquer sistema ou banco de dados sem permisso escrita da Editora. Copyright seses, 2015.
Ferreira, Valria
128 p. : il.
ISBN 978-85-5548-091-1
Sumrio
Prefcio 7
1. Introduo Estatstica:
Anlise Exploratria de Dados
10
Breve histrico
Definio de Estatstica
Distribuio de frequncias
Mtodos grficos
11
11
14
20
2. Medidas de Posio
34
Mdia 34
Mediana (Md)
36
Moda (Mo)
37
Medidas Separatrizes: Quartis, Decis e Percentis
46
3. Medidas de Disperso
64
Exemplo Introdutrio
64
Amplitude Total (R)
65
Amplitude interquartil
66
Desvio-Padro (s)
66
Varincia (s2) 68
Coeficiente de Variao (cv)
69
4. Noes de Probabilidade
69
72
73
74
86
5. Variveis aleatrias
Varivel Aleatria
Funo discreta de probabilidade
Valor esperado e varincia de uma varivel aleatria discreta
Modelos probabilsticos para variveis aleatrias Discretas
118
118
118
124
130
Prefcio
Prezados(as) alunos (as)
Estatstica uma palavra de origem latina, que significou por muito tempo cincia dos negcios do Estado. Ela pode ser vista como uma Matemtica
Aplicada, uma disciplina da rea das cincias exatas que tem aplicao em praticamente todas as reas de estudo. Esse fato serve para desmistificar o temor
vivido pelos alunos com relao ao ensino da matemtica em si (aquela que
ns aprendemos at o ensino mdio). As dificuldades enfrentadas e a falta de
conexo com a prtica so talvez os fatores que mais contribuem para que este
temor ocorra.
No entanto, o ensino da Estatstica, mesmo provocando sentimentos semelhantes aos estudantes, proporciona a esses uma viso prtica do contedo que
est sendo abordado. Mais que isso, ele possibilita, a quem o est aplicando, a
obteno de importantes informaes do fato que est sendo estudado. O conhecimento mnimo em Estatstica se tornou pr-requisito para ler um jornal
ou uma revista conceituada, pois muitas informaes se encontram resumidas
em tabelas ou grficos que grande parte da populao no tem condies de interpretar e por isso ignoram (ou no entendem) reportagens importantes para a
formao de uma pessoa esclarecida social, econmica e politicamente.
Procuramos, aqui, apresentar a Estatstica de forma clara e prtica. No com
o intuito de formar especialistas nessa rea, mas sim de proporcionar a voc,
futuro gestor, uma compreenso dos elementos bsicos que compem essa
cincia, visando a aplicao na sua rea de atuao. No tivemos a inteno de
esgotar o assunto, mas sim de apresentar os elementos necessrios para que
voc realize uma leitura satisfatria da realidade que o cerca e das informaes
que tm a sua volta.
Estudaremos duas reas da Estatstica: Estatstica Descritiva e a Probabilidade. No Captulo 1 apresentaremos os conceitos bsicos da Estatstica bem
como descrio de tcnicas para organizao e apresentao dos dados. Nos
Captulos 2 e 3 aprenderemos a calcular e interpretar as medidas de posio e
disperso. E, introduziremos, nos Captulos 4 e 5, conceitos de Probabilidade.
Abordaremos o clculo de probabilidades atravs do mtodo clssico e frequencial e estudaremos a distribuio de probabilidade Binomial.
1
Introduo
Estatstica: Anlise
Exploratria de Dados
1 Introduo Estatstica:
Anlise Exploratria de Dados
Neste primeiro captulo, apresentaremos alguns conceitos bsicos utilizados
pela Estatstica, alm de fornecer recursos de organizao, resumo e apresentao de dados atravs de tabelas e grficos.
Quando realizamos uma coleta de dados, geralmente estamos lidando com
uma quantidade muito grande de informaes. Portanto, torna-se imprescindvel a utilizao de certas tcnicas visando simplificar a leitura de tais informaes. Para que se tenha uma viso do todo (sobre o fenmeno que est sendo
estudado) precisamos, por exemplo, dispor as informaes em tabelas ou apresent-las em grficos. o que estaremos abordando num primeiro momento.
Logicamente, h mais tcnicas que podem ser aplicadas, mas elas sero vistas
nos prximos captulos.
OBJETIVOS
Aps o estudo dos conceitos e tcnicas apresentados neste captulo, esperamos que voc
consiga identificar os diferentes tipos de variveis que podem estar presentes em uma pesquisa, bem como, organizar, resumir e apresentar, atravs de tabelas e grficos de frequncias, as informaes contidas em grandes conjuntos de dados.
REFLEXO
Voc se lembra de j ter visto tabelas em jornais, livros ou revistas, em que eram utilizados
percentuais para indicar as frequncias de ocorrncias de respostas em uma pesquisa? Ou
com os percentuais referentes avaliao de um governo? Neste captulo, veremos como
(e para qu) construir tabelas dessa natureza, alm de elaborar grficos que representam os
resultados dessas tabelas.
10
captulo 1
CONEXO
Para saber um pouco sobre a evoluo histrica da Estatstica, assista ao vdeo Histria da
Estatstica produzido pela Fundao Universidade de Tocantins, disponvel em: http://www.
youtube.com/watch?v=jCzMPL7Ub2k&feature=related
captulo 1
11
3. Esta etapa envolve a escolha de um possvel modelo que explique o comportamento dos dados para posteriormente se fazer a inferncia dos
dados para a populao de interesse. Esta etapa tambm chamada de
Estatstica Inferencial ou Indutiva. Nesta etapa, se faz necessrio um
conhecimento mais aprofundado, principalmente no que se refere aos
tpicos de probabilidades.
A probabilidade fornece mtodos para quantificar a incerteza existente em determinada situao, usando ora um nmero ora uma
funo matemtica.
Podemos citar inmeros exemplos da Estatstica em vrias reas do conhecimento, mas s para convenc-lo da importncia das tcnicas estatsticas, vamos dar alguns exemplos:
1. Se estamos interessados em abrir um supermercado em um determinado
local precisamos saber se fatores como sexo, grau de escolaridade, idade,
estado civil, renda familiar, entre outros, interferem na abertura deste supermercado e os tipos de produtos que devem ser priorizados nesse estabelecimento, alm de definir as estratgias de marketing mais eficientes.
2. Uma empresa, quando est interessada em lanar um novo produto no
mercado, precisa saber as preferncias dos consumidores. Para isso,
necessrio realizar uma pesquisa de mercado.
3. O gestor precisa saber escolher uma amostra representativa de uma populao de interesse para no perder muito tempo e, consequentemente, dinheiro da empresa em que trabalha.
4. Para se lanar um novo medicamento no mercado farmacutico, necessrio a realizao de vrias experincias. O medicamento deve ser
testado estatsticamente quanto sua eficincia no tratamento a que
se destina e quanto aos efeitos colaterais que pode causar, antes de ser
lanado no mercado.
5. Para uma empresa, muito importante fazer previses de demanda de
seus produtos. Para isto existem vrias tcnicas estatsticas como regresso linear, regresso logstica, anlise de sries temporais, etc.
6. Controles estatsticos de qualidade (ou controles estatsticos do processo) so indispensveis em todos os tipos de empresas. Eles so realizados
atravs de um conjunto de tcnicas estatsticas, geralmente aplicadas
por engenheiros de produo e administradores, para garantir o nvel de
qualidade exigido para a produo (ou servio) dentro de uma indstria.
12
captulo 1
13
14
captulo 1
FAIXA DE
RENDA (EM
SALRIOS
MNIMOS)
NMERO DE
OPERRIOS (f)
FREQUNCIA
RELATIVA
(%) (fr)
0 | 2
43
39,09
2 | 4
39
35,45
4 | 6
16
14,55
6 | 8
7,27
8 | 10
3,64
Total
110
100
Resoluo
A varivel em estudo a renda dos operrios de uma determinada empresa. Esta varivel classificada como quantitativa contnua, pois pode assumir
qualquer valor dentro de um intervalo numrico.
As frequncias absolutas (f) so fornecidas no problema. As frequncias relativas (fr(%)) so encontradas dividindo cada frequncia absoluta (de cada classe de
frequncia) pelo total de operrios (110) e multiplicando por 100.
captulo 1
15
FAIXA DE
RENDA (EM
SALRIOS
MNIMOS)
NMERO
DE
OPERRIOS
(f)
0 | 2
fr(%)
FREQUNCIA
ACUMULADA
(fa)
fra (%)
43
39,09
43
39,09
2 | 4
39
35,45
82
75,55
4 | 6
16
14,55
98
89,09
6 | 8
7,27
106
96,36
8 | 10
3,64
110
100,00
Total
110
100
A coluna frequncia acumulada (fa) de cada classe obtida somando a frequncia da respectiva classe com as que lhe so anteriores e a fra (%) obtida
dividindo a fa pelo nmero total de dados e multiplicando por 100.
Exemplo 1.2: Uma determinada empresa resolveu traar o perfil socioeconmico de seus empregados. Uma das variveis estudadas foi o nmero de filhos, com idade inferior a 18 anos, de cada um dos empregados. A tabela 1.3
fornece a frequncia e a frequncia relativa (%) para cada valor obtido.
16
captulo 1
NMERO DE FILHOS
NMERO DE
OPERRIOS (f)
fr (%)
13,33
11
24,44
13
28,89
15,56
11,11
NMERO DE FILHOS
NMERO DE
OPERRIOS (f)
fr (%)
2,22
4,44
Total
45
100,00
captulo 1
17
Limite inferior (Li): o menor valor que a varivel pode assumir em uma
classe de frequncia.
Limite superior (Ls): serve de limite para estabelecer qual o maior valor que a
varivel pode assumir em uma classe de frequncia, mas, geralmente, os valores
iguais ao limite superior no so computados naquela classe e sim na seguinte.
Ponto mdio (Pm): a mdia aritmtica entre o Li e o Ls da mesma classe, ou
seja, Pm
Li + Ls
2
k n e h
R
k
18
captulo 1
Os valores de k e h devem ser arredondados sempre para o maior valor. Por exemplo,
para uma amostra de tamanho n = 50 cujo menor valor 4 e o maior valor 445
temos que R = 441 (maior valor menor valor). O nmero de classes seria dado por
R 441
=
= 55,125 56 (maior
k
8
inteiro depois de 55). Ou seja, deveramos, para este exemplo, montar uma tabela com
8 classes e de amplitude 56. A tabela pode ser iniciada pelo menor valor do conjunto
de dados.
Resumindo, para montar uma tabela de frequncias com intervalos de classes devemos:
Achar o mnimo e o mximo dos dados.
Determinar as classes de frequncias, o que na verdade nada mais do que
escolher intervalos de mesmo comprimento que cubra a amplitude entre
o mnimo e o mximo. Para determinar o nmero de classes, usaremos
k n e para determinar o tamanho das classes usaremos h R .
Contar o nmero de observaes que pertencem a cada intervalo de classe. Esses nmeros so as frequncias observadas da classe.
Calcular as frequncias relativas e acumuladas de cada classe.
De modo geral, a quantidade de classes no deve ser inferior a 5 e nem
superior a 25.
Um outro critrio utilizado para construir distribuio de frequncias com
intervalos de classes a regra de Sturges.
Neste critrio, o nmero de classes a serem construdas obtido utilizando
a seguinte frmula:
k 1 + 3, 3 log n
onde:
k:nmero de classes
n:total da amostra
log n: logaritmo na base 10 de n
captulo 1
19
=
h
amplitude total R
=
k
k
Devemos arredondar o valor de k para o nmero inteiro mais prximo, pois o nmero
de classes deve ser sempre inteiro. O arredondamento de h deve ser sempre efetuado
para cima usando o mesmo nmero de casas decimais dos elementos da amostra para
que nenhum elemento fique fora da tabela.
CONEXO
Vamos refletir um pouco sobre a necessidade de abordagens pedaggicas para o ensino e
a aprendizagem de grficos acessando o endereo http://www.ufrrj.br/emanped/paginas/
conteudo_producoes/docs_22/carlos.pdf.
20
captulo 1
ANO
1997
1,1
1998
1,3
1999
1,5
2000
1,9
2001
2,4
2002
2,6
2003
3,1
2004
7,4
2005
18,6
2006
21,5
2007
29
captulo 1
21
O grfico que melhor representa este conjunto de dados o grfico em linhas, j que os dados se reportam a uma srie no tempo (srie temporal). O
grfico est ilustrado na figura 1.1.
35
29
30
25
21,5
18,6
20
15
10
5
0
7,4
1,1
1996
1,3
1998
1,5
1,9
2000
2,4
2,6
2002
Anos
3,1
2004
2006
2008
ATENO
Quando construmos o grfico de barras para variveis qualitativas e as barras so arranjadas em ordem descendente de altura, a partir da esquerda para a direita, com o atributo que
ocorre com maior frequncia aparecendo em primeiro lugar, denominamos este grfico de
barras de Diagrama de Pareto.
22
captulo 1
Exemplo 1.4: Uma grande indstria de materiais de construo, com diversas lojas espalhadas pelo pas, fez um levantamento das principais causas de
perda de ativos durante o ano de 2007 e as informaes esto dispostas na tabela seguinte.
CAUSAS
M administrao
5,2
Roubos de funcionrios
3,9
5,5
Assaltos s lojas
1,8
Perda do estoque
1,6
Atendimento ruim
0,8
6
4
Atendimento ruim
Perda de estoque
Assaltos s lojas
Roubos de funcionrios
M administrao
captulo 1
23
Atendimento ruim
Perda do estoque
Causas
Assalto s lojas
Fraudes nas vendas
Roubos de funcionrios
M administrao
0
1
2
3
4
Valor perdido (milhes de reais)
Atendimento ruim
M administrao
Assaltos s lojas
10%
Roubos de
Funcionrios
21%
24
captulo 1
Os grficos que sero apresentados a seguir so grficos construdos segundo uma distribuio de frequncias com intervalos de classes. So eles: o histograma, o polgono de frequncias e a ogiva.
1.4.1.4 Histograma
Um histograma semelhante ao diagrama de barras, porm refere-se a uma
distribuio de frequncias para dados quantitativos contnuos. Por isso,
apresenta uma diferena: no h espaos entre as barras. Os intervalos de
classes so colocados no eixo horizontal enquanto as frequncias so colocadas no eixo vertical. As frequncias podem ser absolutas ou relativas.
Exemplo 1.5: A tabela a seguir apresenta o salrio de funcionrios de uma
empresa no interior de Minas Gerais.
SALRIO (R$)
FREQ. ACUMULADA
(fa)
400,00 | 800,00
38
38
800,00 | 1.200,00
18
56
1.200,00 | 1.600,00
12
68
1.600,00 | 2.000,00
76
2.000,00 | 2400,00
84
2.400,00 | 2.800,00
89
2.800,00 | 3.200,00
92
3.200,00 | 3.600,00
92
3.600,00 | 4.000,00
94
4.000,00 | 4.400,00
94
4.400,00 | 4.800,00
95
Total
95
Tabela 1.6 Distribuio de frequncias dos salrios dos funcionrios de uma empresa no
interior de Minas Gerais.
captulo 1
25
4400,00 | 4800,00
4000,00 | 4400,00
3600,00 | 4000,00
3200,00 | 3600,00
2800,00 | 3200,00
2400,00 | 2800,00
2000,00 | 2400,00
1600,00 | 2000,00
1200,00 | 1600,00
800,00 | 1200,00
40
35
30
25
20
15
10
5
0
400,00 | 800,00
Frequncia
Como os dados da tabela 1.6 esto apresentados em intervalos de classes podemos represent-los graficamente atravs de um histograma ou do polgono de
frequncias, como mostram as figuras 1.4 e 1.5, respectivamente.
Salrio (R$)
Figura 1.4 Histograma dos salrios dos funcionrios de uma empresa no interior de Minas
Gerais.
CONEXO
Para se ter uma ideia da importncia da organizao dos dados em tabelas de frequncias e
da construo do histograma, leia A Estatstica na Prtica em: ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatstica aplicada administrao e economia. So
Paulo: Pioneira Thomson Learning, 2003, pp. 37 e 38.
26
captulo 1
O histograma e o polgono de frequncias so grficos alternativos e contm a mesma informao. Fica a critrio de quem est conduzindo o estudo a
escolha de qual deles utilizar.
Considerando os dados do exemplo 1.5, temos o polgono de frequncias
representado pela figura 1.5.
40
38
35
30
Frequncia
25
20
18
15
12
10
8
0
200
600
1000
1400
1800
2200
2600
3000
3400
0
3800
4200
4600
0
5000
Figura 1.5 Polgono de frequncias dos salrios dos funcionrios de uma empresa no
interior de Minas Gerais.
captulo 1
27
Para construir um grfico de ogiva, devemos usar o limite superior de cada intervalo
no eixo horizontal e a frequncia acumulada no eixo vertical. A frequncia acumulada
relacionada com o limite inferior da primeira classe sempre zero.
100
90
80
Frequncia Acumulada
70
60
50
40
30
20
10
0
400 800 1200 1600 2000 2400 2800 3200 3600 4000 4400 4800
Salrio (R$)
Figura 1.6 Ogiva dos salrios dos funcionrios de uma empresa no interior de Minas Gerais.
ATIVIDADE
1. Classifique as variveis a seguir em quantitativas (discretas ou contnuas) ou qualitativas
(nominal ou ordinal).
a) Cor dos olhos.
b) Nmero de peas produzidas por hora.
c) Dimetro externo.
d) Nmero de pontos em uma partida de futebol.
e) Produo de algodo.
f) Salrios dos executivos de uma empresa.
g) Nmero de aes negociadas na bolsa de valores.
h) Sexo dos filhos.
i) Tamanho de pregos produzidos por uma mquina.
j) Quantidade de gua consumida por uma famlia em um ms.
28
captulo 1
k) Grau de escolaridade.
l) Nvel social.
m) Tipo sanguneo.
n) Estado civil.
2. A seguir temos as idades dos funcionrios de uma determinada empresa. Fazer uma
distribuio de frequncias, agrupando os dados em classes. OBS.: A tabela de distribuio de frequncias deve ser completa com f, fr e fa.
Idades (dados brutos)
48
28
37
26
29
59
27
28
30
40
42
35
23
22
31
21
51
19
27
28
36
25
40
36
49
28
26
27
41
29
ESTADO CIVIL
NMERO DE CLIENTES
Solteiro
2600
Casado
900
Vivo
345
Separado
1200
Outros
1020
Total
6065
captulo 1
29
11,00
5,60
73,85
24,83
98,00
186,00
234,87
58,00
198,65
223,86
341,42
94,76
445,76
82,80
35,00
455,00
371,00
398,60
234,00
64,90
54,98
48,80
68,90
120,32
126,98
76,43
6,35
9,98
12,68
243,00
18,65
134,90
11,10
321,09
290,76
74,00
48,80
74,52
138,65
26,00
210,13
15,78
197,45
75,00
76,55
32,78
166,09
105,34
99,10
45
17
1700| 2100
2
2400| 2700
2100| 2400
4
1400| 1700
1100| 1400
12
800| 1100
50
45
40
35
30
25
20
15
10
5
0
500| 800
Frequncia
Salrio (R$)
funcionrios
ganham
entre
R$
800,00
(inclusive)
R$ 1.100,00 (exclusive)?
b) Qual o nmero de funcionrios total desta empresa?
c) Qual a porcentagem de funcionrios que ganham R$ 1.700,00 ou mais?
30
captulo 1
REFLEXO
Estamos encerrando nosso primeiro captulo. Vimos, aqui, alguns conceitos que sero fundamentais na compreenso do restante do contedo de Estatstica. J deve ter dado para
perceber que, mesmo estando no incio da disciplina, as aplicaes prticas que voc poder
fazer na sua rea de atuao sero muitas. A compreenso e interpretao das mais variadas
informaes, com as quais nos deparamos em nosso cotidiano, dependem, em parte, do conhecimento de certos elementos estatsticos.
Estamos apenas no comeo. Muitas tcnicas (muito interessantes!) ainda sero abordadas.
E lembre-se que o conhecimento e o domnio da Estatstica certamente levaro voc, futuro
gestor, s decises mais acertadas.
LEITURA
Recomendamos a leitura do texto Como analisar de forma simples um grande nmero de
dados?, disponvel no endereo:
< http://www.klick.com.br/materia/20/display/0,5912,POR-20-91-931-,00.html >
Este texto aborda de maneira clara alguns procedimentos que podem ser utilizados quando
nos deparamos com situaes em que precisamos resumir as informaes de grandes
conjuntos de dados.
REFERNCIAS BIBLIOGRFICAS
ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatstica aplicada
administrao e economia. So Paulo: Pioneira Thomson Learning, 2003.
COSTA NETO, Pedro Luiz de Oliveira. Estatstica, So Paulo: Edgard Blucher, 2002.
DOWNING, Douglas; CLARK, Jeffrey. Estatstica aplicada. So Paulo: Saraiva, 2002.
captulo 1
31
FARIAS, Alfredo Alves de; SOARES, Jos Francisco; CSAR, Cibele Comini. Introduo
estatstica. Rio de Janeiro: LTC, 2003.
MEMRIA, Jos M. P. Breve Histria da Estatstica. Disponvel em: <http://www.im.ufrj.
br/~lpbraga/prob1/historia_estatistica.pdf>. Acesso em: 25 setembro 2014.
TRIOLA, Mario F.. Introduo estatstica. Rio de Janeiro: LTC, 1999.
VIEIRA, Sonia. Elementos de estatstica. So Paulo: Atlas, 2003.
NO PRXIMO CAPTULO
Se at agora vimos como organizar, resumir e apresentar os dados (informaes) em tabelas
e grficos, no prximo captulo iremos incrementar esse processo atravs da insero das
medidas de posio e disperso. So medidas que iro, de certa forma, representar o conjunto como um todo. Um exemplo bem conhecido de medida de posio (ou de tendncia
central) a mdia e com relao medida de disperso podemos citar o desvio-padro. No
so raras as situaes em que a mdia utilizada para representar a tendncia central dos
dados e o desvio-padro para representar a variabilidade do conjunto de dados.
Alm destas, veremos outras tambm importantes e com larga aplicao no estudo dos dados.
32
captulo 1
2
Medidas de Posio
2 Medidas de Posio
Nesse captulo, aprenderemos como caracterizar um conjunto de dados atravs
de medidas numricas que sejam representativas de todo o conjunto.
As medidas de posio, tambm chamadas de medidas de tendncia central,
tm o objetivo de representar o ponto central de um conjunto de dados. As mais
conhecidas so a mdia, a mediana e a moda. Alm dessas medidas, podemos
citar outras medidas de posio importantes, que no necessariamente so
centrais. So ela os quartis, os decis e os percentis. Vamos estudar cada uma
dessas medidas de posio (estatsticas).
Primeiramente, vamos fazer um estudo para os dados no tabulados, ou seja,
quando os dados no estiverem na forma de distribuio de frequncia. Em seguida, as mesmas medidas sero calculadas com base em dados tabulados.
OBJETIVOS
Por meio do estudo deste captulo, esperamos que voc seja capaz de calcular e de interpretar as medidas de posio aplicadas a conjuntos de dados.
REFLEXO
Voc se lembra das situaes para as quais j calculou uma mdia? Que tipo de informao
essa medida fornece? Para que serve? Para aplicar e interpretar medidas como ela, necessrio conhec-las bem. Vamos, ento, realizar um estudo detalhado da mdia e de outras
medidas de mesma natureza.
2.1 Mdia
A mdia aritmtica a mais comum e mais simples de ser calculada dentre todas as medidas de posio mencionadas.
34
captulo 2
Para calcul-la, basta fazer a diviso da soma de todos os valores (x1, x2, ..., xn )
da varivel pelo nmero deles (n):
n
x=
xi
i =1
(2.1)
em que:
x = a mdia aritmtica;
xi = os valores da varivel;
n = o nmero de valores.
Outro tipo de mdia que podemos encontrar a mdia geomtrica. Ela muito
utilizada no clculo da taxa mdia de retorno de investimentos.
A mdia geomtrica entre nmeros reais x1 x2,,xn definida como sendo a
raiz n-sima do produto dos n termos (ou, alternativamente) o produto dos n termos elevado ao inverso do nmero de termos, ou seja:
G=
x1 x 2 x 3 ... x n
ou
1
n
(x1 x 2 x 3... x n )
n
i =1
xi
1
n
captulo 2
35
ATENO
A mediana a medida de posio mais frequentemente usada quando a varivel em estudo
for renda (R$), pois algumas rendas extremamente elevadas podem inflacionar a mdia.
Neste caso, a mediana uma melhor medida de posio central.
Md = x n +1
(2.2)
Md =
36
captulo 2
x n + x n
+1
(2.3)
onde
x n , x n + 1 x n
e +1 indicam
2
2
se encontram.
x=
xi
i =1
captulo 2
37
Mdia Aritmtica
No caso de dados tabulados, o clculo da mdia aritmtica dada por:
k
x=
x i fi
i =1
fi
i =1
38
captulo 2
(2.4)
Onde:
xi o valor da varivel (ou o ponto mdio de uma classe de frequncia).
fi a frequncia referente a cada valor (ou classe).
k
i =1
NMERO DE FALTAS
31
20
Total
63
captulo 2
39
Resoluo
Mdia Aritmtica
k
63
fi
63
i =1
40
NMERO DE FALTAS
fa
31
31
20
51
59
61
61
62
63
Total
63
captulo 2
fi
i =1
63
= 3,15
2
No caso do valor i = 1
fi
ser exatamente igual a uma das frequncias acumuladas fa, o
clculo da mediana ser a mdia aritmtica entre dois valores da varivel: xi e x(i+1).
k
fi
= fa e o valor da varivel xi+1 ser aquele
Moda
O valor que tem a maior frequncia para este conjunto de dados de x = 0,
ou seja, mais frequente encontrar funcionrios que no faltam.
No caso do Exemplo 2.3 veremos que os dados esto agrupados em intervalos de classes. Quando o conjunto de dados for apresentado sob a forma agrupada perdemos a informao dos valores das observaes. Neste caso, vamos
supor que todos os valores dentro de uma classe tenham seus valores iguais ao
ponto mdio desta classe.
Os clculos da mdia, da moda e da mediana para tabelas de frequncias
agrupadas em classes esto apresentados a seguir.
captulo 2
41
ATENO
As medidas resumo calculadas quando os dados estiverem agrupados em intervalos de classes so apenas aproximaes dos verdadeiros valores, pois substitumos os valores das observaes pelo ponto do mdio do intervalo de classe.
Exemplo 2.3
A tabela abaixo apresenta a distribuio de frequncias do tempo de vida de
60 componentes eletrnicos (medido em dias) submetidos experimentao
num laboratrio especializado. Calcular as medidas de posio.
TEMPO DE VIDA
(DIAS)
3 18
10,5
18 33
25,5
33 48
40,5
48 63
55,5
63 78
10
70,5
78 93
28
85,5
93 108
100,5
108 123
115,5
Total
60
42
captulo 2
Resoluo
Neste tipo de tabela, como temos classes de frequncias, devemos encontrar um valor que represente cada classe, para que possamos efetuar os clculos. Por exemplo, considerando a primeira classe de frequncia,
TEMPO DE VIDA
(DIAS)
3 18
10,5
x=
x i fi
i =1
fi
i =1
(10, 5 3)+ (25, 5 4)+ (40, 5 4)+ (55, 5 8)+ (70, 5 10)+ (85, 5 28)+ (100, 5 2)+ (115, 5 1)
=
60
4155
=
= 69, 25
60
Podemos dizer, atravs da mdia aritmtica, que os componentes eletrnicos tm uma durao mdia de 69 dias e 6 horas (69,25 dias).
captulo 2
43
Mediana
Como os dados esto tabelados em classes de frequncias, o clculo da mediana fica um pouquinho mais complicado. Agora, teremos que encontrar a
mediana atravs da seguinte frmula:
Md = linf md +
A md
Fmd
fi
- Fmd -1 (2.5)
onde:
linfmd o limite inferior da classe que contm a mediana;
Como
fi
captulo 2
fi
60
= 30 , temos que a classe que contm a mediana de
2
78 93 (pois fa = 57).
44
Classe que
contm a
mediana
Tempo
de vida
PM
x1
fa
3|18
10,5
18|33
21,5
33|48
40,5
11
48|63
55,5
19
63|78
10
70,5
29
78|93
28
85,5
57
93|108
10,5
59
108|123
115,5
60
Total
60
N de observaes
da classe que
contm a mediana
fa da classe
anterior classe
que contm a
Md
fi
Alm disso, temos:
Portanto,
fi = 60 .
Md = 78 +
15 60
15
29 = 78 + ( 30 29 ) = 78 + 0, 54 78, 5
28 2
28
captulo 2
45
Atravs da mediana podemos dizer que pelo menos 50% dos componentes
eletrnicos avaliados tm durao igual ou inferior a 78 dias e 12 horas.
Moda
No clculo da moda para dados agrupados devemos primeiramente identificar a classe modal, ou seja, a classe que apresenta a maior frequncia.
Aps a identificao da classe modal, utilizaremos a seguinte frmula para
calcular a moda bruta:
Mo =
l+L
(2.6)
2
onde:
l:limite inferior da classe modal
L:limite superior da classe modal
CONEXO
Sugerimos os vdeos: Novo Telecurso E. Fundamental Matemtica Aula 34 (parte 1) e
Novo Telecurso E. Fundamental Matemtica Aula 34 (parte 2) disponveis, respectivamente em http://www.youtube.com/watch?v=SyWbYOtAIYc&NR=1 e http://www.youtube.
com/watch?v=ejMyWfuSO5k que apresenta de modo bem prtico a utilizao das medidas
de posio.
46
captulo 2
ATENO
Perceba que o 2 quartil, o 5 decil e o 50 percentil representam a prpria mediana, ou seja,
todas estas medidas separatrizes (Q2, D5, e P50), dividem a distribuio dos dados ao meio,
deixando 50% dos dados abaixo delas e 50% acima.
CONEXO
Para se entender quais so os procedimentos utilizados na construo de um boxplot, bem
como sua interpretao, leia o texto: Diagrama de Caixa (Boxplots) em: TRIOLA, Mario F..
Introduo estatstica. 10.ed.Rio de Janeiro: LTC, 2008, pp.98 a 102
captulo 2
47
2.4.1 Clculo dos quartis e dos percentis para dados no agrupados em classes
Como os quartis so medidas separatrizes precisamos, primeiramente, ordenar o conjunto de dados.
n
. O se4
2n e o terceiro
4
3n
. Quando fazemos
4
estas divises para encontrar as posies dos quartis, pode acontecer do resultado ser um nmero inteiro ou um nmero fracionrio. Ento, adotaremos a
seguinte conveno:
Se a diviso resultar num nmero fracionrio, arredonde-o para cima e
o valor do quartil ser a resposta da varivel encontrada nesta posio.
Se a diviso for um nmero inteiro, o quartil ser a mdia aritmtica da
resposta da varivel que ocupar a posio encontrada com a resposta da
varivel que ocupar a posio seguinte.
Exemplo 2.4
Um escritrio que presta consultoria em administrao levantou os tempos
de espera de pacientes que chegam a uma clnica de ortopedia para atendimento de emergncia. Foram coletados os seguintes tempos, em minutos, durante
uma semana. Encontre os quartis.
2 5 10 11 3 14 8 8 7 12 3 4 7 3 4 2 6 7
48
captulo 2
Resoluo:
Para encontrarmos os quartis, precisamos ordenar o conjunto de dados.
Ento:
2 2 3 3 3 4 4 5 6 7 7 7 8 8 10 11 12 14
Posio do primeiro quartil (Q1):
n 18
= = 4, 5
4 4
2xn
4
2 x 18
= 9
4
Como a diviso resultou em um valor inteiro, o segundo quartil ser o resultado da mdia aritmtica entre o valor que est na nona posio e o valor que
est na dcima posio.
Q2 =
6+7
= 6, 5
2
Temos que pelo menos 50% das observaes so maiores ou iguais a 6,5 minutos.
Posio do terceiro quartil (Q3 ):
3 x n 3 x 18
= = 13, 5
4
4
captulo 2
49
(k x n)
100
50
captulo 2
2.4.2 Clculo dos quartis e dos percentis para dados agrupados em classes
Para calcular os quartis quando os dados esto organizados em intervalos de
classes, utilizaremos o mesmo procedimento descrito para o clculo da mediana (Q2) para dados agrupados em classes.
Para o clculo do Q1 utilizamos a seguinte frmula:
Q1 = linf q1 +
A q1 fi
Fq11 (2.7)
f q1 4
onde:
linf o limite inferior da classe que contm o primeiro quartil;
q1
Fq11 a frequncia acumulada da classe anterior classe que contm o primeiro quartil;
fq1 o nmero de observaes da classe que contm o primeiro quartil;
Aq1 a amplitude do intervalo de classe que contm o primeiro quartil.
De maneira semelhante, o clculo do Q3 ser feito utilizando a seguinte frmula:
Q3 = linf q3 +
A q3 3 x fi
Fq3 1 (2.8)
f q3
4
onde:
linf o limite inferior da classe que contm o terceiro quartil;
q3
Fq31 a frequncia acumulada da classe anterior classe que contm o terceiro quartil;
fq3 o nmero de observaes da classe que contm o terceiro quartil;
Aq3 a amplitude do intervalo de classe que contm o terceiro quartil.
captulo 2
51
Exemplo 2.6
Vamos utilizar os dados do exemplo 2.3 para encontrar o primeiro e o terceiro quartil.
TEMPO DE VIDA
PM
xI
fa
3 18
10,5
18 33
25,5
33 48
40,5
11
48 63
55,5
19
63 78
10
70,5
29
78 93
28
85,5
57
93 108
100,5
59
108 123
115,5
60
Total
60
Resoluo
Primeiramente, temos que encontrar a classe que contm o primeiro quartil. Esta classe corresponde classe associada frequncia acumulada imediatamente superior
52
captulo 2
fi
4
Como
tanto,
fi =60.
Fq1 = frequncia acumulada da classe anterior classe que contm o primeiro quartil. Portanto, fq1 = 11.
fq1 = nmero de observaes da classe que contm o primeiro quartil. Portanto, fq1 = 8.
Aq1 = amplitude do intervalo da classe que contm o primeiro quartil. Portanto, Aq1 = 63 48 = 15.
Agora, basta substituirmos todos os valores encontrados na frmula 2.7 e
encontrar o valor do primeiro quartil:
Q1 = 48 +
15 60
15
3 x fi
4
Como
3 x fi
4
captulo 2
53
fi = 60.
tanto,
Fq3= frequncia acumulada da classe anterior classe que contm o terceiro
quartil. Portanto, Fq3 = 29.
fq3= nmero de observaes da classe que contm o terceiro quartil. Portanto, fq3 = 28.
Aq3 = amplitude do intervalo da classe que contm o terceiro quartil. Portanto, Aq3 = 93 78 = 15.
Agora, basta substituirmos todos os valores encontrados na frmula 2.8 e
encontrar o valor do terceiro quartil:
Q3 = 78 +
15 3 x 60
15
29 = 78 + ( 45 29 ) = 78 + 8, 57 86, 57
28 4
28
Pk = linf pk +
A pk k x fi
Fpk 1
f pk 100
(2.9)
em que k = 1,2,,99.
O procedimento para encontrar as quantidades que devem ser substitudas na
frmula 2.9 so os mesmos que utilizamos para encontrar os quartis.
54
captulo 2
Exemplo 2.7
Vamos utilizar os dados do exemplo 2.3 para encontrar o dcimo quinto
percentil.
TEMPO DE VIDA
PM
xI
fa
3 18
10,5
18 33
25,5
33 48
40,5
11
48 63
55,5
19
63 78
10
70,5
29
78 93
28
85,5
57
93 108
100,5
59
108 123
115,5
60
Total
60
15 x
fi .
100
Como
15 x
100
100
captulo 2
55
fi = 60.
tanto,
Fp15 = frequncia acumulada da classe anterior classe que contm o dcimo quinto percentil. Portanto, Fp15 = 7.
fp15 = nmero de observaes da classe que contm o dcimo quinto percentil. Portanto,fp15 = 4.
Ap15= amplitude do intervalo da classe que contm o dcimo quinto percentil. Portanto, Ap15 = 48 33=15.
Agora, basta substituirmos todos os valores encontrados na frmula 2.9 e
encontrar o valor do dcimo quinto percentil:
P15 = 33 +
15 15 x 60
15
7 = 33 + ( 9 7 ) = 33 + 7, 5 = 40, 5
4 100
4
CONEXO
Agora que j abordamos como se calcula os quartis e percentis, faa uma leitura do texto:
Decis (Dk) em TIBONI, Conceio G.R. Estatstica bsica - para os cursos de Administrao, Cincias Contbeis, Tecnolgicos e de Gesto. So Paulo: Atlas, 2010.
56
captulo 2
ATIVIDADE
1. Quais as vantagens e desvantagens do modelo linear?Os dados abaixo referem-se ao
nmero de horas extras de trabalho de uma amostra de 64 funcionrios de uma determinada empresa localizada na capital paulista.
10
10
12
14
14
14
15
16
18
18
18
18
18
19
20
20
20
20
20
21
22
22
22
22
22
22
22
22
22
22
22
22
23
23
24
24
24
24
24
24
24
25
25
25
25
26
26
26
26
26
26
27
27
27
28
28
29
30
30
32
35
36
40
41
Pede-se:
a) Calcule e interprete as seguintes medidas descritivas calculadas para os dados brutos (dados no tabulados): mdia aritmtica; mediana; moda.
b) Construir uma distribuio de frequncias completa (com freq. absoluta, freq. relativa,
freq. acumulada e ponto mdio).
c) Com a tabela construda no item b), encontre as seguintes medidas: mdia aritmtica;
mediana; moda; 1 quartil; 7 decil; 99 percentil. Interprete os resultados.
d) Construa o histograma para este conjunto de dados.
captulo 2
57
NMERO DE VENDEDORES
01
12
12
23
20
34
48
45
14
56
10
Total
110
58
captulo 2
NMERO DE FILHOS
FREQUNCIA DE FAMLIAS
19
22
28
16
Frequncia
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0
20 | 25
25 | 30
30 | 35
35 | 40
40 | 45
45| 50
Idade
captulo 2
59
REFLEXO
Que a mdia a medida de posio mais utilizada em nosso dia a dia talvez nem seria necessrio dizer. Mas preciso tomar certo cuidado quando utilizamos a mdia como parmetro
de um conjunto de dados. Voc sabe que, se a mdia de sua turma em Estatstica for igual
a 7,0 (por exemplo), no quer dizer que toda ela, ou a maioria, teve bom desempenho nem
que metade da turma teve desempenho igual ou superior a 7,0. Outras medidas, como vimos,
podem complementar as informaes dadas pela mdia.
LEITURA
Como a mdia uma medida descritiva muito utilizada no dia a dia, sugerimos que voc oua
o udio Mdias que interessam, da Srie: Problemas e Solues. H dois mdulos cujos
contedos alertam par ao cuidado que se deve ter na interpretao da mdia, mostram uma
aplicao da mdia ponderada e fazem uma anlise crtica da utilizao da mdia como uma
informao nica. O endereo para acesso : http://m3.ime.unicamp.br/recursos/1315.
REFERNCIAS BIBLIOGRFICAS
ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatstica aplicada
administrao e economia. So Paulo: Pioneira Thomson Learning, 2003.
BUSSAB, Wilton de O.; MORETTIN, Pedro A. Estatstica bsica. So Paulo: Saraiva, 2003.
COSTA NETO, Pedro Luiz de Oliveira. Estatstica. So Paulo: Edgard Blucher, 2002.
DOWNING, Douglas; CLARK, Jeffrey. Estatstica aplicada. So Paulo: Saraiva, 2002.
60
captulo 2
FARIAS, Alfredo Alves de; SOARES, Jos Francisco; CSAR, Cibele Comini. Introduo
estatstica. Rio de Janeiro: LTC, 2003.
TIBONI, Conceio G. Rebelo. Estatstica Bsica - para os cursos de Administrao, Cincias Contbeis, Tecnolgicos e de Gesto. So Paulo: Atlas, 2010.
NO PRXIMO CAPTULO
Abordaremos no prximo captulo aspectos especficos do desenho departamental, assim como
as diversas formas de departamentalizao utilizadas pelas organizaes, tais como a departamentalizao funcional, divisional e suas diversas categorias, tais como projetos, produtos ou
servios, territorial, por clientes etc.
captulo 2
61
3
Medidas de
Disperso
3 Medidas de Disperso
Estas medidas servem para indicar o quanto os dados se apresentam dispersos em
torno da regio central. Fornecem, portanto, o grau de variao existente no conjunto de dados. Dois ou mais conjuntos de dados podem, por exemplo, ter a mesma mdia, porm os valores podero estar muito mais dispersos num conjunto do
que no outro. Ou seja, podem ter maior ou menor grau de homogeneidade.
OBJETIVOS
Por meio do estudo deste captulo, esperamos que voc seja capaz de calcular e interpretar
as medidas de disperso aplicadas a conjuntos de dados, com o objetivo de avaliar o grau
de homogeneidade.
REFLEXO
Voc se lembra de alguma vez em que saiu de casa tendo quase certeza de que ficaria preso
em um engarrafamento no trnsito? No preciso ser muito observador para perceber que,
em determinadas horas do dia, dependendo do dia da semana, o trnsito (nas grandes e nas
mdias cidades) estar congestionado. Talvez o melhor seria deixar para sair outra hora (se
isto for possvel). O fluxo de veculos, nesses momentos, apresenta certa homogeneidade,
ou seja, quase sempre est intenso. Dificilmente, num dia como esses, voc ter um fluxo
acentuadamente menor (ou maior) do que o que voc verifica todos os dias. Vamos estudar
situaes como essas, em que a informao sobre o grau de homogeneidade (ou heterogeneidade) nos ajudar a tomar a deciso mais adequada.
64
captulo 3
ATENO
As medidas de disperso indicam o grau de variabilidade das observaes. Estas medidas
possibilitam que faamos distino entre conjuntos de observaes quanto sua homogeneidade. Quanto menor as medidas de disperso, mais homogneo o conjunto de dados.
Percebemos, atravs desse exemplo bem simples, que uma simples medida
de disperso (a amplitude, por exemplo) j ajudaria muito a tomar certos cuidados com a arrumao das bagagens.
Veremos, nos prximos itens, como calcular e interpretar as seguintes medidas de disperso: amplitude, amplitude interquartil, desvio-padro, varincia e coeficiente de variao.
Primeiramente, vamos apresentar os clculos das medidas de disperso
para dados no-tabulados, ou seja, quando os dados no estiverem na forma de
distribuio de frequncias.
R = x ( mximo) - x ( mnimo)
(3.1)
captulo 3
65
Amplitude interquartil = Q3 Q1
(3.2)
Agora, vamos estudar uma medida de disperso muito utilizada e que leva
em conta todos os valores do conjunto de dados: o desvio-padro.
ATENO
O valor do desvio-padro nunca negativo. zero apenas quando todos os valores do conjunto
de dados so os mesmos. A unidade do desvio-padro a mesma unidade dos dados originais.
66
captulo 3
s=
( x i - x )2
i =1
n -1
( x1 - x ) 2 + ( x 2 - x ) 2 + + ( x n - x ) 2
n -1
(3.3)
( x )
-
s=
x i2
n -1
(3.4)
onde:
CONEXO
Para se entender um pouco mais sobre o conceito de variabilidade, acesse o endereo
http://www.gaussconsulting.com.br/si/site/05072.
captulo 3
67
s2 =
( x i - x )2
i =1
(3.5)
n -1
ou
( x )
-
s2 =
x i2
n -1
(3.6)
68
captulo 3
cv =
onde s o desvio-padro e
s
100
x
(3.7)
x a mdia aritmtica.
captulo 3
69
Exemplo 3.2: Um gerente de banco quis estudar a movimentao de pessoas em sua agncia na segunda semana de determinado ms. Ele constatou
que no primeiro dia entraram 1.348 pessoas, no segundo dia, 1.260 pessoas, no
terceiro, 1.095, no quarto, 832 e no ltimo dia do levantamento, 850 pessoas.
Encontre a amplitude, o desvio-padro, a varincia e o coeficiente de variao
para este conjunto de dados e interprete os resultados.
Resoluo
A amplitude dada por:
n 5
= = 1, 25
4 4
3xn 3x5
= = 3, 75 .
4
4
70
captulo 3
Ento:
Amplitude interquartil = Q3 Q1
=1260 850
=410 pessoas
Ento, a amplitude do intervalo que contm 50% das observaes centrais
410 pessoas.
O desvio-padro obtido atravs das frmulas (3.3) ou (3.4). Como a mdia
aritmtica um nmero inteiro e existem poucos dados, a frmula (3.3) mais
rpida de ser calculada. Porm, fica a critrio de cada um a utilizao de uma ou
de outra. Lembrando que a mdia aritmtica encontrada anteriormente igual
a 1.077 e utilizando a frmula (3.3), temos:
n
s=
( x i - x )2
i =1
n -1
(1.348 -1.077)2 + (1.260 -1.077)2 + (1.095 -1.0777)2 + (832 -1.077)2 + (850 -1.077)2
218.808
= 54.702 @ 233 , 88 pessoas
4
5 -1
Neste exemplo, entram na agncia, em mdia, 1.077 pessoas por dia. O nmero de pessoas que entra na agncia varia, mas, tipicamete, a diferena em
relao mdia foi de aproximadamente 234 pessoas.
A varincia, como vimos, obtida atravs das frmulas (3.5) ou (3.6), ou simplestemente, como j temos o desvio-padro, basta elevarmos o valor encontrado ao quadrado. Para o nosso exemplo, temos:
s2= (233,88 pessoas)2 = 54699,85 pessoas2
captulo 3
71
cv =
s 233, 88
=
@ 0, 2172 ou 21, 72%
1.077
x
Utilizando a regra emprica, podemos dizer que o conjunto de dados apresenta uma mdia disperso.
Agora, vamos aprender a calcular as medidas de disperso atravs de dados
tabulados.
Quando os dados estiverem na forma tabulada, haver uma pequena diferena no clculo das mdias de disperso, pois agora ser necessrio considerar as frequncias, que funcionaro como fatores de ponderao, referentes
a cada valor da varivel.
s=
( x i - x )2 fi
i =1
(3.8)
n -1
Desenvolvendo a frmula (3.8) chegamos frmula (3.9) que tambm utilizada para o clculo do desvio-padro:
( x f )
f -
s=
72
captulo 3
x i2
n -1
(3.9)
onde, para ambas as frmulas (3.8) e (3.9), xi representa cada uma das observaes do conjunto de dados ou, se os dados estiverem agrupados em classes de
frequncias, xi representa o ponto mdio da classe, x a mdia do conjunto de
dados, fi a frequncia associada a cada observao (ou classe de observaes) do
conjunto de dados e n o nmero de total de observaes no conjunto de dados.
s2 =
( x i - x )2 fi
i =1
(3.10)
n -1
ou
( x f )
f -
s2 =
x i2
n -1
(3.11)
captulo 3
73
NMERO DE FALTAS
31
20
Total
63
Encontre a amplitude, o desvio-padro, a varincia e o coeficiente de variao para este conjunto de dados e interprete os resultados.
74
captulo 3
Resoluo
A amplitude para este conjunto de dados dada por:
R = x(mximo) X(mnimo) = 6 0 = 6 faltas
A maior diferena entre os nmeros de faltas ao trabalho, por motivo de sade, que funcionrios de uma determinada empresa tiveram no perodo de um
ms, 6 faltas.
A amplitude interquartil dada por:
Amplitude interquartil = Q3 Q1 = 1 0 = 1 falta
O desvio-padro obtido atravs das frmulas (3.8) ou (3.9). Para exemplificar, vamos trabalhar com a frmula (3.9). Para facilitar, vamos montar um quadro com os resultados que nos interessa para aplicar tal expresso.
NMERO DE
FALTAS X1
fi
Xi X fi
Xi - fi
31
20
20
20
16
32
18
25
36
Total ()
63
53
131
captulo 3
75
( x f )
f -
s=
x i2
n -1
2
53)
(
131 -
63 =
63 -1
2809
63 @ 131 - 44, 59 @
62
62
131 -
cv =
s 1,18
=
@ 1, 4048 ou 140,48%
x 0, 84
O coeficiente de variao nos diz que este conjunto de dados apresenta uma
alta disperso.
Para finalizarmos, vamos fazer os clculos para os dados agrupados em
classes de frequncias. Para isto, vamos utilizar o exemplo 2.3 que se encontra
no item 2.3.
76
captulo 3
3 18
10,5
18 33
25,5
33 48
40,5
48 63
55,5
63 78
10
70,5
78 93
28
85,5
93 108
100,5
108 123
115,5
Total
60
captulo 3
77
Para o clculo da amplitude interquartil vamos utilizar os resultados obtidos no exemplo 2.6. Portanto:
Amplitude interquartil = Q3 Q1 = 86,57 55,5 = 31,07 dias
De acordo como valor obtido, conclumos que 50% das observaes centrais do
conjunto de dados esto contidas em um intervalo cuja amplitude 31,07 dias.
Para o clculo do desvio-padro, podemos utilizar as frmulas (3.8) ou (3.9),
onde o termo xi o ponto mdio de cada classe de frequncia. Como a mdia
aritmtica envolve valores decimais, mais simples efetuar os clculos atravs
da frmula (3.9). Como no exemplo anterior, vamos construir um quadro acrescentando as colunas que fornecero os valores que precisamos para substituir
na frmula 3.9.
CLASSES DE
FREQUNCIAS
PM (Xi)
Xi - fi
Xi - fi
3 18
10,5
31,5
330,75
18 33
25,5
102
2601
33 48
40,5
162
6561
48 63
55,5
444
24642
63 78
10
70,5
705
49702,5
78 93
28
85,5
2394
204687
93 108
100,5
201
20200,5
108 123
115,5
115,5
13340,25
Total
60
4155
322065
78
captulo 3
( x f )
f -
s=
@
x i2
n -1
322065 -
(4155)2
60 -1
60
17264025
60
@
59
322065 -
322065 - 287733, 75
@ 581, 89 @ 24,12 dias
59
cv =
s 24,12
=
@ 0, 3483 ou 34,83%
x 69, 25
captulo 3
79
ATIVIDADE
1. Vamos utilizar, entre outros exerccios, os mesmos da captulo 2, porm encontrando as
medidas de disperso.
Os dados abaixo referem-se ao nmero de horas extras de trabalho de uma amostra de
64 funcionrios de uma determinada empresa localizada na capital paulista.
10
10
12
14
14
14
15
16
18
18
18
18
18
19
20
20
20
20
20
21
22
22
22
22
22
22
22
22
22
22
22
22
23
23
24
24
24
24
24
24
24
25
25
25
25
26
26
26
26
26
26
27
27
27
28
28
29
30
30
32
35
36
40
41
80
captulo 3
NMERO DE VENDEDORES
0 | 1
1 | 2
12
2 | 3
20
3 | 4
48
4 | 5
14
5 | 6
10
Total
110
captulo 3
81
NMERO DE FILHOS
FREQUNCIA DE
FAMLIAS
19
22
28
16
Frequncia
Histograma
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0
20 | 25
25 | 30
30 | 35
35 | 40
40 | 45
45| 50
Idade
82
captulo 3
TIPOS DE CAIXAS
15
20
30
REFLEXO
Vimos, neste captulo, que to importante quanto conhecer a mdia de um conjunto de dados
determinar o seu grau de variabilidade (ou disperso).
Por exemplo, num bairro nobre da capital paulista est uma das maiores favelas de So Paulo. Se analisarmos somente o valor da renda mdia do bairro certamente vamos concluir que
o valor obtido comparvel s melhores economias do mundo. Porm, devemos levar em
conta que a discrepncia entre os diversos valores da renda deve ser muito grande. Ento,
para quantificar a variabilidade dos valores da varivel em estudo fundamental calcular as
medidas de disperso, particularmente o desvio-padro.
LEITURA
Aqui, sugerimos a leitura do artigo E se todos fossem ao mesmo cinema ao mesmo tempo?
do professor Luiz Barco, disponvel em http://super.abril.com.br/ciencia/lei-regularidade-estatistica-se-todos-fossem-ao-mesmo-cinema-ao-mesmo-tempo-439499.shtml. Ele retrata,
de forma bem interessante, a questo da regularidade dos fenmenos relacionados ao comportamento social.
captulo 3
83
REFERNCIAS BIBLIOGRFICAS
ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatstica aplicada
administrao e economia. So Paulo: Pioneira Thomson Learning, 2003.
BUSSAB, Wilton de O.; MORETTIN, Pedro A. Estatstica bsica. So Paulo: Saraiva, 2003.
COSTA NETO, Pedro Luiz de Oliveira. Estatstica. So Paulo: Edgard Blucher, 2002.
DOWNING, Douglas; CLARK, Jeffrey. Estatstica aplicada. So Paulo: Saraiva, 2002.
FARIAS, Alfredo Alves de; SOARES, Jos Francisco; CSAR, Cibele Comini. Introduo
estatstica. Rio de Janeiro: LTC, 2003.
NO PRXIMO CAPTULO
Nos captulos j vistos, estudamos formas de organizar e resumir dados por meio de distribuies de frequncias e de medidas descritivas. So processos que, geralmente, nos passam
informaes sobre algo que j ocorreu. Tais informaes tambm so de fundamental importncia para que possamos prever o que ir acontecer no futuro. Para isso, no prximo captulo,
estudaremos a teoria de probabilidades, que, entre outras coisas, auxilia-nos na determinao
de ocorrncia de eventos futuros, tais como: vai chover amanh, qual ser minha receita no
prximo ms, qual o nvel de demanda de meu produto no prximo ano, entre muitos outros.
84
captulo 3
4
Noes de
Probabilidade
4 Noes de Probabilidade
Nos captulos anteriores vimos como organizar e descrever conjuntos de dados
atravs de grficos, tabelas e medidas resumo, tais como: medidas de posio
e disperso. Observamos que os resultados obtidos nos auxiliam na anlise e
interpretao dos dados.
Neste captulo estudaremos conceitos bsicos de probabilidade.
OBJETIVOS
Com o estudo dos conceitos abordados neste captulo, voc ser capaz de identificar experimentos aleatrios e calcular as probabilidades de ocorrncia de determinados eventos,
atravs da definio de probabilidade e de suas propriedades.
REFLEXO
Voc se lembra do significado da palavra probabilidade? Sabe qual o seu real sentido? E
qual a sua importncia em nosso dia a dia? Certamente voc j deve ter feito perguntas cujas
respostas dependiam do clculo de probabilidades. Por exemplo:
Qual a probabilidade de chover no prximo final de semana prolongado?
Qual a probabilidade de se ganhar na Mega - Sena jogando um volante com seis nmeros?
Qual a probabilidade das vendas de determinado produto decrescer se aumentarmos o
preo do produto?
O clculo destas e outras probabilidades nos auxiliam na tomada de decises.
Introduo
O clculo efetivo de uma probabilidade depende frequentemente do uso dos
resultados da anlise combinatria. A anlise combinatria a parte da Matemtica que desenvolve tcnicas e mtodos de contagem.
Apresentaremos, nos itens a seguir, um resumo dos principais resultados
dessa rea da Matemtica elementar.
86
captulo 4
1 Etapa (escolha do
sanduche)
2 Etapa (escolha do
suco)
Resultado combinado
laranja
(F,L)
uva
(F,U)
laranja
(A,L)
uva
(A,U)
laranja
(Q,L)
uva
(Q,U)
Frango
Atum
Queijo branco
captulo 4
87
Exemplo 4.2
Quantos nmeros de trs algarismos podemos formar com os algarismos
0,1,2,3,4,5 e 6?
Resoluo:
O primeiro algarismo pode ser escolhido de seis maneiras distintas, pois o
nmero que ser formado no pode comear por zero. Observe que 021 = 21;
O segundo algarismo pode ser escolhido de sete maneiras distintas, pois
pode haver repetio de algarismo;
O terceiro algarismo tambm pode ser escolhido de sete maneiras distintas.
Ento, pelo PFC, a quantidade de nmeros que podemos formar :
6 7 7 = 294
88
captulo 4
7 ! = 7 6 5 4 3 2 1 = 7 6!
6!
Exemplo 4.3
Vamos encontrar o valor de
12 !
.
8!
Resoluo
Para encontrar o valor de 12!/8!, podemos desenvolver o fatorial do nmero
maior (12) at chegarmos ao fatorial do nmero menor (8).
Ento:
12! 12 11 10 9 8!
=
= 11880
8!
8!
Podemos dividir o 8! do numerador com o 8! do denominador, obtendo
como resultado 1. Ento, o resultado final ser a multiplicao de 12 11 10 9.
Agora, vamos estudar mtodos de contagem de determinados agrupamentos, baseados no PFC, que simplificaro a resoluo de muitos problemas.
captulo 4
89
4.3 Arranjo
Dado um conjunto com n elementos distintos, chamamos arranjo dos n elementos, tomados k a k, a qualquer sequncia ordenada de k elementos distintos escolhidos entre os n existentes.
Expressamos a definio acima da seguinte maneira:
A n ,k =
n!
,nk
(n - k )!
Exemplo 4.4
Dado o conjunto A={1,2,3,4,5,6}, quantos arranjos desses seis elementos
tomados dois a dois podemos formar?
Resoluo
Vamos escrever todas as sequncias ordenadas de dois elementos distintos
escolhidos entre os seis elementos do conjunto A:
(1,2) (1,3) (1,4) (1,5) (1,6) (2,1) (2,3) (2,4) (2,5) (2,6)
(3,1) (3,2) (3,4) (3,5) (3,6) (4,1) (4,2) (4,3) (4,5) (4,6)
(5,1) (5,2) (5,3) (5,4) (5,6) (6,1) (6,2) (6,3) (6,4) (6,5)
Da sequncia descrita acima, observamos que cada arranjo difere dos demais:
pela natureza dos elementos escolhidos:
(1,3) (3,5)
pela ordem dos elementos escolhidos:
(1,3) (3,1)
J sabemos que a quantidade de arranjos que pode ser formada 30. Utilizando a frmula, obtemos:
A 6, 2 =
6!
6! 6 5 4!
= =
= 30
4!
( 6 2 )! 4!
90
captulo 4
A quantidade de arranjos que pode ser formada tambm pode ser obtida atravs do PFC:
6 5 = 30
n de opes para a
escolha do 1 elemento do par
n de opes para a
escolha do 2 elemento do par
4.4 Permutao
H situaes em que devemos escolher n elementos distintos, entre os n disponveis, para formar uma sequncia ordenada (arranjo). Nestas situaes, o
nome dado a estes arranjos permutao.
Assim, o nmero de permutaes de n elementos distintos dado por:
Pn = n!
Podemos observar que a permutao um caso particular do arranjo, pois:
Exemplo 4.5
Quantos so os anagramas (diferentes disposies das letras de uma palavra) da palavra PAZ?
Resoluo
Vamos listar todos os anagramas:
PAZ
PZA
APZ
AZP
ZPA
ZAP
captulo 4
91
P nn1,n 2 ,...,n r =
n!
n1 !n 2 !...n r !
Para ficar mais claro este conceito, vamos analisar o exemplo a seguir.
Exemplo 4.6
Vamos determinar o nmero de anagramas formados com a palavra ARITMTICA.
Resoluo
A palavra ARITMTICA possui 10 letras, sendo 2 letras iguais a A, 2 iguais a
I e 2 letras T. Ento, temos um caso de permutao com elementos repetidos.
O nmero de anagramas que podemos formar :
P102,2,2 =
10 9 8 7 6 5 4 3 2! 1814400
=
= 453600
2!2!2!
4
4.5 Combinao
Na definio de arranjo vimos que, quando tomamos k elementos distintos de
n existentes, formamos uma sequncia ordenada.
H casos em que s interessam os elementos que compem a
sequncia, no importando a ordem em que ali figuram. Nestes casos, temos,
ento, o que se chama de combinao de n elementos tomado k a k:
Cn ,k =
92
captulo 4
n!
k !( n k )!
Exemplo 4.7
Maria quer escolher dois sabores de torta doce para servir em sua festa de
final de ano. A doceria oferece os seguintes sabores: limo (L), chocolate (C),
morango (M) e floresta negra (F). De quantas formas distintas Maria poder
fazer essa escolha?
Resoluo
Neste exemplo conseguimos perceber que no importa a ordem em que os
sabores so escolhidos. Escolher, por exemplo, torta de chocolate e morango
{C,M} o mesmo que escolher torta de morango e chocolate {M,C}. Cada possvel escolha de Maria representa, portanto, uma combinao de quatro sabores tomados dois a dois.
O nmero de formas distintas de Maria escolher os sabores :
C 4, 2 =
4!
4 3 2!
=
=6
2 !( 4 2 )!
2!2
93
CONEXO
Para voc conhecer um pouco mais sobre a histria da probabilidade sugerimos ouvir o
udio Histria da Probabilidade, disponvel em http://m3.ime.unicamp.br/recursos/1253.
94
captulo 4
Alguns dos eventos que podem ser definidos neste experimento so:
A: sada de face par
A = {2,4,6}
B: sada de face mpar
B = {1,3,5}
C: sada de face maior que 6
C = . Neste caso indica o conjunto vazio. Este evento denominado evento impossvel.
D: sada de face menor que 2
D = {1}, que denominado evento simples.
E: sada de face menor ou igual a 6
E = {1,2,3,4,5,6}, que o prprio espao amostral . Este evento denominado evento certo.
Podemos observar, pelos eventos definidos anteriormente, que um evento pode no conter elementos (conjunto vazio), conter somente um elemento
(evento simples), conter mais de um elemento e, finalmente, pode ser constitudo por todos os elementos do espao amostral, ou seja, o evento o prprio .
captulo 4
95
4.8.2 Interseco
A interseco de dois eventos A e B, denotado por A B, o evento que contm
os pontos amostrais que pertencem simultaneamente aos eventos A e B.
Observao
Quando estamos interessados na interseco de dois eventos utilizamos
a conjuno e, ou seja, queremos encontrar os elementos que pertencem ao
evento A e ao evento B. No caso da unio de dois eventos utilizamos a conjuno ou, ou seja, so elementos que pertencem ao evento A, ou ao B ou a ambos.
96
captulo 4
4.8.3 Complementao
O complemento do evento A, denotado por Ac , definido como o evento que contm todos os pontos amostrais que no pertencem ao evento A, ou seja, Ac = W A
AC
Exemplo 4.9
Considerando o experimento aleatrio do exemplo 4.8 temos que W
={1,2,3,4,5,6}.
Definindo os eventos A e B como:
A: sada de face par
A = {2,4,6}
B: sada de face menor ou igual a 4
B = {1,2,3,4}
Determinar A B, A B, Ac ,Bc , Ac Bc, Ac Bc , Ac B , Bc A
Resoluo
A B = {1,2,3,4,6}
A B = {2,4}
Ac = {1,3,5}
Bc = {5,6}
Ac Bc = {1,3,5,6}
Ac Bc = {5}
Ac B = {1,3}
Bc A = {6}
captulo 4
97
4.9 Probabilidade
A probabilidade um nmero que mede a possibilidade de ocorrncia de um
evento. O clculo da probabilidade pode ser efetuado de trs maneiras: atravs
da definio clssica de probabilidade, atravs da definio frequencial de probabilidade e atravs do mtodo subjetivo.
Vamos concentrar nossos estudos na definio clssica e frequencial. No
mtodo subjetivo, a probabilidade estimada com base no conhecimento de
circunstncias relevantes. Por exemplo, dado o estado de sade do paciente e
a extenso dos ferimentos, um mdico pode sentir que esse paciente tem uma
chance de 95% de se recuperar completamente.
4.9.1 Definio Clssica
Aplicamos esta definio quando os pontos amostrais do espao amostral so
equiprovveis, ou seja, tm a mesma probabilidade de ocorrer. Por exemplo,
quando jogamos um dado equilibrado todas as faces tm a mesma probabilidade de ocorrer, ou seja, 1/6.
Dado um evento A, a probabilidade de A, representada por P(A), obtida
atravs da definio clssica por:
P (A )=
(4.1)
Exemplo 4.10
Retira-se uma carta de um baralho completo de 52 cartas. Qual a probabilidade de sair um rei?
Resoluo
O espao amostral deste experimento :
98
captulo 4
P (A )=
4
52
4
, 0, 0769, ou,
52
P(A) =
(4.2)
captulo 4
99
Resoluo
Pelas informaes, temos que 1.600 televisores no precisaram de reparos
durante a garantia. Sendo o evento A: a televiso no precisa de reparo durante
a garantia e utilizando a teoria frequencial, temos:
P(A) =
1.600 4
= = 0, 8
2.000 5
0 P(A) 1
P(W) = 1
P (A B) = P(A) + P(B) P(A B)
Se A e B forem mutuamente exclusivos, ento P (A B) = P(A) + P(B)
P(Ac) = 1 P(A)
Exemplo 4.12
Retira-se uma carta de um baralho completo de 52 cartas. Qual a probabilidade de sair um nove ou uma carta de paus?
Resoluo
Neste experimento aleatrio, temos que o espao amostral formado por
52 pontos amostrais, ou seja, W = {Ao,...,Ko, AE,... KE, AP,...KP,AC,...,Kc}. Vale relembrar que todos os pontos amostrais so equiprovveis, com isso podemos
utilizar a definio clssica de probabilidade. Devemos observar tambm que o
100
captulo 4
4
52
13
52
1
A B = {9P }, por tan to, P (A B)=
52
Assim,
P (A B)= P (A )+ P (B)- P (A B)
4 13 1
+ 52 52 52
16
P (A B)=
52
P (A B)=
Exemplo 4.13
Uma urna contm 30 bolas vermelhas, 12 bolas azuis e 7 bolas pretas. Extraindo-se aleatoriamente uma bola, qual a probabilidade de ser:
a) vermelha
P (V )=
30
49
b) azul
P (A )=
12
49
captulo 4
101
c) azul ou preta
P (A P )= P (A )+ P (P )=
12 7 19
+
=
49 49 49
( ) () (
P (P )=
7
49
Exemplos 4.14
Em um congresso cientfico existem 25 administradores e 17 matemticos.
Qual a probabilidade de ser formar uma comisso com 8 membros, na qual
figurem 5 administradores e 3 matemticos?
Resoluo
Vamos definir o evento A como: a comisso formada por 5 administradores e 3 matemticos.
O nmero total de comisses que conseguimos formar com 8 membros :
42
= 118.030.185
8
Agora, o nmero de comisses que conseguimos formar com 5 administradores e 3 matemticos :
25 17
= 36.128.400
5 3
102
captulo 4
Portanto:
P (A) =
36.128.400
= 0, 3061 x 100 = 30, 61%
118.030.185
P1
P2
12
120 42
74
captulo 4
103
Ento:
a) Definindo o evento A: o aluno no acertou nenhum problema, temos:
P (A) =
74
= 29, 84%
248
P (A) =
42
= 16, 94%
248
P (A / B)=
P (A B)
,
P (B)
com P (B)> 0
(4.3)
P (A B)= P (B).P (A | B)
104
captulo 4
(4.4)
Exemplo 4.16
H 100 candidatos para uma vaga numa empresa multinacional. Alguns
tm curso superior, outros no. Alguns tm experincia no ramo, outros no.
Os dados so:
Com experincia
anterior
Sem experincia
anterior
Total
POSSUI
CURSO
SUPERIOR
NO POSSUI
CURSO
SUPERIOR
TOTAL
35
45
80
15
20
50
50
100
captulo 4
105
P(B) =
50
100
e
P (A B)=
35
100
35 / 100 35
=
= 0,, 7
50 / 100 50
Note que o valor que aparece no denominador o total de casos do evento que sabemos que ocorreu. Neste exemplo sabamos que o candidato escolhido tinha curso
superior e o total de candidatos com este perfil 50, justamente o valor que aparece no
denominador do clculo da probabilidade condicional.
106
captulo 4
P (A | B)= P (A )
(4.5)
(4.6)
Exemplo 4.17
Numa caixa com 20 lmpadas, 4 so defeituosas. Extraindo-se aleatoriamente duas lmpadas, sem reposio, qual a probabilidade de:
a) nenhuma ser defeituosa;
b) ambas serem defeituosas.
c) considerando a extrao das duas lmpadas, com reposio, encontre a
probabilidade de nenhuma delas ser defeituosa.
Resoluo
Neste exemplo os eventos so dependentes, pois no h reposio das lmpadas na caixa, ou seja, o resultado obtido na extrao da segunda lmpada
afetado pelo resultado obtido na primeira extrao.
a) Nenhuma lmpada ser defeituosa significa que as duas so perfeitas.
Vamos indicar por P1 primeira lmpada ser perfeita e por P2 segunda
lmpada ser perfeita. Como queremos encontrar a probabilidade da primeira ser perfeita e da segunda ser perfeita tambm devemos utilizar o
conceito da regra da multiplicao,
16 15 240
. =
= 0, 6316
20 19 380
captulo 4
107
b) Indicando por D1 primeira lmpada ser defeituosa e por D2 segunda lmpada ser defeituosa temos:
4 3
12
. =
= 0, 0316
20 19 380
c) Vamos indicar por primeira lmpada ser perfeita e por segunda lmpada ser perfeita. Neste caso, as duas extraes so independentes, pois
o resultado da segunda extrao no afetado pelo primeiro resultado.
Ento:
P ( P1 P2 ) = P ( P1 ) ( P2 )
P ( P1 P2 ) =
16 16
= 64%
20 20
Exemplo 4.18:
Para testar se um sistema especialista responde satisfatoriamente a um usurio, foram feitas cinco perguntas, cada uma com quatro alternativas de resposta.
Se o sistema escolhe as alternativas aleatoriamente, qual a probabilidade de ele
responder corretamente a todas as cinco perguntas?
Resoluo
Definindo os eventos:
P1: acertar a pergunta 1
P2 :acertar a pergunta 2
P3: acertar a pergunta 3
P4: acertar a pergunta 4
P5: acertar a pergunta 5
Como o sistema escolhe as alternativas aleatoriamente, a probabilidade de
ele acertar a pergunta
108
captulo 4
O fato do sistema ter escolhido uma alternativa (correta ou errada) em determinada pergunta no afeta as probabilidades de escolhas das outras perguntas. Portanto, os eventos so independentes. Ento:
1 1 1 1 1
P ( P1 P2 P3 P4 P5 ) = P ( P1 ) P ( P2 ) P ( P3 ) P ( P4 ) P ( P5 ) =
4 4 4 4 4
1
=
= 0, 0977%
1024
Estudaremos, no prximo item, uma das relaes mais importantes envolvendo probabilidades condicionais. A ideia central atualizarmos valores prvios de probabilidades calculando as probabilidades adicionais, denominadas
probabilidades posteriores.
captulo 4
109
P (A | R ) =
P (A R )
P (R )
Agora, a interpretao da probabilidade que est no denominador fundamental para o entendimento deste teorema.
A probabilidade do evento R ocorrer est associada utilizao de duas sub-rotinas.
Sabemos que o programa foi realizado dentro do limite de tempo, mas no
sabemos qual sub-rotina foi utilizada. Com isto, precisamos considerar estas
duas situaes:
R A foi realizado dentro do limite de tempo e utilizada a rotina A;
R B foi realizado dentro do limite de tempo e utilizada a rotina B.
Ento, o clculo de P(R) dado por:
P(R) = P(R A) + P(R B)
ou seja, a probabilidade do evento R ocorrer a soma das duas situaes
possveis.
As probabilidades informadas no enunciado so:
P(A) = 0,40 probabilidade obtida atravs da definio frequencial;
P(B) = 0,60 probabilidade obtida atravs da definio frequencial;
P(R|A)=0,75 probabilidade do programa ser realizado dentro do tempo,se (sabendo que) A usada;
P(R|B) = 0,50 probabilidade do programa ser realizado dentro do tempo,se (sabendo que) B usada.
Como vamos encontrar P(R A) e P(R B)? Utilizaremos a regra da multiplicao, abordada no item 4.11.1.
110
captulo 4
Esta regra nos diz que a probabilidade da interseco dos dois eventos pode
ser obtida da seguinte maneira:
P(R A) = P(R|A) P(A)
e
P(R B) =P (R|B) P(B)
As probabilidades que esto do lado direito da igualdade so fornecidas no
enunciado. Ento:
P(R A) = P(R A) P(A) = 0,75 0,40 = 0,30
e
P(R B) = P(R B) P(B) = 0,50 0,60 = 0,30
Finalmente, conseguiremos calcular a probabilidade procurada:
P (A | R ) =
P (A R )
P (A R )
P (R | A) P (A)
=
=
P (R )
P ( R A ) + P ( R B) P ( R | A ) P ( A ) + P ( R | B) P ( B)
P (A | R ) =
0, 30
0, 30
=
= 0, 5 = 50%
0, 30 + 0, 30 0, 60
captulo 4
111
Considere um evento qualquer A em . Supomos conhecidas as probabilidades P(Ci) e P(ACi ),i = 1,2,,n. A probabilidade de ocorrncia do evento Ci,
supondo-se a ocorrncia do evento A, dada por:
P (Ci | A )=
P (Ci )P (A | Ci )
j =1 P (C j )P (A | C j )
n
ATIVIDADE
1. Uma biblioteca acaba de receber, por doao, 40 novos livros, inclusive 15 romances histricos. Se 3 desses livros so escolhidos aleatoriamente, sem reposio, qual a probabilidade de:
a) nenhum ser um romance histrico;
b) todos serem romances histricos;
c) pelo menos um ser romance histrico.
2. Como parte de uma campanha de promoo em So Paulo e no Rio de Janeiro, uma indstria de produtos de limpeza oferecer um prmio de R$ 50.000,00 a quem enviar seu
nome em um formulrio, com a opo de incluir um rtulo de um dos produtos da indstria.
A distribuio dos 200.000 formulrios recebidos est a seguir:
COM RTULO
SEM RTULO
So Paulo
100.000
40.000
Rio de Janeiro
45.000
15.000
112
captulo 4
c) P(A | B)
d) P(Ac | Bc)
e) P(Ac | Bc)
f) P(B | Ac)
3. Uma loja de cosmticos tem os seguintes dados sobre a idade e o estado civil de
150 clientes.
ESTADO CIVIL
IDADE
SOLTEIRO
CASADO
30
70
20
MAIS DE 30
30
30
captulo 4
113
5. Um satlite em rbita tem trs painis solares, e todos eles devem permanecer ativos a fim
de garantir o bom desempenho do aparelho. Os painis funcionam independentemente uns
dos outros. A chance de falha de cada um 0,01. Qual a probabilidade de o satlite funcionar
perfeitamente durante a misso? (Essa probabilidade a chamada confiabilidade do sistema
Farias, Soares e Csar, pg. 65)
6. Uma rede local de computadores composta por um servidor e cinco clientes (A, B, C, D e
E). Registros anteriores indicam que dos pedidos de determinado tipo de processamento,
realizados atravs de uma consulta, cerca de 10% vm do cliente A, 15% do B, 15% do C,
40% do D e 20% do E. Se o pedido no for feito de forma adequada, o processamento
apresentar erro. Usualmente, ocorrem os seguintes percentuais de pedidos inadequados:
1% do cliente A, 2% do cliente B, 0,5% do cliente C, 2% do cliente D e 8% do cliente E.
a) Qual a probabilidade de o sistema apresentar erro?
b) Qual a probabilidade de que o processo tenha sido pedido pelo cliente E, sabendo-se que apresentou erro?
REFLEXO
O estudo de probabilidades, que iniciamos neste captulo, tem muitas aplicaes no dia a dia
do gestor. At o momento, nos preocupamos em apresentar a teoria referente ao assunto. No
entanto, as aplicaes que podemos fazer do clculo de probabilidades so muito diversificadas: determinar a margem de erro e o grau de confiana de uma pesquisa, fazer previses
(com certo grau de confiana) de eventos futuros, auxiliar na tomada de decises, calcular
riscos de certos investimentos, etc.
Procure assimilar bem todos os procedimentos e conceitos apresentados neste captulo para
que possa acompanhar o desenvolvimento dos mtodos que sero apresentados mais adiante..
LEITURA
Recomendamos a leitura do texto possvel quantificar o acaso?, disponvel no endereo
http://www.klick.com.br/materia/20/display/0,5912,POR-20-89-957-,00.html, que apresenta uma interessante situao sobre o estudo de probabilidades.
114
captulo 4
REFERNCIAS BIBLIOGRFICAS
ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatstica aplicada
administrao e economia. So Paulo: Pioneira Thomson Learning, 2003.
BARBETTA, Pedro A.; REIS, Marcelo M.; BORNIA, Antonio C. Estatstica: para os cursos de
engenharia e informtica. So Paulo: Atlas, 2004.
BUSSAB, Wilton de O.; MORETTIN, Pedro A.. Estatstica bsica. So Paulo: Saraiva, 2003.
FARIAS, Alfredo Alves de; SOARES, Jos Francisco; CSAR, Cibele Comini. Introduo
estatstica. Rio de Janeiro,: LTC, 2003.
FARBER, Larson. Estatstica aplicada. So Paulo: Pearson Prentice Hall, 2004.
IEZZI, Gelson; DOLCE, Osvaldo; DEGENSZAJN David; PRIGO, Roberto. Matemtica: volume nico. So Paulo: Atual, 2007.
MORETTIN, Luiz G. Estatstica Bsica Volume I Probabilidade. 7.ed. So Paulo: Makron
Books, 1999.
TOMAZ, Priscilla S.S. Anais do IX Seminrio Nacional de Histria da Matemtica. Disponvel
em: <http://www.each.usp.br/ixsnhm/Anaisixsnhm/Comunicacoes/1_Tomaz_P_S_S_Gerolamo_Cardano.pdf>. Acesso em: 30 set. 2014..
NO PRXIMO CAPTULO
No prximo captulo apresentaremos as variveis aleatrias, que so uma forma de associar
valores aos resultados do experimento aleatrio. Isso ir nos permitir ampliar a capacidade de
aplicao da teoria de probabilidades.
captulo 4
115
5
Variveis aleatrias
5 Variveis aleatrias
O espao amostral, em muitos experimentos, no consiste s em nmeros
como, por exemplo, o espao amostral referente ao lanamento de uma moeda,
que tem como pontos amostrais cara ou coroa. Em Estatstica, muitas vezes, estamos interessados em resultados numricos. Para transformar os resultados
do espao amostral em nmeros utilizamos o conceito de varivel aleatria.
OBJETIVOS
Que voc seja capaz calcular o valor esperado e o desvio padro de uma varivel aleatria
discreta e que consiga identificar as situaes nas quais podemos aplicar o modelo de probabilidade binomial, bem como calcular as probabilidades associadas a tal modelo.
REFLEXO
Voc se lembra dos conceitos de mdia e desvio-padro apresentados nos captulos 2 e 3?
E dos conceitos de probabilidade abordados no captulo 4? Neste captulo, combinaremos
aqueles conceitos ao desenvolvermos as distribuies de probabilidade, que descrevem o
que provavelmente acontecer, ao invs do que realmente aconteceu.
118
captulo 5
Vamos considerar aqui que a v.a. discreta tem um nmero finito de valores
possveis.
A distribuio de probabilidade de uma v.a. discreta X uma tabela que associa a cada valor de X sua probabilidade.
p(x)
x1
p(x1)
x2
p(x2)
x3
p(x3)
xn
p(xn)
Na tabela 5.1, os valores x1, x2, x3,..., xn so aqueles que a v.a. pode assumir e
p(x1) , p(x2), p(x3),..., p(xn) suas respectivas probabilidades.
Uma distribuio de probabilidade deve satisfazer as seguintes condies:
0 p(xi) 1,
i = 1,2,...,n
captulo 5
119
RESULTADOS
c,c,c
c,c,r
c,r,c
c,r,r
r,c,c
r,c,r
r,r,c
r,r,r
120
captulo 5
p(x)
1/8
3/8
3/8
1/8
NMERO DE DIAS
15
17
12
18
captulo 5
121
NMERO DE DIAS
10
NMERO DE DIAS
PROBABILIDADE
15
0,1667
17
0,1889
12
0,1333
18
0,2000
0,0889
10
0,1111
0,1000
0,0111
122
captulo 5
, a segunda probabili-
PROBABILIDADE
0,1667
0,1889
0,1333
0,2000
0,0889
0,1111
0,1000
0,0111
Total
captulo 5
123
(5.2)
(5.3)
124
captulo 5
Propriedades da varincia
Sejam a e b constantes e X uma varivel aleatria. Ento:
i) Var(a) = 0
ii) Var(bX) = b2Var(X)
iii) Var(X + a) = Var(X)
iv) Var(a + bX) = b2Var(X)
Observao: Indicaremos a mdia e a varincia de uma v.a. X por:
E(X) = m
Var(X) = s2
Exemplo 5.3: Utilizando os dados do exemplo 5.1, vamos calcular a mdia e
a varincia da v.a. X: nmero de coroas.
p(x)
x p(x)
x2 p(x)
1/8
3/8
3/8
3/8
3/8
6/8
12/8
1/8
3/8
9/8
Total
12/8
24/8
Resoluo
Substituindo os valores do quadro apresentado nas respectivas frmulas
temos:
captulo 5
125
Portanto, temos que o valor esperado do nmero de coroas, obtido no lanamento de 3 moedas, 1,5 e o desvio-padro 0,866
Exemplo 5.4
Num teste de digitao, o tempo em minutos (T) que os candidatos levam
para digitar um texto modelado, de forma aproximada, pela seguinte funo
de probabilidade:
126
captulo 5
P(T)
0,1
0,1
0,2
0,2
0,2
0,1
0,1
P(T)
10
0,1
0,1
0,2
0,2
0,2
0,1
0,1
captulo 5
127
P(P)
PP(P)
P2 P(P)
10
0,1
10
0,1
0,9
8,1
0,2
1,6
12,8
0,2
1,4
9,8
0,2
1,2
7,2
0,1
0,5
2,5
0,1
0,4
1,6
Total
52
128
captulo 5
Exemplo 5.5
Na produo de uma pea so empregadas duas mquinas. A primeira utilizada para efetivamente produzir as peas, e o custo de produo de R$ 50,00 por
unidade. Das peas produzidas nessa mquina, 90% so perfeitas. As peas defeituosas (produzidas na primeira mquina) so colocadas na segunda mquina
para a tentativa de recuperao (torn-las perfeitas). Nessa segunda mquina o
custo por pea de R$ 25,00, mas apenas 60% das peas so de fato recuperadas.
Sabendo que cada pea perfeita vendida por R$ 90,00, e que cada pea defeituosa vendida por R$ 20,00, calcule o lucro por pea esperado pelo fabricante.
Resoluo
Neste exemplo, a varivel aleatria de interesse :
X: lucro
Para entendermos melhor as informaes contidas no enunciado, vamos
montar um quadro:
CUSTO
VENDA
X
(LUCRO)
P(X)
50
90
40
0,9
50+25
90
15
0,06
50+25
20
-55
0,04
peas perfeitas na 1
mquina
peas perfeitas na 2
mquina
peas defeituosas
captulo 5
129
Na segunda linha esto as informaes das peas que precisaram ir para a segunda mquina e que tornaram-se perfeitas. O custo, nesta situao, ser de R$
75,00, pois o custo por pea na segunda mquina de R$ 25,00, adicionados aos
R$ 50,00 de custo da primeira mquina. Agora, vamos entender o porqu do valor
da probabilidade ser 0,06. Se 90% das peas produzidas pela primeira mquina so
perfeitas, 10% so defeituosas.
Destas 10% de peas defeituosas, apenas 60% so recuperadas pela segunda
mquina. Portanto, 0,10*0,6 = 0,06. Ento, a probabilidade do lucro assumir o
valor R$ 15,00 de 0,06.
E, na terceira linha, temos a informao das peas defeituosas. Neste caso,
a empresa ter prejuzo, pois o custo continuar sendo de R$ 75,00, e a pea
ser vendida por R$ 20,00. A probabilidade do lucro (que ser um prejuzo) assumir o valor de R$ 55,00 0,04, pois das peas defeituosas, 40% no so recuperadas pela segunda mquina. Portanto, 0,10*0,4 = 0,04.
Agora, com os valores obtidos no quadro, conseguimos encontrar o lucro
por pea esperado pelo fabricante.
CUSTO
VENDA
X P(x)
40
0,9
40 0,9 = 36,00
15
0,06
15 0,06 = 0,90
-55
0,04
55 0,04= 2,20
Total
34,70
130
captulo 5
(5.5)
onde:
n o nmero de tentativas do experimento aleatrio;
p = P(S) a probabilidade de sucesso em uma nica tentativa;
q = P(F) a probabilidade de fracasso em uma nica tentativa;
p + q = 1.
Quando a v.a. X tiver distribuio binomial, com parmetros n e p, indicaremos por X ~ b(n,p).
captulo 5
131
(5.6)
Exemplo 5.6: Uma pesquisa mostrou que 60% das famlias residentes na
grande So Paulo tm pelo menos dois carros. Determine a probabilidade de
que dentre 15 famlias selecionadas aleatoriamente nesta regio:
a) exatamente 5 tenham pelo menos dois carros;
b) de 8 a 10 tenham pelo menos dois carros.
Neste exemplo vamos definir a v.a. como tendo distribuio binomial, pois:
o experimento est sendo realizado 15 vezes, ou seja, 15 famlias foram
selecionadas para o estudo;
h somente dois resultados possveis: sucesso, se a famlia tem pelo menos dois carros e fracasso, se a famlia no tem pelo menos dois carros;
as respostas so independentes umas das outras, ou seja, uma famlia
ter pelo menos dois carros no afeta a probabilidade das outras famlias
terem ou no pelo menos dois carros.
O primeiro passo para iniciar a resoluo de problemas deste tipo definir
a v.a.. Neste caso, como estamos interessados no nmero de famlias com pelo
menos dois carros, a v.a. definida como:
X: nmero de famlias com pelo menos dois carros.
A v.a. X pode assumir os valores 0,1,2,...,15, pois, das 15 famlias selecionadas, pode acontecer de nenhuma ter pelo menos dois carros, 1 pode ter pelo
menos dois carros, 2 podem ter pelo menos dois carros , assim por diante, at
as 15 famlias com pelo menos dois carros.
132
captulo 5
captulo 5
133
Resoluo
Temos aqui um experimento binomial com:
X: nmero de peas defeituosas
X = 0,1,2,3,...,10.
n = 10 peas
P(Sucesso) = p = 0,07
P(Fracasso) = q = 0,93
Note que a probabilidade de sucesso que a pea seja defeituosa, pois a varivel aleatria est definida como o nmero de peas defeituosas.
a)
b) )
Neste caso podemos simplificar os clculos utilizando o complementar do
evento, isto ,
c)
d)
134
captulo 5
CONEXO
O clculo de probabilidades para variveis aleatrias cuja distribuio binomial tambm
pode ser feita no Excel. Para compreender a funo que deve ser utilizada, leia Utilizando
o Microsoft Excel para Obter Probabilidades Binomiais, que se encontra no livro Estatstica:
Teoria e Aplicaes Usando Microsoft Excel em Portugus, pp. 196.
ATIVIDADE
1. Uma urna contm 3 bolas brancas e 7 bolas verdes. Trs bolas so retiradas com reposio. Seja X: nmero de bolas verdes. Calcule E(X) e Var(X).
2. Uma companhia area tem as probabilidades
0,05
0,20
0,35
0,15
0,10
0,15
4. O tempo T, em minutos, necessrio para um operrio processar certa pea uma v.a.
com a seguinte distribuio de probabilidade:
p(T)
0,1
0,1
0,3
0,2
0,2
0,1
captulo 5
135
136
captulo 5
REFLEXO
Neste captulo vimos que a varivel aleatria fornece uma descrio numrica de um experimento aleatrio. Com os resultados que uma varivel aleatria pode assumir juntamente com
suas respectivas probabilidade obtemos a distribuio de probabilidade e podemos calcular o
valor esperado (mdia) e o desvio padro para a varivel aleatria. Podemos interpretar o valor
esperado como uma mdia ponderada dos valores que a varivel aleatria pode assumir. Os
pesos so as probabilidades. Estudamos, tambm, uma distribuio discreta de probabilidade
que tem muitas aplicaes: distribuio binomial. Desde que o experimento em estudo satisfaa os requisitos necessrios para que a varivel aleatria tenha distribuio binomial, encontramos facilmente, com o auxlio de uma calculadora cientfica, as probabilidades de interesse.
LEITURA
Sugerimos que voc assista ao vdeo Revendo a Moratria, da srie: Matemtica na Escola.
Ele apresenta uma aplicao do conceito de valor esperado. O endereo para acesso http://
m3.ime.unicamp.br/recursos/1170. Vale a pena conferir!
REFERNCIAS BIBLIOGRFICAS
ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatstica aplicada
administrao e economia. So Paulo: Pioneira Thomson Learning, 2003.
captulo 5
137
BUSSAB, Wilton de O.; MORETTIN, Pedro A.. Estatstica bsica. So Paulo: Saraiva, 2003.
FARIAS, Alfredo Alves de; SOARES, Jos Francisco; CSAR, Cibele Comini. Introduo
estatstica. Rio de Janeiro,: LTC, 2003.
FARBER, Larson. Estatstica aplicada. So Paulo: Pearson Prentice Hall, 2004.
LEVINE, David M.; BERENSON, Mark L.; STEPHAN, David. Estatstica: Teoria e Aplicaes
Usando Microsoft Excel em Portugus. Rio de Janeiro: LTC, 2000.
MAGALHES, Marcos Nascimento; LIMA, Antnio Carlos Pedroso de. Noes de probabilidade e estatstica. So Paulo: Editora da Universidade de So Paulo, 2004.
SPIEGEL Murray R. Estatstica. 3.ed. So Paulo: Makron Books, 1993.
EXERCCIO RESOLVIDO
Captulo 1
1.
a) qualitativa nominal
b) quantitativa discreta
c) quantitativa contnua
d) quantitativa discreta
e) quantitativa contnua
f) quantitativa contnua
g) quantitativa discreta
h) qualitativa nominal
i) quantitativa contnua
j) quantitativa contnua
k) qualitativa ordinal
l) qualitativa ordinal
m) qualitativa nominal
n) qualitativa nominal
138
captulo 5
2.
K 6 classes e amplitude da classe h 7
Tabela 1 Distribuio de frequncias das idades dos funcionrios.
IDADES
fr
fa
19| 26
0,1667
26| 33
13
0,4333
18
33| 40
0,1333
22
40| 47
0,1333
26
47| 54
0,1000
29
54| 61
0,0333
30
Total
30
a) 18
b) 13,33%
c) 17
d) 73,33%
e) 26,67%
captulo 5
139
3.
Outros
16,82%
Solteiro
42,87%
Separado
19,79%
Vivo
5,69
Casado
14,84%
Atravs do grfico, podemos dizer que aproximadamente 43% dos clientes desta agncia de turismo so solteiros, 20% so separados, 17% tm outro tipo de estado civil,
15% so casados e apenas 5% so vivos. Esta informao importante na hora de
lanar pacotes de viagens. A agncia deve se lembrar que grande parte de seus clientes
so solteiros. Tambm pode criar estratgias para trazer mais clientes casados ou vivos,
que provavelmente devem ter outro tipo de perfil.
4.
a) Valores gastos com supermercado. Varivel quantitativa contnua.
b) Tabela 1: Distribuio de frequncias para a varivel Valores gastos com supermercado.
fr
fa
4,89| 61,89
17
0,34
17
61,89| 118,89
13
0,26
30
118,89| 175,89
0,10
35
140
captulo 5
fr
fa
175,89| 232,69
0,10
40
232,89| 289,89
0,06
43
289,89| 346,89
0,06
46
346,89| 403,89
0,04
48
403,89| 460,89
0,04
50
Total
50
c)
403,89 | 460,89
346,89 | 403,89
289,89 | 346,89
232,89 | 289,89
118,89 | 175,89
61,89 | 118,89
4,98 | 61,89
175,89 | 232,89
Histograma
18
16
14
12
10
8
6
4
2
0
Gastos (R$)
captulo 5
141
18
17
16
Frequncia
14
Polgono de Frequncias
13
12
10
8
6
2
2
5
2
0
0
5.
a) Salrio de funcionrios de uma empresa. Esta varivel classificada como quantitativa
contnua.
b) 45 funcionrios
c) 86 funcionrios
d) 9,30%
e) 72,09%
f)
SALRIO (R$)
fr
fa
500,00| 800,00
17
19,77
17
800,00| 1.100,00
45
52,33
62
1.100,00| 1.400,00
12
13,95
74
1.400,00| 1.700,00
4,65
78
142
captulo 5
1.700,00| 2.100,00
3,49
81
2.100,00| 2.400,00
3,49
84
2.400,00| 2.700,00
2,33
86
Total
86
100,00
Captulo 2
Antes das respostas, gostaramos de deixar claro que as interpretaes das questes ficam
a cargo do estudante. Se ocorrerem dvidas, entrar em contato com o tutor.
1.
a)
x 23,1, Md = 22,5 e Mo = 22
b)
CLASSES
fr
fa
Pm
10 14
0,0469
12
14 18
0,0781
16
18 22
12
0,1875
20
20
captulo 5
143
25
0,3906
45
24
26 30
12
0,1875
57
28
30 34
0,0469
60
32
34 38
0,0313
62
36
38 42
0,0313
64
40
Total
64
1,0000
x 24,6
d)
N de horas
2.
a) Vendas mensais. Varivel quantitativa contnua.
b)
x 3,2
Md = 3,4 Mo = 3,5
144
captulo 5
42
|
38
34
38
34
30
30
22
22
18
18
14
|
10
26
24
22
20
18
16
14
12
10
8
6
4
2
0
14
Frequncia
Histograma
26
c)
22 26
3.
a)
x 17,1
b) Md = 2
c) Mo = 2
4.
a) Idade dos funcionrios
b) 48
c)
x 30,9
Md 29,7 Mo 27,8
d) Q1 25,7
e) 25
f) 4,17%
g) 47,9%
5. 4,3
Captulo 3
b) R =
32
cv 0,2633
s 5,8 s2 33,6
ou
26,33%
cv 0,2358
2. R = 6
s 1,24 s2 1,54
cv 0,3875
ou
3. R = 7
s 2,88 s2 8,29
cv0,45 ou
45%
4. R = 5
s 1,29 cv 0,7588
ou
ou 23,58%
38,75%
75,88%
captulo 5
145
5. R = 30
s 6,9 s2 47,6
6.
a) Caixa A (menor variao absoluta (s))
b) Caixa A (maior variao relativa (cv))
Captulo 4
1.
a) 0,2328
b) 0,0461
c) 0,7672
2.
a) 0,7
b) 0,725
c) 0,6897
d) 0,7143
e) 0,2727
f) 0,75
3.
a) 0,6667
b) 0,4
c) 0,3
d) 0,2222
4.
a) 0,75
146
captulo 5
b) 0,25
cv 0,2233
ou
22,33%
5. 5. 0,9703
6.
a) 0,02875
b) 0,5565
Captulo 5
1. E(X) = 2,1
Var(X) = 0,63
2. 2,5
3. R$ 1.400,00
4.
a) 4,6
b) E(G) = 2,75
Var(G) = 0,4125
5.
a) 0,000011
b) 0,0042
c) 0,8329
6. 0,0033
7.
a) 0,1317
c) 0,1646
b) 0,7901
d) 0,9959
captulo 5
147
8.
a) 0,0778
b) 0,2592
9.
a) 0,0881
10.
a) 0,324135
148
captulo 5
b) 0,420175
c) 0,9222