Apost Geral 2020
Apost Geral 2020
Apost Geral 2020
ESTATÍSTICA GERAL
Paulo Bonomo
Professor Pleno da UESB
1
Apresentação
Podemos considerar a Estatística como a ciência que se preocupa com a organização, descrição,
análise e interpretação dos dados experimentais. Ouvimos muito falar em estatísticas da loteria esportiva,
estatística da saúde pública, estatística do crescimento da população etc. Esta noção prende-se apenas à
parte de organização e descrição dos dados observados. Um outro campo da ciência Estatística refere-se a
análise e interpretação desses dados, caracterizando a inferência estatística. É razoável também que, para
poder-se fazer a inferência a respeito dos dados observados, deva-se primeiramente proceder a sua
organização e descrição dos mesmos.
Esta apostila é direcionada aos estudantes de graduação que estão cursando a disciplina
estatística geral. Nesta apostila são abordados os tópicos: estatística descritiva, introdução a teoria das
probabilidades, variáveis aleatórias, distribuições de probabilidade de variáveis aleatórias e introdução a
teste de hipótese. A compreensão desses tópicos permitirá ao aluno ter um suporte teórico para o
entendimento da estatística experimental, sendo esta de fundamental importância para um bom
acompanhamento das demais disciplinas dos cursos de graduação.
O presente material foi elaborado com o objetivo de dar suporte didático ao curso Estatística
Geral. No entanto não substitui a pesquisa em reconhecidos livros editados por autores nacionais e
internacionais.
Sumário
Capítulo Página
2
Cap 1. Estatística descritiva
1.1.Introdução
A estatística dedica-se ao desenvolvimento e ao uso de métodos para a coleta e análise de dados,
isto é, a interpretação substantiva e a construção de inferências neles baseados. No entanto a palavra
estatística lembra, à maioria das pessoas, recenseamentos. Os censos existem a milhares de anos e
constituem um grande esforço dos governos com o objetivo de conhecer seus habitantes, sua condição
sócio econômica, sua cultura, sua religião etc. Portanto, associar estatística a censo é perfeitamente
correto do ponto de vista histórico. É interessante salientar que as palavras estatística e estado tem a
mesma origem latina: status.
Hoje, alguma familiaridade com os princípios básicos da estatística deve fazer parte da educação de
todo ser humano. Afinal, é difícil ser um cidadão informado sem uma compreensão dos vários índices
governamentais, dos gráficos e tabelas publicados diariamente na imprensa e nas pesquisas de opinião
pública. Na realidade, entretanto, como veremos no decorrer da disciplina estatística geral e experimental
a estatística engloba muitos outros aspectos, sendo fundamental na análise de dados provenientes de
quaisquer processos em que exista variabilidade. Por exemplo, quando testamos novos produtos, técnicas
de produção etc.
Para fins de apresentação, é usual dividir-se a estatística em três grandes áreas, embora não se trate
de ramos isolados: os mecanismos de coleta de dados, amostragem e planejamento de experimentos; a
estatística descritiva, que se ocupa da organização, apresentação e sintetização dos dados; a estatística
inferencial, que é o conjunto de métodos para a tomada de decisões, nas situações em que existem
incerteza e variação.
1.2.Coleta de dados
A coleta de dados é a fase inicial de muitos estudos tecnológicos, sociais, econômicos ou
biológicos. Constitui-se no processo de escolha das unidades de análise que serão consideradas no estudo
(ex.: as pessoas que serão entrevistadas, os clientes que serão entrevistados, as plantas que serão
monitoradas, as peças que serão medidas, os pacientes que serão acompanhados), na determinação das
características de cada unidade experimental que serão medidas e da logística de trabalho de campo.
Conforme as necessidades de cada estudo, os dados necessários são coletados através dos métodos de
amostragem ou dos métodos de planejamentos de experimentos adequado para o estudo.
1.2.1. Amostragem
Em estatística, define-se como população a coleção de todas as observações potenciais sobre determinado
fenômeno. O conjunto de dados efetivamente observados, ou extraídos, constitui uma amostra da
população. É sobre os dados da amostra que se desenvolvem os estudos, visando a produção da inferência
em relação a população. Para se chegar a amostra, em cada situação constrói-se um plano amostral.
Nesse caso, o pesquisador não submete determinadas unidades experimentais aos tratamentos
desejados. Mas executa um levantamento de dados dentro de um universo disponível e verifica a
ocorrência de determinada resposta. Ou como essa resposta está associada a outras do mesmo universo.
Determinação de consumo de óleo diesel em ônibus: Com o objetivo de determinar o consumo de óleo
diesel (quilômetros por litro) dos ônibus de Belo Horizonte, toma-se um grupo de 100 ônibus das diversas
empresas que atuam em BH e mede-se o consumo médio por quilômetro. Para tanto deve-se avaliar uma
quantidade de ônibus de cada empresa proporcional ao número total de ônibus daquela empresa.
Avaliação de um sistema de ensino: Primeiro é necessário elaborar um questionário adequado para avaliar
com precisão o sistema de ensino. Também são de difícil determinação os locais onde serão aplicados os
questionários.
Hábitos migratórios de animais: Toma-se um grupo de animais, coloca-se em cada um deles uma etiqueta,
observando-se posteriormente em outras localidades. A amostra aqui é o conjunto de animais etiquetados.
Pela observação da amostra, deduziremos com certa margem de erro, o comportamento da espécie quanto
as características em estudo.
Pesquisas sobre tendências de votação: Em época de eleição, é comum a realização de pesquisas
eleitorais para verificar a tendência dos eleitores. Para que os resultados sejam de fato satisfatórios, toma-
se o cuidado
3
de entrevistar um número de pessoas com características socioeconômicas, culturais, religiosas etc. tão
próxima quanto possível da população à qual os resultados da pesquisa serão estendidos.
1.2.2. Planejamento de experimentos
Em muitas Em muitas situações, o problema de interesse é descobrir como uma variável resposta se
relaciona com os vários fatores explicativos. Por exemplo, como a produtividade de uma planta, medida
pela qualidade de seus frutos, relaciona-se com a qualidade do solo, a quantidade e o tipo de fertilizante
usado, o volume de irrigação disponível. Para se estudar a relação entre variável resposta e variável
explicativa, é preciso coletar dados. Para isso as técnicas agregadas, sob o nome de planejamento de
experimentos são essenciais. Com sua ajuda, determina-se em quais valores das variáveis explicativas as
medidas serão feitas.
Experimentos agrícolas: Os planejamentos estatísticos surgiram para solucionar problemas específicos da
experimentação agrícola. Por exemplo, como testar diferentes cultivares numa determinada área agrícola
sendo que todas as cultivares estejam na mesma condição.
Experimentos clínicos: Um medicamento só é liberado depois de ter sido submetido a um ensaio clínico.
Aqui, a primeira preocupação é o tratamento ético dos pacientes. Depois, é preciso garantir, através da
alocação aleatória, que os grupos que receberam o medicamento padrão e o novo medicamento tenham as
mesmas características. Ou seja, só se distinguem pelo tipo de medicamento tomado.
Experimentos industriais: Em várias indústrias, principalmente na indústria química, os fatores de
operação de um determinado processo de produção são estabelecidos depois de cuidadosa busca de
condições ótimas. Isso é feito através do uso intensivo de técnicas estatísticas de planejamento de
experimentos desenvolvidas para esse fim. Usam de forma intensiva os experimentos fatoriais.
As técnicas de planejamento e análise de dados oriundos desses experimentos serão discutidos
durante s disciplina estatística geral e com maior aprofundamento nas disciplinas estatística experimental,
estatística aplicada e planejamento e análise de experimentos.
Trata-se da parte mais conhecida da estatística. Quem vê os noticiários, na televisão ou nos jornais
sabe quão frequente é o uso de médias, índices e gráficos na descrição de um fato social ou econômico.
No entanto, a utilidade da estatística descritiva é muito mais geral. Na realidade nunca devemos realizar
análise estatística em modelos sofisticados sem uma prévia descrição dos dados.
O INPC, Índice Nacional de Preços ao Consumidor, construído pelo IBGE. Importante índice da nossa
economia, inclusive serve de base para reajuste salarial. Sua construção envolve a sintetização, em um
único número, dos aumentos de preços dos produtos da cesta básica. Seu processo de cálculo é um
sucessivo cálculo de médias.
Anuário Estatístico Brasileiro. O IBGE publica esse anuário todo ano, apresentando em várias tabelas os
mais diversos dados sobre o Brasil. Exemplos: educação, saúde, transporte, economia, culturas etc.
embora simples e fáceis de serem entendidas, as tabelas são frutos de um processo demorado e
extremamente dispendioso de coleta e apuração de dados.
Em ciências sociais, como a psicologia, é possível a obtenção de dados apenas com a observação
das pessoas. Neste caso, os resultados apresentam um alto grau de precisão. Na maioria das situações,
entretanto, os dados dos levantamentos são obtidos através de perguntas respondidas com o preenchimento
de questionários ou em entrevistas.
6
Os dados são informados por relatos verbais do entrevistado e os resultados devem ser tomados com
muito cuidado. O relato de um fato que coloca uma pessoa em posição desfavorável deve ser tomado com
reserva. Da mesma forma se a informação solicitada servir para que a pessoa mostre alguma simpatia ou
prestígio o entrevistador deve ter senso crítico e anotar o dado com ressalva.
Apesar das limitações, o procedimento de perguntas proporciona informações que, se obtidas de
outras formas, seriam muito mais falhas. O questionário é um dos instrumentos mais usados em pesquisas
sócio-econômicas. As limitações do método de perguntas devem ser consideradas pelo pesquisador para
ter o máximo de cuidado e rigor no momento da aplicação.
O questionário e a entrevista são técnicas semelhantes que se baseiam em perguntas formuladas ao
entrevistado. No questionário, as perguntas propostas pelo pesquisador são respondidas por escrito pelo
pesquisado, enquanto que na entrevista as respostas do entrevistado são anotadas pelos entrevistados.
O questionário pode ser enviado pelo correio, nesse caso é mais barata e garante o anonimato do
entrevistado, uma vez que este não precisa identificar-se. Entretanto, esta técnica exige que o entrevistado
saiba ler e escrever e esteja motivado a responder e devolver. Aplicado em grupo, permite rapidez na
aplicação, pois após os esclarecimentos são preenchidos e recolhidos imediatamente, proporcionando
maior garantia de retorno. Formulários individuais, são questionários cujas respostas são preenchidas
pelo próprio pesquisador. Podem ser aplicados a analfabetos e as pessoas com dificuldades de expressar
por escrito. Úteis na obtenção de informações sobre temas simples, mas não apresentam desempenho
satisfatório quando se pretende obter respostas à questões com maior profundidade.
A entrevista pode ser face a face, é a mais flexível de todas, pois permite ajustar-se aos mais
diversos tipos de problemas e de informantes. Permitem obter respostas em profundidade, complexas,
detalhadas, ligadas a intimidade do entrevistado, desde que o pesquisador tenha habilidade e treinamento
adequados. No entanto, está sujeita a deformações provocadas pelo pesquisador se este não tiver cuidado
na condução da entrevista, como influenciar com suas idéias o resultado da pesquisa. Por telefone, é
bastante adotada em pesquisa de opinião e de mercado, sendo rápida, econômica e garantindo altas taxas
de resposta. A desvantagem desta técnica é que nem sempre a amostra obtida é representativa da
população, uma vez quem nem todas as famílias das classes sociais mais baixas possuem telefone. Pela
internet, tem sido usada recentemente e apresenta as mesmas limitações da pesquisa por telefone.
O questionário deve traduzir os objetivos da pesquisa em itens bem redigidos. Para tanto é
importante que os objetivos tenham sido bem definidos. As perguntas devem ter conteúdos adequados
para obtenção dos dados do entrevistado, podendo ser feitas de forma aberta ou fechada. Em estudos
iniciais ou exploratórios podem ser usadas perguntas abertas, onde o entrevistado responde com suas
próprias palavras sem qualquer restrição. O número de perguntas de um questionário não deve ser
superior a trinta. A ordem das perguntas é importante devendo-se evitar mudança brusca de tema sem
antes fornecer as explicações necessárias. De maneira nenhuma a pergunta deve sugerir a resposta.
O questionário inicialmente deve ser submetido a um pré teste para evitar possíveis falhas tais
como: complexidade das perguntas, imprecisão da redação, questões desnecessárias, cansaço e
constrangimento do entrevistado.
O pesquisador deve ser cuidadoso e habilidoso na realização da entrevista. Recomenda-se uma
conversa inicial, de forma amistosa, sobre qualquer tema que possa interessar ao entrevistado procurando
obter a sua confiança. Em seguida são feitos esclarecimentos sobre a finalidade da pesquisa. Um ambiente
de diálogo, cordialidade e simpatia é recomendado.
1.6. Variáveis
A descrição de uma população é feita através de suas características, as de maior interesse por parte
do pesquisador. Por exemplo, o conjunto de híbridos de milho disponível no mercado define uma
população, a qual é descrita por características de interesse econômico, como produtividade, resistência a
doenças, ciclo cultural, arquitetura da planta etc.
7
As características que descrevem a população são chamadas variáveis, e um valor observado com
relação a uma variável é chamado dado ou observação. As variáveis são classificadas quanto à natureza
qualitativas e quantitativas.
As variáveis qualitativas correspondem a atributos, categorias. Elas são nominais quando não são
passíveis de ordenação, como por exemplo a cultura predominante em propriedades de uma região.
Quando os atributos são passíveis de ordenação, a variável qualitativa é dita ordinal; por exemplo, é o
caso quando se usa notas para avaliar uma característica. Em pesquisas eleitorais, é comum classificar os
entrevistados quanto ao nível de escolaridade (nenhum, fundamental, médio e superior), que é uma
variável qualitativa ordinal.
Quanto às variáveis quantitativas, correspondem a números resultantes de contagem ou medidas.
Quando se trata de contagens, como o número de peças defeituosas em amostras de um lote, a variável é
dita discreta, sendo passível a separação em classes distintas (não existe um valor intermediário entre 2 e 3
peças defeituosas, por exemplo). Outros exemplos são: número de folhas por planta atacadas por certa
praga, número de alunos que foram reprovados em determinada disciplina etc.
Nas variáveis quantitativas contínuas, as realizações resultam de uma medida, uma mensuração,
como o diâmetro de eixos fabricados ou o tempo de durabilidade de componentes eletrônicos, não
havendo assim classes distintas, mas um intervalo de números reais possíveis.
1.7.1. Tabelas
A apresentação de dados na forma de tabela é um dos métodos estatísticos mais utilizados. Uma
tabela consegue expor os resultados de determinada pesquisa sinteticamente, na qual se tem uma visão
mais clara e fácil dos resultados obtidos. Os dados devem ser apresentados em tabelas construídas de
acordo com as normas técnicas ditadas pela fundação Inst. Bras. de Geog. e Est. (Fundação IBGE).
8
Tabela 2 – Índice pluviométrico registrado em Itapetinga no período de 1996 a 2005
Ano Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Total 1996 27,8 19,0 61,0 0,0 0,0 17,0 10,0 20,5 38,0 180,0 145,5 15,0
533,8 1997 57,5 165,9 445,5 82,3 14,2 20,5 35,0 13,9 6,5 75,0 61,8 53,0 1.031,1 1998 53,0 40,0 48,3 11,1 45,5 7,5 45,0 28,0 35,5
81,5 315,8 183,5 894,7 1999 37,1 49,6 82,1 51,2 111,5 30,5 101,9 67,2 13,3 66,3 449,6 283,7 1.344,0 2000 125,6 164,0 158,3
184,9 18,3 26,1 104,9 22,9 55,3 16,3 106,0 232,7 1.215,3 2001 10,5 30,0 72,5 36,5 46,7 41,7 39,8 89,4 13,3 127,7 0,0 56,7 564,8
2002 358,7 169,0 94,6 37,6 36,5 57,8 49,5 38,2 46,6 0,0 55,0 144,6 1.088,1 2003 15,0 55,3 45,5 86,9 70,0 0,1 67,2 37,1 33,9 40,0
30,5 46,0 527,5 2004 118,1 113,5 275,1 33,9 22,5 15,0 47,8 0,0 0,0 18,0 220,3 17,0 881,2 2005 121,4 139,4 35,2 95,1 225,6 75,7
37,1 24,9 19,0 0,0 152,7 105,6 1.031,6 Média 92,5 94,6 131,8 62,0 59,1 29,2 53,8 34,2 26,1 60,5 153,7 113,8 911,2 Fonte:
Uesb (2009).
10
a critério de cada pesquisador. Contudo os elementos simplicidade, clareza e veracidade devem ser
considerados.
a) Histograma
É uma representação gráfica dos resultados da distribuição de frequências construídas por colunas
justapostas, cujas alturas são representadas pelas frequências de cada classe e as larguras pelo valor da
amplitude de cada classe, ou representado pelo ponto médio.
b) Polígono de frequências
Os dados apresentados em tabela de distribuição de frequências também pode ser apresentado em
gráficos denominados polígonos de frequências. O polígono de frequências é caracterizado por uma linha
que une os pontos correspondentes aos pontos médios das bases superiores das colunas que compõem o
histograma. Também pode ser apresentada a frequência acumulada.
c) Gráfico de colunas
O gráfico de colunas é usado para apresentar variáveis qualitativas ou ordinais.
11
d) Gráfico de barras
O gráfico de barras também é usado para apresentar variáveis qualitativas ou ordinais. Porém, como
acontece nesse exemplo onde são longos os rótulos das colunas ajusta-se melhor.
e) Gráfico de setores
O gráfico de setores também pode ser usado para apresentar variáveis qualitativas ou ordinais.
Dentro da circunferência são representadas as categorias da variável em estudo.
Figura: Estado conjugal da população brasileira segundo o IBGE, censo demográfico de 2000.
i1= 2 21 22 23
⎜ ⎛
⎝ ∑=, quadrado da soma.
n
⎞
3.
( )2 Xi ⎟ = X + X + X +...+ X
i1n
⎠ 123n
=
4. 1 1 2 2 3 3 n n
, soma de produtos (SP).
∑XiYi =X Y + X Y + X Y +...+ X Y i 1
n m
5.
( ) ( ) 123n123m
X Y = X + X + X +...+ X ⋅ Y + Y + Y +...+ Y Lê-se
∑ i∑ ∑i 1
j =
i1
== Xicomo: somatório de X índice i, com i variando de 1 até n,
j1
em que:
n
, produto da soma.
i1= i1 i1= j ==
i⎟ = ⎠
∑ i∑ = i1 j1
i1=
= X Y 1.050
c) Propriedades de somatório
P.1) Somatório de uma constante: é igual ao número de termos multiplicado pela constante.
13
n i1
=
∑ =++++=⋅
k k k k ... k (NT) K
i1
=
10
2) [( ) ] i i
8
X
Exemplo 3: 1) 6 [(10 1) 1] 6 60 ∑ i = 8−3 +1 ⋅X = 6X j 3
=
=−+⋅=
∑
P.2) Somatório do produto de uma constante por uma variável: é igual ao produto da constante
multiplicado pelo somatório da variável.
n
= + + + + = + + + + =n
()
∑ ∑
kXi kX kX kX ... kX k X X X ... X k X
123n123nii1
==i1
10
=10
Exemplo 4: 1)
∑∑
6X 6 X
ii
i1
==
i1
P.3) Somatório de uma soma ou subtração de variáveis: é igual a soma ou subtração dos somatórios dessas
variáveis.
n
+ − = + −n
n n
()
∑ ∑ ∑ ∑ Xi Yi Z i X Y Z
i
i
i
i1
====
i1 i1
d) Somatório duplo i1
linha.
j =1, 2, ..., K; índice de coluna.
=I
K
K
Total da i-ésima linha: Total da j-ésima coluna:
∑ Xij ∑=Ii 1Xij Total geral: ∑∑= = G Xij
i1
j1
j1
=
3 4 3 4 3
1 1 1 1 23
==
=+++= 4. =++= 1
1. X 1 3 4 8 ∑ i1 = 2. X 1 0 3 2 6 ∑ 1j =
3 15
∑
++= 3. X 29 ∑∑ ij = = 5
X
i1 j1 i1 j1 i1
i3 =
14
Proporção: Um certo número de pessoas foi classificado em quatro categorias. Essas categorias são,
naturalmente, mutuamente exclusivas e exaustivas. Em outras palavras: uma pessoa só poderá estar
incluída em uma única categoria, e todas elas deverão estar classificadas.
N = N1+N2+N3+N4 = número total de pessoas consideradas
Neste caso, a proporção de pessoas pertencentes à primeira categoria é determinada mediante o
cálculo do seguinte quociente: N1N
Para as demais categorias, a determinação segue o mesmo procedimento.
Porcentagem: As porcentagens são obtidas a partir do cálculo das proporções, simplesmente
multiplicando-se o quociente por 100. A soma das proporções é igual a 1, e a soma das porcentagens é
sempre igual a 100, a menos que as categorias não sejam mutuamente exclusivas e exaustivas. As
porcentagens são mais usadas do que as proporções para reproduzir resultados. Normalmente, as
porcentagens são arredondadas até a primeira casa decimal, ajustando-se os últimos dígitos, de modo que
o total seja igual a 100.
15
Um conjunto de dados pode ser descrito por medidas de posição e medidas de dispersão.
Caracterizar um conjunto de dados apenas por medidas de posição pode ser inadequado e perigoso, pois,
conjuntos com medidas semelhantes de posição podem apresentar características muito diferentes. Por
isso, normalmente são apresentadas para a descrição de um conjunto de valores tanto medidas de posição
quanto medidas de dispersão, simultaneamente.
∑
denotaremos por Xé dada por: nX
X X ... X
+++
i
12n n =
= i1
∑
fX
1122
X +++ nn
f X f X ... f X =n =
=
ii
i 1
f f ... f
+++ ∑
12 i n
n f =
1
Obs.: Se quisermos saber a média aritmética ponderada para um determinado conjunto de dados, então
podemos considerar fi como sendo o peso para cada valor de X i. Para calcular a média quando temos uma
tabela e dados agrupados em classes, basta considerar como x i o ponto médio de cada classe.
Exemplo 1: Numa avaliação 80% dos alunos obtiveram nota 10 e 20% obtiveram nota 5. Determine a nota
média da turma.
Nota (Xi) Proporção (fi) fiXi
10 0,80 8
5 0,20 1
=x x
0,80 10 0,20 5
=
X 0,80 0,20 + 9,0
+
16
Exemplo 2: Um estudante obteve as seguintes notas nas provas parciais de estatística.
Provas (i) Pesos (fi) Notas (Xi)
1 1 20
2 1 70
3 2 50
4 4 90
=x x x x
1 20 1 70 2 50 4 90
==
X +++ 71,25
+++1124 550 8
∑
f pm
ii
944
1
X === 18,88
i i
=
n
∑ 50
f
i 1
=
∑ +∑ ∑ ∑ ()
Xk Xk
i i
+ Xi nk
a) X k
i
= =+=+
=1 =1 =1 =1
i i i
n n n n
n
(X k)n
n n
−
∑ ∑ ∑ ∑ Xk
i i
− Xi nk
b) X k
i1
= =−=−
====
i1 i1
n n i1 n n
n
1n n
n
∑∑
1⇒X
⎜ ⎛ b) Divisão ⎟ k 1 1
⎝ Xi ⎠⎞ Xi Xi
i1
==
==i1
k
n k n k
Prova:( ) 0
=
∑ −=
SD Xi X
i
Outras médias
=
1
Algumas vezes é interessante calcular médias de forma diferente para dados com características especiais.
Média geométrica:X G
Bastante empregadas para observações positivas referentes a crescimentos exponenciais (como
taxas de avanço de doenças, número de habitantes de regiões em colonização, crescimento de
produtividade e lucro em alguns negócios etc.). A média geométrica é a raiz n-ésima do produto das
observações.
n
f
fi
G12 Xn X = X .X ..... ou ∑
f
f
X GX X X
n 112
{10, 60, 360} 10 60 x x = = Aplicações da = =
i n
n
a) Média de relações: Se para uma determinada empresa, se deseja estabelecer uma relação do tipo Capital
Líquido/Dívida que seja independente da dívida ou do capital de diferentes empresas envolvidas, é
recomendável o uso da média geométrica.
Empresa Capital Líquido Dívida Cap. Liq./Dív.
A 2 500 1 000 2,5
B 1 000 2 000 0,5
X G= 2,5* 0,5 =1,1180
b) Média de taxas de variação: Ex: suponhamos que um indivíduo tenha aplicado um capital de R$ 500,00
durante 2007 em um ano de aplicação, essa importância chegou a R$ 650,00. Reaplicando essa última
quantia em 2008 no final de mais um ano seu montante situava-se em R$ 910,00. Qual a taxa média de
aumento de capital?
Período Taxa
2007 650/500 = 1,3
2008 910/650 = 1,4
X G= 1,3*1,4 = 1,3491
Média Harmônica X H
18
Para fenômenos que dependem fortemente do menor dos dados, em geral utiliza-se médias
harmônicas calculadas como o inverso da média dos inversos. O cálculo da ( ) XHaplica-se a variáveis
resultantes da relação entre duas outras, como no caso da velocidade média (km/h) e o custo médio por kg
de determinado produto. Um exemplo é o cálculo do tamanho efetivo de populações naturais submetidas a
processos de devastação ecológica (gargalos populacionais).
n n ∑
n
f
X ou = n f f ... f
X
+++
= i
=n
H 12n =
1 1 1 1 = i1
H
+ + + ... f +++ f ∑ f
∑ f
1 n
X X X X 2
... i
i1 X1 X2 Xn X
12n i=
i1
i=
Exemplo 1: O número de hipopótamos de uma região ao longo de quatro gerações foi de (2.000, 20, 250,
1.500), a média harmônica é dada por:
X H= 1 1 4 72,51
≅
2000 1 250
1 20 1500
+++
Pode-se notar que, enquanto a média geométrica favorece os maiores números, a média
harmônica favorece os números menores.
Exemplo 2: Calcule a média aritmética, geométrica e a harmônica.
X = {2,2,2}
Conjunto Média aritmética Média geométrica Média harmônica 2,00 2,00
Y = {14, 18, 20} W = {8, 12} Z = {2, 50, 70}
2,00 17,33 17,15 16,95 10,00 9,80 9,60 40,67
K = {200, 20, 800}
19,13 5,61 334,00 68,40 5,93
1.9.2. Mediana (MD)
A mediana é preferível à média quando existem valores discrepantes na amostra de dados. Se a
amostra é simétrica, então a mediana será igual ou próxima ao valor da média. Colocados os valores em
ordem crescente de grandeza, mediana é o elemento que ocupa a posição central, ou seja, existem números
iguais de elementos antes e depois da mediana. Ou ainda, é o valor abaixo e acima do qual se tem a
metade dos dados.
Observações:
a) Quando o número de elementos da série estatística for ímpar, haverá coincidência da mediana com um
dos elementos da série.
b) Quando o número de elementos da série for par, nunca haverá coincidência da mediana com um dos
elementos da série. A mediana será sempre a média aritmética dos dois elementos centrais da série. c) Em
uma série a mediana, a média e a moda não tem, necessariamente, o mesmo valor. d) A mediana depende
da posição e não dos valores dos elementos na série ordenada. Essa é uma das diferenças marcantes entre
mediana e média. A média é muito influenciada pelos valores extremos de uma série.
Ex1: Em {5, 7, 10, 13, 15} a média é 10 e a mediana é 10. Em {5, 7, 10, 13, 65} a média é 20 e a mediana
é 10. Isto é, a média do segundo conjunto de valores é maior do que a do primeiro, por influencia dos
valores extremos, ao passo que a mediana permanece a mesma.
Ex1: Em {5, 7, 10, 13, 15, 18} mediana é 11,5.
19
Em algumas situações, a distribuição das observações é tal que as frequências são maiores nos
extremos. Nesses casos, a utilização apenas da média e da mediana é contraindicada, pois são valores
pouco representativos do conjunto e o uso da moda poderá, então, ser considerada. A moda de um
conjunto de observações é o valor de maior ocorrência dentro do conjunto.
Com relação a moda, uma série de dados pode ser classificada em: Amodal: não possui moda;
Unimodal: possui apenas uma moda; Bimodal: possui duas modas; Multimodal: possui mais de duas
modas.
A moda é utilizada quando desejamos obter uma medida rápida e aproximada de posição ou quando
a medida de posição deva ser o valor mais típico da distribuição. Já a média aritmética é a medida de
posição que possui a maior estabilidade.
Calcule a Mediana e a Moda das variáveis X e Y.
a) X = { 2, 3, 1, 2, 3, 2, 4} n = 7Mo = 2 - Unimodal
} 2M
Valores ordenados X'= { 1, 2, 2, 2, 3, 3, 4 d = X4 =
b) Y = { 8, 10, 5, 5, 15, 15} n = 6Mo = 5 e 15 - Bimodal
2 2
Utilização da média aritmética, da mediana e da moda
20
Média Aritmética
A medida de tendência central mais utilizada é a média aritmética, que representa em relação a mediana e
a moda vantagens apreciáveis, tais como:
a) É facilmente calculável.
b) É a que melhor se presta a análises estatísticas.
c) Depende de todos os valores da série.
d) É uma medida de tendência central particularmente estável, variando o menos possível de amostra para
amostra extraídas da mesma população.
e) Pode ser tratada algebricamente.
Existem,
todavia, casos em que a informação fornecida pela mediana ou pela moda, parece ser mais comp leta do
que a fornecida pela média aritmética.
Mediana
Esta medida de tendência central deverá ser utilizada quando:
a) Se deseja conhecer o ponto médio exato da distribuição.
b) Existem resultados extremos que afetariam grandemente a média. Importa salientar que a mediana não
é influenciada pelos resultados extremos.
Exemplo: na série 10,13,15,16,18,19,21, tanto a média como a mediana são 16; se substituirmos 2 1 por
50 e os restantes resultados permanecerem os mesmos, a mediana é 16 e a média será de 20,1;
c) A distribuição é truncada, isto é, incompleta nas extremidades. Exemplo: desejamos medir os tempos
de reação em Psicologia e as várias respostas ultrapassam as capacidades de medida do aparelho; assim,
impossibilitados de calcular a média, já que não di spomos de todos os valores da variável, sendo, no
entanto, possível calcular o valor da mediana, já que conhecemos o número de medidas efetuadas.
Moda
Esta medida de tendência central deverá utilizar‐se quando:
a) Uma medida rápida e aproximada da tendência central for suficiente.
b) Se deseja conhecer o valor mais típico de uma distribuição. Exemplo: descrever o estilo de vestido
usado pela mulher média, salário preponderante em deter minada empresa.
É de salientar que, apesar das vantagens apresentadas para a moda, esta tem a desvantagem de s er de
determinação imprecisa, no caso das variáveis contínuas.
21
Caracterizar um conjunto de dados apenas por medidas de posição é inadequado e perigoso, pois,
conjuntos com medidas de posição semelhantes podem apresentar características muito diferentes. As
medidas de dispersão são estatísticas descritivas, que quantificam de algum modo a variabilidade dos
dados, geralmente utilizando como referência uma medida de posição. As principais medidas de dispersão
são a amplitude total, desvio, desvio médio, variância amostral, coeficiente de variação e erro padrão da
média.
Exemplo:
Amostra A: 4, 8, 3, 9, 7, 5
Amostra B: 1, 5, 2, 14, 3, 11
Note que:XA = 6e X 6 B=, porém, a dispersão dos valores na amostra B é maior.
AT = Xmax − Xmin
Embora dê uma idéia geral da dispersão relativa dos dados para amostras de fenômenos pouco
conhecidos do observador, a amplitude pouco informa sobre sua distribuição. Por ser uma medida
calculada apenas com dois valores extremos (máximo e mínimo) a amplitude é muito afetada por valores
extremos que ocorrem em algumas variáveis. Em exemplos onde os valores máximos ou mínimos são
muitíssimo raros, prejudicam a compreensão da variabilidade dos dados.
1.10.2. Desvio[ ] dx
São os desvios em relação a média aritmética dos dados. A soma dos desvio sempre será igual a
zero. Seja a amostra (2, 3, 5, 7, 8), com média 5 e desvios (-3, -2, 0, 2, 3).
ˆ
1.10.4. Variância Amostral [ V(X)]
S ouˆou 2x
2
x σ
Eliminar os desvios negativos sem utilizar módulos pode ser conseguido utilizando potencias pares
dos mesmos (o mais simples é elevar ao quadrado), o que favorece o cálculo em grandes amostras. A
22
medida assim obtida (média dos quadrados dos desvios) é a chamada Variância. A variância mede a
dispersão dos valores em torno da média.
Ela é dada pela soma dos quadrados dos desvios em relação a média aritmética, dividida pelo
número de graus de liberdade. É a medida de dispersão mais utilizada, fácil de calcular e compreender,
além de ser bastante empregada na inferência estatística.
Para uma amostra de n valores, X1, X2, ..., Xn, a variância amostral é dada por:
⎜ n
X ⎟ 2
⎝⎛ ∑ ⎠⎞
n n i
n
∑∑∑ () =
2 2 2 i 1
XX
i
SQD d X − n
SVX − i i
2
==() = = =
ˆ i
===
1 i 1 i 1
x
− 1111
n
n − n − n −
Propriedades da Variância
P1) A variância de uma constante é igual a zero. V( k ) = 0
P2) Somando-se ou subtraindo-se uma constante de uma v.a., sua variância não se altera. V(X + k) =
V(X), da mesma forma temos que: V(X − k) = V(X)
P3) Multiplicando-se uma v.a. por uma constante, sua variância fica multiplicada pelo quadrado da 2
constante. V(kX) k V(X)
=
23
Para comparar variabilidades de diferentes conjuntos de valores, onde as médias são muito
desiguais ou as unidades de medidas são diferentes, o C.V. é indicado. O C.V. expresso em percentagens é
dado por:
2
S x S
C.V.(%) x = = X
X
.100
Nota: o C.V. é o desvio padrão expresso em porcentagem da média. Medida adimensional.
Aplicação: - Utilizado para avaliação da precisão experimental.
- Utilizado para avaliar qual amostra é mais homogênea (menor variabilidade). Na situação em que as
amostras possuem a mesma média, a conclusão pode ser feita a partir da análise de suas variâncias. Para
amostras com médias diferentes, aquela que apresenta menor C.V., é mais homogênea.
n
n
Note que o erro padrão da média é:
- Inversamente proporcional ao tamanho da amostra;
- Diretamente proporcional a variância da amostra.
ˆ
V(x)
ˆ
=esta expressão é válida para populações infinitas ou população
V(x)
Fato: Variância da média:
n
finita e amostra com reposição dos elementos.
Exemplos:
24
Ex.1. Sejam as variáveis horas de estudo (X) e nota do aluno (Y)
X (horas estudo) 3 1 4 3 5 Y (nota obtida) 9 3 8 8 7 Calcule:
a) Média aritmética
n
∑ X 16 ∑ Yi 35
i n
=
7,0
=
X 3,2 Y ===
= = = i1 i1
n b) Variâncias 5 5
n
⎜ ∑ X ⎟
⎝⎛ ⎠⎞
n 2
i
n ()
2
∑ = 16
60
2 i1
X − − 60 51,2
i 2
n 5 − 8,8
=
⇒S 2,2 x=
2
S
x ==
= n1− ⎜ n ⎟ = 2 51− = 2,2
i1 ⎜ ⎝⎛ ⎟ ⎠⎞ 4 4
∑ Y
i
n∑
= ()
35
2 267
2 i 2
Yi − n − 5 267 245 − 22,0
1
2
==
Y⇒S 5,5
S i 1 = 1 51− = 5,5 =
Y
= n
= − 4 4
2
S 2,2 S 5,5
x
X 1,0488
2Y
SS
2
====
S SX
YY
==== 0,6633 n 5
n 5
f) Amplitude total (AT)
AT X X 5 1 4 X=max − min = − = AT Y Y 9 3 6 Y=max − min = − = g)
⎜ n
⎜ ⎛⎟ n
⎟
⎝⎛ ⎝ ⎠⎞ ⎠⎞
∑ ∑ XY
ni 16 35
i 121 x
∑ ==
i
X Y ii 11 n − 121 112 −
− i
Covariância2,25
ˆ ( , ) Cov X Y =
1
=
5
r ˆ ( , ) 2,25 = n − 4 4
i Cov X Y S S x 2 2= =
= = 1 =
0,65
Coeficiente de correlação:
XY XY
⋅ 2,2 5,5
∑ Xi
19,5
112 ... 23,0 22,7 ....... =XXX
+++ +++
→ Peso:20,580 X n
n
== Y 10
i
=
∑ i
=
n n
→ Comprimento:101,300
YYY
+++
104 105 ....... 99
112 ... =
=
Y ==n
+++
i
=
b) Variância: ⎜ n 2
10
n ⎝⎛ n ⎟
⎠⎞
i
∑ n
()
X [( ) ( ) ( ) ]
2
→ Peso: ∑ =
23,0 22,7 .... 19,5 + + +
1
ˆ X − 222 23,0 22,7 ...... 19,5 +++− 10
2 i i n
2
=SVX
==
Y 1
1 14,297
() n = 9
i
= − 2
→ Comprimento: Y
i
n
⎜ ⎛
⎝ − ()
⎟
[( ) ( ) ( ) ]
⎠⎞
n
2
∑ 104 105 .... 99
104 105 ...... 99
Y
∑ =
+++
i
1 i
2 222
+++−
n
ˆ 17,789
ˆ 910
2
=S V Y
==
()
=
VY
∴=
i
()
Y
c) Desvio padrão:
1
n−1
→ Peso:( ) 3,781
ˆ
S X= s(X ) = V X =
ˆ
→ Comprimento:( ) 4,218 SY= s(Y) = V Y =
d) Erro padrão da média:
ˆ S
→ Peso:1,196 ( )
VX
ˆ
()= ===
S V XX
X
n ˆ n S
→ Comprimento:1,334 ( )
VY
ˆ
()= ===
S V YY
Y 2
S
S n
e) Coeficiente de variação: n
→ Peso:. .(%) .100 18,373% CVX X
===
X X
i 11i
XY − −
Covariância12,296
ii
ˆ(,) n 10
1 i
Cov X Y ==
=
=
ˆ ( , ) 12,296 −
Cov X Y 1
9
n
0,771
Coeficiente de correlação:
r 22 ==
XY
⋅
= XY
SSx 14,297 17,789
26
O termo correlação representa uma medida que mede o grau de associação entre duas variáveis
aleatórias X e Y. O valor da correlação, conhecido como coeficiente de correlação, assume valores no
intervalo de -1 a +1, de acordo com o grau de associação entre as variáveis em questão.
Se as variáveis X e Y crescem no mesmo sentido, isto é, se quando X cresce Y em média também
cresce, diz-se que as duas variáveis tem correlação positiva. Se as duas variáveis X e Y variam em
sentidos contrários, isto é, se quando X cresce, Y em média decresce, diz-se que as duas variáveis tem
correlação negativa.
5 10 15
10 5 0
0 2 4 6 8 CORRELAÇÃO NULA
Assim como, quando o coeficiente de correlação assume valores próximos de +1, a associação é dita alta e positiva. Se o
seu valor está próximo de -1, a correlação é chamada negativa. Se o valor é próximo de 0, não existe correlação linear.
A correlação se aplica a qualquer área em que se pretende avaliar se uma variável X está associada a uma outra Y. Assim
a amplitude de aplicação é ilimitada, tendo como exemplos:
✓ O grau de analfabetismo de um país e expectativa de vida
✓ Grau de instrução dos pais e avaliações de candidatos no vestibular
✓ Taxa de desemprego e índice de criminalidade
✓ Idade e altura de crianças
✓ Tempo de prática de esportes e ritmo cardíaco
✓ Tempo de estudo e nota na prova
✓ Acidez e pH do leite fresco
✓ Matéria Orgânica (Lactose) e Demanda Bioquímica de Oxigênio (DBO) do soro de queijo (resíduo) Cálculo do
27
Sejam duas amostras relativas às variáveis X e Y, dadas a seguir
Xi X1 X2 ... Xn
Yi Y1 Y2 ... Yn
O coeficiente de correlação entre os valores de X e Y é dado
por: SP
XY
Coˆv(X,Y) SP
− n1
==
r=
XY
XY
SQD .SQD
ˆ V(Y) SQD .
V(X). ˆ SQD
⎜ ⎜ ⎛⎟ ⎟ n1 n1
⎝⎛ ⎝ ⎠⎞ ⎠⎞ −− XY
n n XY
∑ ∑ XY
i
n
i
2
⎜
⎝⎛
⎜ ⎛⎟
⎝ ⎠⎞
⎟
⎠⎞
n
n
⎜
⎝⎛
n
⎟
∑= = ∑∑ ∑ ⎠⎞
i1 i1 X
XY − XY
ii i
n ∑ == i
n ∑ =
i
n
i 11i SQD X Xi
Coˆv(X,Y) = =− 1
i1= SP X Y XY i i i
2
=− n
n1 n=
i 1 1
− = i
É importante deixar claro que uma correlação positiva entre duas variáveis mostra apenas que essas
variáveis crescem no mesmo sentido. A correlação positiva não indica que aumentos em uma das variáveis
causam aumentos sucessivos na outra variável. Da mesma forma, uma correlação negativa entre duas
variáveis mostra apenas que elas variam em sentidos contrários. A correlação negativa não indica que
acréscimos em uma das variáveis causam decréscimos na outra variável.
Exemplo: Sejam as variáveis horas de estudo (X) e nota do aluno (Y)
X (horas estudo) 3 1 4 3 5
Y (nota obtida) 9 3 8 8 7
⎜ n
⎜ ⎛⎟ n
⎟
⎝⎛ ⎝ ⎠⎞ ⎠⎞
∑ ∑ XY
ni 16 35
i 121 x
∑ ==
11
ˆ(,) X Y ii − i n − 5 121 112 −
i
Cov X Y 1
=
=
n 2
⎜ =
= 1 4 2,25
⎝⎛ n ⎟
i ⎠⎞ − = 2 4
⎜ n
⎟
∑ ⎝⎛ ⎠⎞
X () ∑
i 2
n
Y
16 i
60 n
= ( )5,5
2
∑ =
2 1 35
− − ∑ = ˆ ( , ) 2,25
X i 267
i i
5 Yi 1 − r Cov X Y =
n 2
− n S S x 2 2= =
2
, Y
0,65 5
S =
x =
i 1 2
=
= 22
⋅
=
n − 51− S 1 − = 51− XY
2,2 5,5
1 = n 1 XY
i
Podemos concluir que rxy = 0,65 é uma correlação moderada, ou seja, com maior número de horas
de estudo espera-se que o aluno obtenha maior nota na prova. No entanto, não significa que sempre que
um aluno estude mais que outro irá obter maior nota.
Segundo alguns autores a correlação poderá ser assim interpretada:
✓ ≤ 0,20 Correlação muito fraca e sem significância
✓ 0,20 < r ≤ 0,39 Correlação fraca
✓ 0,40 < r ≤ 0,69 Correlação moderada
✓ 0,70 < r ≤ 0,89 Correlação forte
✓ 0,90 < r ≤ 1,00 Correlação muito forte
O Coeficiente de Correlação indica a direção que é obtida pelo sinal + ou ‐ e a intensidade ou força
que é dada pelo valor que varia entre ‐1,0 e +1,0. Se a correlação for próxima a zero não existe correlação
linear entre as variáveis (exemplo: cor dos olhos e inteligência).
1.12. Exercícios
28
Exercícios de amostragem
1. Quando o uso da amostragem não é interessante?
2. Porque fazer amostragem?
3. Qual a diferença entre censo e amostragem?
4. Quais são as vantagens da amostragem?
5. Qual a diferença entre amostragem probabilística e amostragem não probabilística? 6.
Qual a limitação de uma pesquisa onde as entrevistas foram feitas pela Internet? 7. Qual a
limitação de uma pesquisa onde os questionários foram enviados pelo correio?
2. Resultado final da disciplina W, entre 00 I— 20: 5 alunos; entre 20 I— 40: 10 alunos; entre 40 I— 60:
20 alunos; entre 60 I— 80: 15 alunos; entre 80 I— 100: 10 alunos. Construa uma tabela de distribuição de
frequências para apresentar o resultado da turma.
3. Salários mensais de funcionários da indústria farofinha no ano de 2010, entre 130 I— 150: 605
funcionários; entre 150 I— 170: 182 funcionários; entre 170 I— 190: 113 funcionários; entre 190 I—
210: 77 funcionários; entre 210 I— 230: 23 funcionários. Construa uma tabela de distribuição de
frequências para apresentar os salários mensais da indústria farofinha no ano de 2010.
4. Construa uma tabela de distribuição de frequências completa: 51, 44, 55, 60, 39, 43, 57, 42, 37, 60, 35,
39, 39, 42, 61, 55, 63, 52, 34, 40, 34, 51, 61, 61, 63, 39, 36, 39, 59, 55, 57, 40, 49, 36, 54, 55
Exercícios de somatório
29
1. Considere as variáveis X e Y que representam, respectivamente, as notas de duas disciplinas, para um
grupo de 7 alunos. X = {9, 7, 4, 8, 9, 6, 10} Y = {6, 7, 5, 8, 7, 6, 9}
Calcule:
2
Xib) ∑=712 7 ⎜ ⎛ i 5 6
⎝ ∑i=X d) ∑= i 1Xi e) ∑= 22
a) ∑ i 1 Xic) i 1
⎟ Xi f) i
= 7 ⎠⎞
2
⎜ ⎛ 6 ⎞
7 ⎝ ∑= = 1 ⎜ ⎛
5
5
⎝ ⎟∑
⎜ ⎛ i h) ⎟
⎝ ∑i=X g) i ⎠⎞
⎟
⎠⎞ ∑X Y i
Xi Y 1 ii
1 i = 1 i ⎠
2. Seja os valores da variável X = {5, 2, 1, 8, 0, 11, 4, 6, 7, 10}. Calcule: 2
10
10 10 2 10 X ⎟
Xib) ∑= 12 10 ⎜ ⎛ ⎠⎞
⎝ ∑ ii
⎜ ⎛
⎝ ∑i=Xid) 10 110
⎟ ∑ −=
⎠⎞
a) ∑ i 1 Xic) 1
2
=
1
= i X −
1
ii
2
10 ∑− ()
10
i
X h) 10
4 10
f) Xi
Xi ( )2 101 ∑
i= i=
Xig) ∑ − 4 1 1
e) ∑( − ) 4 10 1
i 1 i=
−
=
g)
j Xj ∑ 4
≠= 21 61
4
3
1 Xj
f)
∑ Xj
h)
∑ 6
e) ∑ 4
Xj
j = j ≠ 1 jj 12 2
22 22 jj =≠
∑
f
i
i 1
=
5. Considere o conjunto de dados a seguir, onde se observou a produção de uma determinada gramínea
(t.ha-1) em relação a diferentes níveis de adubação (kg.ha -1):
Nível (x) 0 20 40 60 80 Produção (y) 0,8 0,9 1,2 1,5 1,4 Calcule:
i i
a) ∑=5i 1X e ∑=5i 1Y b)
2
⎜ ⎛ i
⎝ ∑i=Y e ∑= 12
5
i ⎟⎟
5
⎟ ⎜ ⎛ *
⎠⎞ Y c) ⎠⎞ ⎜ ⎝ ∑ ∑ ==
5 5 5
i i ()
X i Y e ∑=5i 1XiY d)∑
XY ⎟
ii e ⎠⎞
⎜ ⎛ +
⎝ ∑ ∑ ==
1 ii1i 5
+ i
i 1
i1
5
Xi Y
5 5 5 =
e) i () i
∑ X e∑ 5
X g) ∑=514 5
ii11
i ()
X e∑
7 + i () 3 i ()
7 X f) ∑ Ye∑
i 1 i 1 i 1 i 1 i
= = = = = + Yi
3 + 9
1
i
30
1. Calcule a média aritmética, geométrica e harmônica dos números:
a) 3 e 9 f) 3 e 27
b) 2 e 8 g) 2 e 16
c) 1, 3 e 27 h) 1, 4 e 16
d) 2, 2, 2 e 2 i) 7, 7, 7, 7 e 7
e) 2, 5, 7 e 9 j) 2, 500, 20, 900
2. A média mínima para aprovação em determinada disciplina é 5,0. Se um estudante obtém as notas: 7,5;
8,0; 3,5; 6,0; 4,0; 2,5; 5,5 e 2,0 nos trabalhos mensais da disciplina em questão, este aluno foi aprovado?
4. Um aluno obteve 3,0 na prova e 9,0 no trabalho, cujos pesos são 4 e 1, respectivamente. Sabendo que a
média mínima para aprovação é 5,0, este aluno foi aprovado?
5. Um professor de biologia leciona para quatro turmas. Sabe-se que as turmas apresentaram as seguintes
médias em um determinado semestre. Calcule a média conjunta das turmas.
Turma A (60 alunos) - Média 9,0 Turma B (40 alunos) - Média 8,0 Turma C (70
alunos) - Média 7,0 Turma D (30 alunos) - Média 5,0
7. Num determinado país a população feminina representa 51% da população total. Sabendo-se que a
expectativa de vida da mulher é de 73 anos e a do homem é de 70 anos, qual a expectativa de vida média
da população?
8. A média aritmética das notas dos alunos de uma turma formada por 25 meninas e 5 meninos é igual a 7.
Se a média aritmética das notas dos meninos é igual a 6, a média aritmética das notas das meninas é igual
a quanto?
ic
n
10
êu
35
10 4
8 7
q
r
5
F
0 50 I- - 150 150 I- -
250 250 I- - 350 350 I- - 450 450 I- - 550 550 I- - 650
11. Calcule o coeficiente de variação dos dados de notas de dois grupos (A e B) de estudantes, dizendo
ainda, com base nos cálculos, qual o grupo mais homogêneo (ou menos disperso).
31
Grupo A: 8, 7, 7, 6, 9 e 8
Grupo B: 8, 5, 7, 3 e 9
14.1 Para o conjunto de dados (sem considerar a raça) e para o peso e o comprimento,
calcule: a) Média; b) Mediana; c) Moda; d) Amplitude total; e) A variância; f) desvio padrão;
g) O erro padrão da média; h) Coeficiente de variação; i) Coeficiente de correlação e
interprete essa correlação.
15.2. Matéria Orgânica (Lactose) e Demanda Bioquímica de Oxigênio (DBO) do soro de queijo
Materia orgânica (g/L) 44 56 68 80 92 DBOppm 40000 60000 70000 80000 90000
15.4. Variáveis X e Y
X 7 9 10 13 15
Y98977
15.5. Variáveis Z e W
Z 0 5 10 15 20
W 2,4 5,8 8,6 8,3 8,0
15.6. Variáveis X e Y
X 0 1,5 3,0 4,5 6,0 7,5 9,0
Y 70,9 64,1 60,5 55,1 52,2 55,9 55,1
15.7. Variáveis L e K
L 10 20 30 40 50 60 70 80 K 2,1 5,4 3,6 3,5 4,2 3,7 3,1 2,8
Respostas exercícios de somatório
33
2. a) 54 b) 416 c) 2.916 d) 13,822 e) 14 f) 144 g) 16 h) 5,4 3. a) 12 b) 29 c) 45 d) X 1 = 24 e X2 = 6 e) 10 f) 1/16
g) 132 h) 96 4. a) 102 b) 30 c) 478 d) 8.098 e) 269,93
5. a) 200 b)33,64 c)1.160 d)205,8 e)1.400 f)215 g)23,2 5. a) 5,8 b)7,1 c)268 d)205,8 e)235 f)600
g)50,8
2.a) 4,875 3.a) 6,2 b) 5,9 4.a) 4,2 5.a) 7,5 6.a) 10,47 7.a) 71,53 8.a) 7,2 9.a) 367,57
10.a) 4,0 b) 4,2 c) 4,0 d) 6,0
8,67 3,70 0,00 5,60
2,94 1,92 0,00 2,37
73,6 45,8 0,0 39,4
14.a) 50,0 b) 50 c) 51 d) 13 e) 15,73 f) 3,97 g) 0,99 h) 7,93 i) -0,166 a) 89,44 b) 89,44 c) amodal d) 41 e) 137,20 f)
11,71 g) 2,93 h) 13,10
14.1.48,63 b) 49,5 c) 50 d) 6 e) 5,41 f) 2,33 g) 0,82 h) 4,78 i) 0,060 a) 96,88 b) 97,0 c) amodal d) 29 e) 96,13 f)
9,80 g) 3,47 h) 10,12
14.1 51,38 b) 52,5 c) amodal d) 13 e) 23,98 f) 4,90 g) 1,73 h) 9,53 i) 0,131 a) 82,00 b) 82,5 c) amodal d) 24 e)
71,43 f) 8,45 g) 2,99 h) 10,31
2.1. Introdução
34
A teoria matemática da probabilidade dá-nos a instrumental para construção e análise de modelos
matemáticos relativos a fenômenos aleatórios. Ao estudarmos um fenômeno aleatório, temos diante de nós
um experimento cujo resultado não pode ser previsto. Ocorre-nos então logo à mente experimentos
relacionados com jogos de azar. De fato, a teoria das probabilidades, surgida nos séculos XV e XVI, foi
motivada por problemas deste tipo.
Historicamente, o propósito original da teoria das probabilidades limitava-se a descrição e ao
estudo dos jogos de azar e quase todo esforço era concentrado no cálculo do valor de certas
probabilidades de interesse. Entretanto, a obtenção de valores numéricos de probabilidade não é o
objetivo principal da teoria, e sim a descoberta de leis gerais, e a construção de modelos teóricos
satisfatórios.
Com o advento da teoria das probabilidades, foi possível estabelecer as distribuições de
probabilidade, consideradas hoje a espinha dorsal da teoria estatística, pois todos os processos inferenciais
são aplicações de distribuições de probabilidades.
Assim, o conhecimento dos conceitos advindos da teoria das probabilidades é de grande
importância para compreensão e correta utilização da técnica estatística.
2.2.5. Eventos
Denomina-se evento a todo particular conjunto de resultados de S, ou ainda, a todo subconjunto de
S. É desse resultado que se tem interesse no cálculo de probabilidade. Será útil considerarmos o espaço
todo (S) e o conjunto vazio (Φ) como eventos. O primeiro é denominado evento certo e o segundo, evento
impossível, e temos:
P(S) = 1 P(Φ) = 0
Em particular, se S é um espaço amostral discreto ou enumerável composto de n pontos amostrais,
existem 2nsubconjuntos ou eventos que podem ser formados a partir de S. O conjunto que reúne todos
esses subconjuntos é chamado de espaço de eventos ou classe de eventos.
Exemplo: Seja S = {1, 2, 3}
Temos então, n = 3 ⇒ 23 = 8 eventos,
A1 = Φ,A2 = { 1 }, A3 = { 2 }, A4 = { 3 },
A5 = { 1, 2}, A6 = { 1, 3}, A7 = { 2, 3}, A8 = {1, 2, 3}.
No caso continuo, os eventos são colocados na forma de intervalos.
Por exemplo, B = { a ≤ x ≤ b }.
= = = ( )31
PA 12 Fatos: n
S
A 4 S 12
n ===B
a) O conceito clássico só pode ser utilizado em situações onde o S é enumerável, finito e equiprovável.
b) Sendo ( ) n
P A =, no caso infinito todos os eventos teriam probabilidade zero. A
S
n
37
2.3.2. Frequência Relativa ou Probabilidade “a posteriori”
Seja E um experimento e A um evento. Se após n realizações do experimento E, n suficientemente
grande, forem observados m resultados favoráveis ao evento A, então uma estimativa da probabilidade
é dada pela frequência relativa
P(A) nm
fr = .
Esta definição é, as vezes, chamada de probabilidade empírica e tem por base o princípio
estatístico da estabilidade, ou seja, à medida que o número de repetições do experimento cresce, a
frequência relativa se aproxima da probabilidade P(A). Se jogarmos um dado 90 vezes e obtivermos o
resultado do Quadro 1.1, teremos na frequência relativa a probabilidade "a posteriori" e na frequência
esperada relativa, a probabilidade "a priori". Quando o número de tentativas aumenta consideravelmente,
as duas se aproximam.
Quadro 1 - Resultado hipotético do lançamento de um dado 90 vezes consecutivos.
Face no Frequência observada Frequência relativa Frequência esperada Frequência esperada relativa
1 12 12/90 = 0,1333 15 1/6 = 0,1667 2 17 17/90 = 0,1889 15 1/6 = 0,1667 3 15 15/90 =
0,1667 15 1/6 = 0,1667 4 18 18/90 = 0,2000 15 1/6 = 0,1667 5 10 10/90 = 0,1111 15 1/6 =
0,1667 6 18 18/90 = 0,2000 15 1/6 = 0,1667
Soma 90 1,000 90 1,000 A exigência n suficientemente grande é por demais vaga para que sirva
como uma boa definição de probabilidade, além de impossibilitar, tal como o conceito clássico, o
tratamento probabilístico de eventos de espaços amostrais contínuos.
Exemplo 3: Em 660 lançamentos de uma moeda, foram observadas 310 caras. Qual a probabilidade de,
num novo lançamento dessa moeda obter-se coroa?
m 350
Aqui, a estimativa fr da probabilidade P(A) será: 0,5303 fr = = =
Exemplo 4: Seja uma turma composta pelos alunos Helena, Maria, Pedro, José e Alice. Selecionando-se
um aluno ao acaso: a) qual a probabilidade de ser selecionada a Helena? b) e de ser selecionada uma
mulher? Resolução: S = {Helena, Maria, Pedro, José, Alice}. n s = 5
⇒ Considerando que S é um espaço finito e seus pontos são equiprováveis, isto é, cada ponto de S tem a
mesma probabilidade de ocorrer, tem-se que:
a) Selecionando-se um aluno ao acaso qual a probabilidade de ser selecionada a
Helena? n
A = {Helena} nA = 1 ( )51
PA n
S
==A
b) Selecionando-se um aluno ao acaso a probabilidade de ser selecionada uma mulher?
n
M = {Helena, Maria, Alice} nM = 3 ( )53
PM n
S
==M
Exemplo 5: Seja o espaço amostral referente ao número de caras obtidos no “lançamento de uma moeda
3 vezes” e A o evento “ocorrência de uma cara”. Neste caso:
S = {0,1,2,3} e n 4 S = e A = { l } e n A = 1
Aqui, o conceito clássico não pode ser imediatamente aplicado, pois, os pontos de S não são
equiprováveis, ou seja, P(A) ≠ 1/4. Observando-se o espaço amostral original:
S’ = {CCC, CCK, CKC, KCC, CKK, KCK, KKC, KKK};
n
vê-se, A’ = {CKK, KCK, KKC} e, logo,
83
P(A') A'
= =, nesse caso, S’ é equiprovável.
S'
n
S P(S) =1
A
A = S− A, logo A ∪ A = S, e P(A ∪ A) = P(S) =1
Por definição:
Ora, A ∩ A = Φ, isto é, A e Asão mutuamente exclusivos.
Logo, P(A) + P(A) =1 ∴ P(A) =1− P(A)
40
Exemplo 6: Imagine que uma carta será retirada de um baralho contendo apenas as figuras (Rei, Valete e
Dama). Qual a probabilidade de sair uma dama ou a carta ser de espadas? Esse baralho tem 12 cartas,
sendo três figuras (Rei, Valete e Dama) e quatro naipes (Paus, Copas, Espadas e Ouros). Então:
4 3
P(D ∪ E) = P(D) + P(E) − P(D ∩ E)
21
1 6
P(D ∪ E) = + − = =
12 12 12 12
Exemplo 7: A probabilidade de um guarda rodoviário aplicar quatro ou mais multas em um dia é de
63%; a probabilidade de ele aplicar quatro ou menos multas em um dia é de 56%. Qual a probabilidade
de o guarda aplicar exatamente quatro multas em um dia?
Solução: Quatro ou mais = 63% Quatro ou menos = 56%
P(A∪ B) = P(A) + P(B) − P(A∩ B) =>100 = 6 3+ 5 6− P(A∩ B) => P(A∩ B) =119−100 =1 9%
Teorema 5: Se A ⊂ B, então P(A) ≤ P(B)
S
B
A
Resta provar que P(A) ≤1Pelo Teorema 5, A ⊂S, logo ⇒P(A) ≤ P(S)
Pelo axioma (ii), tem-se que P(S) =1, logo P(A) ≤1 ∴ 0 ≤ P(A) ≤1
Exemplo 8: Numa classe há 10 homens e 20 mulheres. Metade dos homens e metade das mulheres tem
olhos castanhos. Qual a probabilidade de uma pessoa escolhida ao acaso ter olhos castanhos ou ser
mulher? Olhos Castanhos Olhos Claros Totais
Homens 5 5 10
Mulheres 10 10 20
Totais 15 15 30 ns = 30
Eventos: M: “ser mulher”nM= 20 32
20
P(M) = =
30
Exemplo 9: Lançando um dado e uma moeda e observando as faces superiores, quantos diferentes
resultados podemos obter?
n1 = 6possíveis resultados do dado.n2 = 2possíveis resultados da moeda.
Portanto será possível obter n1⋅n2 = 6x2 =12diferentes resultados.
(5 5)! −
42
Há casos em que só interessam os elementos que compõem o grupamento, não importando a
ordem que ali figuram. Temos então o que se chama de combinação de n elementos k a k. Símbolo: n!
( )k!(n k)! k
Ckn
==
n
−
Os grupamentos básicos do exemplo 1.10, abc, abd, acd, bcd (primeira coluna), são precisamente
as combinações dos quatro elementos a, b, c, d tomados 3 a 3. Ou seja:
4! 4x3x2x1
C34 = = = .
3!(4 3)! − 4
3x2x1
Ali, qualquer permutação que façamos com os elementos de determinado grupamento origina a
mesma combinação. São idênticas as combinações:
abc, acb, bac, bca, cab, cba.
Exemplo 12: De um grupo de sete pessoas, quantas comissões de três pessoas podemos formar? Solução:
Evidentemente, só interessa os indivíduos em si, e não a ordem que os consideramos. Temos, pois, um
problema de combinações de 7 elementos tomados 3 a 3, cujo resultado é:
7! 7x6x5x4!
C37= = = .
3!(7 3)! − 35
3x2x1x4!
Exemplo 13: De um grupo de sete pessoas, quantas comissões podemos formar, compostas de um
presidente, um secretário e um tesoureiro?
Solução: Aqui já não interessam apenas os indivíduos em si, mas também os cargos que irão ocupar (ou
seja, a ordem que os consideramos). Uma comissão em que João é presidente, Helena secretária e Renata
tesoureiro é diferente da comissão composta por Helena presidente, Renata secretária e João tesoureiro.
Estamos, pois, em face de um problema de arranjos de 7 elementos tomados 3 a 3, cujo resultado é:
7! 7x6x5x4!
A37= =
= 210
(7 3)! − 4!
Exemplo 14. Seja o experimento aleatório “de um grupo de 3 mulheres e 4 homens, seleciona-se duas
pessoas de uma só vez”.
a) Obter o espaço amostral referente ao número de homens selecionados.
Como são selecionadas duas pessoas fica.
S = {0,1,2} Espaço amostral não equiprovável.
b) Obter a probabilidade de ocorrência de cada um dos pontos do espaço amostral. Como são selecionadas duas
pessoas de um só vez, o espaço amostral básico do experimento será 7!
C27=
=pontos amostrais, ou seja, 21 diferentes grupos de 2 pessoas que
composto por: 21
2!(7 2)!
−
podem ser formados a partir de 7 pessoas.
11
12 13
12/21
1
C4⋅C =
20
6
6/21
2
C4⋅C =
0
3
Soma = 1,0
Exemplo 15. Uma caixa contém 10 peças, das quais 3 são defeituosas. Extraem-se três ao acaso. Qual a
probabilidade de:
a) A = {todas serem defeituosas} c) C = {uma ser defeituosa}
3
CC ⋅ P(A)3 0
1
1
CC⋅ 2
63
=120
=
3
P(C)3
7
= 3
=7
10 10
C 120 C
b) B = {duas serem defeituosas} d) D = {nenhuma ser defeituosa}
2 1 0
CC P(D)3
CC⋅ 21 3
⋅ 35
P(B)3 = 3
=
=
120
7
=7
3
10 10
C 120 C
Fato: Observa-se que os eventos acima formam o espaço amostral que representa o número de
peças defeituosas retiradas: S = {3, 2, 1, 0} 1 21 35
63 120
P(S) = P(A) + P(B) + P(C) + P(D) = + + + = = 1
44
Vamos indicar por P o evento que ocorre quando escolhendo-se ao acaso um aluno do instituto e
este for um estudante de Matemática Pura (P), A, E, I, H e M têm significados análogos. Desta maneira,
vemos que:
Podemos considerar uma subpopulação formada pelos homens, em que n H = 120. A probabilidade
de que um aluno do Instituto, escolhido ao acaso nessa subpopulação (somente homens), seja um
estudante de Inglês é igual a nHI/nH, onde nHI é o número de homens estudantes de Inglês. O resultado será
15/120 = 3/24.
O símbolo mais comumente adotado é P(I/H), que pode ser lido como a "probabilidade do evento
I (estudante de Inglês) dado o evento H (sabendo-se que a pessoa escolhida é Homem)". Em símbolos: ()
()
n IH ∩
P I/H ==∩ PIH
H
n P(H)
É claro que cada subpopulação pode ser considerada como sendo uma nova população; o termo
subpopulação é usado unicamente por conveniência de linguagem servindo para indicar que existe uma
população maior sendo considerada.
Por analogia com a fórmula acima, introduziremos agora a seguinte definição formal. Seja B um
evento cuja probabilidade é conhecida. Para um evento A, arbitrário, definimos.
( )( )
PAB
P A B∩
/ = , P(B)
P(B)
> 0.
A quantidade assim definida será chamada de probabilidade condicional de A na hipótese B (ou
dado B). No caso de todos os pontos amostrais terem probabilidades iguais, P(A/B) é o quociente
() n
P A/B ∩
P B A∩
PAB
/ =, P(A) > 0.
P(A)
Considerar probabilidades condicionais de vários eventos com relação a uma hipótese particular H
é equivalente a escolhermos H como um novo espaço amostral, com probabilidades proporcionais às
probabilidades originais; o fator de proporcionalidade P(H) é necessário para que se tenha a probabilidade
total do novo espaço igual a 1. Essa formulação mostra que todos os teoremas gerais sobre probabilidades
são válidos também para probabilidades condicionais, com respeito a qualquer hipótese particular H. Por
exemplo, a relação fundamental para a probabilidade da ocorrência de A ou B ou ambos, toma a forma:
P[(A∪ B)/ H] = P(A/ H)+ P(B / H)− P[(A∩ B)/ H].
45
Exemplo 17: Para o exemplo do Quadro 1.2, se desejamos encontrar a probabilidade de um aluno
escolhido ao acaso estar matriculado em estatística sabendo-se que é Mulher, fazemos:
Eventos: E: “matriculado em Estatística”
M: “ser Mulher”.
n
, então fazemos
Desejamos saber P(E / M) 41
P(E/M) ===
20 EM
∩
M
n 80
Dada a informação da ocorrência de um evento, teremos a redução do espaço amostral. A
probabilidade condicional pode ser avaliada diretamente no espaço amostral reduzido.
Um indivíduo é selecionado ao acaso, sabendo-se que é mulher, qual a probabilidade de ser criança?
PCM n 3
(/)== n
CM M
∩
5
P(A/B)∩
= P(A B) P(B)
46
Exemplo 20: Uma urna contém 2 bolas brancas e três vermelhas. Retiram-se duas bolas dessa urna com
reposição. Quais as diferentes ocorrências que podem ocorrer:
2 2 4
P(1º B ∩ 2º B) = P(1º B)⋅ P(2º B /1º B) = ⋅ =
52 53 25 6
P(1º B ∩ 2ºV ) = P(1º B)⋅ P(2ºV /1º B) = ⋅ =
53 52 25 6
P(1ºV ∩ 2º B) = P(1ºV )⋅ P(2º B /1ºV ) = ⋅ =
53 53 25 9
P(1ºV ∩ 2ºV) = P(1ºV)⋅ P(2ºV /1ºV) = ⋅ =
5 5 25
Exemplo 21: Uma urna contém 2 bolas brancas e três vermelhas. Retiram-se duas bolas dessa urna sem
que haja reposição. Quais as diferentes ocorrências que podem ocorrer:
2 1 2 1
P(1º B ∩ 2º B) = P(1º B)⋅ P(2º B /1º B) = ⋅ = =
52 43 206 103
P(1º B ∩ 2ºV ) = P(1º B)⋅ P(2ºV /1º B) = ⋅ = =
53 42 206 103
P(1ºV ∩ 2º B) = P(1ºV )⋅ P(2º B /1ºV ) = ⋅ = =
53 42 206 103
P(1ºV ∩ 2ºV ) = P(1ºV )⋅ P(2ºV /1ºV ) = ⋅ = =
5 4 20 10
Exemplo 22: Dentre 10 alunos de uma sala, 3 são mulheres. Duas pessoas são chamadas aleatoriamente,
uma após a outra, sem reposição. Pede-se:
47
2.11. Independência Probabilística
A probabilidade condicional P(A/B) não é, em geral, igual a probabilidade P(A). No caso em que P(A
/B) = P(A)diremos que A é estatisticamente (probabilisticamente) independente de B. A expressão P(A
∩ B) = P(B)⋅ P(A / B)segundo a condição P(A /B) = P(A)pode ser escrita da forma: P(A ∩ B) =
P(B)⋅P(A)ou P(A ∩ B) = P(A)⋅ P(B)
Essa equação é simétrica em A e B, e mostra que sempre que A for independente de B, B também
será independente em relação a A.
48
Exemplo 24: A probab. de o homem viver 10 anos além dos 60 anos é 1/4 e da mulher 1/3. Obs.: Sejam
os eventos H: “o homem viver 10 anos após os 60” e M: “a mulher viver 10 anos após os 60”. É evidente
que os eventos H e M são independentes.
1
P(H) =⇒ prob. do homem estar vivo 10 anos após os 60 anos.
4
1 3
P(H) =1− =⇒ prob. do homem não estar vivo 10 anos após os 60 anos.
1 4 4
49
2.12. Teorema da Probabilidade Total (ou diagrama de árvore).
Enunciaremos agora um teorema útil que relaciona a probabilidade de um evento com
probabilidades condicionais. Sejam B1, B2, ..., Bn eventos mutuamente exclusivos e exaustivos*. Então
para um evento arbitrário A,
P(A) P(A/ B ) P(B ) P(A/ B ) P(B ) ... P(A/ B ) P(B )
=⋅+⋅++⋅
1122nn
∑
i i P(A) P(A / B ) P(B )
=⋅
i1
=
A utilidade deste resultado reside no fato de que as probabilidades que compõem o somatório
acima são em geral mais fáceis de calcular que a própria probabilidade de A.
* {B1, B2, ..., Bn} é um conjunto de eventos mutuamente exclusivos e exaustivos se quaisquer dois eventos
Bi e Bj não podem ocorrer ao mesmo tempo e um deles deve ocorrer. Simbolicamente, Bi ∩Bj = Φ , i ≠ j e
B1 ∪B2 ∪...∪Bn= S
B1 B2 B3
A
B4B5
Partição disjunta de Ω em eventos Bi (i= 1, 2, .., 5), e sua interseção com o evento A.
( )( ) ( )
P B A×
=/
PABPB
/
P(A)
Combinando este resultado com o teorema da probabilidade total, temos como conseqüência,
( )( ) ( )
PABPB
PBA / ×
jj
/,=n
j
∑ ()()
PABPB
i 1 ii
= /
×
50
Exemplo 26: Em determinada universidade os alunos de português estão divididos em três turmas, da
seguinte forma:
• Turma 1 com 10 alunos, dos quais 4 são Químicos.
• Turma 2 com 5 alunos, dos quais 1 é Químico.
• Turma 3 com 20 alunos, dos quais 3 são Químicos.
1/3 T3 Q
17/20 N
2 01 7
6 04 5
1
1 06
1
4
1
3
P(N) P(T ) P(N /T ) P(T ) P(N /T ) P(T ) P(N /T ) = 1⋅1 + 2⋅2 + 3⋅3 = ⋅ + ⋅ + ⋅ = =
3
3
5
3
4
Fato:P(S) = P(Q) + P(N) =1
b) selecionando-se uma turma aleatoriamente, em seguida selecionando um aluno, também aleatoriamente,
verificou-se que o aluno é químico. Qual a probabilidade dele ser da T 3?
Pelo Teorema da Bayes teremos:
U3V 9/15
3/6
6/15 B
a) Qual a probabilidade da bola 1 3
extraída ser Branca? 65
2
Pelo Teorema da Probabilidade Total 1 2
2 1 56
teremos:
1 04 3 61 3
P(B) P(U ) P(B/ U ) P(U ) P(B/ U ) P(U ) P(B/ U ) = 1⋅1 + 2⋅2 + 3⋅3 = ⋅ + ⋅ + ⋅ = =
e de ser será: 62 63 180 115
vermelha 61 1 21 0 1 06 1 59 3 62 3
P(V) P(U ) P(V / U ) P(U ) P(V / U ) P(U ) P(V / U ) = 1⋅1 + 2⋅2 + 3⋅3 = ⋅ + ⋅ + ⋅ = =
6
6
6
180
Fato: P(S) = P(B) + P(V) =1
b) Qual a probabilidade de se ter escolhido a urna 1, dado que a bola extraída é Vermelha?
Pelo Teorema da Bayes teremos:
P(U / V) P(U ) P(V/ U ) ⋅ 16 ⋅
1 21 0 1 21 0 2 35
1 =
=
=
11
1
2
1 06
3
1 59
P(U ) P(V/ U ) P(U ) P(V/ U ) P(U ) P(V/ U )
⋅ + ⋅ + ⋅ 112233 ⋅+⋅+⋅
6 6 6
52
2.14. Exercícios: Introdução a Probabilidade
2. Se
exclusivos. 21
e
P(A) = 41
P(B) =e A e B são mutuamente exclusivos, calcule:
,
P(A) = 31
3. Se e
21 P(B) = 41
P(A ∩ B) =, calcule:
6. Uma moeda é lançada três vezes e observado o número de caras. Qual a prob. de
ocorrer: a) três caras; d) duas caras e uma coroa;
b) nenhuma cara; e) pelo menos uma cara; e
c) exatamente uma cara; f) pelo menos uma coroa.
53
10. Suponha que a probabilidade que um vigia noturno num navio com luzes apagadas descubra um
periscópio em certas condições de tempo é 0,7. Qual é a probabilidade de que a combinação de dois vigias
similares A e B, fizesse a descoberta?
11. Uma urna contém 12 bolas: 5 brancas, 4 vermelhas e 3 pretas. Outra contém 18 bolas: 4 brancas, 6
vermelhas e 8 pretas. Uma bola é retirada de cada urna. Qual a probabilidade das duas bolas serem da
mesma cor?
12. Uma urna contém 7 bolas pretas e 3 vermelhas. Foram extraídas duas bolas com reposição. Qual a
probabilidade de terem sido uma bola preta e uma vermelha?
13. Uma urna contém 7 bolas pretas e 3 vermelhas. Foram extraídas duas bolas sem reposição. Qual a
probabilidade de terem sido uma bola preta e uma vermelha?
14. Uma caixa A contém 8 peças, das quais 3 são defeituosas e uma caixa B contém 5 peças, das quais
duas são defeituosas. Uma peça é retirada aleatoriamente de cada caixa:
a) qual a probabilidade p de que ambas as peças não sejam defeituosas?
b) qual a probabilidade p de que uma peça seja defeituosa e a outra não?
15. Das dez alunas de uma classe, três tem olhos azuis. Se duas delas são escolhidas aleatoriamente, qual é
a probabilidade de:
a) ambas terem olhos azuis?
b) nenhuma ter olhos azuis?
c) pelo menos uma ter olhos azuis?
16. Dois cães são retirados de um canil contendo 10 cães, dos quais 8 são fêmeas. Determine a
probabilidade de que os dois cães retirados sejam fêmeas.
17. A probabilidade de uma mulher estar viva daqui a 30 anos é 3/4 e de seu marido é 2/5. Calcular a
probabilidade de:
a) apenas o homem estar vivo;
b) somente a mulher estar viva;
c) ambos estarem vivos, e
d) pelo menos um estar vivo.
54
19. Jogam-se dois dados. Se as duas faces mostram números diferentes, qual é a probabilidade de que
uma das faces seja 4?
20. Seja E: lançar dois dados, e:
A ={(x1, x2)/ x1 + x2 = 8}, ou seja, a soma ser 8.
B ={(x1, x2)/ x1 = x2}, ou seja, o primeiro resultado ser igual ao segundo.
C ={(x1, x2)/ x1 + x2 =10}, ou seja, a soma ser 10.
Calcular: a) P(A)d) P(A/ B)g) P(A∩ B)
b) P(B)e) P(B/ A)h) P(A∪ B)
c) P(C)f) P(A/C)i) P(A ∩ B)
21. Um dado é viciado de tal forma que a probabilidade de sair um certo número é proporcional ao seu
valor. Pede-se:
a) qual a probabilidade de sair o 3, sabendo-se que o ponto que saiu é ímpar?
b) qual a probab. de sair um número par, sabendo-se que saiu um número maior que 3?
23. Sejam A e B eventos cujas probabilidades são: P(A) = 1/4; P(B) = p; P(A∪B) =
1/3. Determine p para os casos em que:
a) A e B são mutuamente exclusivos.
b) A e B são independentes.
c) A é subconjunto de B.
25. Considere a escolha aleatória de um entre os dez primeiros números inteiros positivos (a partir de um),
e os eventos:
A = {1, 2, 3, 4, 5} B = {4, 5, 6, 7} C = {5, 9}. Pede-se:
Os eventos são mutuamente independentes? Mostre por quê.
26. A e B são eventos mutuamente exclusivos. Determine quais das relações abaixo são verdadeiras e
quais são falsas. Justifique.
a) P(A/B) = P(A) b) P(A) = 0; P(B) = 0; ou ambas c) P(A∩B) = P(A).P(B)
55
29. De 100 estudantes, 30 frequentam um curso de inglês, 20 frequentam um curso de computação e 10
frequentam tanto um curso de inglês como um curso de computação. Um estudante é selecionado ao
acaso. a) Determine a probabilidade de que ele não frequente o curso de inglês.
b) Determine a probabilidade de que ele frequente pelo menos um dos cursos.
c) Determine a probabilidade de que ele não frequente nenhum desses dois cursos. d) Se ele frequenta o
curso de inglês, determine a probabilidade de que ele também frequente o curso de computação.
e) Se ele frequenta o curso de computação, determine a probabilidade de que ele também frequente o
curso de inglês.
30. Em um certo colégio, 25% dos alunos foram reprovados em matemática, 15% em química e 10% em
matemática e química ao mesmo tempo. Um estudante é selecionado aleatoriamente. Pede-se: a) se ele foi
reprovado em química, qual a prob. de ter sido reprovado em matemática? b) se ele foi reprovado em
matemática, qual a prob. de ter sido reprovado em química? c) qual a probabilidade de ter sido reprovado
em matemática ou química?
31. A probabilidade de um carro ser vendido para indivíduos da classe A é 3/4, da B é 1/6, da C é 1/20 e
da D é 1/30. A probabilidade do indivíduo da classe A comprar um carro da marca E é 1/10; da B
comprar da marca E é 3/5, da C é 2/10 e da D é 1/10. Em certa loja vendeu-se um carro da marca E. Qual
a probabilidade de um indivíduo da classe B o tenha comprado?
32. Em certo colégio 5% dos homens e 3% das mulheres tem mais de 1,80 m de altura. Por outro lado
60% dos estudantes são homens. Se um estudante é selecionado aleatoriamente e tem mais de 1,80 m de
altura, qual a probabilidade de que o estudante seja mulher?
33. Sejam dois currais A e B com a seguinte composição: curral I: 15 animais dos quais 5 estão
amamentando; curral II: 8 animais dos quais 3 estão amamentando. Todos os animais são identificados por
números. Um deles é selecionado aleatoriamente.
a) Constata-se que está amamentando. Determine a probabilidade de que o animal seja do curral I.
b) Determine a probabilidade de que o animal escolhido não esteja amamentando.
34. Três máquinas, A, B e C produzem respectivamente 40%, 50% e 10% do total de peças de uma
fábrica. As percentagens de peças defeituosas produzidas pelas respectivas máquinas são 3%, 5% e 2%.
Uma peça é sorteada ao acaso e verifica-se que é defeituosa. Qual a probabilidade de que a peça tenha
vindo da máquina A?
Selecionamos uma caixa aleatoriamente e então retiramos uma lâmpada, também aleatoriamente. Qual a
probabilidade dela ser defeituosa?
56
36. Uma caixa A contém 8 peças, das quais 3 são defeituosas e uma caixa B contém 5 peças das quais 2
são defeituosas. Uma peça é retirada aleatoriamente de cada caixa:
a) Qual a probabilidade de que ambas as peças não sejam defeituosas?
b) Qual a probabilidade de uma peça ser defeituosa e outra não?
c) Qual a probabilidade de pelo menos uma peça ser defeituosa?
37. Você pode jogar na MEGASENA escolhendo 6 números pertencentes ao intervalo de 01 a 60. São
sorteados 6 números de forma aleatória pela CEF. Pede-se:
a) qual a probabilidade de você ganhar jogando apenas um cartão?
b) e se você apostar 500 cartões?
c) e se você marcar oito números no mesmo cartão?
57
Respostas
1. a)S = {C1,C2,C3,C4,C5,C6,K1,K2,K3,K4,K5,K6}
58
Cap.3. Variáveis Aleatórias
3.1. Conceito
É toda e qualquer variável associada a uma probabilidade, isto é, seus valores estão
relacionados a um experimento aleatório. Em termos de experimentação, variáveis aleatórias são as
características avaliadas nas unidades experimentais. Por exemplo, num experimento para selecionar
qual a melhor entre quatro rações, a característica avaliada seria ganho de peso, expressa em kg. Para
avaliar qual o melhor tratamento térmico a ser submetido um produto, a variável medida seria o
número de microorganismo que existe após os diversos tratamentos.
Seja E um experimento aleatório e S o espaço amostral associado a este experimento. Uma
função X, que associe a cada elemento a pertencente a S um número real X(a), é denominada variável
aleatória.
a X X(a)
S
R
Exemplo 1: Considere o lançamento de duas moedas e seja X = número de caras obtidas.
Observações:
1) O uso de variáveis aleatórias equivale a descrever os resultados de um experimento aleatório por meio
de números ao invés de palavras, o que apresenta a vantagem de possibilitar melhor tratamento
matemático;
2) Nem toda função é uma variável aleatória.
3) As Variáveis Aleatórias podem ser classificadas em qualitativas e quantitativas.
4) Uma V. A. quantitativa pode ser discreta ou contínua.
Este é o caso mais simples da v.a. discreta, onde cada possível valor ocorre com a mesma
probabilidade.
Definição: A variável aleatória discreta X, assumindo os valores 1 2 xn x ,x ,...,, tem distribuição uniforme,
se e somente se,
1
P(X = xi) = P(xi) = p =, para todo i = 1, 2, ... , n.
n
i) Tabela
...
xi 1 x 2 x 3 x n x
P(x )i1/n 1/n 1/n ... 1/n
ii) Gráfico ...X
P(X) x1 x2 x3 xn
1/n
i) Tabela
xi1 2 3 4 5 6
P(x )i1/6 1/6 1/6 1/6 1/6 1/6
# Este exemplo trata-se de uma v.a.d. X = {nº de pontos obtidos}, uniformemente distribuída.
ii) Gráfico x1 x2 x3 x4 x5 X x6
P(X)
1/6
60
Exemplo 3: Seja E: “o lançamento de duas moedas”.
Seja a v.a.d. X = {nº de caras}, se S = {kk, kc; ck, cc}, então X = {0, 1, 2}
i) Tabela
xi x1 = 0 x2 =1 x 2 3 =
P(x )i1/4 2/4 1/4
# Este exemplo trata-se de uma v.a.d. X = {nº de caras obtidas}.
3.3.1.Definição
Seja X uma v.a.. Se X puder assumir todo e qualquer valor em algum intervalo a ≤ x ≤ b,
onde a e b podem ser, respectivamente -∞ e +∞, então X é v.a.c.
Assim uma v.a. X é contínua quando associada a um espaço amostral infinito não enumerável.
A função que denotaremos por f(x), definida para a ≤ x ≤ b, será chamada f.d.p. se satisfizer às
seguintes condições:
Observações:
< < =dc
1) Para c < d ,
∫
P(c X d) f(x)dx
x
= = ; sendo assim,
=0 ∫
2) Para um valor fixo de X, por exemplo, 0 X = x, temos que P(X x ) f(x)dx 0 0
x
0
3) A função densidade de probabilidade f(x) não representa probabilidade. Somente quando a função for
integrada entre dois limites ela produzirá uma probabilidade, que será a área sob a curva da função
entre os valores considerados.
5) Se o conjunto de valores de X não estiver contido no intervalo [a,b], então x ∉ [a,b], tem-se f(x) = 0.
61
3.3.3. Variável aleatória contínua uniformemente distribuída
Este é o caso mais simples de v.a. contínua.
Definição: a V.A. contínua X tem distribuição uniforme no intervalo [a, b], sendo a e b finitos, se a sua
função densidade de probabilidade é dada por:
1
⎪ ⎧
⎨ ≤≤
f(x) =−ba , para a x b
⎪
⎩
f(x)
0, para outros valores de x a b x
⎪
⎪ ⎩ 0 2 x
0, para x 2 >
c) Calcular P(X ≤ 1). ⎤ 1 1
⎢ 1 1
⎣⎡ 22 0
1 2
⎢ 1 ⎤
⎣⎡ x 1
⎥=
10
1
1
0
P(X ≤ 1) =
2 ⎦
2 ⎦
0
2 1
4 4
0
62
Exemplo 5: Seja uma v.a.c. X definida pela seguinte f.d.p.
Respostas:
b) c) 5
k=1 8 P(X > 2) =
a)
4
∑
F(x) P(X x) P(x )
=≤=
i
xx
i ≤
Pede-se:
a) Traçar o gráfico da distribuição de probabilidade de X.
b) Obter a função de distribuição acumulada e traçar seu gráfico.
63
3.5. Medidas de posição de uma variável aleatória
∑ i=
i1
=
Define-se a esperança matemática de X por:
n
∑
x112233nnii E(X) μ μ x P(x ) x P(x ) x P(x ) ... x P(x ) x P(x )
===⋅+⋅+⋅++⋅=⋅
i1
=
Exemplo 8: Seja o lançamento de quatro moedas. Considere a v.a.d. X número de caras. Calcule a
esperança matemática (média) de X.
Solução:
X01234
) 1 6 4
P(X=xi 16 16416 16 161
n
1 4 6 4 1 32
= ⋅=++++==
∑ EXxPxxxxxx
( ) ( ) 0 ii 1 2 3 4 16 16
16 16 16 16 2
i = 1
64
3.5.3.2. Caso em que X é uma v.a.c.
A esperança matemática de uma v.a.c. X é definida por:
∫∞
E(X) = xf(x)dx
−∞
Exemplo 2.9: Uma v.a.c. X apresenta a seguinte
f.d.p.: 0, para x 0
⎪ x <
⎪ ⎨⎧
f(x)Calcular E(X)
= ⎪ 2
⎪ ⎩ , para 0 x 2 ≤ ≤
0, para x 2
>
2
E(X) xf (x)dx x 0dx x ⎥
⎦⎤
+∞ 2 ∞
x 1 1 ⎢ x
0 x 2 2 2 ⎣⎡ 3
= = ⋅+ ⋅+ ⋅= = =
∫ ∫ ∫ ∫ ∫ ∫
−∞ −∞ 0
2 dx x 0dx 2 0 2 2 0
2 3 0
dx x dx 2
= − ⇒ 34
1 ⎢ 2 0 ⎤ 8 4
⎣⎡ E(X) =
E(X) ⎥ = =
33
2 3 3 ⎦ 6 3
=
== ∫ ∫+∞
+∞
=
Prova: E(X) kf(x)dx k f(x)dx k - ∫+∞
∞ ⇒ E(X) = k, pois f(x)dx 1
-- ∞ ∞
P2) A esperança matemática do produto de uma constante por uma variável é igual ao produto da
constante pela esperança matemática da variável, ou seja, multiplicando-se uma variável aleatória
por uma constante; sua média fica multiplicada por essa constante.
+∞
==
= ∫ ∫+∞
Prova: E(kX) kxf(x)dx k xf(x)dx kE(X)
--
∞ ∞
P3) A esperança matemática da soma ou subtração de uma v.a. com uma constante é igual a soma ou
subtração da esperança matemática da variável com a constante, ou seja, somando-se ou subtraindo
se uma constante a uma v.a., a sua média fica somada ou subtraída da mesma constante.
E(X ± K) = E(X) ± K
P4) A média de uma v.a. centrada é zero, ou seja, a média dos desvios dos valores da v.a. em relação a sua
média é zero.
Obs.: Dizemos que a v.a. está centrada quando todos os valores são expressos como desvios em relação à
respectiva média, (X -μx )
Assim: E(X -μx) = E(X) - E(μx) = μx - μx = 0
P5) A esperança matemática da soma ou da subtração de duas v.a. quaisquer é igual a soma ou a subtração
das esperanças matemáticas das duas v.a., ou seja, a média da soma ou da subtração de duas v.a. é igual
a soma ou subtração das médias.
E(X ± Y) = E(X) ± E(Y)
P6) A esperança matemática do produto de duas variáveis aleatórias independentes é igual ao produto das
esperanças matemáticas das variáveis, ou seja, a média do produto de duas variáveis aleatórias
independentes é o produto das médias.
E(XY) = E(X)⋅E(Y)
65
Exemplo 10: Seja X uma v.a.d. com a seguinte distribuição de probabilidade xi-2 -1 0 1 2
Total P(x )i1/8 2/8 2/8 1/8 2/8 1,00
Determinar:
a) Esperança de X
n
2 2 1 2 1 ⇒
1 81
=
∑ i⋅i = − ⋅ + − ⋅ + ⋅ + ⋅ + ⋅ =
E(X) x P(x ) ( 2) = b) Moda 8 8 8 8 8 8
i1 (Mo) ( 1) (0) (1) (2) E(X) =
c) Mediana (Md)
Md = 0, pois temos que a
83
P(X ≤ 0) = P(X ≥ 0) =
2x, para 0 x 1
f(x) ⎪
⎨⎧ ≤ ≤
Determinar: = ⎪
0, para outros valores de x. ⎩
a) Esperança de X
1
x 0dx x 2xdx x 0dx 2x dx 2 x dx 2 ⎥
E(X) xf(x)dx ⎦⎤
+∞ 1 1
⎢ x
0 ∞ 1 ⎣⎡ 3
⋅+⋅+⋅===
== ∫∫∫∫∫∫
−∞ 0
−∞ 3 0
2 0 0
2 1
⎢ 33
⎣⎡ ⎤
⇒
=− 32
E(X) 2 3 3 ⎦ E(X) =
1 0 ⎥= 23
c) Mediana (Md)
Md
⎢
⎣⎡⇒
2
=⎥
f(x)dx
=
Md
∫ −∞ ⇒ ⎦⎤
21
+=
0
∫−∞ ∫⇒21
1
x
Md
0dx 2xdx = ⇒
0 ∫ 21
0 0
2 2 2 1
2 xdx Md Md = + =
⎢ ⎡ ⇒ 1 2 ⇒
1 Md 2 2=⎥
⎣ − 2 Md = 2 Md = ±, por coerência 0,707 2 ⎦⎤
2 2 2
0 12
66
3.6. Medidas de dispersão de uma Variável Aleatória
3.6.1. Variância
É a medida que quantifica a dispersão dos valores em torna da média.
A variância de uma v.a. é definida por:
222
( ) [ ( )] [ ] V X =σ x= E X − E X = E X − μx
=
# para X uma v.a.d. ∑− 2
V X = x − f x dx x ( ) ( ) ( )
−∞
μ
[ ( )]
2
2
V(X) = E(X ) − E X, pois
2
V(X) = E[X − E(X)] { }
22
= E X − 2XE(X) +[E(X)]
22
= E(X ) − 2E(X)E(X) +[E(X)]
222
= E(X ) − 2[E(X)] +[E(X)]
[ ( )]
2
2
V(X) = E(X ) − E X
em que:
=n
# para X uma v.a.d.
∑
2
E(X ) x P(x )
2
i
i
i1
=
67
Exemplo 12: Uma v.a.c. X apresenta a seguinte
função: 1
⎪ ⎧
⎨ ≤≤
f(x) = 4 x, para 1 x 3
⎪
⎩
0, para outros valores de x.
0dx⇒xdx 0
= + +3
=
4
⎢ 1
⎥ 4 1 9 1 4 2
−∞ ⎣⎡ ⎦⎤ 1
=−
12 2 ⇒1 21
3
⎢
⎣⎡
(x)dx =⎥
f ⎦⎤
=−
∫+∞
−∞ , logo f(x) é uma f.d.p..
4 2 4 2 2
b) Calcular P(X ≥ 2) . 3
⎤
⎢
⎣⎡
⎢ 1 22
⎣⎡ x ⎤
2
1 1
1 3
2
5
+∞ +∞
3
3
∫∫∫∫
P(X 2) f(x)dx
≥==+=+=⋅
22 ⎥=
4 xdx 0dx 4 xdx 0 4 2
⎥=⋅−
4
2
2
8
32
⎦
⎦
2
c) Esperança de X
13
+∞
1 1 1 ⎢ x 3 3
⎢ 3 33 1 ⎤
⎣⎡ ⎤ 1 ⎣⎡
⎥=
1
3 +∞ 1
=
==⋅+⋅+⋅= ∫ ∫∫∫∫
E(X) xf (x)dx x xdx x 0dx 4 4 x dx 3
0dx x 2
4 ⎥=−
−∞ −∞ 1 3 0
⎦ 1
4 3 3 ⎦ 6
d) Moda (Mo) ⇒ é o valor de maior densidade, logo, Mo = 3.
e) Mediana (Md)
1Md
⎢ ⇒
⎣⎡ 21
x =⎥ ⎢ ⎡ ⎤
2 ⎦⎤ ⎣ −⇒
12 2⎥ =
+=
1
∫−∞ ∫⇒21
= ⇒
f(x)dx Md ∫ −∞21
Md = + 51 2 0dx Md 1 1 4 xdx 4 2 4 Md 2 1 2 ⎦
1
f) Variância de X ⇒[ ( )] 3
⎢
⎢ ⎣⎡
2
2
V(X) = E(X ) − E X ⎣⎡ 4
⎤ 1
1 x 3
44
1 1
⎤
+∞ 1 3 +∞ 1
1
==++==
∫∫∫∫∫
⎥=
222
2
f(x)dx x 0dx 2 4 x dx 4 5
E(X ) x x4 xdx x 0dx 3
4 ⎥=−
−∞ −∞ 1 3 0
⎦ 1
4 4 4 ⎦
13
V(X) E(X ) E X 52
[ ( )]3611
⎜ ⎞ 169
⎝⎛ 5
2 ⎟ = − =
2
= − = − ⇒ V(X) = 0,3056
6 g) Desvio padrão de X
⎠ 36
68
3.7.1. Introdução
3.7.2. Definição s
* S X Y
Xs
* Ys
Para que ( ) i j P x , yseja uma função de probabilidade conjunta é necessário que satisfaça as seguintes
condições:
a) P(xi, y j) ≥ 0, para todo valor ( ) i j
x,y.
r s
=
∑∑
b) ( ) 1 ijP x , y
i ==11j
69
{(x y ) P(x y )} para i r e j s i j i j
, , ,= 1,2,...,= 1,2,...,
Ou seja,
Y
X y1 y2 ... ys ( )i P X = x
x1( ) 1 1 P x , y ( ) 1 2 P x , y ... ( )s P x , y 1( ) 1 P X = x
x2( ) 2 1 P x , y ( ) 2 2 P x , y ... ( )s P x , y 2( ) 2 P X = x
... ... ... ... ... ...
xr ( ) 1 P x y r, ( ) 2 P x y r, ... ( ) r s P x , y ( )r P X = x
( )j P Y = y ( ) 1 P Y = y ( ) 2 P Y = y ... ( )s P Y = y1,00
Dada uma distribuição conjunta de duas variáveis aleatórias X e Y, podemos determinar a distribuição de
X sem considerar Y e a de Y sem considerar X. São as chamadas distribuições marginais. A distribuição
marginal é constituída pelos valores da variável aleatória e suas respectivas probabilidades marginais. A
probabilidade marginal para cada valor é obtida da seguinte forma:
()() ()
• Para X: ∑
iiijP XxPxPxy
===
,
j
=
1
r
)() ()
• Para Y: ( ∑ jjijP YyPyPxy
===
,
i
=
1
Com as probabilidades marginais para cada valor, podemos construir a distribuição marginal para
a variável aleatória.
• Para X:
xi x1 x2 ... xr
( )i P x ( ) 1 P x ( ) 2 P x ... ( )r P x1,00
• Para Y:
yi y1 y2 ... ys
( )j P y ( ) 1 P y ( ) 2 P y ... ( )s P y1,00
A probabilidade PYyXx
=
( )( ) = = =,
/
ji
PXx
PXxYy
==
ij
( )i
É denominada probabilidade condicional de j Y = y, dado que i X = x .
Assim, para xi fixado, os pares {y j,P(Y = y j/ X = xi)}definem a distribuição condicional de Y,
dado que i X = x .
70
yi y1 y2 ... ys
() j i P Y = y / X = x ( )i P Y = y / X = x 1( )i P Y = y / X = x 2... ( ) s i P Y = y / X = x1,00
( )( )
PXxYy
= = =,
==
/ , ( = > 0) j P Y y
ij
xYy
PX =
( )j
ij
PYy
xi x1 X2 ... xr
() i j P X = x /Y = y ( )j P X = x /Y = y 1 ( )j P X = x /Y = y 2... ( ) r j P X = x /Y = y1,00
(X,Y) será uma v.a. contínua bidimensional se os valores possíveis de X e Y puderem assumir
todos os valores em algum conjunto não enumerável.
Seja (X,Y) uma v.a.c. bidimensional. Dizemos que f(x,y) é uma função densidade de
probabilidade conjunta de X e Y, se satisfizer às seguintes condições:
∫∫ ∞
∞
b) ( ) = 1
f x, y dxdy
−∞ −∞
∫
∞
e
g( x ) = f( x, y )dy ∫
∞
−∞
h( y )= f( x, y )dx, respectivamente. −∞
Temos ainda que:
b
d
)
( ∫
()
P a X b g( x )dxe ∫
≤≤= iii) Distribuições condicionais
P c Y d h( y )dy
a ≤≤=
c
71
Sejam X e Y v.a.c. com f.d.p. conjunta f( x, y )e f.d.p. marginais dadas por g( x )e h( y ). A
f.d.p. condicional de X, dado que Y = yé definida por:
fxy
(,)
f x y = , h( y ) > 0
(/)
hy
()
Analogamente, a f.d.p. condicional de Y, dado que X = xé definida por:
fxy
(,)
f y x = , g( x ) > 0
(/)
gx
()
As f.d.p. condicionais acima, satisfazem a todas as condições impostas para uma f.d.p.
unidimensional.
a) f( y / x ) ≥ 0
∫∫∫ ∞
∞
∞
fxy(,) 1 hy ()
b) 1 f x y dx
(/)
hy====
dx f x y dx ( , )
−∞()
hy
()()
−∞
3.8. Variáveis aleatórias v.a.d. bidimensional
Definição 1 - Seja (X,Y) v.a.d. bidimensional. Dizemos que X e Y são independentes se, e somente se,
para todo par de valores ( ) i j
x , yde X e Y, tem-se:
( ) ( ) ( ) i j i j P X = x ,Y = y = P X = x .P Y = y
Basta que esta condição não se verifique para um par ( ) i j
x , ypara que X e Y não sejam
independentes. Neste caso diremos que X e Y são dependentes.
Definição 2 - Seja (X,Y) v.a.d. bidimensional. Neste caso X e Y serão independentes se, e somente se:
( ) ( ) i j i P X = x /Y = y = P X = x, para todo i e j.
Ou equivalente se, e somente se:
( ) ( ) j i j P Y = y / X = x = P Y = y, para todo i e j.
Definição 1 - Seja (X,Y) v.a.c. bidimensional. Dizemos que X e Y são independentes se, e somente se,
tem se:
f( x, y ) = g( x )⋅ h( y ), para todo x e todo y.
Definição 2 - Seja (X,Y) v.a.c. bidimensional. Neste caso X e Y serão independentes se, e somente se:
3.9. Covariância
72
Seja X e Y duas variáveis aleatórias. A covariância denotada por Cov(X,Y )é definida por
Cov(X,Y) = E{[X−E(X)]⋅[Y−E(Y)]}
Desenvolvendo a expressão acima, temos:
Cov(X,Y) = E[XY−XE(Y)−YE(X)+E(X)E(Y)]
Cov(X,Y) = E(XY) −E(X)E(Y)−E(Y)E(X)+E(X)E(Y)
() ()
Onde: ∑∑
iji yj E XY x y P x ,, para (X, Y) v.a. discretas. i 1
==
j1
+∞
()
∫∫
+∞
Obs.: para que haja covariância é necessário que existam pelo menos duas variáveis aleatórias. A
covariância nos dá uma idéia da relação de dependência entre duas variáveis.
Proposição:
P1) Cov(X,Y) = Cov(Y,X)
P2) Se V(X) = 0 ou V(Y) = 0, então Cov(X,Y) = 0
P3) Cov(aX,Y) = aCov(X,Y), sendo a uma constante.
P4) Cov(aX,bY)= abCov(X,Y), sendo a e b constantes.
P5) Cov(X + Z,Y) = Cov(X,Y)+Cov(Z,Y)
P6) Se X e Y são duas variáveis quaisquer, então:
V(X+ Y)= V(X)+ V(Y)+ 2Cov(X,Y)
V(X−Y) = V(X)+ V(Y)−2Cov(X,Y)
Exemplo 2.13. Seja (X,Y) uma v.a.d. bidimensional com a seguinte distribuição conjunta.
Y
73
X -3 2 4
1 0,1 0,2 0,2
3 0,3 0,1 0,1
a) Defina as distribuições marginais de X e de Y.
• Para X:
xi 1 3
( )i P x0,5 0,5 1,00
• Para Y:
yi -3 2 4
( )j P y0,4 0,3 0,3 1,00
b) X e Y são variáveis aleatórias independentes?
c) Calcule a variância de X e de Y.
2
=
∑ =+⇒=
()105305()2
EXxPxxxEX
(),,
ii
i 1 2
=
=
∑ =+⇒=( ) 105305( ) 5
22 222
EXxPxxxEX
(),,
ii
i 1
= [ ] 5 2 10
22222
= ( )− ( ) = −( ) ⇒ =, σ x E X E X σ x(Variância de X) 3
= ( ) = − , + , + , ⇒ =,
∑ ()304203403()06
E Y y P y x x x E Y jj
j = 1
3
=
∑ ( )=( − ) , + , + , ⇒ =, ( ) 3 0 4 2 0 3 4 0 3 ( ) 9 6
22 2222
E Y y P y x x x E Y jj
j = 1
[ ] 9 6 0 6 9 24 22222
= ( )− ( ) =, −( , ) ⇒ =, σ y E Y E Y σ y(Variância de Y) d) Calcule a
covariância entre X e Y.
2 3
()= ,= ( − ) , + , + , + ( − ) , + , + ,=,
∑∑
( ) 1 3 01 1 2 0 2 1 4 0 2 3 3 0 3 3 2 01 3 4 01 0 0
E XY x y P x y x x x x x x x x x x x x i j i j
ij
==
1 1
Cov X Y
ρ
( , ) 1,2
− 0,3948
ρ
=xy 2 2⇒ = − =
xy
x
xy
σσ
⋅ 1,0 9,24
74
1. Seja E: “Lançamento de um dado não viciado”, e seja a variável aleatória X = ⎨número de pontos
obtidos⎬. Pede-se:
a) determine o espaço amostral.
b) X é uma variável aleatória contínua ou discreta? Por quê?
c) determine a distribuição de probabilidade da V. A. X (tabela e gráfico).
4. Numa sala temos 5 rapazes e 4 moças. São retiradas aleatoriamente, 3 pessoas. Faça X a variável
aleatória número de rapazes.
a) Determine a distribuição de probabilidade da variável X, construa uma
tabela. b) Construa o gráfico da distribuição de probabilidade.
c) Calcule as probabilidades:
c.1) P(X ≤ 2)c.2) P(X ≤ 0)c.3) P(1< X ≤ 2)c.4) P(2 < X < 3) c.5) P(X > 2)c.6) P(X >
0)c.7) P(X > −1)c.8) P(X < 5)
5. Seja X uma v.a.c. definida pela seguinte f.d.p.:
⎪
⎨⎧ ≤ ≤
kX para X
fX ,02
()
para outros valores de X
=
0, .
⎪
⎩
a) determine o valor de k; b) traçar o gráfico da f.d.p.;
c) calcular P(X ≤ 1); d) calcular P(X ≥ 1); e) calcular P(X ≤ 2).
-2 0 2 4 6
75
P(xi) 1/9 2/9 1/9 3/9 1/9 1/9 a) esta é realmente uma
distribuição de probabilidade. b) traçar o gráfico da distribuição de
probabilidade.
0, 0
para X fX <
⎪
⎪ ⎨⎧ 1
8. Seja X uma v.a.c. () = 2 X para X , 0 2 ≤ ≤
dada por:
⎪
⎪ ⎩
0, 2.
para X
>
Pede-se:
a) traçar o gráfico da f.d.p.
b)P(X ≥1)c) P(X ≤1)d) P(X ≥ 3)
11. Uma urna contém 5 bolas brancas e 7 bolas pretas. Três bolas são retiradas simultaneamente dessa
urna. Ganha-se R$ 200,00 por bola branca retirada e perde-se R$ 100,00 por bola preta retirada, qual seria
o lucro esperado? (Obs. Faça a V.A. X o lucro esperado por rodada).
76
fX() =
0, .
⎪ ⎪
⎨⎧ ≤ ≤ ⎩
2
Determine:
3,01 para outros valores de X
X para X
15. Se X e Y são duas V. A. tal que, E(X2) = 6, E(Y) = 2, E(X) = 2, E(Y2) = 12, E(X.Y) =
5. Calcule:
a) V(X) e desvio-padrão de X.
b) V(Y) e desvio-padrão de Y.
c) Covariância entre X e Y.
d) V(X + Y)
e) V(X – Y)
f) Correlação entre X e Y.
Y
X -1 1 2
-2 0,1 0,1 0,2
0 0,1 0,2 0,1
3 0,1 0,1 0,0
a) X e Y são variáveis aleatórias independentes? Mostre porque.
b) Calcule a variância de X e de Y.
c) Qual a covariância entre X e Y.
d) Qual a correlação entre X e Y.
e) V(7X); V(X+Y); V(X-Y); V(Y+5); V(2X-Y)
20. Seja (X,Y) uma variável aleatória bidimensional discreta, com a função de probabilidade.
2
,,,,,
xy
+
⎪ ⎧
⎨ ==
ij
para x e y
() 012 012 3
P x yi j
, Pede-se: 42
ij
= Caso contrário
⎪
0 ⎩
78
Respostas
2. a) S = {2,3,4,5,6,7,8,9,10,11,12}
b) Y 2 3 4 5 6 7 8 9 10 11 12 P(Y) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 c) S =
{1,2,3,4,5,6}
d) Z 1 2 3 4 5 6 P(Z) 1/36 3/36 5/36 7/36 9/36 11/36
9. b) 5/16 c) 11/16 d) 0
11. X 600 300 0 -300 E(X) = 75,00 P(X) 2/44 14/44 21/44 7/44
12. a) 2/3 b) 1 c) 1/ 2d) –7/3
13. a) 4/3 b) 2/9 c) 2/9 d) 2 e) –4/3 e 8/9 14. a) 3/4 b) 3/80 c) 3/80 d) 75/80 e) –15/2 e
c) 1 d) 12 e) 8 f)
3/20 15. a) 2 e 2b) 8 e 8 41
20.
0 1 2 3 P(X)
0 0,000 0,024 0,048 0,071 0,143
1 0,048 0,071 0,095 0,119 0,333
2 0,095 0,119 0,143 0,167 0,524
P(Y) 0,143 0,214 0,286 0,357 1,000
21.
-2 0 1 P(X)
-3 0,067 0,267 0,067 0,400
-2 0,067 0,133 0,033 0,233
-1 0,100 0,067 0,200 0,367
P(Y) 0,233 0,467 0,300 1,000