Apost Geral 2020

Universidade Estadual do Sudoeste da Bahia - UESB
Departamento de Ciências Exatas e Naturais - DCEN

Campus Juvino Oliveira, Itapetinga – BA
ESTATÍSTICA GERAL
Paulo Bonomo
Professor Pleno da UESB
Universidade Estadual do Sudoeste da Bahia

Itapetinga – Bahia
2020
1
Apresentação
Podemos considerar a Estatística como a ciência que se preocupa com a organização, descrição,
análise e interpretação dos dados experimentais. Ouvimos muito falar em estatísticas da loteria esportiva,
estatística da saúde pública, estatística do crescimento da população etc. Esta noção prende-se apenas à
parte de organização e descrição dos dados observados. Um outro campo da ciência Estatística refere-se a
análise e interpretação desses dados, caracterizando a inferência estatística. É razoável também que, para
poder-se fazer a inferência a respeito dos dados observados, deva-se primeiramente proceder a sua
organização e descrição dos mesmos.
Esta apostila é direcionada aos estudantes de graduação que estão cursando a disciplina
estatística geral. Nesta apostila são abordados os tópicos: estatística descritiva, introdução a teoria das
probabilidades, variáveis aleatórias, distribuições de probabilidade de variáveis aleatórias e introdução a
teste de hipótese. A compreensão desses tópicos permitirá ao aluno ter um suporte teórico para o
entendimento da estatística experimental, sendo esta de fundamental importância para um bom
acompanhamento das demais disciplinas dos cursos de graduação.
O presente material foi elaborado com o objetivo de dar suporte didático ao curso Estatística
Geral. No entanto não substitui a pesquisa em reconhecidos livros editados por autores nacionais e
internacionais.
Sumário
Capítulo Página
Cap. 1 - Estatística descritiva ....................................................................................... 03 Cap. 2 -

Introdução a teoria das probabilidades ............................................................ 35 Cap. 3 - Variáveis
aleatórias ........................................................................................ 59 Cap. 4 - Distribuições de
probabilidade de V. A. e intervalo de confiança ..................... 81 Cap. 5 - Bibliografia
consultada .................................................................................. 97 Cap. 6 - Tabela da distribuição
normal padronizada ........................................................... 98
2
Cap 1. Estatística descritiva
1.1.Introdução
A estatística dedica-se ao desenvolvimento e ao uso de métodos para a coleta e análise de dados,
isto é, a interpretação substantiva e a construção de inferências neles baseados. No entanto a palavra
estatística lembra, à maioria das pessoas, recenseamentos. Os censos existem a milhares de anos e
constituem um grande esforço dos governos com o objetivo de conhecer seus habitantes, sua condição
sócio econômica, sua cultura, sua religião etc. Portanto, associar estatística a censo é perfeitamente
correto do ponto de vista histórico. É interessante salientar que as palavras estatística e estado tem a
mesma origem latina: status.
Hoje, alguma familiaridade com os princípios básicos da estatística deve fazer parte da educação de
todo ser humano. Afinal, é difícil ser um cidadão informado sem uma compreensão dos vários índices
governamentais, dos gráficos e tabelas publicados diariamente na imprensa e nas pesquisas de opinião
pública. Na realidade, entretanto, como veremos no decorrer da disciplina estatística geral e experimental
a estatística engloba muitos outros aspectos, sendo fundamental na análise de dados provenientes de
quaisquer processos em que exista variabilidade. Por exemplo, quando testamos novos produtos, técnicas
de produção etc.
Para fins de apresentação, é usual dividir-se a estatística em três grandes áreas, embora não se trate
de ramos isolados: os mecanismos de coleta de dados, amostragem e planejamento de experimentos; a
estatística descritiva, que se ocupa da organização, apresentação e sintetização dos dados; a estatística
inferencial, que é o conjunto de métodos para a tomada de decisões, nas situações em que existem
incerteza e variação.
1.2.Coleta de dados
A coleta de dados é a fase inicial de muitos estudos tecnológicos, sociais, econômicos ou
biológicos. Constitui-se no processo de escolha das unidades de análise que serão consideradas no estudo
(ex.: as pessoas que serão entrevistadas, os clientes que serão entrevistados, as plantas que serão
monitoradas, as peças que serão medidas, os pacientes que serão acompanhados), na determinação das
características de cada unidade experimental que serão medidas e da logística de trabalho de campo.
Conforme as necessidades de cada estudo, os dados necessários são coletados através dos métodos de
amostragem ou dos métodos de planejamentos de experimentos adequado para o estudo.
1.2.1. Amostragem
Em estatística, define-se como população a coleção de todas as observações potenciais sobre determinado
fenômeno. O conjunto de dados efetivamente observados, ou extraídos, constitui uma amostra da
população. É sobre os dados da amostra que se desenvolvem os estudos, visando a produção da inferência
em relação a população. Para se chegar a amostra, em cada situação constrói-se um plano amostral.
Nesse caso, o pesquisador não submete determinadas unidades experimentais aos tratamentos
desejados. Mas executa um levantamento de dados dentro de um universo disponível e verifica a
ocorrência de determinada resposta. Ou como essa resposta está associada a outras do mesmo universo.
Determinação de consumo de óleo diesel em ônibus: Com o objetivo de determinar o consumo de óleo
diesel (quilômetros por litro) dos ônibus de Belo Horizonte, toma-se um grupo de 100 ônibus das diversas
empresas que atuam em BH e mede-se o consumo médio por quilômetro. Para tanto deve-se avaliar uma
quantidade de ônibus de cada empresa proporcional ao número total de ônibus daquela empresa.
Avaliação de um sistema de ensino: Primeiro é necessário elaborar um questionário adequado para avaliar
com precisão o sistema de ensino. Também são de difícil determinação os locais onde serão aplicados os
questionários.
Hábitos migratórios de animais: Toma-se um grupo de animais, coloca-se em cada um deles uma etiqueta,
observando-se posteriormente em outras localidades. A amostra aqui é o conjunto de animais etiquetados.
Pela observação da amostra, deduziremos com certa margem de erro, o comportamento da espécie quanto
as características em estudo.
Pesquisas sobre tendências de votação: Em época de eleição, é comum a realização de pesquisas
eleitorais para verificar a tendência dos eleitores. Para que os resultados sejam de fato satisfatórios, toma-
se o cuidado
3
de entrevistar um número de pessoas com características socioeconômicas, culturais, religiosas etc. tão
próxima quanto possível da população à qual os resultados da pesquisa serão estendidos.
1.2.2. Planejamento de experimentos
Em muitas Em muitas situações, o problema de interesse é descobrir como uma variável resposta se
relaciona com os vários fatores explicativos. Por exemplo, como a produtividade de uma planta, medida
pela qualidade de seus frutos, relaciona-se com a qualidade do solo, a quantidade e o tipo de fertilizante
usado, o volume de irrigação disponível. Para se estudar a relação entre variável resposta e variável
explicativa, é preciso coletar dados. Para isso as técnicas agregadas, sob o nome de planejamento de
experimentos são essenciais. Com sua ajuda, determina-se em quais valores das variáveis explicativas as
medidas serão feitas.
Experimentos agrícolas: Os planejamentos estatísticos surgiram para solucionar problemas específicos da
experimentação agrícola. Por exemplo, como testar diferentes cultivares numa determinada área agrícola
sendo que todas as cultivares estejam na mesma condição.
Experimentos clínicos: Um medicamento só é liberado depois de ter sido submetido a um ensaio clínico.
Aqui, a primeira preocupação é o tratamento ético dos pacientes. Depois, é preciso garantir, através da
alocação aleatória, que os grupos que receberam o medicamento padrão e o novo medicamento tenham as
mesmas características. Ou seja, só se distinguem pelo tipo de medicamento tomado.
Experimentos industriais: Em várias indústrias, principalmente na indústria química, os fatores de
operação de um determinado processo de produção são estabelecidos depois de cuidadosa busca de
condições ótimas. Isso é feito através do uso intensivo de técnicas estatísticas de planejamento de
experimentos desenvolvidas para esse fim. Usam de forma intensiva os experimentos fatoriais.
As técnicas de planejamento e análise de dados oriundos desses experimentos serão discutidos
durante s disciplina estatística geral e com maior aprofundamento nas disciplinas estatística experimental,
estatística aplicada e planejamento e análise de experimentos.
1.3. Estatística descritiva
Trata-se da parte mais conhecida da estatística. Quem vê os noticiários, na televisão ou nos jornais
sabe quão frequente é o uso de médias, índices e gráficos na descrição de um fato social ou econômico.
No entanto, a utilidade da estatística descritiva é muito mais geral. Na realidade nunca devemos realizar
análise estatística em modelos sofisticados sem uma prévia descrição dos dados.
O INPC, Índice Nacional de Preços ao Consumidor, construído pelo IBGE. Importante índice da nossa
economia, inclusive serve de base para reajuste salarial. Sua construção envolve a sintetização, em um
único número, dos aumentos de preços dos produtos da cesta básica. Seu processo de cálculo é um
sucessivo cálculo de médias.
Anuário Estatístico Brasileiro. O IBGE publica esse anuário todo ano, apresentando em várias tabelas os
mais diversos dados sobre o Brasil. Exemplos: educação, saúde, transporte, economia, culturas etc.
embora simples e fáceis de serem entendidas, as tabelas são frutos de um processo demorado e
extremamente dispendioso de coleta e apuração de dados.
1.4. Inferência estatística

A tomada de decisões sobre uma população com base nos estudos feito a partir de uma amostra
constitui o problema central da inferência estatística. A tais decisões estão sempre associadas a um grau de
4
incerteza e, consequentemente, uma probabilidade de erro. A generalização das conclusões tomadas a
partir da amostra para a população é feita com o auxílio de um modelo estatístico para a situação em
estudo. O estudo de probabilidade é indispensável para a compreensão das análises realizadas quando se
trabalha com inferência estatística, pois a tomada de decisão está associada a probabilidade de erro na
conclusão adotada.
Comparação: testes sobre medicamentos. Um experimento testa se um novo analgésico é melhor que o
produto padrão correspondente. Vinte pessoas são selecionadas, dez tomam o novo medicamento e dez
tomam o padrão. O experimento deve ser do tipo duplo cego, ou seja, nem o médico nem o paciente sabre
qual medicamento está usando. Sabendo-se que sete pessoas foram curadas usando o novo medicamento e
seis com o padrão, é lícito concluir que o novo é superior? Ou os dois medicamentos são similares e a
diferença ocorreu apenas por uma variação aleatória.
Pesquisas sobre tendências de votação: Voltando ao caso das eleições, é comum a realização de pesquisas
eleitorais para verificar a tendência dos eleitores. Quando os institutos de pesquisa informam a intenção de
voto em determinado candidato, esse valor refere-se ao observado com base em uma amostra, sendo então
uma estatística descritiva, pois descreveu o número obtido. Porém é comum ser informado a margem de
erro, essa margem de erro refere-se a inferência estatística.
1.5. Teoria da amostragem
O conhecimento de fatos que afetam a convivência sócio-econômica numa comunidade influi

sempre na tomada de decisão de um indivíduo em todos os aspectos de sua vida e de sua família. A
amostragem é naturalmente usada em nossa vida diária. Por exemplo, para verificar o tempero de um
alimento em preparação, podemos provar (observar) uma pequena porção. Estamos fazendo uma
amostragem, ou seja, extraindo do todo (população) uma parte (amostra), com o propósito de termos uma
idéia (inferirmos) sobre a qualidade quantidade do tempero que está sendo usado em todo o alimento.
Nas pesquisas científicas, em que se deseja conhecer algumas características (parâmetros) de uma
população, também podemos observar apenas uma amostra de seus elementos e, com base nos resultados
da amostra, obter valores aproximados, ou estimativas, para os parâmetros de interesse. Esse tipo de
pesquisa é usualmente chamado de levantamento por amostragem. Contudo, a seleção dos elementos que
serão efetivamente observados, deve ser feita sob uma metodologia adequada, de tal forma que os
resultados da amostra sejam suficientemente informativos para se inferir sobre os parâmetros
populacionais.
Quando realizar uma amostragem e não um censo: a) Em geral, torna-se bem mais econômico o
levantamento de somente uma parte da população; b) Economia de tempo, numa pesquisa eleitoral, a três
dias de uma eleição presidencial, não haveria tempo suficiente para pesquisar toda a população de
eleitores do país, mesmo que houvesse recursos financeiros em abundância; c) Quando se pesquisa um
número reduzido de elementos, pode-se dar mais atenção aos casos individuais, evitando erros nas
respostas; d) É mais fácil realizar operações de pequena escala. Um dos problemas típicos nos grandes
censos (pesquisa de toda a população) é o controle dos entrevistadores.
Quando o uso da amostragem não é interessante: a) População pequena. Imagine que se queira
saber a percentagem de mulheres numa sala de aula com dez alunos, antes de se conhecer a turma; b)
Característica de fácil mensuração. Talvez a população não seja tão pequena, mas a variável que se quer
observar é de tão fácil mensuração que não compensa em investir em um plano de amostragem; c)
Necessidade de alta precisão. A cada dez anos o IBGE realiza um censo demográfico para estudar
diversas características da população brasileira. Dentre essas características, tem-se o número de
habitantes residentes no país. É um parâmetro que precisa ser avaliado com grande precisão; por isso, se
pesquisa toda população.
Quando se planeja cientificamente um levantamento por amostragem, usualmente se leva em
conta que todas as amostras possíveis da população têm probabilidade diferente de zero de serem
selecionadas. Neste caso a escolha da amostra é feita por processo aleatório, o que permite a aplicação da
teoria envolvida nas distribuições probabilísticas da Estatística. Entretanto, ocorrem situações em que
restrições práticas impedem que a seleção da amostra seja totalmente aleatória.
5
1.5.1. Amostragem probabilística
Os principais tipos são:

a) Amostra aleatória simples. É obtida quando todos os elementos da população têm a mesma
probabilidade, diferente de zero, de pertencer à amostra. É recomendado para estudo de populações
homogêneas.
b) Amostra aleatória estratificada. Quando a população for heterogênea não se deve usar a amostra
aleatória simples devido a baixa precisão das estimativas obtidas. Nessa situação, deve-se subdividir a
população em subpopulações de forma que dentro das subpopulações haja homogeneidade. Esse processo
chama-se estratificação da população, sendo cada subpopulação um estrato.
c) Amostra aleatória sistemática. É uma variação da amostra aleatória simples. Sua aplicação exige que a
população esteja devidamente ordenada de tal forma que cada um de seus elementos possa ser unicamente
identificado pela sua localização ou por outro critério qualquer. Isto ocorre, por exemplo, quando todos os
elementos da população estão anotados numa listagem, quando um grupo de pessoas está colocado numa
fila, quando se considera o conjunto das fichas de inscrição referentes aos candidatos de um concurso,
numa linha de produção quando são amostrados determinado número de elementos de acordo que vão
sendo produzidos.
d) Amostra aleatória por conglomerado. Utilizada quando a população é muito dispersa, tornando
inviável a organização de um rol com todos os elementos. Neste caso, a população é dividida em
subpopulações ou conglomerados, sendo alguns destes sorteados para constituir a amostra. Normalmente
torna-se mais fácil organizar o rol completo de todos os elementos quando se trabalha dentro dos
conglomerados sorteados.
1.5.2. Amostragem não probabilística
Os principais tipos são:

a) Acessibilidade. A amostra atinge apenas parte acessível da população. Num vagão com minério, por
exemplo, a amostra pode ser feita em alguns casos, apenas nos 20 cm superiores, por dificuldade de se
atingir todos os pontos do vagão.
b) Amostra tomada a esmo. A amostra é constituída pelos elementos que se consegue tomar de uma
população. Num galpão com aves, por exemplo, a amostra pode ser constituída das aves que forem
tomadas no instante da coleta dos dados, sem entretanto ter havido um sorteio prévio.
c) Amostra intencional. O pesquisador escolhe a seu juízo os elementos da população que julga
representativos, para constituírem a sua amostra, mas sem fazer sorteio.
d) Amostra de voluntários. Casos onde o processo de obtenção dos dados é desagradável. Como por
exemplo, tem se a amostra envolvida num estudo com doadores de sangue.
1.5.3. O questionário e a entrevista
Em ciências sociais, como a psicologia, é possível a obtenção de dados apenas com a observação
das pessoas. Neste caso, os resultados apresentam um alto grau de precisão. Na maioria das situações,
entretanto, os dados dos levantamentos são obtidos através de perguntas respondidas com o preenchimento
de questionários ou em entrevistas.
6
Os dados são informados por relatos verbais do entrevistado e os resultados devem ser tomados com
muito cuidado. O relato de um fato que coloca uma pessoa em posição desfavorável deve ser tomado com
reserva. Da mesma forma se a informação solicitada servir para que a pessoa mostre alguma simpatia ou
prestígio o entrevistador deve ter senso crítico e anotar o dado com ressalva.
Apesar das limitações, o procedimento de perguntas proporciona informações que, se obtidas de
outras formas, seriam muito mais falhas. O questionário é um dos instrumentos mais usados em pesquisas
sócio-econômicas. As limitações do método de perguntas devem ser consideradas pelo pesquisador para
ter o máximo de cuidado e rigor no momento da aplicação.
O questionário e a entrevista são técnicas semelhantes que se baseiam em perguntas formuladas ao
entrevistado. No questionário, as perguntas propostas pelo pesquisador são respondidas por escrito pelo
pesquisado, enquanto que na entrevista as respostas do entrevistado são anotadas pelos entrevistados.
O questionário pode ser enviado pelo correio, nesse caso é mais barata e garante o anonimato do
entrevistado, uma vez que este não precisa identificar-se. Entretanto, esta técnica exige que o entrevistado
saiba ler e escrever e esteja motivado a responder e devolver. Aplicado em grupo, permite rapidez na
aplicação, pois após os esclarecimentos são preenchidos e recolhidos imediatamente, proporcionando
maior garantia de retorno. Formulários individuais, são questionários cujas respostas são preenchidas
pelo próprio pesquisador. Podem ser aplicados a analfabetos e as pessoas com dificuldades de expressar
por escrito. Úteis na obtenção de informações sobre temas simples, mas não apresentam desempenho
satisfatório quando se pretende obter respostas à questões com maior profundidade.
A entrevista pode ser face a face, é a mais flexível de todas, pois permite ajustar-se aos mais
diversos tipos de problemas e de informantes. Permitem obter respostas em profundidade, complexas,
detalhadas, ligadas a intimidade do entrevistado, desde que o pesquisador tenha habilidade e treinamento
adequados. No entanto, está sujeita a deformações provocadas pelo pesquisador se este não tiver cuidado
na condução da entrevista, como influenciar com suas idéias o resultado da pesquisa. Por telefone, é
bastante adotada em pesquisa de opinião e de mercado, sendo rápida, econômica e garantindo altas taxas
de resposta. A desvantagem desta técnica é que nem sempre a amostra obtida é representativa da
população, uma vez quem nem todas as famílias das classes sociais mais baixas possuem telefone. Pela
internet, tem sido usada recentemente e apresenta as mesmas limitações da pesquisa por telefone.
O questionário deve traduzir os objetivos da pesquisa em itens bem redigidos. Para tanto é
importante que os objetivos tenham sido bem definidos. As perguntas devem ter conteúdos adequados
para obtenção dos dados do entrevistado, podendo ser feitas de forma aberta ou fechada. Em estudos
iniciais ou exploratórios podem ser usadas perguntas abertas, onde o entrevistado responde com suas
próprias palavras sem qualquer restrição. O número de perguntas de um questionário não deve ser
superior a trinta. A ordem das perguntas é importante devendo-se evitar mudança brusca de tema sem
antes fornecer as explicações necessárias. De maneira nenhuma a pergunta deve sugerir a resposta.
O questionário inicialmente deve ser submetido a um pré teste para evitar possíveis falhas tais
como: complexidade das perguntas, imprecisão da redação, questões desnecessárias, cansaço e
constrangimento do entrevistado.
O pesquisador deve ser cuidadoso e habilidoso na realização da entrevista. Recomenda-se uma
conversa inicial, de forma amistosa, sobre qualquer tema que possa interessar ao entrevistado procurando
obter a sua confiança. Em seguida são feitos esclarecimentos sobre a finalidade da pesquisa. Um ambiente
de diálogo, cordialidade e simpatia é recomendado.
1.6. Variáveis
A descrição de uma população é feita através de suas características, as de maior interesse por parte
do pesquisador. Por exemplo, o conjunto de híbridos de milho disponível no mercado define uma
população, a qual é descrita por características de interesse econômico, como produtividade, resistência a
doenças, ciclo cultural, arquitetura da planta etc.
7
As características que descrevem a população são chamadas variáveis, e um valor observado com
relação a uma variável é chamado dado ou observação. As variáveis são classificadas quanto à natureza
qualitativas e quantitativas.
As variáveis qualitativas correspondem a atributos, categorias. Elas são nominais quando não são
passíveis de ordenação, como por exemplo a cultura predominante em propriedades de uma região.
Quando os atributos são passíveis de ordenação, a variável qualitativa é dita ordinal; por exemplo, é o
caso quando se usa notas para avaliar uma característica. Em pesquisas eleitorais, é comum classificar os
entrevistados quanto ao nível de escolaridade (nenhum, fundamental, médio e superior), que é uma
variável qualitativa ordinal.
Quanto às variáveis quantitativas, correspondem a números resultantes de contagem ou medidas.
Quando se trata de contagens, como o número de peças defeituosas em amostras de um lote, a variável é
dita discreta, sendo passível a separação em classes distintas (não existe um valor intermediário entre 2 e 3
peças defeituosas, por exemplo). Outros exemplos são: número de folhas por planta atacadas por certa
praga, número de alunos que foram reprovados em determinada disciplina etc.
Nas variáveis quantitativas contínuas, as realizações resultam de uma medida, uma mensuração,
como o diâmetro de eixos fabricados ou o tempo de durabilidade de componentes eletrônicos, não
havendo assim classes distintas, mas um intervalo de números reais possíveis.
1.7. Organização e apresentação de dados: tabelas e gráficos
1.7.1. Tabelas
A apresentação de dados na forma de tabela é um dos métodos estatísticos mais utilizados. Uma
tabela consegue expor os resultados de determinada pesquisa sinteticamente, na qual se tem uma visão
mais clara e fácil dos resultados obtidos. Os dados devem ser apresentados em tabelas construídas de
acordo com as normas técnicas ditadas pela fundação Inst. Bras. de Geog. e Est. (Fundação IBGE).
a) Componentes das tabelas

A tabela tem título, corpo, cabeçalho e coluna indicadora. O título explica o que a tabela contém. O
corpo é formado pelas linhas e colunas de dados. O cabeçalho especifica o conteúdo das linhas. Toda
tabela deve ser delimitada por traços horizontais. Podem ser feitos traços verticais para separar as colunas,
mas não devem ser feitos traços verticais para delimitar a tabela. O cabeçalho é separado do corpo por um
traço horizontal.
As tabelas podem conter fonte, notas e chamadas. A fonte dá indicação de entidade, ou do
pesquisador que publicou ou forneceu os dados. As notas devem esclarecer aspectos relevantes do
levantamento dos dados. As chamadas dão esclarecimentos sobre os dados. Devem ser feitas através de
algarismos arábicos escritos entre parênteses e colocados a direita da coluna.
Tabela 1 - Animais abatidos no Brasil, primeiro trimestre de 2009
Animais Número de cabeças abatidas (mil)
Bovino 6.446
Suínos 7.332
Frangos 1.121.768
Fonte: IBGE (2009)
b) Tabelas de contingência
Muitas vezes os elementos da amostra são classificados de acordo com dois fatores. Os dados
devem então ser apresentados em tabelas de contingência, isto é, tabelas de dupla entrada, cada entrada
relativa a um dos fatores.
8
Tabela 2 – Índice pluviométrico registrado em Itapetinga no período de 1996 a 2005
Ano Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Total 1996 27,8 19,0 61,0 0,0 0,0 17,0 10,0 20,5 38,0 180,0 145,5 15,0
533,8 1997 57,5 165,9 445,5 82,3 14,2 20,5 35,0 13,9 6,5 75,0 61,8 53,0 1.031,1 1998 53,0 40,0 48,3 11,1 45,5 7,5 45,0 28,0 35,5
81,5 315,8 183,5 894,7 1999 37,1 49,6 82,1 51,2 111,5 30,5 101,9 67,2 13,3 66,3 449,6 283,7 1.344,0 2000 125,6 164,0 158,3
184,9 18,3 26,1 104,9 22,9 55,3 16,3 106,0 232,7 1.215,3 2001 10,5 30,0 72,5 36,5 46,7 41,7 39,8 89,4 13,3 127,7 0,0 56,7 564,8
2002 358,7 169,0 94,6 37,6 36,5 57,8 49,5 38,2 46,6 0,0 55,0 144,6 1.088,1 2003 15,0 55,3 45,5 86,9 70,0 0,1 67,2 37,1 33,9 40,0
30,5 46,0 527,5 2004 118,1 113,5 275,1 33,9 22,5 15,0 47,8 0,0 0,0 18,0 220,3 17,0 881,2 2005 121,4 139,4 35,2 95,1 225,6 75,7
37,1 24,9 19,0 0,0 152,7 105,6 1.031,6 Média 92,5 94,6 131,8 62,0 59,1 29,2 53,8 34,2 26,1 60,5 153,7 113,8 911,2 Fonte:
Uesb (2009).
c) Tabelas de distribuição de frequências

As tabelas com grande número de dados são cansativas e não dão ao leitor uma visão rápida e
global do fenômeno. Quando existe uma grande quantidade de observações é preciso que os dados estejam
organizados em uma tabela de distribuição de frequencias.
Elementos de uma distribuição de frequências

1. Dados brutos são os dados coletados, que ainda não foram numericamente
organizados. 2. Rol são os dados brutos organizados em ordem crescente ou decrescente.
3. Amplitude total dos dados (A) é a diferença entre o maior e o menor elemento do
rol. 4. Classe são os intervalos de variação da variável.
5. Limites de classe são os valores extremos de uma classe. O maior valor é o limite superior e o menor é
o denominado limite inferior da classe.
6. Amplitude de uma classe (a) é a diferença entre os limites superior e inferior da
classe. 7. Ponto médio da classe é a média aritmética dos limites da classe.
8. Frequência absoluta (f) é o número de repetições de um valor ou de uma classe de
valores. 9. Frequência relativa (fr) representa a proporção de observações de um valor ou
classe. 10. Frequência acumulada (fa) é obtida somando-se cada frequência com a anterior.
11. Frequência acumulada relativa (far) é obtida somando-se cada proporção com a anterior.
c.1. Tabela de distribuição de frequência para variável aleatória discreta

Quando a amostra é grande, mas o número de observações distintas é pequeno. Para se construir
uma distribuição de frequências, basta dispor os dados em duas colunas, uma para os valores observados
e outra para as frequências correspondentes a cada valor.
Ex: Considere uma amostra com 40 dados referentes a notas de no concurso de viola, 2012:
9
5555555566666667777777777888888888999999
Tabela 3 – Notas de 40 alunos no concurso de moda de viola, 2012
Notas f fr (%) fa far (%)
5 8 20,0 8 20,0
6 7 17,5 15 37,5
7 10 25,0 25 62,5
8 9 22,5 34 85,0
9 6 15,0 40 100,0
Total 40 100,0
c.2. Tabela de distribuição de frequência para variável aleatória contínua

Quando trata-se de uma variável aleatória discreta tendo um tamanho da amostra grande, ou é uma
variável aleatória contínua. Um método para construção de uma distribuição de frequências para dados
agrupados em classes.
Obs.: Qualquer regra para determinação do número de classes da tabela não nos leva a uma decisão final;
esta vai depender de um julgamento pessoal que ligado à natureza dos dados e objetivo do trabalho.
Exemplo: Diâmetro de 50 plantas de eucalipto com 5 anos, no município de Ribeirão
12,4 13,1 13,4 13,7 14,0 14,0 15,3 15,4 15,6 15,7 16,2 16,6 16,9 16,9 17,2 17,8 17,8 18,2 18,8 18,8 18,8 18,8
19,1 19,4 19,7 19,7 19,7 19,7 20,1 20,1 20,1 20,4 20,4 20,4 20,7 20,7 20,7 21,0 21,3 21,3 21,3 21,7 21,7 21,7
22,0 22,3 22,6 22,9 23,6 23,8
1) Amplitude amostral A = 23,8 −12,4 =11,4k = 50 = 7,07 ≅ 7

2) Número de classes Porém utilizaremos 6 classes.
a A 11,4
===≅
1,9 2
3) Amplitude de cada classe Amplitude de classe 2.
k 6
Tabela 4 – Diâmetro de 50 plantas de eucalipto com 5 anos, no município de Ribeirão Notas PM f

fr (%) fa far (%)
13,0 15,0 17,0
12,0 I— 14,0 4 8,0 4 8,0 14,0 I— 16,0 6 12,0 10 20,0 16,0 I— 18,0 7 14,0 17
19,0 21,0 23,0
34,0 18,0 I— 20,0 11 22,0 28 56,0 20,0 I— 22,0 16 32,0 44 88,0 22,0 I— I 24,0 6
12,0 50 100,0
Obs.: O traço (I—) indica intervalo fechado à esquerda e aberto à direita, isto é, o limite inferior faz parte
dos valores do intervalo, enquanto o limite superior está fora, entrando no próximo intervalo. Pode ser
utilizado também (—I) ou (I—I).
1.7.2. Gráficos
A representação gráfica tem por finalidade representar os resultados obtidos, permitindo chegar a
conclusões sobre a evolução do fenômeno ou sobre como se relacionam os valores da série. Não há uma
única maneira de representar graficamente uma série estatística. A escolha do gráfico mais apropriado
ficará
10
a critério de cada pesquisador. Contudo os elementos simplicidade, clareza e veracidade devem ser
considerados.
a) Histograma
É uma representação gráfica dos resultados da distribuição de frequências construídas por colunas
justapostas, cujas alturas são representadas pelas frequências de cada classe e as larguras pelo valor da
amplitude de cada classe, ou representado pelo ponto médio.
b) Polígono de frequências
Os dados apresentados em tabela de distribuição de frequências também pode ser apresentado em
gráficos denominados polígonos de frequências. O polígono de frequências é caracterizado por uma linha
que une os pontos correspondentes aos pontos médios das bases superiores das colunas que compõem o
histograma. Também pode ser apresentada a frequência acumulada.
c) Gráfico de colunas
O gráfico de colunas é usado para apresentar variáveis qualitativas ou ordinais.
11
d) Gráfico de barras
O gráfico de barras também é usado para apresentar variáveis qualitativas ou ordinais. Porém, como
acontece nesse exemplo onde são longos os rótulos das colunas ajusta-se melhor.
e) Gráfico de setores
O gráfico de setores também pode ser usado para apresentar variáveis qualitativas ou ordinais.
Dentro da circunferência são representadas as categorias da variável em estudo.
Figura: Estado conjugal da população brasileira segundo o IBGE, censo demográfico de 2000.
1.8. Revisão de matemática

1.8.1. Somatório
12
Muitos processos estatísticos exigem o cálculo da soma. Para simplificar a representação da
de adição nas expressões algébricas, utiliza-se a notação
operação ∑, letra grega sigma maiúsculo.
a) As principais representações são:

n
=
1. 1 2 3 n
∑Xi =X + X + X +...+ X i 1 n
, soma simples.
X , soma de quadrados (SQ).

2. 2n 2 ∑ i = X + X + X +...+ X
i1= 2 21 22 23
⎜ ⎛
⎝ ∑=, quadrado da soma.
n
⎞
3.
( )2 Xi ⎟ = X + X + X +...+ X
i1n
⎠ 123n
=
4. 1 1 2 2 3 3 n n
, soma de produtos (SP).
∑XiYi =X Y + X Y + X Y +...+ X Y i 1
n m
5.
( ) ( ) 123n123m
X Y = X + X + X +...+ X ⋅ Y + Y + Y +...+ Y Lê-se
∑ i∑ ∑i 1
j =
i1
== Xicomo: somatório de X índice i, com i variando de 1 até n,
j1
em que:
n
, produto da soma.
✓ n é a ordem da última parcela ou limite superior (LS) do somatório.

✓ i = 1 é a ordem da primeira parcela da soma ou limite inferior (LI) do somatório. ✓ i é o
índice que está indexando a variável X (outras letras como j, l, k podem ser utilizadas).
Exemplo 1: Considere as variáveis de X e Y que representam, respectivamente, as notas de duas

disciplinas, português e inglês, para um grupo de cinco alunos.
X = {9, 5, 4, 7, 10} Y = {6, 7, 8, 5, 4}
2
5
⎜ ⎛
⎝ ∑=X Y 196
5 5
∑i X 35 ∑ ii
5 ⎞
5
= X 271 2 ∑ i = X 1.225 5
i1= i1 i1= j ==
i⎟ = ⎠
∑ i∑ = i1 j1
i1=
= X Y 1.050
b) Número de Termos (NT) ou parcelas do somatório O

número de termos de um somatório pode ser obtido por: NT =
(LS−LI)+1
Se o somatório está sujeito a r restrições basta
fazer: NT = (LS−LI)+1− r
Exemplo 2: Obter o número de termos para os seguintes somatórios:
6
3)
15
Xi⇒NT = (15−3)+1=13 ∑
1) = = i4=
∑i 1 2)
Xi⇒NT = (6−1)+1= 6 ∑i 3
16
Xi⇒NT = (16− 4)+1− 2 =11
i 5,8
≠
c) Propriedades de somatório
P.1) Somatório de uma constante: é igual ao número de termos multiplicado pela constante.
13
n i1
=
∑ =++++=⋅
k k k k ... k (NT) K
i1
=
10
2) [( ) ] i i
8
X
Exemplo 3: 1) 6 [(10 1) 1] 6 60 ∑ i = 8−3 +1 ⋅X = 6X j 3
=
=−+⋅=
∑
P.2) Somatório do produto de uma constante por uma variável: é igual ao produto da constante
multiplicado pelo somatório da variável.
n
= + + + + = + + + + =n
()
∑ ∑
kXi kX kX kX ... kX k X X X ... X k X
123n123nii1
==i1
10
=10
Exemplo 4: 1)
∑∑
6X 6 X
ii
i1
==
i1
P.3) Somatório de uma soma ou subtração de variáveis: é igual a soma ou subtração dos somatórios dessas
variáveis.
n
+ − = + −n
n n
()
∑ ∑ ∑ ∑ Xi Yi Z i X Y Z
i
i
i
i1
====
i1 i1
d) Somatório duplo i1
Considere a tabela a seguir, conhecida como tabela de dupla entrada:

i / j 1 2 ... K Totais de linhas K
1 X11 X12 ... X1K∑
X1j
j1
=
K
2 X21 X22 ... X2K∑

X2 j
j1
=
... ... ... ... ... ...

I XI1 XI2 ... XIK∑=Kj 1XIj
Totais de
... I
colunas∑= i 1Xi1 ∑= i 1Xi2 ∑= i 1XiKG Xij ⇒i =1, 2, ..., I; índice de
I I
linha.
j =1, 2, ..., K; índice de coluna.
=I
K
K
Total da i-ésima linha: Total da j-ésima coluna:
∑ Xij ∑=Ii 1Xij Total geral: ∑∑= = G Xij
i1
j1
j1
=
Exemplo 5: Utilizando a tabela abaixo, calcule:

i/j1234
11032
23254
34113
3 4 3 4 3
1 1 1 1 23
==
=+++= 4. =++= 1
1. X 1 3 4 8 ∑ i1 = 2. X 1 0 3 2 6 ∑ 1j =
3 15
∑
++= 3. X 29 ∑∑ ij = = 5
X
i1 j1 i1 j1 i1
i3 =
1.8.2. Proporção e porcentagem
14
Proporção: Um certo número de pessoas foi classificado em quatro categorias. Essas categorias são,
naturalmente, mutuamente exclusivas e exaustivas. Em outras palavras: uma pessoa só poderá estar
incluída em uma única categoria, e todas elas deverão estar classificadas.
N = N1+N2+N3+N4 = número total de pessoas consideradas
Neste caso, a proporção de pessoas pertencentes à primeira categoria é determinada mediante o
cálculo do seguinte quociente: N1N
Para as demais categorias, a determinação segue o mesmo procedimento.
Porcentagem: As porcentagens são obtidas a partir do cálculo das proporções, simplesmente
multiplicando-se o quociente por 100. A soma das proporções é igual a 1, e a soma das porcentagens é
sempre igual a 100, a menos que as categorias não sejam mutuamente exclusivas e exaustivas. As
porcentagens são mais usadas do que as proporções para reproduzir resultados. Normalmente, as
porcentagens são arredondadas até a primeira casa decimal, ajustando-se os últimos dígitos, de modo que
o total seja igual a 100.
1.8.3. Números significativos

Os algarismos significativos de um número são os dígitos diferentes de zero, contados a partir da
esquerda até o último dígito diferente de zero à direita, caso não haja vírgula decimal, ou até o último
dígito (zero ou não) caso haja vírgula decimal. Por exemplo, o número 2,67 tem três algarismos
significativos. Se expressarmos o número como 2,6700, entretanto, temos cinco algarismos significativos,
pois os zeros à direita dão maior exatidão para o número. Outros exemplos com 4 algarismos
significativos: 56,00; 0,2301; 00,00003256; 3256000. Zeros a esquerda não são números significativos.
Quando somamos ou subtraímos dois números levando em consideração os algarismos
significativos o resultado deve manter a precisão do operando de menor precisão.
34,65 + 0,1234 = 34,7734 = 34,77
Na multiplicação e divisão, considerando os algarismos significativos, o resultado deve ter o mesmo
número de algarismos significativos do operando com a menor quantidade de algarismos significativos.
1,2345 x 0,340 = 0,419
Obs.: Se várias operações são realizadas em sequência, é desejável manter todos os dígitos nos valores
intermediários e arredondar somente o valor final.
Descrição dos dados
15
Um conjunto de dados pode ser descrito por medidas de posição e medidas de dispersão.
Caracterizar um conjunto de dados apenas por medidas de posição pode ser inadequado e perigoso, pois,
conjuntos com medidas semelhantes de posição podem apresentar características muito diferentes. Por
isso, normalmente são apresentadas para a descrição de um conjunto de valores tanto medidas de posição
quanto medidas de dispersão, simultaneamente.
1.9. Medidas de posição ou medidas de tendência central

São medidas empregadas para resumir um conjunto de dados, apresentando um ou alguns valores
que sejam “representativos” do conjunto todo. Quando usamos um só valor, obtemos uma redução
drástica dos dados. São medidas de posição: média, moda e mediana.
1.9.1. Média aritmética (X)
É chamada medida de tendência central, pois representa os fenômenos pelos seus valores médios
em torno do qual tendem a se concentrar os dados.
Se X1, X2, ..., Xn são n valores distintos da variável X, então a média aritmética de X, que n
∑
denotaremos por Xé dada por: nX
X X ... X
+++
i
= , ou seja, é a soma de todos os valores que a X
12n n =
= i1
variável assume, dividido pelo número total de valores da mesma.
Média Aritmética Ponderada

Agora, se temos n observações da variável X associadas a frequências, então temos:
Xi X1 X2 X3 ... Xn fi f1 f2 f3 ... fn
n
∑
fX
1122
X +++ nn
f X f X ... f X =n =
=
ii
i 1
f f ... f
+++ ∑
12 i n
n f =
1
Obs.: Se quisermos saber a média aritmética ponderada para um determinado conjunto de dados, então
podemos considerar fi como sendo o peso para cada valor de X i. Para calcular a média quando temos uma
tabela e dados agrupados em classes, basta considerar como x i o ponto médio de cada classe.
Exemplo 1: Numa avaliação 80% dos alunos obtiveram nota 10 e 20% obtiveram nota 5. Determine a nota
média da turma.
Nota (Xi) Proporção (fi) fiXi
10 0,80 8
5 0,20 1
=x x
0,80 10 0,20 5
=
X 0,80 0,20 + 9,0
+
16
Exemplo 2: Um estudante obteve as seguintes notas nas provas parciais de estatística.
Provas (i) Pesos (fi) Notas (Xi)
1 1 20
2 1 70
3 2 50
4 4 90
=x x x x
1 20 1 70 2 50 4 90
==
X +++ 71,25
+++1124 550 8
Exemplo 3 – Diâmetro de 50 plantas de eucalipto com 5 anos, no município de Ribeirão.

Notas pm fi pmi
f
12,0 I— 14,0
13 4 52
14,0 I— 16,0
15 6 90
16,0 I— 18,0
17 7 119
18,0 I— 20,0
19 11 209
20,0 I— 22,0
21 16 336
22,0 I— I 24,0
23 6 138
Total
50 944
n
∑
f pm
ii
944
1
X === 18,88
i i
=
n
∑ 50
f
i 1
=
Propriedades da média aritmética

P1) Somando-se ou subtraindo-se uma constante a cada um dos valores da série X 1, X2, ..., Xn, a média
aritmética fica somada ou subtraída dessa constante.
n n n n
∑ +∑ ∑ ∑ ()
Xk Xk
i i
+ Xi nk
a) X k
i
= =+=+
=1 =1 =1 =1
i i i
n n n n
n
(X k)n
n n
−
∑ ∑ ∑ ∑ Xk
i i
− Xi nk
b) X k
i1
= =−=−
====
i1 i1
n n i1 n n
Exemplo: Seja 1.000.656, 1.000.601, 1.000.310, 1.000.550. Calcule a média aritmética.

Podemos observar que todos os valores são representados por 1.000.000 acrescida de uma outra
quantia. Assim, aplicando-se a P1, temos:
656 601 310 550
X 1.000.000 ⎟ =
=+ ⎜ ⎞⎠ 1.000.529,25
⎝⎛ + + + 4
assim não precisamos trabalhar com números excessivamente grandes.

17
P2) Multiplicando-se ou dividindo-se cada um dos valores da série X 1, X2, ..., Xn, por uma constante, a
média aritmética fica multiplicada ou dividida pela constante.
n
kXn
∑∑
X
Prova: a) Multiplicação ( )i kX⇒kX
i i
i1
==k
==i1
n
1n n
n
∑∑
1⇒X
⎜ ⎛ b) Divisão ⎟ k 1 1
⎝ Xi ⎠⎞ Xi Xi
i1
==
==i1
k
n k n k
P3) A soma algébrica dos desvios em relação a média aritmética é nula.

n
Prova:( ) 0
=
∑ −=
SD Xi X
i
Outras médias
=
1
Algumas vezes é interessante calcular médias de forma diferente para dados com características especiais.
Média geométrica:X G
Bastante empregadas para observações positivas referentes a crescimentos exponenciais (como
taxas de avanço de doenças, número de habitantes de regiões em colonização, crescimento de
produtividade e lucro em alguns negócios etc.). A média geométrica é a raiz n-ésima do produto das
observações.
n
f
fi
G12 Xn X = X .X ..... ou ∑
f
f
X GX X X
n 112
{10, 60, 360} 10 60 x x = = Aplicações da = =
i n
n
Ex: Considere os dados: 360 216.000 60 33

XG= média geométrica: . ..... 1 2
a) Média de relações: Se para uma determinada empresa, se deseja estabelecer uma relação do tipo Capital
Líquido/Dívida que seja independente da dívida ou do capital de diferentes empresas envolvidas, é
recomendável o uso da média geométrica.
Empresa Capital Líquido Dívida Cap. Liq./Dív.
A 2 500 1 000 2,5
B 1 000 2 000 0,5
X G= 2,5* 0,5 =1,1180
b) Média de taxas de variação: Ex: suponhamos que um indivíduo tenha aplicado um capital de R$ 500,00
durante 2007 em um ano de aplicação, essa importância chegou a R$ 650,00. Reaplicando essa última
quantia em 2008 no final de mais um ano seu montante situava-se em R$ 910,00. Qual a taxa média de
aumento de capital?
Período Taxa
2007 650/500 = 1,3
2008 910/650 = 1,4
X G= 1,3*1,4 = 1,3491
Média Harmônica X H
18
Para fenômenos que dependem fortemente do menor dos dados, em geral utiliza-se médias
harmônicas calculadas como o inverso da média dos inversos. O cálculo da ( ) XHaplica-se a variáveis
resultantes da relação entre duas outras, como no caso da velocidade média (km/h) e o custo médio por kg
de determinado produto. Um exemplo é o cálculo do tamanho efetivo de populações naturais submetidas a
processos de devastação ecológica (gargalos populacionais).
n n ∑
n
f
X ou = n f f ... f
X
+++
= i
=n
H 12n =
1 1 1 1 = i1
H
+ + + ... f +++ f ∑ f
∑ f
1 n
X X X X 2
... i
i1 X1 X2 Xn X
12n i=
i1
i=
Exemplo 1: O número de hipopótamos de uma região ao longo de quatro gerações foi de (2.000, 20, 250,
1.500), a média harmônica é dada por:
X H= 1 1 4 72,51
≅
2000 1 250
1 20 1500
+++
Pode-se notar que, enquanto a média geométrica favorece os maiores números, a média
harmônica favorece os números menores.
Exemplo 2: Calcule a média aritmética, geométrica e a harmônica.
X = {2,2,2}
Conjunto Média aritmética Média geométrica Média harmônica 2,00 2,00
Y = {14, 18, 20} W = {8, 12} Z = {2, 50, 70}
2,00 17,33 17,15 16,95 10,00 9,80 9,60 40,67
K = {200, 20, 800}
19,13 5,61 334,00 68,40 5,93
1.9.2. Mediana (MD)
A mediana é preferível à média quando existem valores discrepantes na amostra de dados. Se a
amostra é simétrica, então a mediana será igual ou próxima ao valor da média. Colocados os valores em
ordem crescente de grandeza, mediana é o elemento que ocupa a posição central, ou seja, existem números
iguais de elementos antes e depois da mediana. Ou ainda, é o valor abaixo e acima do qual se tem a
metade dos dados.
Observações:
a) Quando o número de elementos da série estatística for ímpar, haverá coincidência da mediana com um
dos elementos da série.
b) Quando o número de elementos da série for par, nunca haverá coincidência da mediana com um dos
elementos da série. A mediana será sempre a média aritmética dos dois elementos centrais da série. c) Em
uma série a mediana, a média e a moda não tem, necessariamente, o mesmo valor. d) A mediana depende
da posição e não dos valores dos elementos na série ordenada. Essa é uma das diferenças marcantes entre
mediana e média. A média é muito influenciada pelos valores extremos de uma série.
Ex1: Em {5, 7, 10, 13, 15} a média é 10 e a mediana é 10. Em {5, 7, 10, 13, 65} a média é 20 e a mediana
é 10. Isto é, a média do segundo conjunto de valores é maior do que a do primeiro, por influencia dos
valores extremos, ao passo que a mediana permanece a mesma.
Ex1: Em {5, 7, 10, 13, 15, 18} mediana é 11,5.
1.9.3. Moda (Mo)
19
Em algumas situações, a distribuição das observações é tal que as frequências são maiores nos
extremos. Nesses casos, a utilização apenas da média e da mediana é contraindicada, pois são valores
pouco representativos do conjunto e o uso da moda poderá, então, ser considerada. A moda de um
conjunto de observações é o valor de maior ocorrência dentro do conjunto.
Com relação a moda, uma série de dados pode ser classificada em: Amodal: não possui moda;
Unimodal: possui apenas uma moda; Bimodal: possui duas modas; Multimodal: possui mais de duas
modas.
A moda é utilizada quando desejamos obter uma medida rápida e aproximada de posição ou quando
a medida de posição deva ser o valor mais típico da distribuição. Já a média aritmética é a medida de
posição que possui a maior estabilidade.
Calcule a Mediana e a Moda das variáveis X e Y.
a) X = { 2, 3, 1, 2, 3, 2, 4} n = 7Mo = 2 - Unimodal
} 2M
Valores ordenados X'= { 1, 2, 2, 2, 3, 3, 4 d = X4 =
b) Y = { 8, 10, 5, 5, 15, 15} n = 6Mo = 5 e 15 - Bimodal
Y'={ 5, 5, 8, 10, 15, 15} 9

XX
= Md
+ = 8 10 +
=
34
2 2
Utilização da média aritmética, da mediana e da moda
20
Média Aritmética
A medida de tendência central mais utilizada é a média aritmética, que representa em relação a mediana e
a moda vantagens apreciáveis, tais como:
a) É facilmente calculável.
b) É a que melhor se presta a análises estatísticas.
c) Depende de todos os valores da série.
d) É uma medida de tendência central particularmente estável, variando o menos possível de amostra para
amostra extraídas da mesma população.
e) Pode ser tratada algebricamente.
Existem,
todavia, casos em que a informação fornecida pela mediana ou pela moda, parece ser mais comp leta do
que a fornecida pela média aritmética.
Mediana
Esta medida de tendência central deverá ser utilizada quando:
a) Se deseja conhecer o ponto médio exato da distribuição.
b) Existem resultados extremos que afetariam grandemente a média. Importa salientar que a mediana não
é influenciada pelos resultados extremos.
Exemplo: na série 10,13,15,16,18,19,21, tanto a média como a mediana são 16; se substituirmos 2 1 por
50 e os restantes resultados permanecerem os mesmos, a mediana é 16 e a média será de 20,1;
c) A distribuição é truncada, isto é, incompleta nas extremidades. Exemplo: desejamos medir os tempos
de reação em Psicologia e as várias respostas ultrapassam as capacidades de medida do aparelho; assim,
impossibilitados de calcular a média, já que não di spomos de todos os valores da variável, sendo, no
entanto, possível calcular o valor da mediana, já que conhecemos o número de medidas efetuadas.
Moda
Esta medida de tendência central deverá utilizar‐se quando:
a) Uma medida rápida e aproximada da tendência central for suficiente.
b) Se deseja conhecer o valor mais típico de uma distribuição. Exemplo: descrever o estilo de vestido
usado pela mulher média, salário preponderante em deter minada empresa.
É de salientar que, apesar das vantagens apresentadas para a moda, esta tem a desvantagem de s er de
determinação imprecisa, no caso das variáveis contínuas.
1.10. Medidas de Dispersão (ou medidas de variabilidade)
21
Caracterizar um conjunto de dados apenas por medidas de posição é inadequado e perigoso, pois,
conjuntos com medidas de posição semelhantes podem apresentar características muito diferentes. As
medidas de dispersão são estatísticas descritivas, que quantificam de algum modo a variabilidade dos
dados, geralmente utilizando como referência uma medida de posição. As principais medidas de dispersão
são a amplitude total, desvio, desvio médio, variância amostral, coeficiente de variação e erro padrão da
média.
Exemplo:
Amostra A: 4, 8, 3, 9, 7, 5
Amostra B: 1, 5, 2, 14, 3, 11
Note que:XA = 6e X 6 B=, porém, a dispersão dos valores na amostra B é maior.
1.10.1. Amplitude Total (AT)
É a diferença entre o maior e o menor valor de uma amostra ou de um conjunto de dados. A

amplitude total indica que o desvio padrão entre duas observações quaisquer é no máximo igual a AT.
AT = Xmax − Xmin
Embora dê uma idéia geral da dispersão relativa dos dados para amostras de fenômenos pouco
conhecidos do observador, a amplitude pouco informa sobre sua distribuição. Por ser uma medida
calculada apenas com dois valores extremos (máximo e mínimo) a amplitude é muito afetada por valores
extremos que ocorrem em algumas variáveis. Em exemplos onde os valores máximos ou mínimos são
muitíssimo raros, prejudicam a compreensão da variabilidade dos dados.
1.10.2. Desvio[ ] dx
São os desvios em relação a média aritmética dos dados. A soma dos desvio sempre será igual a
zero. Seja a amostra (2, 3, 5, 7, 8), com média 5 e desvios (-3, -2, 0, 2, 3).
1.10.3. Desvio Médio [ ] dx

É construído tomando a média dos módulos dos desvios em relação a média geral dos dados. Tomar
os desvios em módulo impede que a média seja nula. Seja amostra (2, 3, 5, 7, 8), média 5 e desvios (-3, -2,
0, 2, 3). Os módulos dos desvios (3, 2, 0, 2, 3), sua média é d = 2.
O desvio médio é uma medida de muito interesse, mas que não teve um papel importante no
desenvolvimento da estatística devido a ausência de propriedades matemáticas favoráveis para o trabalho
com módulos.
ˆ
1.10.4. Variância Amostral [ V(X)]
S ouˆou 2x
2
x σ
Eliminar os desvios negativos sem utilizar módulos pode ser conseguido utilizando potencias pares
dos mesmos (o mais simples é elevar ao quadrado), o que favorece o cálculo em grandes amostras. A
22
medida assim obtida (média dos quadrados dos desvios) é a chamada Variância. A variância mede a
dispersão dos valores em torno da média.
Ela é dada pela soma dos quadrados dos desvios em relação a média aritmética, dividida pelo
número de graus de liberdade. É a medida de dispersão mais utilizada, fácil de calcular e compreender,
além de ser bastante empregada na inferência estatística.
Para uma amostra de n valores, X1, X2, ..., Xn, a variância amostral é dada por:
⎜ n
X ⎟ 2
⎝⎛ ∑ ⎠⎞
n n i
n
∑∑∑ () =
2 2 2 i 1
XX
i
SQD d X − n
SVX − i i
2
==() = = =
ˆ i
===
1 i 1 i 1
x
− 1111
n
n − n − n −
Graus de liberdade: É possível demonstrar que, utilizando-se o denominador n-1, obtém-se um

estimador de melhor qualidade de variância populacional. De maneira geral, o número de graus de
liberdade associados a uma estatística é o número de elementos da amostra n menos o número de
parâmetros (medidas da população) já estimados. Existem n-1 desvios independentes.
O denominador (n-1) é chamado número de graus de liberadade, pois corresponde exatamente ao
número de observações da amostra que tem ‘liberdade’ para variar. Isso vem do fato de se usar o conjunto
de dados para se calcular a média, assim quando determinamos n-1 observações de uma série e
conhecemos a média automaticamente o último valor já está determinado. Ou seja, não tem como variar.
Por exemplo, seja a amostra a seguir, dada por: Y 1 = 5 Y2 = 7 Y3 = 8 Y4 = y4 Assim, se

Yfor igual a 8, necessariamente y4 é igual a 12, pois (5+7+8+12)/4 = 8. Portanto
y4 não tem liberdade para variar.
Propriedades da Variância
P1) A variância de uma constante é igual a zero. V( k ) = 0
P2) Somando-se ou subtraindo-se uma constante de uma v.a., sua variância não se altera. V(X + k) =
V(X), da mesma forma temos que: V(X − k) = V(X)
P3) Multiplicando-se uma v.a. por uma constante, sua variância fica multiplicada pelo quadrado da 2
constante. V(kX) k V(X)
=
1.10.5. Desvio Padrão Amostral (Sx)

Como medida de dispersão, a variância tem a desvantagem de apresentar unidade de medida igual
ao quadrado da unidade dos dados. Assim, por exemplo, se os dados são medidos em metros, a variância é
dada em metros ao quadrado. Para voltarmos a unidade de medida original, precisamos de uma outra
medida de dispersão. Então, se define desvio padrão como a raiz quadrada positiva da variância.
ˆ
x Sx V(x) S = =
2
1.10.6. Coeficiente de Variação (CV)
23
Para comparar variabilidades de diferentes conjuntos de valores, onde as médias são muito
desiguais ou as unidades de medidas são diferentes, o C.V. é indicado. O C.V. expresso em percentagens é
dado por:
2
S x S
C.V.(%) x = = X
X
.100
Nota: o C.V. é o desvio padrão expresso em porcentagem da média. Medida adimensional.
Aplicação: - Utilizado para avaliação da precisão experimental.
- Utilizado para avaliar qual amostra é mais homogênea (menor variabilidade). Na situação em que as
amostras possuem a mesma média, a conclusão pode ser feita a partir da análise de suas variâncias. Para
amostras com médias diferentes, aquela que apresenta menor C.V., é mais homogênea.
1.10.7. Erro Padrão da Média ( ) Sx

É uma medida utilizada para avaliar a precisão da média é dada por:
ˆ S
V(x)
V(x) S ˆ x x= = =
n
n
Note que o erro padrão da média é:
- Inversamente proporcional ao tamanho da amostra;
- Diretamente proporcional a variância da amostra.
ˆ
V(x)
ˆ
=esta expressão é válida para populações infinitas ou população
V(x)
Fato: Variância da média:
n
finita e amostra com reposição dos elementos.
Exemplos:
24
Ex.1. Sejam as variáveis horas de estudo (X) e nota do aluno (Y)
X (horas estudo) 3 1 4 3 5 Y (nota obtida) 9 3 8 8 7 Calcule:
a) Média aritmética
n
∑ X 16 ∑ Yi 35
i n
=
7,0
=
X 3,2 Y ===
= = = i1 i1
n b) Variâncias 5 5
n
⎜ ∑ X ⎟
⎝⎛ ⎠⎞
n 2
i
n ()
2
∑ = 16
60
2 i1
X − − 60 51,2
i 2
n 5 − 8,8
=
⇒S 2,2 x=
2
S
x ==
= n1− ⎜ n ⎟ = 2 51− = 2,2
i1 ⎜ ⎝⎛ ⎟ ⎠⎞ 4 4
∑ Y
i
n∑
= ()
35
2 267
2 i 2
Yi − n − 5 267 245 − 22,0
1
2
==
Y⇒S 5,5
S i 1 = 1 51− = 5,5 =
Y
= n
= − 4 4
c) Desvio padrão amostral
X =X= =⇒SX=1,4832 S S 2,2 1,4832 2
Y Y = = =⇒SY= 2,3452 S S 5,5 2,3452 2

d) Coeficiente de variação (CV)
2
2
S 2,2 5,5
S
(X) = ⋅ = ⋅ = 100 33,50%
X Y
CV (%) 100 100 46,35% CV (%)
(Y) = ⋅ = ⋅ =
2
X e) Erro padrão da média 3,2 Y
100
7,0
2
S 2,2 S 5,5
x
X 1,0488
2Y
SS
2
====
S SX
YY
==== 0,6633 n 5
n 5
f) Amplitude total (AT)
AT X X 5 1 4 X=max − min = − = AT Y Y 9 3 6 Y=max − min = − = g)
Coeficiente de correlação amostral
⎜ n
⎜ ⎛⎟ n
⎟
⎝⎛ ⎝ ⎠⎞ ⎠⎞
∑ ∑ XY
ni 16 35
i 121 x
∑ ==
i
X Y ii 11 n − 121 112 −
− i
Covariância2,25
ˆ ( , ) Cov X Y =
1
=
5
r ˆ ( , ) 2,25 = n − 4 4
i Cov X Y S S x 2 2= =
= = 1 =
0,65
Coeficiente de correlação:
XY XY
⋅ 2,2 5,5
Ex.2. Dados referentes a medidas tomadas em uma amostra de 10 cães

25
Cão 1 2 3 4 5 6 7 8 9 10 Peso (kg) 23,0 22,7 21,2 21,5 17,0 28,4 19,0 14,5 19,0 19,5
Comprimento (cm) 104 105 103 105 100 104 100 91 102 99 Pede-se, para as características
avaliadas, peso e comprimento, as estatísticas:
a) Média:
n
∑ Xi
19,5
112 ... 23,0 22,7 ....... =XXX
+++ +++
→ Peso:20,580 X n
n
== Y 10
i
=
∑ i
=
n n
→ Comprimento:101,300
YYY
+++
104 105 ....... 99
112 ... =
=
Y ==n
+++
i
=
b) Variância: ⎜ n 2
10
n ⎝⎛ n ⎟
⎠⎞
i
∑ n
()
X [( ) ( ) ( ) ]
2
→ Peso: ∑ =
23,0 22,7 .... 19,5 + + +
1
ˆ X − 222 23,0 22,7 ...... 19,5 +++− 10
2 i i n
2
=SVX
==
Y 1
1 14,297
() n = 9
i
= − 2
→ Comprimento: Y
i
n
⎜ ⎛
⎝ − ()
⎟
[( ) ( ) ( ) ]
⎠⎞
n
2
∑ 104 105 .... 99
104 105 ...... 99
Y
∑ =
+++
i
1 i
2 222
+++−
n
ˆ 17,789
ˆ 910
2
=S V Y
==
()
=
VY
∴=
i
()
Y
c) Desvio padrão:
1
n−1
→ Peso:( ) 3,781
ˆ
S X= s(X ) = V X =
ˆ
→ Comprimento:( ) 4,218 SY= s(Y) = V Y =
d) Erro padrão da média:
ˆ S
→ Peso:1,196 ( )
VX
ˆ
()= ===
S V XX
X
n ˆ n S
→ Comprimento:1,334 ( )
VY
ˆ
()= ===
S V YY
Y 2
S
S n
e) Coeficiente de variação: n
→ Peso:. .(%) .100 18,373% CVX X
===
X X
→ Comprimento:. .(%) .100 4,164% 2

S S
CVY Y
===
Y Y
f) Qual das duas características é a mais homogênea? Resp:

Comprimento, pois o seu coeficiente de variação é menor.
g) Coeficiente de correlação amostral

⎜ n
⎜ ⎛⎟ n
⎟
⎝⎛ ⎝ ⎠⎞ ⎠⎞
∑ ∑ XY
i
n 205,8 1.013
i 20.958,2 x
∑ ==
i 11i
XY − −
Covariância12,296
ii
ˆ(,) n 10
1 i
Cov X Y ==
=
=
ˆ ( , ) 12,296 −
Cov X Y 1
9
n
0,771
Coeficiente de correlação:
r 22 ==
XY
⋅
= XY
SSx 14,297 17,789
1.11. Coeficiente de Correlação Amostral (r ou ρˆ)
26
O termo correlação representa uma medida que mede o grau de associação entre duas variáveis
aleatórias X e Y. O valor da correlação, conhecido como coeficiente de correlação, assume valores no
intervalo de -1 a +1, de acordo com o grau de associação entre as variáveis em questão.
Se as variáveis X e Y crescem no mesmo sentido, isto é, se quando X cresce Y em média também
cresce, diz-se que as duas variáveis tem correlação positiva. Se as duas variáveis X e Y variam em
sentidos contrários, isto é, se quando X cresce, Y em média decresce, diz-se que as duas variáveis tem
correlação negativa.
Representação gráfica dos tipos de correlação

20 0 5
0 2 4 6 8 CORRELAÇÃO POSITIVA
15 20 0
0 2 4 6 8 CORRELAÇÃO NEGATIVA
10 15 20
5 10 15
10 5 0
0 2 4 6 8 CORRELAÇÃO NULA
Assim como, quando o coeficiente de correlação assume valores próximos de +1, a associação é dita alta e positiva. Se o
seu valor está próximo de -1, a correlação é chamada negativa. Se o valor é próximo de 0, não existe correlação linear.
A correlação se aplica a qualquer área em que se pretende avaliar se uma variável X está associada a uma outra Y. Assim
a amplitude de aplicação é ilimitada, tendo como exemplos:
✓ O grau de analfabetismo de um país e expectativa de vida
✓ Grau de instrução dos pais e avaliações de candidatos no vestibular
✓ Taxa de desemprego e índice de criminalidade
✓ Idade e altura de crianças
✓ Tempo de prática de esportes e ritmo cardíaco
✓ Tempo de estudo e nota na prova
✓ Acidez e pH do leite fresco
✓ Matéria Orgânica (Lactose) e Demanda Bioquímica de Oxigênio (DBO) do soro de queijo (resíduo) Cálculo do
Coeficiente de Correlação Amostral
27
Sejam duas amostras relativas às variáveis X e Y, dadas a seguir
Xi X1 X2 ... Xn
Yi Y1 Y2 ... Yn
O coeficiente de correlação entre os valores de X e Y é dado
por: SP
XY
Coˆv(X,Y) SP
− n1
==
r=
XY
XY
SQD .SQD
ˆ V(Y) SQD .
V(X). ˆ SQD
⎜ ⎜ ⎛⎟ ⎟ n1 n1
⎝⎛ ⎝ ⎠⎞ ⎠⎞ −− XY
n n XY
∑ ∑ XY
i
n
i
2
⎜
⎝⎛
⎜ ⎛⎟
⎝ ⎠⎞
⎟
⎠⎞
n
n
⎜
⎝⎛
n
⎟
∑= = ∑∑ ∑ ⎠⎞
i1 i1 X
XY − XY
ii i
n ∑ == i
n ∑ =
i
n
i 11i SQD X Xi
Coˆv(X,Y) = =− 1
i1= SP X Y XY i i i
2
=− n
n1 n=
i 1 1
− = i
É importante deixar claro que uma correlação positiva entre duas variáveis mostra apenas que essas
variáveis crescem no mesmo sentido. A correlação positiva não indica que aumentos em uma das variáveis
causam aumentos sucessivos na outra variável. Da mesma forma, uma correlação negativa entre duas
variáveis mostra apenas que elas variam em sentidos contrários. A correlação negativa não indica que
acréscimos em uma das variáveis causam decréscimos na outra variável.
Exemplo: Sejam as variáveis horas de estudo (X) e nota do aluno (Y)
X (horas estudo) 3 1 4 3 5
Y (nota obtida) 9 3 8 8 7
⎜ n
⎜ ⎛⎟ n
⎟
⎝⎛ ⎝ ⎠⎞ ⎠⎞
∑ ∑ XY
ni 16 35
i 121 x
∑ ==
11
ˆ(,) X Y ii − i n − 5 121 112 −
i
Cov X Y 1
=
=
n 2
⎜ =
= 1 4 2,25
⎝⎛ n ⎟
i ⎠⎞ − = 2 4
⎜ n
⎟
∑ ⎝⎛ ⎠⎞
X () ∑
i 2
n
Y
16 i
60 n
= ( )5,5
2
∑ =
2 1 35
− − ∑ = ˆ ( , ) 2,25
X i 267
i i
5 Yi 1 − r Cov X Y =
n 2
− n S S x 2 2= =
2
, Y
0,65 5
S =
x =
i 1 2
=
= 22
⋅
=
n − 51− S 1 − = 51− XY
2,2 5,5
1 = n 1 XY
i
Podemos concluir que rxy = 0,65 é uma correlação moderada, ou seja, com maior número de horas
de estudo espera-se que o aluno obtenha maior nota na prova. No entanto, não significa que sempre que
um aluno estude mais que outro irá obter maior nota.
Segundo alguns autores a correlação poderá ser assim interpretada:
✓ ≤ 0,20 Correlação muito fraca e sem significância
✓ 0,20 < r ≤ 0,39 Correlação fraca
✓ 0,40 < r ≤ 0,69 Correlação moderada
✓ 0,70 < r ≤ 0,89 Correlação forte
✓ 0,90 < r ≤ 1,00 Correlação muito forte
O Coeficiente de Correlação indica a direção que é obtida pelo sinal + ou ‐ e a intensidade ou força
que é dada pelo valor que varia entre ‐1,0 e +1,0. Se a correlação for próxima a zero não existe correlação
linear entre as variáveis (exemplo: cor dos olhos e inteligência).
1.12. Exercícios
28
Exercícios de amostragem
1. Quando o uso da amostragem não é interessante?
2. Porque fazer amostragem?
3. Qual a diferença entre censo e amostragem?
4. Quais são as vantagens da amostragem?
5. Qual a diferença entre amostragem probabilística e amostragem não probabilística? 6.
Qual a limitação de uma pesquisa onde as entrevistas foram feitas pela Internet? 7. Qual a
limitação de uma pesquisa onde os questionários foram enviados pelo correio?
Exercícios de tabelas e gráficos

1. De acordo com o IBGE em 2000 ocorreu, em acidentes de trânsito, 27.306 casos de vítimas fatais,
assim distribuídos: 11.712 pedestres, 7.116 passageiros e 8.478 condutores. Faça uma tabela de
distribuição de frequências e apresente as frequências absolutas, relativas, acumuladas e acumuladas
relativas.
2. Resultado final da disciplina W, entre 00 I— 20: 5 alunos; entre 20 I— 40: 10 alunos; entre 40 I— 60:
20 alunos; entre 60 I— 80: 15 alunos; entre 80 I— 100: 10 alunos. Construa uma tabela de distribuição de
frequências para apresentar o resultado da turma.
3. Salários mensais de funcionários da indústria farofinha no ano de 2010, entre 130 I— 150: 605
funcionários; entre 150 I— 170: 182 funcionários; entre 170 I— 190: 113 funcionários; entre 190 I—
210: 77 funcionários; entre 210 I— 230: 23 funcionários. Construa uma tabela de distribuição de
frequências para apresentar os salários mensais da indústria farofinha no ano de 2010.
4. Construa uma tabela de distribuição de frequências completa: 51, 44, 55, 60, 39, 43, 57, 42, 37, 60, 35,
39, 39, 42, 61, 55, 63, 52, 34, 40, 34, 51, 61, 61, 63, 39, 36, 39, 59, 55, 57, 40, 49, 36, 54, 55
Exercícios de somatório
29
1. Considere as variáveis X e Y que representam, respectivamente, as notas de duas disciplinas, para um
grupo de 7 alunos. X = {9, 7, 4, 8, 9, 6, 10} Y = {6, 7, 5, 8, 7, 6, 9}
Calcule:
2
Xib) ∑=712 7 ⎜ ⎛ i 5 6
⎝ ∑i=X d) ∑= i 1Xi e) ∑= 22
a) ∑ i 1 Xic) i 1
⎟ Xi f) i
= 7 ⎠⎞
2
⎜ ⎛ 6 ⎞
7 ⎝ ∑= = 1 ⎜ ⎛
5
5
⎝ ⎟∑
⎜ ⎛ i h) ⎟
⎝ ∑i=X g) i ⎠⎞
⎟
⎠⎞ ∑X Y i
Xi Y 1 ii
1 i = 1 i ⎠
2. Seja os valores da variável X = {5, 2, 1, 8, 0, 11, 4, 6, 7, 10}. Calcule: 2
10
10 10 2 10 X ⎟
Xib) ∑= 12 10 ⎜ ⎛ ⎠⎞
⎝ ∑ ii
⎜ ⎛
⎝ ∑i=Xid) 10 110
⎟ ∑ −=
⎠⎞
a) ∑ i 1 Xic) 1
2
=
1
= i X −
1
ii
2
10 ∑− ()
10
i
X h) 10
4 10
f) Xi
Xi ( )2 101 ∑
i= i=
Xig) ∑ − 4 1 1
e) ∑( − ) 4 10 1
i 1 i=
−
=
3. Utilizando os dados da tabela abaixo, calcule:

i \ j 1 2 3 4 1 8 7 5 9 2 4 0 10 2
4
2
2
4
Xib) ∑=411
Xij
a) ∑ X jc) ∑ ∑ Xijd) ∑
jj
i
11
j
⎟ ⎜ ij1==
=≠
= =⎟ ⎠⎞ ⎜ ⎝⎛ 1 13
g)
j Xj ∑ 4
≠= 21 61
4
3
1 Xj
f)
∑ Xj
h)
∑ 6
e) ∑ 4
Xj
j = j ≠ 1 jj 12 2
22 22 jj =≠
4. Observe os dados e calcule as seguintes quantidades:

i 1 2 3 4 5 6 fi 3 5 9 10 2 1 Xi 10 11 15 19 21 26
6
Xib) ∑=6i 1if
c)
∑ 6
Xi fe) ∑
= i 1i 6
2 fX
6 2
i
a) ∑ fd)∑ =
ii
ii Xi
i1= = 1 1
6
∑
f
i
i 1
=
5. Considere o conjunto de dados a seguir, onde se observou a produção de uma determinada gramínea
(t.ha-1) em relação a diferentes níveis de adubação (kg.ha -1):
Nível (x) 0 20 40 60 80 Produção (y) 0,8 0,9 1,2 1,5 1,4 Calcule:
i i
a) ∑=5i 1X e ∑=5i 1Y b)
2
⎜ ⎛ i
⎝ ∑i=Y e ∑= 12
5
i ⎟⎟
5
⎟ ⎜ ⎛ *
⎠⎞ Y c) ⎠⎞ ⎜ ⎝ ∑ ∑ ==
5 5 5
i i ()
X i Y e ∑=5i 1XiY d)∑
XY ⎟
ii e ⎠⎞
⎜ ⎛ +
⎝ ∑ ∑ ==
1 ii1i 5
+ i
i 1
i1
5
Xi Y
5 5 5 =
e) i () i
∑ X e∑ 5
X g) ∑=514 5
ii11
i ()
X e∑
7 + i () 3 i ()
7 X f) ∑ Ye∑
i 1 i 1 i 1 i 1 i
= = = = = + Yi
3 + 9
1
i
Exercícios de descrição dos dados
30
1. Calcule a média aritmética, geométrica e harmônica dos números:
a) 3 e 9 f) 3 e 27
b) 2 e 8 g) 2 e 16
c) 1, 3 e 27 h) 1, 4 e 16
d) 2, 2, 2 e 2 i) 7, 7, 7, 7 e 7
e) 2, 5, 7 e 9 j) 2, 500, 20, 900
2. A média mínima para aprovação em determinada disciplina é 5,0. Se um estudante obtém as notas: 7,5;
8,0; 3,5; 6,0; 4,0; 2,5; 5,5 e 2,0 nos trabalhos mensais da disciplina em questão, este aluno foi aprovado?
3. Calcule a média ponderada dos números:

a) 4, 5 e 8 atribuindo aos mesmos, respectivamente, pesos de 3, 2 e 5.
b) 8, 5 e 6 atribuindo aos mesmos, respectivamente, pesos de 1, 3 e 6.
4. Um aluno obteve 3,0 na prova e 9,0 no trabalho, cujos pesos são 4 e 1, respectivamente. Sabendo que a
média mínima para aprovação é 5,0, este aluno foi aprovado?
5. Um professor de biologia leciona para quatro turmas. Sabe-se que as turmas apresentaram as seguintes
médias em um determinado semestre. Calcule a média conjunta das turmas.
Turma A (60 alunos) - Média 9,0 Turma B (40 alunos) - Média 8,0 Turma C (70
alunos) - Média 7,0 Turma D (30 alunos) - Média 5,0
6. Calcule a Média aritmética ponderada de:

Xi 4 7 9 10 12 15 fi 3 6 4 5 2 10 Xi – valores e fi – frequência dos respectivos
valores.
7. Num determinado país a população feminina representa 51% da população total. Sabendo-se que a
expectativa de vida da mulher é de 73 anos e a do homem é de 70 anos, qual a expectativa de vida média
da população?
8. A média aritmética das notas dos alunos de uma turma formada por 25 meninas e 5 meninos é igual a 7.
Se a média aritmética das notas dos meninos é igual a 6, a média aritmética das notas das meninas é igual
a quanto?
9. O histograma seguinte mostra a distribuição de uma amostra. Calcule a média desta

distribuição. 15
a
ic
n
10
êu
35
10 4
8 7
q
r
5
F
0 50 I- - 150 150 I- -
250 250 I- - 350 350 I- - 450 450 I- - 550 550 I- - 650
10. Calcule a média, variância e o desvio padrão e coeficiente de variação dos

números: a) 1, 3, 4 e 8
b) 3, 7, 5, 2 e 4
c) 4, 4, 4, 4, 4 e 4.
d) 4, 3, 7, 9, 8 e 5.
11. Calcule o coeficiente de variação dos dados de notas de dois grupos (A e B) de estudantes, dizendo
ainda, com base nos cálculos, qual o grupo mais homogêneo (ou menos disperso).
31
Grupo A: 8, 7, 7, 6, 9 e 8
Grupo B: 8, 5, 7, 3 e 9
12. Seja X = {2, 5, 7, 4, 7, 9}, calcule a média e a variância de:

a) X e) D = X + 7
b) Z = X – 2 f) Y = 4X
c) B = X – 5 g) K = X − X
d) W = X + 3 h) A = 2X
13. Os dados abaixo se referem a medidas tomadas em uma mostra de 10 cães:

Cão 1 2 3 4 5 6 7 8 9 10 Peso (kg) 23,0 22,7 21,2 21,5 17,0 28,4 19,0 14,5 19,0 19,5
Comprimento (cm) 104 105 103 105 100 104 100 91 102 99
Pede-se para as características avaliadas, peso e comprimento, as estatísticas:

a) Média; d) Erro padrão da média;
b) Variância; e) Coeficiente de variação;
c) Desvio padrão; f) Qual das duas características é mais homogênea.
14. Tabela 14. Peso e comprimento de bezerros ao nascer das raças A e B

Raça Peso (kg) Comprimento
(cm) Raça Peso (kg) Comprimento
(cm)
A 45 102 B 44 82 A 46 98 B 46 90 A 47 89 B 48 72 A 49 91 B 51 69 A 50 110
B 54 93 A 50 81 B 55 88 A 51 96 B 56 79 A 51 108 B 57 83
14.1 Para o conjunto de dados (sem considerar a raça) e para o peso e o comprimento,
calcule: a) Média; b) Mediana; c) Moda; d) Amplitude total; e) A variância; f) desvio padrão;
g) O erro padrão da média; h) Coeficiente de variação; i) Coeficiente de correlação e
interprete essa correlação.
14.2 Calcule agora para cada raça A e B:

a) Média; b) Mediana; c) Moda; d) Amplitude total; e) A variância; f) desvio padrão; g) O
erro padrão da média; h) Coeficiente de variação. i) Coeficiente de correlação e interprete
essa correlação.
15. Calcule o coeficiente de correlação e diga se a correlação é positiva ou negativa e se a associação é

forte, fraca ou regular.
15.1. Acidez e pH do leite fresco
32
Acidez (ºD) 16 18 20 22 24 26
pH 6,7 6,9 6,3 6,0 5,5 5,4
15.2. Matéria Orgânica (Lactose) e Demanda Bioquímica de Oxigênio (DBO) do soro de queijo
Materia orgânica (g/L) 44 56 68 80 92 DBOppm 40000 60000 70000 80000 90000
15.3. Teor de clorofila e teor de proteína em braquiária
Teor de clorofila (SPAD) 15,46 30,86 39,57 41,97

teor de proteína bruta (%) 3,66 6,13 10,67 15,32
15.4. Variáveis X e Y
X 7 9 10 13 15
Y98977
15.5. Variáveis Z e W
Z 0 5 10 15 20
W 2,4 5,8 8,6 8,3 8,0
15.6. Variáveis X e Y
X 0 1,5 3,0 4,5 6,0 7,5 9,0
Y 70,9 64,1 60,5 55,1 52,2 55,9 55,1
15.7. Variáveis L e K
L 10 20 30 40 50 60 70 80 K 2,1 5,4 3,6 3,5 4,2 3,7 3,1 2,8
Respostas exercícios de somatório
1.a) 53 b) 427 c) 2.809 d) 37 e) 246 f) 1.369 g) 376 h) 1.443
33
2. a) 54 b) 416 c) 2.916 d) 13,822 e) 14 f) 144 g) 16 h) 5,4 3. a) 12 b) 29 c) 45 d) X 1 = 24 e X2 = 6 e) 10 f) 1/16
g) 132 h) 96 4. a) 102 b) 30 c) 478 d) 8.098 e) 269,93
5. a) 200 b)33,64 c)1.160 d)205,8 e)1.400 f)215 g)23,2 5. a) 5,8 b)7,1 c)268 d)205,8 e)235 f)600
g)50,8
Respostas exercícios de descrição de dados
1.a) 6; 5,2; 4,5 b)5; 4; 3,2 c)10,3;

4,3; 2,19 d)2; 2; 2 e) 5,75;
5,01; 4,19 f)15; 9; 5,4 g)9; 5,66;
3,56 h)7; 4; 2,29
2.a) 4,875 3.a) 6,2 b) 5,9 4.a) 4,2 5.a) 7,5 6.a) 10,47 7.a) 71,53 8.a) 7,2 9.a) 367,57
10.a) 4,0 b) 4,2 c) 4,0 d) 6,0
8,67 3,70 0,00 5,60
2,94 1,92 0,00 2,37
73,6 45,8 0,0 39,4
11.a) 14,0 b) 37,6

12.a) 5,67 b) 3,67 c) 0,67 d) 8,67 e) 12,67 f) 22,67 g) 0,00 h) 11,33 6,27 6,27 6,27 6,27 6,27 100,27 6,27 25,07
13.a) 20,58 b) 14,30 c) 3,78 d) 1,20 e) 18,37 f) 15,73

101,30 17,79 4,22 1,33 4,16 137,20
14.a) 50,0 b) 50 c) 51 d) 13 e) 15,73 f) 3,97 g) 0,99 h) 7,93 i) -0,166 a) 89,44 b) 89,44 c) amodal d) 41 e) 137,20 f)
11,71 g) 2,93 h) 13,10
14.1.48,63 b) 49,5 c) 50 d) 6 e) 5,41 f) 2,33 g) 0,82 h) 4,78 i) 0,060 a) 96,88 b) 97,0 c) amodal d) 29 e) 96,13 f)
9,80 g) 3,47 h) 10,12
14.1 51,38 b) 52,5 c) amodal d) 13 e) 23,98 f) 4,90 g) 1,73 h) 9,53 i) 0,131 a) 82,00 b) 82,5 c) amodal d) 24 e)
71,43 f) 8,45 g) 2,99 h) 10,31
15) -0,955 2) 0,986 3) 0,903 4) -0,861 5) 0,832 6) -0,852 7) -0,166

Cap.2. Introdução a Teoria das Probabilidades
2.1. Introdução
34
A teoria matemática da probabilidade dá-nos a instrumental para construção e análise de modelos
matemáticos relativos a fenômenos aleatórios. Ao estudarmos um fenômeno aleatório, temos diante de nós
um experimento cujo resultado não pode ser previsto. Ocorre-nos então logo à mente experimentos
relacionados com jogos de azar. De fato, a teoria das probabilidades, surgida nos séculos XV e XVI, foi
motivada por problemas deste tipo.
Historicamente, o propósito original da teoria das probabilidades limitava-se a descrição e ao
estudo dos jogos de azar e quase todo esforço era concentrado no cálculo do valor de certas
probabilidades de interesse. Entretanto, a obtenção de valores numéricos de probabilidade não é o
objetivo principal da teoria, e sim a descoberta de leis gerais, e a construção de modelos teóricos
satisfatórios.
Com o advento da teoria das probabilidades, foi possível estabelecer as distribuições de
probabilidade, consideradas hoje a espinha dorsal da teoria estatística, pois todos os processos inferenciais
são aplicações de distribuições de probabilidades.
Assim, o conhecimento dos conceitos advindos da teoria das probabilidades é de grande
importância para compreensão e correta utilização da técnica estatística.
2.2. Conceitos fundamentais

2.2.1. Modelo determinístico
É aquele modelo em que, a partir das condições em que o experimento é realizado, pode-se
determinar seu resultado. Sabe-se, por exemplo, que a expressão S = vt, representa a distância percorrida
por um objeto. Sendo, v a velocidade média e t o tempo gasto no percurso. Portanto, conhecidos os valores
de v e t, o valor de S fica implicitamente determinado.
É importante observar que existe uma relação definida entre t, v e S que determina univocamente a
quantidade no primeiro membro da equação, se aquelas do segundo membro forem fornecidas.
2.2.2. Modelo Probabilístico

É aquele modelo em que as condições de execução de um experimento não determinam o
resultado final, mas sim o comportamento probabilístico do resultado observável.
Considere-se, por exemplo, a seguinte situação: deseja-se determinar qual a precipitação
pluviométrica que ocorrerá numa determinada localidade como resultado de uma tempestade que se
avizinha. Dispõe-se de informações sobre pressão barométrica em vários pontos, variação de pressão,
velocidade do vento, etc. Embora sejam essas informações valiosas, não são capazes de responder a
questão levantada, qual seja, a de quanta chuva irá cair. Como se pode notar, este fenômeno não se
coaduna com um tratamento determinístico; um modelo probabilístico se adapta à situação com mais
propriedade.
2.2.3. Experimentos Probabilísticos ou Aleatórios
São aqueles experimentos cujos resultados podem não ser os mesmos, ainda que sejam repetidos
sob condições essencialmente idênticas.
São exemplos de experimentos probabilísticos:
El: Lançar 4 moedas e observar o número de caras obtidas.
E2: Escolher, ao acaso, duas pessoas na população e observar o sexo.
E3:Lançar uma moeda e observar a face superior.
E4: jogar um dado e uma moeda e observar as faces superiores.
2.2.4. Espaço Amostral

Chama-se espaço amostral o conjunto de todos os possíveis resultados de um experimento
aleatório ou, em outras palavras, é o conjunto universo relativo aos resultados de um experimento. Esse
conjunto será representado pela letra S. Assim, pode-se dizer que, a cada experimento aleatório sempre
estará associado um conjunto de resultados possíveis ou espaço amostral.
35
Aos experimentos aleatórios exemplificados anteriormente estão associados os seguintes espaços
amostrais, respectivamente:
S1 = {0, 1, 2, 3, 4}
S2 = {HH, HM, MH,MM}
S3 = {C, K}, em que {C – Cara e K – Coroa}
S4 = {C1, C2, C3, C4, C5, C6, K1, K2, K3, K4, K5, K6}
2.2.5. Eventos
Denomina-se evento a todo particular conjunto de resultados de S, ou ainda, a todo subconjunto de
S. É desse resultado que se tem interesse no cálculo de probabilidade. Será útil considerarmos o espaço
todo (S) e o conjunto vazio (Φ) como eventos. O primeiro é denominado evento certo e o segundo, evento
impossível, e temos:
P(S) = 1 P(Φ) = 0
Em particular, se S é um espaço amostral discreto ou enumerável composto de n pontos amostrais,
existem 2nsubconjuntos ou eventos que podem ser formados a partir de S. O conjunto que reúne todos
esses subconjuntos é chamado de espaço de eventos ou classe de eventos.
Exemplo: Seja S = {1, 2, 3}
Temos então, n = 3 ⇒ 23 = 8 eventos,
A1 = Φ,A2 = { 1 }, A3 = { 2 }, A4 = { 3 },
A5 = { 1, 2}, A6 = { 1, 3}, A7 = { 2, 3}, A8 = {1, 2, 3}.
No caso continuo, os eventos são colocados na forma de intervalos.
Por exemplo, B = { a ≤ x ≤ b }.
2. 2.6. Eventos Mutuamente Exclusivos

Diz-se que dois eventos são mutuamente exclusivos se, e somente se, a ocorrência de um impede a
ocorrência do outro. Correspondentemente, caracterizam-se, na teoria dos conjuntos, por dois conjuntos
disjuntos, isto é, que não possuem nenhum ponto em comum.
Como exemplo, considere-se os seguintes casos:
(i) No lançamento de um dado, a ocorrência de uma face elimina a possibilidade de ocorrência das outras
cinco.
(ii) Seja S o espaço amostral referente à retirada de uma carta de um baralho de 52 cartas. Seja A o evento
retirada de um ás e B o evento retirada de uma carta de ouro. Vê-se que a possibilidade de ocorrer A e
B ao mesmo tempo não está descartada, ou seja, ocorrer ás de ouro. Logo, os eventos A e B não são
mutuamente exclusivos.
Em outras palavras, dois eventos A e B são mutuamente exclusivos se o seu conjunto interseção
for vazio, ou seja,
A ∩ B = Φ ⇔ A e B são disjuntos.
Obs.: Usando-se as operações com conjuntos, podem-se formar novos eventos.
I) A ∪ Bé o evento que ocorre se A ocorre ou B ocorre ou ambos ocorrem;
II) A ∩ Bé o evento que ocorre se A e B ocorrem;
III) Aé o evento que ocorre se A não ocorre. Conhecido como complemento de A.
Exemplo 1: Seja o experimento aleatório “lançar um dado e anotar a face

superior”. S = { 1, 2, 3, 4, 5, 6} n 6 S =
⇒ Evento A: “sair número par”A = { 2, 4, 6} nA = 3
36
⇒ Evento B: “sair número ímpar”B= { 1, 3, 5} nB= 3
⇒ Evento C: “sair número menor que 3”C = { 1, 2} n 2 C =
• A ∩ B = Φ, portanto A e B são mutuamente exclusivos.
• A ∩C = {2}, portanto A e C não são mutuamente exclusivos.
B∩C = { 1 }
• , portanto B e C não são mutuamente exclusivos.
• A∪C = { 1, 2, 4, 6}
• B∪C = { 1, 2, 3, 5}
• C = { 3, 4, 5, 6}
2.3. Conceitos de Probabilidade
Como a teoria das probabilidades está, historicamente, ligada aos jogos de azar, esta associação
gerou inicialmente um conceito chamado conceito clássico ou probabilidade “a priori”, devido a Laplace.
O conceito de frequência relativa como estimativa de probabilidade ou probabilidade “a posteriori” surgiu
posteriormente com Richard Von Mises.
Já no século XX, como a conceituação até então existente não era apropriada a um tratamento
matemático mais rigoroso, A. N. Kolmogoroff conceituou probabilidade por meio de axiomas rigorosos.
2.3.1. Conceito Clássico ou Probabilidade “a priori”

Seja E um experimento e S um espaço amostral a ele associado, composto de n s pontos amostrais.
Define-se a probabilidade da ocorrência de um evento A, indicada por P(A), como sendo a relação entre o
número de pontos favoráveis (nA) a realização do evento A e o número total de pontos (ns), ou seja:
A
() n
PA= S
n
ns = nA + c, onde c = número de pontos contrários à realização do evento A.
Podemos complementar definindo a probabilidade de realização do acontecimento contrário,
c
indicada por P(A), onde :( )
P A =Obviamente, P(A)+ P(A)=1 ⇒ P(A)=1− P(A).
Sn
Exemplo 2: E “escolher aleatoriamente uma carta num baralho contendo apenas figuras”.
S = {RP,RC,RO,RE,VP,VC,VO,VE,DP,DC,DO,DE}e n 12 S =
Sendo: R – Rei, V – Valete, D – Dama / P - Paus, C – Copas, O – Ouros, E – Espadas.
Sejam os eventos associados ao S:a) A: “a carta é de copas” ⇒A = {RC,VC,DC} nA = 3 b)

B: “a carta é um rei” ⇒B = {RP,RC,RO,RE} nB= 4
⇒ Considerando que os pontos de S são equiprováveis, isto é, cada ponto de S tem a mesma probabilidade
de ocorrer, tem-se que:
n
( )41
3 n
PB
= = = ( )31
PA 12 Fatos: n
S
A 4 S 12
n ===B
a) O conceito clássico só pode ser utilizado em situações onde o S é enumerável, finito e equiprovável.
b) Sendo ( ) n
P A =, no caso infinito todos os eventos teriam probabilidade zero. A
S
n
37
2.3.2. Frequência Relativa ou Probabilidade “a posteriori”
Seja E um experimento e A um evento. Se após n realizações do experimento E, n suficientemente
grande, forem observados m resultados favoráveis ao evento A, então uma estimativa da probabilidade
é dada pela frequência relativa
P(A) nm
fr = .
Esta definição é, as vezes, chamada de probabilidade empírica e tem por base o princípio
estatístico da estabilidade, ou seja, à medida que o número de repetições do experimento cresce, a
frequência relativa se aproxima da probabilidade P(A). Se jogarmos um dado 90 vezes e obtivermos o
resultado do Quadro 1.1, teremos na frequência relativa a probabilidade "a posteriori" e na frequência
esperada relativa, a probabilidade "a priori". Quando o número de tentativas aumenta consideravelmente,
as duas se aproximam.
Quadro 1 - Resultado hipotético do lançamento de um dado 90 vezes consecutivos.
Face no Frequência observada Frequência relativa Frequência esperada Frequência esperada relativa
1 12 12/90 = 0,1333 15 1/6 = 0,1667 2 17 17/90 = 0,1889 15 1/6 = 0,1667 3 15 15/90 =
0,1667 15 1/6 = 0,1667 4 18 18/90 = 0,2000 15 1/6 = 0,1667 5 10 10/90 = 0,1111 15 1/6 =
0,1667 6 18 18/90 = 0,2000 15 1/6 = 0,1667
Soma 90 1,000 90 1,000 A exigência n suficientemente grande é por demais vaga para que sirva
como uma boa definição de probabilidade, além de impossibilitar, tal como o conceito clássico, o
tratamento probabilístico de eventos de espaços amostrais contínuos.
Exemplo 3: Em 660 lançamentos de uma moeda, foram observadas 310 caras. Qual a probabilidade de,
num novo lançamento dessa moeda obter-se coroa?
m 350
Aqui, a estimativa fr da probabilidade P(A) será: 0,5303 fr = = =
n 2.3.3. Conceito Moderno ou Axiomático

660
Seja E um experimento e S um espaço amostral associado a E. A cada evento A de S associaremos

um número real P(A), denominado probabilidade da ocorrência do evento A, se forem satisfeitas as
seguintes condições ou axiomas:
i) P(A) ≥ 0, para qualquer evento A em S
ii) P(S) = 1
iii) Se A e B são dois eventos de S e são mutuamente exclusivos, então:
P(A ∪ B) = P(A) + P(B)
Este último axioma pode ser generalizado para o caso de um número finito de eventos
mutuamente exclusivos, ou seja,
∪ ∪ ∪ = + + + =n
()()()() ()
∑
12n12 P An P Ai P A A ... A P A P A ... , se Ai ∩ Aj = Φ para todo par (i, j), com i i1
=
≠ j. Decorre daí, duas propriedades importantes, ou sejam:

a) 0 ≤ P(A) ≤ 1
b) P(A) = P(S) − P(A) = 1− P(A).
Pelo que se pode notar, o conceito axiomático não fornece formas e sim condições para o cálculo
de probabilidade, ou seja, qualquer processo de cálculo da probabilidade é válido desde que satisfaça os
axiomas. Facilmente se comprova que os conceitos “a priori” e “a posteriori” se enquadram dentro desse
conceito.
38
2.4. Espaço Amostral finito
Seja S um espaço amostral finito:
S = {a1, a 2,..., a n }
Um espaço amostral de probabilidade finito é obtido associando-se a cada ponto ai ∈S, um

número real pi, chamado de probabilidade de i
a, satisfazendo as seguintes condições:
i) pi ≥ 0, para i = 1,2,..., n
ii) p1 + p2 +... + pn=1
A probabilidade de qualquer evento A, que denotaremos por P(A), é dada pela soma das
probabilidades dos pontos de A.
2. 5. Espaços Amostrais Finitos e Equiprováveis

Seja S um espaço de probabilidade finito. Se cada ponto de S tem uma mesma probabilidade de
ocorrer, então o espaço amostral chama-se equiprovável, ou uniforme. Se S contém ns pontos então a
probabilidade de cada ponto será S n

1. n
P(B) = .
B
Por outro lado, se um evento B possui nB pontos, então n
S
Exemplo 4: Seja uma turma composta pelos alunos Helena, Maria, Pedro, José e Alice. Selecionando-se
um aluno ao acaso: a) qual a probabilidade de ser selecionada a Helena? b) e de ser selecionada uma
mulher? Resolução: S = {Helena, Maria, Pedro, José, Alice}. n s = 5
⇒ Considerando que S é um espaço finito e seus pontos são equiprováveis, isto é, cada ponto de S tem a
mesma probabilidade de ocorrer, tem-se que:
a) Selecionando-se um aluno ao acaso qual a probabilidade de ser selecionada a
Helena? n
A = {Helena} nA = 1 ( )51
PA n
S
==A
b) Selecionando-se um aluno ao acaso a probabilidade de ser selecionada uma mulher?
n
M = {Helena, Maria, Alice} nM = 3 ( )53
PM n
S
==M
Exemplo 5: Seja o espaço amostral referente ao número de caras obtidos no “lançamento de uma moeda
3 vezes” e A o evento “ocorrência de uma cara”. Neste caso:
S = {0,1,2,3} e n 4 S = e A = { l } e n A = 1
Aqui, o conceito clássico não pode ser imediatamente aplicado, pois, os pontos de S não são
equiprováveis, ou seja, P(A) ≠ 1/4. Observando-se o espaço amostral original:
S’ = {CCC, CCK, CKC, KCC, CKK, KCK, KKC, KKK};
n
vê-se, A’ = {CKK, KCK, KKC} e, logo,
83
P(A') A'
= =, nesse caso, S’ é equiprovável.
S'
n
2.6. Principais Teoremas para o Cálculo de Probabilidades

39
O cálculo de probabilidades, além dos axiomas, possui nos teoremas a serem enunciados um
poderoso instrumento de auxílio. Os diagramas de Venn, são úteis na compreensão tanto dos teoremas
como dos processos de demonstração.
Teorema 1: Se Φ é um conjunto vazio, então P(Φ) = 0.

Prova: Temos que A = A ∪ Φ=> P(A) = P(A ∪ Φ)
A ∩ Φ = Φ, isto é, A e Φ são mutuamente exclusivos.
Logo, P(A) = P(A) + P(Φ)(do axioma iii) Assim, P(Φ) = P(A) − P(A) = 0 ∴ P(Φ) = 0
Teorema 2: Se Aé o complemento de A, então P(A) = 1− P(A) .

Prova:
S P(S) =1
A
A = S− A, logo A ∪ A = S, e P(A ∪ A) = P(S) =1
Por definição:
Ora, A ∩ A = Φ, isto é, A e Asão mutuamente exclusivos.
Logo, P(A) + P(A) =1 ∴ P(A) =1− P(A)
Teorema 3: Se A e B são dois eventos quaisquer e Bé o complemento de B,

então P(A ∩ B) = P(A) − P(A ∩B).
Prova:
S A = (A ∩ B) ∪(A ∩B)
A B P(A) = P(A ∩ B) + P(A ∩B), pois (A ∩ B)e (A ∩ B)são
mutuamente exclusivos, logo: P(A ∩ B) = P(A) − P(A
∩B)
Teorema 4: Teorema da soma das probabilidades. Se A e B são dois eventos quaisquer,

então: P(A ∪ B) = P(A) + P(B) − P(A ∩ B)
Prova: Pela figura do teorema 3 vê-se, que:
A ∪B = B∪(A ∩ B)sendo B e (A ∩ B)mutuamente exclusivos. Assim:
P(A ∪ B) = P(B) + P(A ∩ B)
Mas pelo teorema 3, P(A ∩ B) = P(A) − P(A ∩B), logo:
P(A ∪B) = P(A) + P(B) − P(A ∩B)
40
Exemplo 6: Imagine que uma carta será retirada de um baralho contendo apenas as figuras (Rei, Valete e
Dama). Qual a probabilidade de sair uma dama ou a carta ser de espadas? Esse baralho tem 12 cartas,
sendo três figuras (Rei, Valete e Dama) e quatro naipes (Paus, Copas, Espadas e Ouros). Então:
4 3
P(D ∪ E) = P(D) + P(E) − P(D ∩ E)
21
1 6
P(D ∪ E) = + − = =
12 12 12 12
Exemplo 7: A probabilidade de um guarda rodoviário aplicar quatro ou mais multas em um dia é de
63%; a probabilidade de ele aplicar quatro ou menos multas em um dia é de 56%. Qual a probabilidade
de o guarda aplicar exatamente quatro multas em um dia?
Solução: Quatro ou mais = 63% Quatro ou menos = 56%
P(A∪ B) = P(A) + P(B) − P(A∩ B) =>100 = 6 3+ 5 6− P(A∩ B) => P(A∩ B) =119−100 =1 9%
Teorema 5: Se A ⊂ B, então P(A) ≤ P(B)
Prova: Podemos escrever:B = A ∪(A ∩B)
S
B
A
P(B) = P(A) + P(A ∩B), pois A e (A ∩ B)são mutuamente exclusivos, logo:

P(A ∩B) = P(B) − P(A), mas pelo axioma (i), vem:
P(B) −P(A) ≥ 0 ∴ P(B) ≥ P(A)
Teorema 6: Para um evento A qualquer, 0 ≤ P(A) ≤1
S P(A) ≥ 0pelo axioma (i)
Prova:
A
Resta provar que P(A) ≤1Pelo Teorema 5, A ⊂S, logo ⇒P(A) ≤ P(S)
Pelo axioma (ii), tem-se que P(S) =1, logo P(A) ≤1 ∴ 0 ≤ P(A) ≤1
Exemplo 8: Numa classe há 10 homens e 20 mulheres. Metade dos homens e metade das mulheres tem
olhos castanhos. Qual a probabilidade de uma pessoa escolhida ao acaso ter olhos castanhos ou ser
mulher? Olhos Castanhos Olhos Claros Totais
Homens 5 5 10
Mulheres 10 10 20
Totais 15 15 30 ns = 30
Eventos: M: “ser mulher”nM= 20 32
20
P(M) = =
30
C : “ter olhos castanhos”n 15 C =21

15
P(C) = =
30
M∩C: “ser mulher e ter olhos castanhos”n 10 M∩C =31

10
P(M ∩C) = =
30
A probabilidade de uma pessoa escolhida ao acaso ter olhos castanhos ou ser mulher será:
2 1 1 5
P(M ∪C) = P(M) + P(C) − P(M ∩C) = + − =
3
2
3
6
2.7. A análise combinatória

41
O número de elementos do espaço amostral Ω, em certas situações, é finito e enumerável. Nesses
casos, se a probabilidade de eventos associados a Ω for constante, então, de acordo com a teoria clássica, a
probabilidade de um evento A é dada pela divisão do número de elementos favoráveis ao evento A pelo
número total dos elementos de Ω. Ou seja, existem situações nas quais a teoria clássica é adequada, e que
portanto o cálculo de probabilidades resume-se em um problema de contagem.
Entretanto, a contagem ou enumeração dos eventos associados a A é frequentemente laboriosa.
Portanto as técnicas de contagem (análise combinatória) correspondem a uma ferramenta matemática
poderosa para determinar a probabilidade associada a um certo evento A, contido no espaço amostral
finito Ω.
2.7.1. Princípio fundamental da contagem

Se determinada operação pode ser realizada de n 1 maneiras distintas, e se, para cada uma dessas
maneiras, uma segunda operação pode ser realizada de n 2 maneiras distintas, então as duas operações
podem ser realizadas conjuntamente, de n 1.n2 maneiras. Cada um dos modos de realização da primeira
pode associar-se a cada um dos modos de realização da segunda.
Exemplo 9: Lançando um dado e uma moeda e observando as faces superiores, quantos diferentes
resultados podemos obter?
n1 = 6possíveis resultados do dado.n2 = 2possíveis resultados da moeda.
Portanto será possível obter n1⋅n2 = 6x2 =12diferentes resultados.
2.7.2. Arranjos e Permutações

Dado um conjunto de n objetos, o número de disposições desses elementos tomados k de cada vez
constitui o que chamamos de arranjo de n elementos k a k, representados k An.
Exemplo 10: Os arranjos das quatro letras a, b, c, d tomadas 3 a 3 são:
abc acb bca bac cab cba
abd adb bda bad dab dba
acd adc cad cda dac dca
bcd bdc cbd cdb dcb dbc
Pode-se mostrar que o número de arranjos de n elementos tomados k de cada vez
é: n!
kn
A −
= 4!
(n k)! A34 = =
No caso anterior temos 4x3x2x1 24
=diferentes arranjos.
(4 3)!
−
O símbolo n!, dito fatorial de n, é o produto dos n primeiros números inteiros consecutivos, de 1
até n. Assim, 3!= 3x2x1= 6; 5!=5x4x3x2x1=120. Por convenção 0!=1.
Se os arranjos abrangem a totalidade dos elementos, temos o que se chama de permutações de n
elementos. Simbolicamente: Pn. Pode-se verificar que P n!
n= .
Exemplo 11: Quantos números de cinco algarismos podemos formar com os

algarismos: 2, 4, 6, 7, 9, sem os repetir?
5!
P 5! 5x4x3x2x1 120 5 = = =, que coincide com 5! 120
A55 = =
= 2.7.3. Combinações
(5 5)! −
42
Há casos em que só interessam os elementos que compõem o grupamento, não importando a
ordem que ali figuram. Temos então o que se chama de combinação de n elementos k a k. Símbolo: n!
( )k!(n k)! k
Ckn
==
n
−
Os grupamentos básicos do exemplo 1.10, abc, abd, acd, bcd (primeira coluna), são precisamente
as combinações dos quatro elementos a, b, c, d tomados 3 a 3. Ou seja:
4! 4x3x2x1
C34 = = = .
3!(4 3)! − 4
3x2x1
Ali, qualquer permutação que façamos com os elementos de determinado grupamento origina a
mesma combinação. São idênticas as combinações:
abc, acb, bac, bca, cab, cba.
Exemplo 12: De um grupo de sete pessoas, quantas comissões de três pessoas podemos formar? Solução:
Evidentemente, só interessa os indivíduos em si, e não a ordem que os consideramos. Temos, pois, um
problema de combinações de 7 elementos tomados 3 a 3, cujo resultado é:
7! 7x6x5x4!
C37= = = .
3!(7 3)! − 35
3x2x1x4!
Exemplo 13: De um grupo de sete pessoas, quantas comissões podemos formar, compostas de um
presidente, um secretário e um tesoureiro?
Solução: Aqui já não interessam apenas os indivíduos em si, mas também os cargos que irão ocupar (ou
seja, a ordem que os consideramos). Uma comissão em que João é presidente, Helena secretária e Renata
tesoureiro é diferente da comissão composta por Helena presidente, Renata secretária e João tesoureiro.
Estamos, pois, em face de um problema de arranjos de 7 elementos tomados 3 a 3, cujo resultado é:
7! 7x6x5x4!
A37= =
= 210
(7 3)! − 4!
Exemplo 14. Seja o experimento aleatório “de um grupo de 3 mulheres e 4 homens, seleciona-se duas
pessoas de uma só vez”.
a) Obter o espaço amostral referente ao número de homens selecionados.
Como são selecionadas duas pessoas fica.
S = {0,1,2} Espaço amostral não equiprovável.
b) Obter a probabilidade de ocorrência de cada um dos pontos do espaço amostral. Como são selecionadas duas
pessoas de um só vez, o espaço amostral básico do experimento será 7!
C27=
=pontos amostrais, ou seja, 21 diferentes grupos de 2 pessoas que
composto por: 21
2!(7 2)!
−
podem ser formados a partir de 7 pessoas.
Os resultados podem ser resumidos da seguinte forma:

43
02
Homens Mulheres Número de grupos Probabilidade CC3
3/21
4⋅=
0 23
11
12 13
12/21
1
C4⋅C =
20
6
6/21
2
C4⋅C =
0
3
Soma = 1,0
Exemplo 15. Uma caixa contém 10 peças, das quais 3 são defeituosas. Extraem-se três ao acaso. Qual a
probabilidade de:
a) A = {todas serem defeituosas} c) C = {uma ser defeituosa}
3
CC ⋅ P(A)3 0
1
1
CC⋅ 2
63
=120
=
3
P(C)3
7
= 3
=7
10 10
C 120 C
b) B = {duas serem defeituosas} d) D = {nenhuma ser defeituosa}
2 1 0
CC P(D)3
CC⋅ 21 3
⋅ 35
P(B)3 = 3
=
=
120
7
=7
3
10 10
C 120 C
Fato: Observa-se que os eventos acima formam o espaço amostral que representa o número de
peças defeituosas retiradas: S = {3, 2, 1, 0} 1 21 35
63 120
P(S) = P(A) + P(B) + P(C) + P(D) = + + + = = 1
2.9. Probabilidade 120 120 120 120 120

Condicional
A noção de probabilidade condicional é uma ferramenta básica da teoria das probabilidades. As

considerações seguintes conduzem de modo natural à definição formal.
A ideia de probabilidade condicional pode ser entendida através de um exemplo. Imagine que um
dado foi jogado. Qual é a probabilidade de ter saído a face 5? Como o dado tem 6 faces, a probabilidade
de ter ocorrido a face com número 5 é: 1/6.
Imagine agora que o dado foi jogado e já se sabe que ocorreu uma face com número ímpar. Qual é a
probabilidade de ter saído a face 5? Note que a resposta a esta pergunta é diferente da resposta dada à
pergunta anterior. Se saiu uma face com número ímpar, só podem ter ocorrido os números:1, 3 ou 5. Logo,
a probabilidade de ter ocorrido 5 é: 1/3.
A probabilidade de ocorrer determinado evento pode ser modificada quando se impõe uma
condição. Como mostra o exemplo, a probabilidade de ocorrer 5 no jogo de um dado é 16,67%, mas, sob a
condição de ter ocorrido a face com número ímpar, a probabilidade de ocorrer 5 é 33,33%.
Denomina-se probabilidade condicional à probabilidade de ocorrer determinado evento sob uma
dada condição. Indica-se a probabilidade condicional de ocorrer o evento A sob a condição de ter ocorrido
B por P(A/B), que se lê “ probabilidade de A dado B”.
Considere este outro exemplo:
Exemplo 16: Sejam 200 alunos matriculados em dado Instituto de Matemática, num dado ano, assim
distribuídos:
Curso \ Sexo Homens (H) Mulheres (M) Totais Matemática Pura (P) 70 35 105
Matemática Aplicada (A) 25 15 40 Estatística (E) 10 20 30
Inglês (I) 15 10 25 Totais 120 80 200
44
Vamos indicar por P o evento que ocorre quando escolhendo-se ao acaso um aluno do instituto e
este for um estudante de Matemática Pura (P), A, E, I, H e M têm significados análogos. Desta maneira,
vemos que:
Podemos considerar uma subpopulação formada pelos homens, em que n H = 120. A probabilidade
de que um aluno do Instituto, escolhido ao acaso nessa subpopulação (somente homens), seja um
estudante de Inglês é igual a nHI/nH, onde nHI é o número de homens estudantes de Inglês. O resultado será
15/120 = 3/24.
O símbolo mais comumente adotado é P(I/H), que pode ser lido como a "probabilidade do evento
I (estudante de Inglês) dado o evento H (sabendo-se que a pessoa escolhida é Homem)". Em símbolos: ()
()
n IH ∩
P I/H ==∩ PIH
H
n P(H)
É claro que cada subpopulação pode ser considerada como sendo uma nova população; o termo
subpopulação é usado unicamente por conveniência de linguagem servindo para indicar que existe uma
população maior sendo considerada.
Por analogia com a fórmula acima, introduziremos agora a seguinte definição formal. Seja B um
evento cuja probabilidade é conhecida. Para um evento A, arbitrário, definimos.
( )( )
PAB
P A B∩
/ = , P(B)
P(B)
> 0.
A quantidade assim definida será chamada de probabilidade condicional de A na hipótese B (ou
dado B). No caso de todos os pontos amostrais terem probabilidades iguais, P(A/B) é o quociente
() n
P A/B ∩
=, do número de pontos amostrais comuns a A e B, pelo número de pontos de B. A B

B
n
Do mesmo modo tem-se que:( )( )
P B A∩
PAB
/ =, P(A) > 0.
P(A)
Considerar probabilidades condicionais de vários eventos com relação a uma hipótese particular H
é equivalente a escolhermos H como um novo espaço amostral, com probabilidades proporcionais às
probabilidades originais; o fator de proporcionalidade P(H) é necessário para que se tenha a probabilidade
total do novo espaço igual a 1. Essa formulação mostra que todos os teoremas gerais sobre probabilidades
são válidos também para probabilidades condicionais, com respeito a qualquer hipótese particular H. Por
exemplo, a relação fundamental para a probabilidade da ocorrência de A ou B ou ambos, toma a forma:
P[(A∪ B)/ H] = P(A/ H)+ P(B / H)− P[(A∩ B)/ H].
Se A e B forem eventos mutuamente exclusivos, então:

P[(A∪ B)/ H] = P(A/ H)+ P(B / H).
45
Exemplo 17: Para o exemplo do Quadro 1.2, se desejamos encontrar a probabilidade de um aluno
escolhido ao acaso estar matriculado em estatística sabendo-se que é Mulher, fazemos:
Eventos: E: “matriculado em Estatística”
M: “ser Mulher”.
n
, então fazemos
Desejamos saber P(E / M) 41
P(E/M) ===
20 EM
∩
M
n 80
Dada a informação da ocorrência de um evento, teremos a redução do espaço amostral. A
probabilidade condicional pode ser avaliada diretamente no espaço amostral reduzido.
Exemplo 18: Um grupo de 15 indivíduos apresenta a seguinte composição:
Homem (H) Mulher (M)

Criança (C) 5 3
Adulto (A) 5 2
Um indivíduo é selecionado ao acaso, sabendo-se que é mulher, qual a probabilidade de ser criança?
PCM n 3
(/)== n
CM M
∩
5
2.10. Teorema do Produto das Probabilidades

Vimos que a probabilidade de A na hipótese B (ou dado B) é:
P(A/B)∩
= P(A B) P(B)
Multiplicado cruzado a expressão anterior, temos:

P(A ∩B) = P(B)⋅P(A/B), ou também podemos ter P(A ∩B) = P(A)⋅P(B/ A) .
Exemplo 19: Uma moeda será jogada duas vezes. Qual a probabilidade de ocorrer cara nas duas jogadas?
A probabilidade de ocorrer cara na primeira jogada é 50%, e a probabilidade de ocorrer cara na segunda
jogada também é 50%.
O fato de ocorrer cara na primeira jogada não modifica a probabilidade de ocorrer cara na segunda
jogada (os eventos são independentes).
Para se obter a probabilidade de ocorrer cara nas duas jogadas, faz-se o produto.
1
⋅=
1 1
4
2 2
46
Exemplo 20: Uma urna contém 2 bolas brancas e três vermelhas. Retiram-se duas bolas dessa urna com
reposição. Quais as diferentes ocorrências que podem ocorrer:
2 2 4
P(1º B ∩ 2º B) = P(1º B)⋅ P(2º B /1º B) = ⋅ =
52 53 25 6
P(1º B ∩ 2ºV ) = P(1º B)⋅ P(2ºV /1º B) = ⋅ =
53 52 25 6
P(1ºV ∩ 2º B) = P(1ºV )⋅ P(2º B /1ºV ) = ⋅ =
53 53 25 9
P(1ºV ∩ 2ºV) = P(1ºV)⋅ P(2ºV /1ºV) = ⋅ =
5 5 25
Exemplo 21: Uma urna contém 2 bolas brancas e três vermelhas. Retiram-se duas bolas dessa urna sem
que haja reposição. Quais as diferentes ocorrências que podem ocorrer:
2 1 2 1
P(1º B ∩ 2º B) = P(1º B)⋅ P(2º B /1º B) = ⋅ = =
52 43 206 103
P(1º B ∩ 2ºV ) = P(1º B)⋅ P(2ºV /1º B) = ⋅ = =
53 42 206 103
P(1ºV ∩ 2º B) = P(1ºV )⋅ P(2º B /1ºV ) = ⋅ = =
53 42 206 103
P(1ºV ∩ 2ºV ) = P(1ºV )⋅ P(2ºV /1ºV ) = ⋅ = =
5 4 20 10
Exemplo 22: Dentre 10 alunos de uma sala, 3 são mulheres. Duas pessoas são chamadas aleatoriamente,
uma após a outra, sem reposição. Pede-se:
a) Qual a probabilidade de ambas serem homens?

7 6 42 7
P(1ºH ∩ 2ºH) = P(1ºH)⋅P(2ºH /1ºH) = ⋅ = =
10 9 90 15
b) Qual a probabilidade de surgir primeiro um homem e depois uma mulher?
7 3 21 7
P(1ºH ∩ 2ºM) = P(1ºH)⋅P(2ºM /1ºH) = ⋅ = =
10 9 90 30
c) Qual a probabilidade de surgir primeiro uma mulher e depois um homem?
3 7 21 7
P(1ºM ∩ 2ºH) = P(1ºM)⋅P(2º H /1ºM) = ⋅ = =
d) Qual a probabilidade mulheres? 9 2 301

de surgirem duas 103 906
P(1ºM ∩ 2ºM) = P(1ºM)⋅P(2ºM /1ºM) = ⋅ = =

10 9 90 15
Fato: Observa-se que os eventos acima formam o espaço amostral representado por:
S = {HH, HM, MH, MM}
42
P(S) = P(A) + P(B) + P(C) + P(D) = + + + = =
90 2190 6 90 9090 1
2190
47
2.11. Independência Probabilística
A probabilidade condicional P(A/B) não é, em geral, igual a probabilidade P(A). No caso em que P(A
/B) = P(A)diremos que A é estatisticamente (probabilisticamente) independente de B. A expressão P(A
∩ B) = P(B)⋅ P(A / B)segundo a condição P(A /B) = P(A)pode ser escrita da forma: P(A ∩ B) =
P(B)⋅P(A)ou P(A ∩ B) = P(A)⋅ P(B)
Essa equação é simétrica em A e B, e mostra que sempre que A for independente de B, B também
será independente em relação a A.
Definição: dois eventos A e B são estocasticamente independentes, ou simplesmente, independentes se for

válida a igualdade P(A ∩ B) = P(B)⋅P(A).
Suponha agora três eventos A, B e C, tais que:
P(A B) P(A) P(B)
a) ∩=⋅ ⎪
∩=⋅ ⎬⎫
P(B C) P(B) P(C) ∩ = ⋅ os eventos A, B e C são independentes
P(A C) P(A) P(C) ⎪
dois a dois. ⎭
b) P(A ∩ B ∩ C) = P(A)⋅ P(B)⋅ P(C).

Se os eventos A, B e C satisfazem as condições (a) e (b), eles são mutuamente independentes.
Exemplo 23: Para entender a ideia de eventos independentes, imagine que um dado e uma moeda são
jogados ao mesmo tempo e se pergunta:
a) qual é a probabilidade de sair cara na moeda?
b) qual a probabilidade de sair cara na moeda sabendo que saiu a face 6 no dado?
Dos 12 eventos possíveis e igualmente prováveis apresentados, seis correspondem à saída de cara
na moeda. Então a probabilidade de sair cara na moeda é:
6/12 = 0,5 ou 50%
Para obter a probabilidade de sair cara na moeda, sabendo que saiu 6 no dado. Dos dois eventos que
correspondem à saída de 6 no dado, um corresponde à saída de cara na moeda. Então a probabilidade de
sair cara na moeda, sabendo que saiu 6 no dado é: 1/2 = 0,5 ou 50%
Neste exemplo, a probabilidade de ocorrer um evento (sair cara na moeda) não foi modificada pela
ocorrência de outro evento (sair 6 no dado). Diz-se então que esses eventos são independentes.
Por definição, dois eventos são independentes quando a probabilidade de ocorrer um deles não é
modificada pela ocorrência do outro. Quando se jogam um dado e uma moeda, o resultado que ocorre na
moeda não depende do que ocorre no dado. Então esses eventos são independentes. Escreve-se P(A/B) =
P(A).
Na área biológica existem vários exemplos de eventos independentes e de eventos dependentes.
Assim olhos claros e cabelos claros são eventos dependentes, porque a probabilidade de uma pessoa ter
olhos claros é maior se a pessoa tem cabelos claros. Já olhos claros e idade avançada são eventos
independentes, porque a probabilidade de uma pessoa ter olhos claros não aumenta (ou diminui) com a
idade.
48
Exemplo 24: A probab. de o homem viver 10 anos além dos 60 anos é 1/4 e da mulher 1/3. Obs.: Sejam
os eventos H: “o homem viver 10 anos após os 60” e M: “a mulher viver 10 anos após os 60”. É evidente
que os eventos H e M são independentes.
1
P(H) =⇒ prob. do homem estar vivo 10 anos após os 60 anos.
4
1 3
P(H) =1− =⇒ prob. do homem não estar vivo 10 anos após os 60 anos.
1 4 4
P(M) =⇒ prob. da mulher estar viva 10 anos após os 60 anos. 3

1 2
P(M) =1− =⇒ prob. da mulher não estar viva 10 anos após os 60 anos.
3 3
Encontre a probabilidade de:
1
1
1
a) Ambos viverem mais 10 anos após os 60 anos?
12
P(H ∩ M) = P(H)⋅P(M) = ⋅ =
4
3
3
1
3
1
b) Somente a mulher viver mais 10 anos?
P(H ∩ M) = P(H)⋅P(M) = ⋅ = =
4 3
4
12
1
1
1
1
1
c) Ao menos um deles viver mais 10 anos?
P(H ∪ M) = P(H) + P(M) − P(H ∩ M) = + − ⋅ =
4
3
4
3
2
3
2
6
1
d) Nenhum dos dois viver 10 anos após os 60 anos?
P(H ∩ M) = P(H)⋅ P(M) = ⋅ = =
4
3
12
2
Exemplo 25: Numa amostra aleatória retirada da população obtiveram-se os dados:
Com Bronquite (CB) (SB) Total
Sem Bronquite
Fumantes (F) 40 20 60 Não Fumantes (NF) 15 25 40 Total 55 45 100
Determine as seguintes probabilidades:
40
P(CB/ F) = = =
2
a) de um indivíduo fumante ter bronquite. 0,6667
60 3
15
P(CB/ NF) = = =
3
b) de um indivíduo não fumante ter bronquite. 0,3750
40
8
c) de um indivíduo ser fumante.
53
60
P(F) = =
100
d) de um indivíduo ter bronquite.
2011
55
P(CB) = =
100
e) de um indivíduo ser fumante e ter bronquite.
208
40
P(F ∩ CB) = =
100
f) os eventos F “ser fumante” e CB “ter bronquite”, são independentes?
Para os dois eventos serem independentes deve-se verificar a condição

3 11 33
P(F ∩ CB) = P(F)⋅ P(CB) = ⋅ =. Como pode-se verificar no item e que na realidade
5 20 100
40
P(F ∩ CB) = , então os eventos F “ser fumante” e CB “ter bronquite” não são
independentes.100
49
2.12. Teorema da Probabilidade Total (ou diagrama de árvore).
Enunciaremos agora um teorema útil que relaciona a probabilidade de um evento com
probabilidades condicionais. Sejam B1, B2, ..., Bn eventos mutuamente exclusivos e exaustivos*. Então
para um evento arbitrário A,
P(A) P(A/ B ) P(B ) P(A/ B ) P(B ) ... P(A/ B ) P(B )
=⋅+⋅++⋅
1122nn
∑
i i P(A) P(A / B ) P(B )
=⋅
i1
=
A utilidade deste resultado reside no fato de que as probabilidades que compõem o somatório
acima são em geral mais fáceis de calcular que a própria probabilidade de A.
* {B1, B2, ..., Bn} é um conjunto de eventos mutuamente exclusivos e exaustivos se quaisquer dois eventos
Bi e Bj não podem ocorrer ao mesmo tempo e um deles deve ocorrer. Simbolicamente, Bi ∩Bj = Φ , i ≠ j e
B1 ∪B2 ∪...∪Bn= S
B1 B2 B3
A
B4B5
Partição disjunta de Ω em eventos Bi (i= 1, 2, .., 5), e sua interseção com o evento A.
2.13. Teorema de Bayes

Com base na definição de probabilidade condicional, pode-se estabelecer um resultado bastante
útil, geralmente conhecido como Teorema de Bayes.
Sejam A e B dois eventos arbitrários com P(A) > 0 e P(B) > 0. Então,
( )( ) ( )
P B A×
=/
PABPB
/
P(A)
Combinando este resultado com o teorema da probabilidade total, temos como conseqüência,
( )( ) ( )
PABPB
PBA / ×
jj
/,=n
j
∑ ()()
PABPB
i 1 ii
= /
×
para qualquer j onde os Bi representam um conjunto de eventos mutuamente exclusivos e exaustivos.
50
Exemplo 26: Em determinada universidade os alunos de português estão divididos em três turmas, da
seguinte forma:
• Turma 1 com 10 alunos, dos quais 4 são Químicos.
• Turma 2 com 5 alunos, dos quais 1 é Químico.
• Turma 3 com 20 alunos, dos quais 3 são Químicos.
1/3 1/3 4/10 4/5 3/20 N Q

6/10 Q
T1 T2 ⇒
1/5 N
1/3 T3 Q
17/20 N
a) selecionando-se uma turma aleatoriamente, em seguida selecionando um aluno, também aleatoriamente.

Qual a probabilidade do aluno selecionado ser de Química?
Pelo Teorema da Probabilidade Total
teremos: 1 04 6 01 5
1
1 2 03
1 1
1
P(Q) P(T ) P(Q/T ) P(T ) P(Q/T ) P(T ) P(Q/T ) = 1⋅1 + 2⋅2 + 3⋅3 = ⋅ + ⋅ + ⋅ = =
3
3
5
3
4
e de não estudar química será:
2 01 7
6 04 5
1
1 06
1
4
1
3
P(N) P(T ) P(N /T ) P(T ) P(N /T ) P(T ) P(N /T ) = 1⋅1 + 2⋅2 + 3⋅3 = ⋅ + ⋅ + ⋅ = =
3
3
5
3
4
Fato:P(S) = P(Q) + P(N) =1
b) selecionando-se uma turma aleatoriamente, em seguida selecionando um aluno, também aleatoriamente,
verificou-se que o aluno é químico. Qual a probabilidade dele ser da T 3?
Pelo Teorema da Bayes teremos:
P(T /Q) P(T ) P(Q/T ) ⋅ 13 ⋅ 1

2 03
3 =
=
=
33
1
1 04
1
1
1
2 03
P(T ) P(Q/T ) P(T ) P(Q/T ) P(T ) P(Q/T )
⋅ + ⋅ + ⋅ 112233 ⋅+⋅+⋅ 5
3 3 5 3
51
Exemplo 27: Considerando-se 3 urnas com a seguinte composição:
• Urna 1 contém 12 bolas sendo 10 Vermelhas e 2 Brancas.
Uma bola é extraída de uma das urnas, sendo a escolha da urna feita do seguinte modo: um dado é lançado
uma vez,
- se sair a face 1, escolhe-se a urna 1,
- se sair as faces 2 ou 3, escolhe-se a urna 2, e
- se sair as faces 4, 5 ou 6, escolhe-se a urna 3.
a) Qual a probabilidade da bola extraída ser Branca?

b) Qual a probabilidade de se ter escolhido a urna 1, dado que a bola extraída é Vermelha?
Seja o diagrama de árvore:
1/6 2/6 10/12 4/10 B V

V
U1 U2 2/12 ⇒
6/10 B
U3V 9/15
3/6
6/15 B
a) Qual a probabilidade da bola 1 3
extraída ser Branca? 65
2
Pelo Teorema da Probabilidade Total 1 2
2 1 56
teremos:
1 04 3 61 3
P(B) P(U ) P(B/ U ) P(U ) P(B/ U ) P(U ) P(B/ U ) = 1⋅1 + 2⋅2 + 3⋅3 = ⋅ + ⋅ + ⋅ = =
e de ser será: 62 63 180 115
vermelha 61 1 21 0 1 06 1 59 3 62 3
P(V) P(U ) P(V / U ) P(U ) P(V / U ) P(U ) P(V / U ) = 1⋅1 + 2⋅2 + 3⋅3 = ⋅ + ⋅ + ⋅ = =
6
6
6
180
Fato: P(S) = P(B) + P(V) =1
b) Qual a probabilidade de se ter escolhido a urna 1, dado que a bola extraída é Vermelha?
Pelo Teorema da Bayes teremos:
P(U / V) P(U ) P(V/ U ) ⋅ 16 ⋅
1 21 0 1 21 0 2 35
1 =
=
=
11
1
2
1 06
3
1 59
P(U ) P(V/ U ) P(U ) P(V/ U ) P(U ) P(V/ U )
⋅ + ⋅ + ⋅ 112233 ⋅+⋅+⋅
6 6 6
52
2.14. Exercícios: Introdução a Probabilidade
1. Lance um dado e uma moeda.

a) Construa o espaça amostral.
b) Enumere os seguintes eventos:
A = {coroa, marcado por número par}
B = {cara, marcado por número ímpar}
C = {múltiplos de três}
c) Expresse os eventos:
I) B
II) A ou B ocorrem
III) B e C ocorrem
IV) A ∪ B
d) Verifique dois a dois os eventos A, B e C e digam quais são mutuamente
2. Se
exclusivos. 21
e
P(A) = 41
P(B) =e A e B são mutuamente exclusivos, calcule:
a) P(A)c) P(A ∩ B)e) P(A ∩ B)

b) P(B)d) P(A ∪ B)
,
P(A) = 31
3. Se e
21 P(B) = 41
P(A ∩ B) =, calcule:
a) P(A ∪ B)b) P(A ∪ B)c) P(A ∩ B)

4. Determine a probabilidade de cada evento:
a) um número par apareça no lançamento de um dado não viciado;
b) um rei aparece ao extrair-se uma carta de um baralho;
c) pelo menos uma cara aparece no lançamento de 3 moedas;
5. Um número inteiro é escolhido aleatoriamente dentre os números 1, 2, 3, ... , 30. Qual a
probabilidade de:
a) o número ser divisível por 5;
b) terminar em 3;
c) ser primo; e
d) ser divisível por 6 ou 8.
6. Uma moeda é lançada três vezes e observado o número de caras. Qual a prob. de
ocorrer: a) três caras; d) duas caras e uma coroa;
b) nenhuma cara; e) pelo menos uma cara; e
c) exatamente uma cara; f) pelo menos uma coroa.
7. A probabilidade de um aluno X resolver esse problema é e a do aluno Y é

53 74. Qual a
probabilidade de que o problema seja resolvido?
8. No lançamento de um dado, qual a probabilidade de sair o número 5 ou um número par?
53
9. As probabilidades de três jogadores marcarem um pênalti são respectivamente: , e

32 54 107. Se cada um
cobrar uma única vez, qual a probabilidade de:
a) todos acertarem;
b) apenas o primeiro acertar;
c) todos errarem.
10. Suponha que a probabilidade que um vigia noturno num navio com luzes apagadas descubra um
periscópio em certas condições de tempo é 0,7. Qual é a probabilidade de que a combinação de dois vigias
similares A e B, fizesse a descoberta?
11. Uma urna contém 12 bolas: 5 brancas, 4 vermelhas e 3 pretas. Outra contém 18 bolas: 4 brancas, 6
vermelhas e 8 pretas. Uma bola é retirada de cada urna. Qual a probabilidade das duas bolas serem da
mesma cor?
12. Uma urna contém 7 bolas pretas e 3 vermelhas. Foram extraídas duas bolas com reposição. Qual a
probabilidade de terem sido uma bola preta e uma vermelha?
13. Uma urna contém 7 bolas pretas e 3 vermelhas. Foram extraídas duas bolas sem reposição. Qual a
probabilidade de terem sido uma bola preta e uma vermelha?
14. Uma caixa A contém 8 peças, das quais 3 são defeituosas e uma caixa B contém 5 peças, das quais
duas são defeituosas. Uma peça é retirada aleatoriamente de cada caixa:
a) qual a probabilidade p de que ambas as peças não sejam defeituosas?
b) qual a probabilidade p de que uma peça seja defeituosa e a outra não?
15. Das dez alunas de uma classe, três tem olhos azuis. Se duas delas são escolhidas aleatoriamente, qual é
a probabilidade de:
a) ambas terem olhos azuis?
b) nenhuma ter olhos azuis?
c) pelo menos uma ter olhos azuis?
16. Dois cães são retirados de um canil contendo 10 cães, dos quais 8 são fêmeas. Determine a
probabilidade de que os dois cães retirados sejam fêmeas.
17. A probabilidade de uma mulher estar viva daqui a 30 anos é 3/4 e de seu marido é 2/5. Calcular a
probabilidade de:
a) apenas o homem estar vivo;
b) somente a mulher estar viva;
c) ambos estarem vivos, e
d) pelo menos um estar vivo.
18. Considerando o espaço amostral de um experimento constituído do lançamento de dois dados

perfeitamente simétrico, pede-se:
a) qual a probabilidade de que o primeiro dado mostre a face 2 e o segundo a 3?
b) qual a probabilidade de que ambos os dados mostrem a mesma face?
c) qual a probabilidade de que o segundo dado mostre um número ímpar?
54
19. Jogam-se dois dados. Se as duas faces mostram números diferentes, qual é a probabilidade de que
uma das faces seja 4?
20. Seja E: lançar dois dados, e:
A ={(x1, x2)/ x1 + x2 = 8}, ou seja, a soma ser 8.
B ={(x1, x2)/ x1 = x2}, ou seja, o primeiro resultado ser igual ao segundo.
C ={(x1, x2)/ x1 + x2 =10}, ou seja, a soma ser 10.
Calcular: a) P(A)d) P(A/ B)g) P(A∩ B)
b) P(B)e) P(B/ A)h) P(A∪ B)
c) P(C)f) P(A/C)i) P(A ∩ B)
21. Um dado é viciado de tal forma que a probabilidade de sair um certo número é proporcional ao seu
valor. Pede-se:
a) qual a probabilidade de sair o 3, sabendo-se que o ponto que saiu é ímpar?
b) qual a probab. de sair um número par, sabendo-se que saiu um número maior que 3?
22. Definir e dar exemplos de:

a) Eventos mutuamente exclusivos b) Eventos independentes.
23. Sejam A e B eventos cujas probabilidades são: P(A) = 1/4; P(B) = p; P(A∪B) =
1/3. Determine p para os casos em que:
a) A e B são mutuamente exclusivos.
b) A e B são independentes.
c) A é subconjunto de B.
24. Seja S = {1, 2, 3, 4} um espaço amostral equiprovável e os eventos A = {1, 2}, B =

{1, 3} e C = {1, 4}. Verifique se os eventos A, B e C são mutuamente independentes.
25. Considere a escolha aleatória de um entre os dez primeiros números inteiros positivos (a partir de um),
e os eventos:
A = {1, 2, 3, 4, 5} B = {4, 5, 6, 7} C = {5, 9}. Pede-se:
Os eventos são mutuamente independentes? Mostre por quê.
26. A e B são eventos mutuamente exclusivos. Determine quais das relações abaixo são verdadeiras e
quais são falsas. Justifique.
a) P(A/B) = P(A) b) P(A) = 0; P(B) = 0; ou ambas c) P(A∩B) = P(A).P(B)
27. Dado ( )21 P A =; ( )31

P B = ; ( )4 1 P A∩ B =, calcular:
a) P(A∪B); b) P(A/ B)c) P(B/ A)
28. Dado ( )21 P A =; ( )31

P B = ; ( )4 1 P A∩ B =, calcular:
a) P(A)b) P(B)c) P(A∪B) d)P(A ∩ B)e)P(A / B)f) P(B / A)
55
29. De 100 estudantes, 30 frequentam um curso de inglês, 20 frequentam um curso de computação e 10
frequentam tanto um curso de inglês como um curso de computação. Um estudante é selecionado ao
acaso. a) Determine a probabilidade de que ele não frequente o curso de inglês.
b) Determine a probabilidade de que ele frequente pelo menos um dos cursos.
c) Determine a probabilidade de que ele não frequente nenhum desses dois cursos. d) Se ele frequenta o
curso de inglês, determine a probabilidade de que ele também frequente o curso de computação.
e) Se ele frequenta o curso de computação, determine a probabilidade de que ele também frequente o
curso de inglês.
30. Em um certo colégio, 25% dos alunos foram reprovados em matemática, 15% em química e 10% em
matemática e química ao mesmo tempo. Um estudante é selecionado aleatoriamente. Pede-se: a) se ele foi
reprovado em química, qual a prob. de ter sido reprovado em matemática? b) se ele foi reprovado em
matemática, qual a prob. de ter sido reprovado em química? c) qual a probabilidade de ter sido reprovado
em matemática ou química?
31. A probabilidade de um carro ser vendido para indivíduos da classe A é 3/4, da B é 1/6, da C é 1/20 e
da D é 1/30. A probabilidade do indivíduo da classe A comprar um carro da marca E é 1/10; da B
comprar da marca E é 3/5, da C é 2/10 e da D é 1/10. Em certa loja vendeu-se um carro da marca E. Qual
a probabilidade de um indivíduo da classe B o tenha comprado?
32. Em certo colégio 5% dos homens e 3% das mulheres tem mais de 1,80 m de altura. Por outro lado
60% dos estudantes são homens. Se um estudante é selecionado aleatoriamente e tem mais de 1,80 m de
altura, qual a probabilidade de que o estudante seja mulher?
33. Sejam dois currais A e B com a seguinte composição: curral I: 15 animais dos quais 5 estão
amamentando; curral II: 8 animais dos quais 3 estão amamentando. Todos os animais são identificados por
números. Um deles é selecionado aleatoriamente.
a) Constata-se que está amamentando. Determine a probabilidade de que o animal seja do curral I.
b) Determine a probabilidade de que o animal escolhido não esteja amamentando.
34. Três máquinas, A, B e C produzem respectivamente 40%, 50% e 10% do total de peças de uma
fábrica. As percentagens de peças defeituosas produzidas pelas respectivas máquinas são 3%, 5% e 2%.
Uma peça é sorteada ao acaso e verifica-se que é defeituosa. Qual a probabilidade de que a peça tenha
vindo da máquina A?
35. São dadas três caixas, como segue:

A caixa I tem 10 lâmpadas, das quais 4 são defeituosas
A caixa II tem 6 lâmpadas, das quais 1 é defeituosa
A caixa III tem 15 lâmpadas, das quais 5 são defeituosas.
Selecionamos uma caixa aleatoriamente e então retiramos uma lâmpada, também aleatoriamente. Qual a
probabilidade dela ser defeituosa?
56
36. Uma caixa A contém 8 peças, das quais 3 são defeituosas e uma caixa B contém 5 peças das quais 2
são defeituosas. Uma peça é retirada aleatoriamente de cada caixa:
a) Qual a probabilidade de que ambas as peças não sejam defeituosas?
b) Qual a probabilidade de uma peça ser defeituosa e outra não?
c) Qual a probabilidade de pelo menos uma peça ser defeituosa?
37. Você pode jogar na MEGASENA escolhendo 6 números pertencentes ao intervalo de 01 a 60. São
sorteados 6 números de forma aleatória pela CEF. Pede-se:
a) qual a probabilidade de você ganhar jogando apenas um cartão?
b) e se você apostar 500 cartões?
c) e se você marcar oito números no mesmo cartão?
57
Respostas
1. a)S = {C1,C2,C3,C4,C5,C6,K1,K2,K3,K4,K5,K6}
b)A = {K2,K4,K6} B = {C1,C3,C5} C = {C3,C6,K3,K6}

III = {C3}
c)I = {C2,C4,C6,K1,K2,K3,K4,K5,K6} II = {K2,K4,K6,C1,C3,C5} IV =
{C1,C2,C3,C4,C5,C6,K1,K2,K3,K4,K5,K6}
d)A ∩ Bsão M.E.A∩Cnão são M.E.B ∩Cnão são M.E. 2. a) 1/2 b) 3/4 c) 0
d) 3/4 e) 1/4
3. a) 7/12 b) 3/4 c) 5/12
4. a) 1/2 b) 1/13 c) 7/8
5. a) 1/5 b) 1/10 c) 1/3 d) 7/30
6. a) 1/8 b) 1/8 c) 3/8 d) 3/8 e) 7/8 f) 7/8
7. 29/35
8. 2/3
9. a) 28/75 b) 1/25 c) 1/50
10. 0,91 11. 17/54 12. 21/50 13. 7/15
14. a) 3/8 b) 19/40 c) 8/15
15. a) 1/15 b) 7/15
16. 28/45
17. a) 1/10 b) 9/20 c) 3/10 d) 17/20
18. a) 1/36 b) 1/6 c) ½
19. 1/3
20. a) 5/36 b) 1/6 c) 1/12 d) 1/6 e) 1/5 f) 0 g) 1/36 h) 5/18 i) 13/18 21. a) 1/3 b) 2/3
23.a) 1/12 b) 1/9 c) 1/3
24. A, B e C não são mutuamente independentes.
25. A, B e C não são mutuamente independentes.
26. a) falsa b) falsa c) falsa
27.a) 7/12 b) 3/4 c) ½
28. a) 1/2 b) 2/3 c) 7/12 d) 5/12 e) 5/8 f) 5/6
29. a) 7/10 b) 2/5 c) 3/5 d) 1/3 e) 1/2
30. a) 2/3 b) 2/5 c) 3/10
31. 60/113
32. 2/7
33. a) 8/17 b) 31/48
58
Cap.3. Variáveis Aleatórias
3.1. Conceito
É toda e qualquer variável associada a uma probabilidade, isto é, seus valores estão
relacionados a um experimento aleatório. Em termos de experimentação, variáveis aleatórias são as
características avaliadas nas unidades experimentais. Por exemplo, num experimento para selecionar
qual a melhor entre quatro rações, a característica avaliada seria ganho de peso, expressa em kg. Para
avaliar qual o melhor tratamento térmico a ser submetido um produto, a variável medida seria o
número de microorganismo que existe após os diversos tratamentos.
Seja E um experimento aleatório e S o espaço amostral associado a este experimento. Uma
função X, que associe a cada elemento a pertencente a S um número real X(a), é denominada variável
aleatória.
a X X(a)
S
R
Exemplo 1: Considere o lançamento de duas moedas e seja X = número de caras obtidas.
S = {cc, ck, kc, kk}

X = {0, 1, 2}, isto é, X(kk) = 0, X(ck) = X(kc) = 1, X(cc) = 2
Observações:
1) O uso de variáveis aleatórias equivale a descrever os resultados de um experimento aleatório por meio
de números ao invés de palavras, o que apresenta a vantagem de possibilitar melhor tratamento
matemático;
2) Nem toda função é uma variável aleatória.
3) As Variáveis Aleatórias podem ser classificadas em qualitativas e quantitativas.
4) Uma V. A. quantitativa pode ser discreta ou contínua.
3.2. Variável Aleatória Discreta (v.a.d.)

3.2.1. Definição
Seja X uma v.a.. Se o número de valores de X for finito ou infinito enumerável então X será uma
v.a.d.. Em geral é obtida mediante alguma forma de contagem.
Exemplos:
- nº de acidentes ocorridos em uma semana;
- n° de peças defeituosas produzidas por um fabricante;
- nº de filhos do sexo masculino por casal; e
- nº de leitões por leitegada.
59
3.2.2. Função de Probabilidade
Chama-se função de probabilidade (f.p.) da variável aleatória discreta X, a função P(X = x i) =
P(xi) = pi que a cada valor de xi, associa sua probabilidade de ocorrência.
A função P(xi) será uma função de probabilidade se satisfizer às seguintes condições:
i) P(xi) ≥ 0, para todo xi
n
ii)
∑=
P(xi) 1
i
A coleção de pares [xi, P(xi)], i = 1, 2, ... , n, denominaremos distribuição de probabilidade da
v.a.d. X, que pode ser representada por meio de tabelas e gráficos.
3.2.3. Variável Aleatória Discreta Uniformemente Distribuída
Este é o caso mais simples da v.a. discreta, onde cada possível valor ocorre com a mesma
probabilidade.
Definição: A variável aleatória discreta X, assumindo os valores 1 2 xn x ,x ,...,, tem distribuição uniforme,
se e somente se,
1
P(X = xi) = P(xi) = p =, para todo i = 1, 2, ... , n.
n
i) Tabela
...
xi 1 x 2 x 3 x n x
P(x )i1/n 1/n 1/n ... 1/n
ii) Gráfico ...X
P(X) x1 x2 x3 xn
1/n
Exemplo 2: Seja E: “o lançamento de um dado não viciado”.

O espaço amostral é S = {1, 2, 3, 4, 5, 6}
Obs.: Cada ponto de S tem probabilidade de ocorrer igual a 1/6.
i) Tabela
xi1 2 3 4 5 6
P(x )i1/6 1/6 1/6 1/6 1/6 1/6
# Este exemplo trata-se de uma v.a.d. X = {nº de pontos obtidos}, uniformemente distribuída.
ii) Gráfico x1 x2 x3 x4 x5 X x6
P(X)
1/6
60
Exemplo 3: Seja E: “o lançamento de duas moedas”.
Seja a v.a.d. X = {nº de caras}, se S = {kk, kc; ck, cc}, então X = {0, 1, 2}
i) Tabela
xi x1 = 0 x2 =1 x 2 3 =
P(x )i1/4 2/4 1/4
# Este exemplo trata-se de uma v.a.d. X = {nº de caras obtidas}.
ii) Gráfico iii) Fórmula P(X) 2/4 1/4 1

0 1 2 X
x
P(X x )
= i = ⋅2 =
4 C , para x 0, 1, 2.
# observe que nesse exemplo as duas condições para ser uma v.a. são satisfeitas.
3.3. Variável aleatória Contínua (v.a.c.)
3.3.1.Definição
Seja X uma v.a.. Se X puder assumir todo e qualquer valor em algum intervalo a ≤ x ≤ b,
onde a e b podem ser, respectivamente -∞ e +∞, então X é v.a.c.
Assim uma v.a. X é contínua quando associada a um espaço amostral infinito não enumerável.
3.3.2. Função densidade de probabilidade (f.d.p.)
A função que denotaremos por f(x), definida para a ≤ x ≤ b, será chamada f.d.p. se satisfizer às
seguintes condições:
i) f(x) ≥ 0, para todo x ∈ [a,b]

b
=
a ∫
ii) f(x)dx 1
Observações:
< < =dc
1) Para c < d ,
∫
P(c X d) f(x)dx
x
= = ; sendo assim,
=0 ∫
2) Para um valor fixo de X, por exemplo, 0 X = x, temos que P(X x ) f(x)dx 0 0
x
0
as probabilidades abaixo são todas iguais, se X for uma v.a.c.:

P(c ≤ X ≤ d) = P(c ≤ X < d) = P(c < X ≤ d) = P(c < X < d)
3) A função densidade de probabilidade f(x) não representa probabilidade. Somente quando a função for
integrada entre dois limites ela produzirá uma probabilidade, que será a área sob a curva da função
entre os valores considerados.
5) Se o conjunto de valores de X não estiver contido no intervalo [a,b], então x ∉ [a,b], tem-se f(x) = 0.
61
3.3.3. Variável aleatória contínua uniformemente distribuída
Este é o caso mais simples de v.a. contínua.
Definição: a V.A. contínua X tem distribuição uniforme no intervalo [a, b], sendo a e b finitos, se a sua
função densidade de probabilidade é dada por:
1
⎪ ⎧
⎨ ≤≤
f(x) =−ba , para a x b
⎪
⎩
f(x)
0, para outros valores de x a b x
Exemplo 4: Seja uma v.a.c. X definida pela seguinte f.d.p.
f(x) 0, para x 0 kx, para 0 x 2 0, para x 2

= < ≤≤ >
⎪ ⎪
⎨⎧ ⎩
a) Determinar o valor de k.
Por definição:
∫+∞
−∞f(x)dx = 1. Então temos:
2
⎢
⎣⎡
=⎥
⎦⎤
2
x
+=
0
+ ∫ ∫ ∫∞
2
2
⇒0dx kxdx 0dx 1
+=
+ ∫ ⇒1
k
−∞⇒0 k xdx 0 1 2
0
2
⎢ ⎡ ⇒
0 ⎣ − ⇒2k =1 21
0
4 0
⎢ ⎡
⎣ − ⇒1
2 220 =⎥ k =⎥ k=
⎦⎤ ⎦⎤
⇒1
k 2 2 2 2
b) Traçar o gráfico da f.d.p.. 0, para x 0

f(x)
f(x) ⎪ 12 < x, para 0 x 2 ≤ ≤

= ⎪ ⎨⎧ 1
⎪
⎪ ⎩ 0 2 x
0, para x 2 >
c) Calcular P(X ≤ 1). ⎤ 1 1
⎢ 1 1
⎣⎡ 22 0
1 2
⎢ 1 ⎤
⎣⎡ x 1
⎥=
10
1
1
∫−∞ ∫−∞ ∫ ∫ P(X 1) f(x)dx 0dx

≤==+=+=⋅
2 xdx 0 2 xdx 2 2
⎥=⋅−
0
P(X ≤ 1) =
2 ⎦
2 ⎦
0
2 1
4 4
0
62
Exemplo 5: Seja uma v.a.c. X definida pela seguinte f.d.p.
f(x) 0, para x 1 kx, para 1 x 3 0, para x 3

= < ≤≤ >
⎪ ⎪
⎨⎧ ⎩
a) Determinar o valor de k.
b) Traçar o gráfico da f.d.p..
c) Calcular P(X > 2).
Respostas:
b) c) 5
k=1 8 P(X > 2) =
a)
4
3.4. Função de Distribuição Acumulada

3.4.1. Definição
Dada a variável aleatória X, chamaremos de função de distribuição acumulada ou, simplesmente
função repartição F(x), a função F(x) = P(X ≤ x).
Observe que o domínio de F é todo o conjunto real.
3.4.2. Propriedades de F(x)

i) 0 ≤ F(x) ≤ 1 para todo x.
ii) Se x1 ≤ x2, então F(x1) ≤ F(x2), isto é F(x) é não decrescente.
3.4.3. F(x) para X v.a.d.

Para X uma v.a.d. temos que:
∑
F(x) P(X x) P(x )
=≤=
i
xx
i ≤
Exemplo 6: Seja X uma v.a.d. com a seguinte distribuição de probabilidade
xi-2 -1 1 2 Total P(x )i¼ 1/8 1/2 1/8 1,00
Pede-se:
a) Traçar o gráfico da distribuição de probabilidade de X.
b) Obter a função de distribuição acumulada e traçar seu gráfico.
3.4.4. F(x) para X v.a.c.

Para X v.a.c., temos que:
= ≤ = −∞ < ≤ =x
∫−∞
F(x) P(X x) P( X x) f(x)dx
Temos ainda que,
< ≤ = − =dc
∫
P(c X d) F(d) F(c) f(x)dx
63
3.5. Medidas de posição de uma variável aleatória
3.5.1. Mediana de uma v.a. (Md)

A mediana é o valor de X que divide a distribuição em duas partes equiprováveis, ou seja:
1
P(X ≤ Md) = P(X ≥ Md) =
2
1
Md
f(x)dx
Para X uma v.a.c. o valor de X = Md é obtido por:
∫ ∫+∞ −∞= =Md
f(x)dx
2
3.5.2. Moda de uma v.a. (Mo)

É o valor que possui maior probabilidade no caso discreto ou maior densidade de probabilidade no
caso contínuo.
3.5.3. Esperança matemática (média ou valor esperado de uma v. a.)

Neste item vamos aprender a quantificar o parâmetro média de uma população. A esperança
matemática de uma população é denominada uma medida da tendência central.
Parâmetro é uma medida utilizada para descrever uma característica de uma população e
caracteriza a distribuição de probabilidade de uma variável aleatória.
Sob o ponto de vista científico, a esperança matemática corresponde ao que se espera que
aconteça em média.
3.5.3.1. Caso em que X é uma v.a.d.

Seja X uma v.a.d. com a seguinte distribuição de probabilidade:
... Total
xi 1 x 2 x 3 x n x
... n
P(x )i P(x )1 P(x )2 P(x )3 P(x ) P(x ) 1
n
∑ i=
i1
=
Define-se a esperança matemática de X por:
n
∑
x112233nnii E(X) μ μ x P(x ) x P(x ) x P(x ) ... x P(x ) x P(x )
===⋅+⋅+⋅++⋅=⋅
i1
=
Exemplo 8: Seja o lançamento de quatro moedas. Considere a v.a.d. X número de caras. Calcule a
esperança matemática (média) de X.
Solução:
X01234
) 1 6 4
P(X=xi 16 16416 16 161
n
1 4 6 4 1 32
= ⋅=++++==
∑ EXxPxxxxxx
( ) ( ) 0 ii 1 2 3 4 16 16
16 16 16 16 2
i = 1
64
3.5.3.2. Caso em que X é uma v.a.c.
A esperança matemática de uma v.a.c. X é definida por:
∫∞
E(X) = xf(x)dx
−∞
Exemplo 2.9: Uma v.a.c. X apresenta a seguinte
f.d.p.: 0, para x 0
⎪ x <
⎪ ⎨⎧
f(x)Calcular E(X)
= ⎪ 2
⎪ ⎩ , para 0 x 2 ≤ ≤
0, para x 2
>
2
E(X) xf (x)dx x 0dx x ⎥
⎦⎤
+∞ 2 ∞
x 1 1 ⎢ x
0 x 2 2 2 ⎣⎡ 3
= = ⋅+ ⋅+ ⋅= = =
∫ ∫ ∫ ∫ ∫ ∫
−∞ −∞ 0
2 dx x 0dx 2 0 2 2 0
2 3 0
dx x dx 2
= − ⇒ 34
1 ⎢ 2 0 ⎤ 8 4
⎣⎡ E(X) =
E(X) ⎥ = =
33
2 3 3 ⎦ 6 3
3.5.3.3. Propriedades da esperança matemática

As propriedades a seguir valem quando X for uma v.a.c. ou quando for uma v.a.d..
P1) Se X é uma v.a. com P(X = k) = 1, então E(X) = k, sendo k uma constante (ou numa linguagem mais
simples mas menos rigorosa, pode-se dizer que a média de uma constante é a própria constante).
=
== ∫ ∫+∞
+∞
=
Prova: E(X) kf(x)dx k f(x)dx k - ∫+∞
∞ ⇒ E(X) = k, pois f(x)dx 1
-- ∞ ∞
P2) A esperança matemática do produto de uma constante por uma variável é igual ao produto da
constante pela esperança matemática da variável, ou seja, multiplicando-se uma variável aleatória
por uma constante; sua média fica multiplicada por essa constante.
+∞
==
= ∫ ∫+∞
Prova: E(kX) kxf(x)dx k xf(x)dx kE(X)
--
∞ ∞
P3) A esperança matemática da soma ou subtração de uma v.a. com uma constante é igual a soma ou
subtração da esperança matemática da variável com a constante, ou seja, somando-se ou subtraindo
se uma constante a uma v.a., a sua média fica somada ou subtraída da mesma constante.
E(X ± K) = E(X) ± K
P4) A média de uma v.a. centrada é zero, ou seja, a média dos desvios dos valores da v.a. em relação a sua
média é zero.
Obs.: Dizemos que a v.a. está centrada quando todos os valores são expressos como desvios em relação à
respectiva média, (X -μx )
Assim: E(X -μx) = E(X) - E(μx) = μx - μx = 0
P5) A esperança matemática da soma ou da subtração de duas v.a. quaisquer é igual a soma ou a subtração
das esperanças matemáticas das duas v.a., ou seja, a média da soma ou da subtração de duas v.a. é igual
a soma ou subtração das médias.
E(X ± Y) = E(X) ± E(Y)
P6) A esperança matemática do produto de duas variáveis aleatórias independentes é igual ao produto das
esperanças matemáticas das variáveis, ou seja, a média do produto de duas variáveis aleatórias
independentes é o produto das médias.
E(XY) = E(X)⋅E(Y)
65
Exemplo 10: Seja X uma v.a.d. com a seguinte distribuição de probabilidade xi-2 -1 0 1 2
Total P(x )i1/8 2/8 2/8 1/8 2/8 1,00
Determinar:
a) Esperança de X
n
2 2 1 2 1 ⇒
1 81
=
∑ i⋅i = − ⋅ + − ⋅ + ⋅ + ⋅ + ⋅ =
E(X) x P(x ) ( 2) = b) Moda 8 8 8 8 8 8
i1 (Mo) ( 1) (0) (1) (2) E(X) =
Mo = −1, 0 e 2, assim consideramos uma série multimodal.
c) Mediana (Md)
Md = 0, pois temos que a
83
P(X ≤ 0) = P(X ≥ 0) =
Exemplo 2.11: Uma v.a.c. X apresenta a seguinte f.d.p.:
2x, para 0 x 1
f(x) ⎪
⎨⎧ ≤ ≤
Determinar: = ⎪
0, para outros valores de x. ⎩
a) Esperança de X
1
x 0dx x 2xdx x 0dx 2x dx 2 x dx 2 ⎥
E(X) xf(x)dx ⎦⎤
+∞ 1 1
⎢ x
0 ∞ 1 ⎣⎡ 3
⋅+⋅+⋅===
== ∫∫∫∫∫∫
−∞ 0
−∞ 3 0
2 0 0
2 1
⎢ 33
⎣⎡ ⎤
⇒
=− 32
E(X) 2 3 3 ⎦ E(X) =
1 0 ⎥= 23
b) Moda (Mo) ⇒ é o valor de maior densidade, logo, Mo = 1.
c) Mediana (Md)
Md
⎢
⎣⎡⇒
2
=⎥
f(x)dx
=
Md
∫ −∞ ⇒ ⎦⎤
21
+=
0
∫−∞ ∫⇒21
1
x
Md
0dx 2xdx = ⇒
0 ∫ 21
0 0
2 2 2 1
2 xdx Md Md = + =
⎢ ⎡ ⇒ 1 2 ⇒
1 Md 2 2=⎥
⎣ − 2 Md = 2 Md = ±, por coerência 0,707 2 ⎦⎤
2 2 2
0 12
d) Para Y =3x +8, calcule a esperança de Y. 2

E(Y) = E(3x + 8) = E(3x) + E(8) = 3⋅E(x) + 8 = 3⋅ + ⇒ E(Y) =10
3 8
66
3.6. Medidas de dispersão de uma Variável Aleatória
3.6.1. Variância
É a medida que quantifica a dispersão dos valores em torna da média.
A variância de uma v.a. é definida por:
222
( ) [ ( )] [ ] V X =σ x= E X − E X = E X − μx
=
# para X uma v.a.d. ∑− 2
ixi V(X ) (x ) P(x )

μ
i
# para X uma v.a.c.

∫ +∞
2
V X = x − f x dx x ( ) ( ) ( )
−∞
μ
Uma fórmula prática para se calcular a variância é:
[ ( )]
2
2
V(X) = E(X ) − E X, pois
2
V(X) = E[X − E(X)] { }
22
= E X − 2XE(X) +[E(X)]
22
= E(X ) − 2E(X)E(X) +[E(X)]
222
= E(X ) − 2[E(X)] +[E(X)]
[ ( )]
2
2
V(X) = E(X ) − E X
em que:
=n
# para X uma v.a.d.
∑
2
E(X ) x P(x )
2
i
i
i1
=
# para X uma v.a.c.

∫+∞
3.6.2. Desvio padrão E(X ) = x f(x)dx 2 2 −∞
Desvio padrão da variável X é a raiz quadrada positiva da variância de X.

V(X) σ x=
3.6.3. Propriedades da variância
P1) A variância de uma constante é igual a zero. V( k ) = 0

P2) Somando-se ou subtraindo-se uma constante de uma v.a., sua variância não se altera. V(X + k) =
V(X), da mesma forma temos que: V(X − k) = V(X)
P3) Multiplicando-se uma v.a. por uma constante, sua variância fica multiplicada pelo quadrado da 2
constante. V(kX) k V(X)
=
67
Exemplo 12: Uma v.a.c. X apresenta a seguinte
função: 1
⎪ ⎧
⎨ ≤≤
f(x) = 4 x, para 1 x 3
⎪
⎩
0, para outros valores de x.
a) Esta função é uma f.d.p.?

Por definição:
∫+∞
f(x)dx =1. Então:
−∞
3
⎢
⎣⎡
1⎥
⎦⎤
1 ∫ ∫ ∫+∞ 031 x
1 2
xdx 0dx 1 =++
∫⇒
3
0dx⇒xdx 0
= + +3
=
4
⎢ 1
⎥ 4 1 9 1 4 2
−∞ ⎣⎡ ⎦⎤ 1
=−
12 2 ⇒1 21
3
⎢
⎣⎡
(x)dx =⎥
f ⎦⎤
=−
∫+∞
−∞ , logo f(x) é uma f.d.p..
4 2 4 2 2
b) Calcular P(X ≥ 2) . 3
⎤
⎢
⎣⎡
⎢ 1 22
⎣⎡ x ⎤
2
1 1
1 3
2
5
+∞ +∞
3
3
∫∫∫∫
P(X 2) f(x)dx
≥==+=+=⋅
22 ⎥=
4 xdx 0dx 4 xdx 0 4 2
⎥=⋅−
4
2
2
8
32
⎦
⎦
2
c) Esperança de X
13
+∞
1 1 1 ⎢ x 3 3
⎢ 3 33 1 ⎤
⎣⎡ ⎤ 1 ⎣⎡
⎥=
1
3 +∞ 1
=
==⋅+⋅+⋅= ∫ ∫∫∫∫
E(X) xf (x)dx x xdx x 0dx 4 4 x dx 3
0dx x 2
4 ⎥=−
−∞ −∞ 1 3 0
⎦ 1
4 3 3 ⎦ 6
d) Moda (Mo) ⇒ é o valor de maior densidade, logo, Mo = 3.
e) Mediana (Md)
1Md
⎢ ⇒
⎣⎡ 21
x =⎥ ⎢ ⎡ ⎤
2 ⎦⎤ ⎣ −⇒
12 2⎥ =
+=
1
∫−∞ ∫⇒21
= ⇒
f(x)dx Md ∫ −∞21
Md = + 51 2 0dx Md 1 1 4 xdx 4 2 4 Md 2 1 2 ⎦
1
f) Variância de X ⇒[ ( )] 3
⎢
⎢ ⎣⎡
2
2
V(X) = E(X ) − E X ⎣⎡ 4
⎤ 1
1 x 3
44
1 1
⎤
+∞ 1 3 +∞ 1
1
==++==
∫∫∫∫∫
⎥=
222
2
f(x)dx x 0dx 2 4 x dx 4 5
E(X ) x x4 xdx x 0dx 3
4 ⎥=−
−∞ −∞ 1 3 0
⎦ 1
4 4 4 ⎦
13
V(X) E(X ) E X 52
[ ( )]3611
⎜ ⎞ 169
⎝⎛ 5
2 ⎟ = − =
2
= − = − ⇒ V(X) = 0,3056
6 g) Desvio padrão de X
⎠ 36
Desvio padrão da variável X é a raiz quadrada positiva da variância de X.

11
V(X) σ x= = = ⇒ σ x= 0,5528
36 0,5528
3.7. Variáveis aleatórias bidimensionais
68
3.7.1. Introdução
Refere-se ao caso em que para um determinado experimento, cada resultado é proveniente da

avaliação simultânea de dois caracteres. Logo, há interesse em dois resultados simultâneos. Por exemplo,
estudar a estatura X e peso Y, de alguma pessoa escolhida ao acaso, o que forneceria o resultado (x,y).
Como pode se notar, o resultado é identificado por cada um dos valores que as variáveis aleatórias
unidimensionais assumem.
3.7.2. Definição s
* S X Y
Xs
* Ys
Sejam E um experimento aleatório e S o espaço amostral associado a este experimento. Sejam,

X=Xs e Y=Ys duas funções, cada uma associando um número real a cada resultado s ∈ S, denomina
se (X,Y )uma variável aleatória bidimensional.
Em determinadas situações X e Y não estão ligadas a um mesmo experimento, mas existe uma
razão bastante definida para considerar X e Y conjuntamente.
Para nosso estudo vamos considerar que X e Y são ambas discretas ou contínuas. Do mesmo
modo que no caso unidimensional (X,Y) deve ter associada, a cada valor que pode assumir, uma
probabilidade de ocorrência. Assim precisamos definir a distribuição de probabilidade da v.a.
bidimensional (X,Y).
3.7.3. Distribuição conjunta de duas v.a., distribuições marginais e condicionais
3.7.3.1. (X,Y) é uma v.a.d. bidimensional

(X,Y) será uma v.a. discreta bidimensional se os valores possíveis de X e Y forem finitos ou
infinitos enumeráveis. Isto é, se os valores possíveis de (X,Y) podem ser representados por (x y ) com i r
e j s ij
,= 1,2,...,= 1,2,..., .
i) Função de probabilidade conjunta de X e Y
Chama-se de função de probabilidade conjunta da v.a.d. bidimensional (X,Y) a

função: ( ) ( ) i j i j pij P X = x ,Y = y = P x , y =
Que a cada valor de ( ) i j
x , yassocia um valor de probabilidade de ocorrência.
Para que ( ) i j P x , yseja uma função de probabilidade conjunta é necessário que satisfaça as seguintes
condições:
a) P(xi, y j) ≥ 0, para todo valor ( ) i j
x,y.
r s
=
∑∑
b) ( ) 1 ijP x , y
i ==11j
Distribuição de probabilidade conjunta é o conjunto de pares:
69
{(x y ) P(x y )} para i r e j s i j i j
, , ,= 1,2,...,= 1,2,...,
Ou seja,
Y
X y1 y2 ... ys ( )i P X = x
x1( ) 1 1 P x , y ( ) 1 2 P x , y ... ( )s P x , y 1( ) 1 P X = x
x2( ) 2 1 P x , y ( ) 2 2 P x , y ... ( )s P x , y 2( ) 2 P X = x
... ... ... ... ... ...
xr ( ) 1 P x y r, ( ) 2 P x y r, ... ( ) r s P x , y ( )r P X = x
( )j P Y = y ( ) 1 P Y = y ( ) 2 P Y = y ... ( )s P Y = y1,00
ii) Distribuições marginais
Dada uma distribuição conjunta de duas variáveis aleatórias X e Y, podemos determinar a distribuição de
X sem considerar Y e a de Y sem considerar X. São as chamadas distribuições marginais. A distribuição
marginal é constituída pelos valores da variável aleatória e suas respectivas probabilidades marginais. A
probabilidade marginal para cada valor é obtida da seguinte forma:
()() ()
• Para X: ∑
iiijP XxPxPxy
===
,
j
=
1
r
)() ()
• Para Y: ( ∑ jjijP YyPyPxy
===
,
i
=
1
Com as probabilidades marginais para cada valor, podemos construir a distribuição marginal para
a variável aleatória.
• Para X:
xi x1 x2 ... xr
( )i P x ( ) 1 P x ( ) 2 P x ... ( )r P x1,00
• Para Y:
yi y1 y2 ... ys
( )j P y ( ) 1 P y ( ) 2 P y ... ( )s P y1,00
iii) Distribuições condicionais

Seja xi um valor de X, tal que P(X = xi) = P(xi) > 0
A probabilidade PYyXx
=
( )( ) = = =,
/
ji
PXx
PXxYy
==
ij
( )i
É denominada probabilidade condicional de j Y = y, dado que i X = x .
Assim, para xi fixado, os pares {y j,P(Y = y j/ X = xi)}definem a distribuição condicional de Y,
dado que i X = x .
70
yi y1 y2 ... ys
() j i P Y = y / X = x ( )i P Y = y / X = x 1( )i P Y = y / X = x 2... ( ) s i P Y = y / X = x1,00
Analogamente para X, temos:
( )( )
PXxYy
= = =,
==
/ , ( = > 0) j P Y y
ij
xYy
PX =
( )j
ij
PYy
xi x1 X2 ... xr
() i j P X = x /Y = y ( )j P X = x /Y = y 1 ( )j P X = x /Y = y 2... ( ) r j P X = x /Y = y1,00
3.7.3.2. (X,Y) é uma v.a.c. bidimensional
(X,Y) será uma v.a. contínua bidimensional se os valores possíveis de X e Y puderem assumir
todos os valores em algum conjunto não enumerável.
i) Função de probabilidade conjunta de X e Y
Seja (X,Y) uma v.a.c. bidimensional. Dizemos que f(x,y) é uma função densidade de
probabilidade conjunta de X e Y, se satisfizer às seguintes condições:
a) f (x, y) ≥ 0, para todo valor (x, y).
∫∫ ∞
∞
b) ( ) = 1
f x, y dxdy
−∞ −∞
f (x, y) = 0para (x, y) ∉aos intervalos de x e y.
Temos ainda que:

d
b
()
∫∫
P a X b,c Y d f( x, y )dxdy ≤ ≤ ≤ ≤ =
c
a
ii) Distribuições marginais
As f.d.p. marginais de X e Y são dadas por:
∫
∞
e
g( x ) = f( x, y )dy ∫
∞
−∞
h( y )= f( x, y )dx, respectivamente. −∞
Temos ainda que:
b
d
)
( ∫
()
P a X b g( x )dxe ∫
≤≤= iii) Distribuições condicionais
P c Y d h( y )dy
a ≤≤=
c
71
Sejam X e Y v.a.c. com f.d.p. conjunta f( x, y )e f.d.p. marginais dadas por g( x )e h( y ). A
f.d.p. condicional de X, dado que Y = yé definida por:
fxy
(,)
f x y = , h( y ) > 0
(/)
hy
()
Analogamente, a f.d.p. condicional de Y, dado que X = xé definida por:
fxy
(,)
f y x = , g( x ) > 0
(/)
gx
()
As f.d.p. condicionais acima, satisfazem a todas as condições impostas para uma f.d.p.
unidimensional.
Deste modo para y fixado, teremos:
a) f( y / x ) ≥ 0
∫∫∫ ∞
∞
∞
fxy(,) 1 hy ()
b) 1 f x y dx
(/)
hy====
dx f x y dx ( , )
−∞()
hy
()()
−∞
3.8. Variáveis aleatórias v.a.d. bidimensional
independentes 3.8.1. (X,Y) é uma hy

−∞
Definição 1 - Seja (X,Y) v.a.d. bidimensional. Dizemos que X e Y são independentes se, e somente se,
para todo par de valores ( ) i j
x , yde X e Y, tem-se:
( ) ( ) ( ) i j i j P X = x ,Y = y = P X = x .P Y = y
Basta que esta condição não se verifique para um par ( ) i j
x , ypara que X e Y não sejam
independentes. Neste caso diremos que X e Y são dependentes.
Definição 2 - Seja (X,Y) v.a.d. bidimensional. Neste caso X e Y serão independentes se, e somente se:
( ) ( ) i j i P X = x /Y = y = P X = x, para todo i e j.
Ou equivalente se, e somente se:
( ) ( ) j i j P Y = y / X = x = P Y = y, para todo i e j.
3.8.2. (X,Y) é uma v.a.c. bidimensional
Definição 1 - Seja (X,Y) v.a.c. bidimensional. Dizemos que X e Y são independentes se, e somente se,
tem se:
f( x, y ) = g( x )⋅ h( y ), para todo x e todo y.
Definição 2 - Seja (X,Y) v.a.c. bidimensional. Neste caso X e Y serão independentes se, e somente se:
f (x / y) = g( x ). Nesse caso, é evidente que f (y / x) = h( y ).
3.9. Covariância
72
Seja X e Y duas variáveis aleatórias. A covariância denotada por Cov(X,Y )é definida por
Cov(X,Y) = E{[X−E(X)]⋅[Y−E(Y)]}
Desenvolvendo a expressão acima, temos:
Cov(X,Y) = E[XY−XE(Y)−YE(X)+E(X)E(Y)]
Cov(X,Y) = E(XY) −E(X)E(Y)−E(Y)E(X)+E(X)E(Y)
Cov(X,Y) = E(XY) −E(X)E(Y)

=n n
() ()
Onde: ∑∑
iji yj E XY x y P x ,, para (X, Y) v.a. discretas. i 1
==
j1
+∞
()
∫∫
+∞
E XY = xyf(x,y)dxdy, para (X, Y) v.a. contínuas.

−∞ −∞
Obs.: para que haja covariância é necessário que existam pelo menos duas variáveis aleatórias. A
covariância nos dá uma idéia da relação de dependência entre duas variáveis.
Proposição:
P1) Cov(X,Y) = Cov(Y,X)
P2) Se V(X) = 0 ou V(Y) = 0, então Cov(X,Y) = 0
P3) Cov(aX,Y) = aCov(X,Y), sendo a uma constante.
P4) Cov(aX,bY)= abCov(X,Y), sendo a e b constantes.
P5) Cov(X + Z,Y) = Cov(X,Y)+Cov(Z,Y)
P6) Se X e Y são duas variáveis quaisquer, então:
V(X+ Y)= V(X)+ V(Y)+ 2Cov(X,Y)
V(X−Y) = V(X)+ V(Y)−2Cov(X,Y)
Se X e Y são duas variáveis aleatórias independentes, então: Cov(X,Y)= 0
Portanto:V(X+ Y) = V(X)+ V(Y)

V(X −Y) = V(X)+ V(Y)
3.10. Coeficiente de correlação
Define-se o coeficiente de correlação populacional (ρ)entre duas variáveis aleatórias X e Y: (

)
Cov X,Y
ρ = , −1≤ ρ ≤ +1
xy
⋅
V(X) V(Y)
O coeficiente de correlação mede o grau de associação entre duas variáveis aleatórias X e
Y. Fatos:
i) Se X e Y são v.a. independentes, então Cov(X,Y)= 0e conseqüentemente ρxy= 0 ii) Cov(X,Y)= 0não
implica que X e Y sejam variáveis aleatórias independentes, a não ser que X e Y tenham distribuição
normal bivariada, ou seja, X e Y não correlacionadas ( 0) ρxy=não equivale, em geral, que X e Y sejam
independentes.
Exemplo 2.13. Seja (X,Y) uma v.a.d. bidimensional com a seguinte distribuição conjunta.
Y
73
X -3 2 4
1 0,1 0,2 0,2
3 0,3 0,1 0,1
a) Defina as distribuições marginais de X e de Y.
• Para X:
xi 1 3
( )i P x0,5 0,5 1,00
• Para Y:
yi -3 2 4
( )j P y0,4 0,3 0,3 1,00
b) X e Y são variáveis aleatórias independentes?
Condição de independência ( ) ( ) ( ) i j i j P X = x ,Y = y = P X = x .P Y = y . Y Distr.

marginal
X -3 2 4 De X
1 0,20 0,15 0,15 0,5
3 0,20 0,15 0,15 0,5
Distr. marginal de Y 0,4 0,3 0,3 1,00 Verifica-se que a condição de independência não é
satisfeita, portanto X e Y são dependentes.
c) Calcule a variância de X e de Y.
2
=
∑ =+⇒=
()105305()2
EXxPxxxEX
(),,
ii
i 1 2
=
=
∑ =+⇒=( ) 105305( ) 5
22 222
EXxPxxxEX
(),,
ii
i 1
= [ ] 5 2 10
22222
= ( )− ( ) = −( ) ⇒ =, σ x E X E X σ x(Variância de X) 3
= ( ) = − , + , + , ⇒ =,
∑ ()304203403()06
E Y y P y x x x E Y jj
j = 1
3
=
∑ ( )=( − ) , + , + , ⇒ =, ( ) 3 0 4 2 0 3 4 0 3 ( ) 9 6
22 2222
E Y y P y x x x E Y jj
j = 1
[ ] 9 6 0 6 9 24 22222
= ( )− ( ) =, −( , ) ⇒ =, σ y E Y E Y σ y(Variância de Y) d) Calcule a
covariância entre X e Y.
2 3
()= ,= ( − ) , + , + , + ( − ) , + , + ,=,
∑∑
( ) 1 3 01 1 2 0 2 1 4 0 2 3 3 0 3 3 2 01 3 4 01 0 0
E XY x y P x y x x x x x x x x x x x x i j i j
ij
==
1 1
Cov( X,Y ) = E( XY )− E( X )⋅ E( Y ) = 0,0 − 2x0,6 ⇒ Cov( X,Y ) = −1,2
e) Calcule a correlação entre X e Y.
Cov X Y
ρ
( , ) 1,2
− 0,3948
ρ
=xy 2 2⇒ = − =
xy
x
xy
σσ
⋅ 1,0 9,24
3.11. Exercícios: Variáveis aleatórias
74
1. Seja E: “Lançamento de um dado não viciado”, e seja a variável aleatória X = ⎨número de pontos
obtidos⎬. Pede-se:
a) determine o espaço amostral.
b) X é uma variável aleatória contínua ou discreta? Por quê?
c) determine a distribuição de probabilidade da V. A. X (tabela e gráfico).
2. Seja a distribuição de probabilidade da variável aleatória X (pontos obtidos no lançamento de um dado),

dados pela tabela abaixo:
X123456
P(X) 1/6 1/6 1/6 1/6 1/6 1/6
Sejam as variáveis aleatórias: Y = X + X (V.A. soma dos pontos de dois dados). Z
= Max {(x1, x2)}, onde ( ) 1 2
x , xpontos de dois dados.
Pede-se:
a) espaço amostral da V.A. Y.
b) distribuição de probabilidade de Y.
c) espaço amostral da V.A. Z.
d) distribuição de probabilidade de Z.
3. No lançamento simultâneo de dois dados, considere as seguintes variáveis

aleatórias: X = número de pontos obtidos no primeiro dado.
Y = número de pontos obtidos no segundo dado.
a) Construir a distribuição de probabilidade por meio de uma tabela e gráfico das seguintes
variáveis I) W = X – Y III) Z = XY
II) A = 2Y IV) B = Mínimo de (X,Y)
4. Numa sala temos 5 rapazes e 4 moças. São retiradas aleatoriamente, 3 pessoas. Faça X a variável
aleatória número de rapazes.
a) Determine a distribuição de probabilidade da variável X, construa uma
tabela. b) Construa o gráfico da distribuição de probabilidade.
c) Calcule as probabilidades:
c.1) P(X ≤ 2)c.2) P(X ≤ 0)c.3) P(1< X ≤ 2)c.4) P(2 < X < 3) c.5) P(X > 2)c.6) P(X >
0)c.7) P(X > −1)c.8) P(X < 5)
5. Seja X uma v.a.c. definida pela seguinte f.d.p.:
⎪
⎨⎧ ≤ ≤
kX para X
fX ,02
()
para outros valores de X
=
0, .
⎪
⎩
a) determine o valor de k; b) traçar o gráfico da f.d.p.;
c) calcular P(X ≤ 1); d) calcular P(X ≥ 1); e) calcular P(X ≤ 2).
6. Uma v.a.c. X possui a seguinte função:

⎪
⎨⎧ ≤ ≤
k para X
fX , 1 5.
()
=
0, .
⎪
⎩
a) determine o valor de k.
b) traçar o gráfico da f.d.p.
c) calcular P(2 ≤ X ≤ 4).
7. Seja X uma v.a.d. com a seguinte distribuição de probabilidade. xi -4
-2 0 2 4 6
75
P(xi) 1/9 2/9 1/9 3/9 1/9 1/9 a) esta é realmente uma
distribuição de probabilidade. b) traçar o gráfico da distribuição de
probabilidade.
0, 0
para X fX <
⎪
⎪ ⎨⎧ 1
8. Seja X uma v.a.c. () = 2 X para X , 0 2 ≤ ≤
dada por:
⎪
⎪ ⎩
0, 2.
para X
>
Pede-se:
a) traçar o gráfico da f.d.p.
b)P(X ≥1)c) P(X ≤1)d) P(X ≥ 3)
9. Seja X uma v.a.c. dada por:

3
⎪ ⎧
⎨ −<<
()
2
1,01
fX() = 2 X para X
⎪ Pede-se:
⎩
0, . caso contrário
a) traçar o gráfico da f.d.p.

b) P(X >1/ 2)b) P(X < 1/ 2)c) P(X ≤ 0)

1
⎪ ⎧
⎨ +≤≤
X K para X
fX() ⎪ 0, .
⎩
= ,03
6 caso contrário
a) encontre o valor de K para que f(X) seja uma f.d.p.
b) traçar o gráfico da f.d.p.
c) encontre P(1 < X < 2)
11. Uma urna contém 5 bolas brancas e 7 bolas pretas. Três bolas são retiradas simultaneamente dessa
urna. Ganha-se R$ 200,00 por bola branca retirada e perde-se R$ 100,00 por bola preta retirada, qual seria
o lucro esperado? (Obs. Faça a V.A. X o lucro esperado por rodada).
12. X é uma v.a.c., tal que:

2,01
X para X
fX ⎪
⎨⎧ ≤ ≤
)
( para outros valores de X
=
0, .
⎪
⎩
Determinar:
a) E(X); b) moda; c) mediana; d) para Y = 4X – 5, calcule E(Y).

1
⎪ ⎧
⎨ ≤≤
X para X
fX = ,02
() 2
0, . para outros valores de X
⎪
Determine: ⎩
a) E(X) b) V(X) c) V(X + 7) d) V(3X) e) Y = 2X – 4, determine a E(Y) e V(Y).

76
fX() =
0, .
⎪ ⎪
⎨⎧ ≤ ≤ ⎩
2
Determine:
3,01 para outros valores de X
X para X
a) E(X); b) V(X); c) V(3 + X); d) V(5X);

e) Y = 2X – 9, determine a E(Y) e V(Y).
15. Se X e Y são duas V. A. tal que, E(X2) = 6, E(Y) = 2, E(X) = 2, E(Y2) = 12, E(X.Y) =
5. Calcule:
a) V(X) e desvio-padrão de X.
b) V(Y) e desvio-padrão de Y.
c) Covariância entre X e Y.
d) V(X + Y)
e) V(X – Y)
f) Correlação entre X e Y.
16. Cite as propriedades de:

a) Esperança matemática.
b) Variância.
c) Covariância.

⎪
⎨⎧ ≤ ≤
KX para X
fX ,01
()
=
0, .
⎪
⎩
Determine:
a) o valor de K para que f(X) seja uma f.d.p. b) trace o gráfico da f.d.p. de X c) P(X <
1/ 2)d) média
e) variância f) V(3 + X) g) V(5X) h) Y = 2X – 9, determine a E(Y) e V(Y).
18. Suponha que X e Y tenham a seguinte distribuição conjunta:
Y
X -1 1 2
-2 0,1 0,1 0,2
0 0,1 0,2 0,1
3 0,1 0,1 0,0
a) X e Y são variáveis aleatórias independentes? Mostre porque.
b) Calcule a variância de X e de Y.
c) Qual a covariância entre X e Y.
d) Qual a correlação entre X e Y.
e) V(7X); V(X+Y); V(X-Y); V(Y+5); V(2X-Y)
19. Suponha que X e Y tenham a seguinte distribuição conjunta:

77
Y
X1245
2 0,2 0,1 0,1 0,2
3 0,1 0,1 0,1 0,1
a) X e Y são variáveis aleatórias independentes? Mostre porque.

b) Calcule a variância de X e de Y.
c) Qual a covariância entre X e Y.
d) Qual a correlação entre X e Y.
e) V(5X-3Y)
20. Seja (X,Y) uma variável aleatória bidimensional discreta, com a função de probabilidade.
2
,,,,,
xy
+
⎪ ⎧
⎨ ==
ij
para x e y
() 012 012 3
P x yi j
, Pede-se: 42
ij
= Caso contrário
⎪
0 ⎩
a) Tabela da distribuição conjunta.

b) X e Y são variáveis aleatórias independentes? Mostre porque.
d) Qual a covariância entre X e Y.
e) Qual a correlação entre X e Y.
f) E(X + Y) e V(X + Y)
21. Dada a distribuição conjunta abaixo, parcialmente indicada:

Y
X -2 0 1 P(X)
-3 1/15 8/30 6/15
-2 1/15 1/30 7/30
-1 1/15
P(Y) 7/30 9/30
Pede-se:
a) Tabela da distribuição conjunta.
b) X e Y são variáveis aleatórias independentes? Mostre porque.
d) Qual a covariância entre X e Y.
e) Qual a correlação entre X e Y.
f) E(X - Y) e V(X - Y)
78
Respostas
1. a) S = {1,2,3,4,5,6}b) X é uma V.A. discreta, pois assume apenas valores inteiros.
2. a) S = {2,3,4,5,6,7,8,9,10,11,12}
b) Y 2 3 4 5 6 7 8 9 10 11 12 P(Y) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 c) S =
{1,2,3,4,5,6}
d) Z 1 2 3 4 5 6 P(Z) 1/36 3/36 5/36 7/36 9/36 11/36
3. a) Foi apresentada apenas a tabela

I) W -5 -4 -3 -2 -1 0 1 2 3 4 5
P(W) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
II) A 2 4 6 8 10 12
P(A) 1/6 1/6 1/6 1/6 1/6 1/6
III) Z 1 2 3 4 5 6 8 9 10 12 15 16 18 20 24 25 30 36 P(Z) 1/36 2/36 2/36 3/36 2/36 4/36 2/36 1/36
2/36 4/36 2/36 1/36 2/36 2/36 2/36 1/36 2/36 1/36 IV) B 1 2 3 4 5 6
P(B) 11/36 9/36 7/36 5/36 3/36 1/36
4. a) X 0 1 2 3 b) P(X) 4/84 30/84 40/84 10/84

c.1) 74/84 c.2) 4/84 c.3) 40/84 c.4) 0
c.5) 10/84 c.6) 80/84 c.7) 1,0 c.8)1,0
5. a) 1/2 b) Gráfico c) 1/4 d) 3/4 e) 1,0
6. a) 1/4 b) Gráfico c) 1/2

7.
8. b) 3/4 c) 1/4 d) 0
9. b) 5/16 c) 11/16 d) 0
10. a) 1/12 b) Gráfico c) 1/3
11. X 600 300 0 -300 E(X) = 75,00 P(X) 2/44 14/44 21/44 7/44
12. a) 2/3 b) 1 c) 1/ 2d) –7/3
13. a) 4/3 b) 2/9 c) 2/9 d) 2 e) –4/3 e 8/9 14. a) 3/4 b) 3/80 c) 3/80 d) 75/80 e) –15/2 e
c) 1 d) 12 e) 8 f)
3/20 15. a) 2 e 2b) 8 e 8 41
17. a) 2 b) Gráfico c) 1/4 d) 2/3 e) 1/18

f) 1/18 g) 25/18 h) –23/3 e 2/9
18. a) dependentes b) V(X) = 3,36 V(Y) = 1,41 c) Cov(X,Y) = -0,66 d) r xy = -0,303

e) 164,64 3,45 6,09 1,41 17,49
79
19. a) dependentes b) V(X) = 0,24 V(Y) = 2,80 c) Cov(X,Y) = 0,0 d) r xy = 0,0 e)
31,2
20.
0 1 2 3 P(X)
0 0,000 0,024 0,048 0,071 0,143
1 0,048 0,071 0,095 0,119 0,333
2 0,095 0,119 0,143 0,167 0,524
P(Y) 0,143 0,214 0,286 0,357 1,000
b) dependentes c) V(X) = 0,522 V(Y) = 1,122 d) Cov(X,Y) = -0,136 e) r xy = -0,136

f) 3,24 e 1,37
21.
-2 0 1 P(X)
-3 0,067 0,267 0,067 0,400
-2 0,067 0,133 0,033 0,233
-1 0,100 0,067 0,200 0,367
P(Y) 0,233 0,467 0,300 1,000
b) dependentes c) V(X) = 0,766 V(Y) = 1,206 d) Cov(X,Y) = 0,061 d) r xy = 0,064 e) -1,87 e

1,85
80

Apost Geral 2020

Enviado por

Direitos autorais:

Formatos disponíveis

Apost Geral 2020

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Apost Geral 2020

Enviado por

Direitos autorais:

Formatos disponíveis

Universidade Estadual do Sudoeste da Bahia - UESB

Departamento de Ciências Exatas e Naturais - DCEN

Universidade Estadual do Sudoeste da Bahia

Cap. 1 - Estatística descritiva ....................................................................................... 03 Cap. 2 -

1.3. Estatística descritiva

1.4. Inferência estatística

1.5. Teoria da amostragem

O conhecimento de fatos que afetam a convivência sócio-econômica numa comunidade influi

Os principais tipos são:

1.5.2. Amostragem não probabilística

Os principais tipos são:

1.5.3. O questionário e a entrevista

1.7. Organização e apresentação de dados: tabelas e gráficos

a) Componentes das tabelas

c) Tabelas de distribuição de frequências

Elementos de uma distribuição de frequências

c.1. Tabela de distribuição de frequência para variável aleatória discreta

c.2. Tabela de distribuição de frequência para variável aleatória contínua

1) Amplitude amostral A = 23,8 −12,4 =11,4k = 50 = 7,07 ≅ 7

Tabela 4 – Diâmetro de 50 plantas de eucalipto com 5 anos, no município de Ribeirão Notas PM f

1.8. Revisão de matemática

a) As principais representações são:

X , soma de quadrados (SQ).

✓ n é a ordem da última parcela ou limite superior (LS) do somatório.

Exemplo 1: Considere as variáveis de X e Y que representam, respectivamente, as notas de duas

b) Número de Termos (NT) ou parcelas do somatório O

Considere a tabela a seguir, conhecida como tabela de dupla entrada:

2 X21 X22 ... X2K∑

... ... ... ... ... ...

Exemplo 5: Utilizando a tabela abaixo, calcule:

1.8.2. Proporção e porcentagem

1.8.3. Números significativos

Descrição dos dados

1.9. Medidas de posição ou medidas de tendência central

= , ou seja, é a soma de todos os valores que a X

variável assume, dividido pelo número total de valores da mesma.

Média Aritmética Ponderada

Exemplo 3 – Diâmetro de 50 plantas de eucalipto com 5 anos, no município de Ribeirão.

Propriedades da média aritmética

Exemplo: Seja 1.000.656, 1.000.601, 1.000.310, 1.000.550. Calcule a média aritmética.

assim não precisamos trabalhar com números excessivamente grandes.

P3) A soma algébrica dos desvios em relação a média aritmética é nula.

Ex: Considere os dados: 360 216.000 60 33

1.9.3. Moda (Mo)

Y'={ 5, 5, 8, 10, 15, 15} 9

1.10. Medidas de Dispersão (ou medidas de variabilidade)

1.10.1. Amplitude Total (AT)

É a diferença entre o maior e o menor valor de uma amostra ou de um conjunto de dados. A

1.10.3. Desvio Médio [ ] dx

Graus de liberdade: É possível demonstrar que, utilizando-se o denominador n-1, obtém-se um

Por exemplo, seja a amostra a seguir, dada por: Y 1 = 5 Y2 = 7 Y3 = 8 Y4 = y4 Assim, se

1.10.5. Desvio Padrão Amostral (Sx)

1.10.6. Coeficiente de Variação (CV)

1.10.7. Erro Padrão da Média ( ) Sx

c) Desvio padrão amostral

X =X= =⇒SX=1,4832 S S 2,2 1,4832 2

Y Y = = =⇒SY= 2,3452 S S 5,5 2,3452 2

Coeficiente de correlação amostral

Ex.2. Dados referentes a medidas tomadas em uma amostra de 10 cães

→ Comprimento:. .(%) .100 4,164% 2