Sebenta ME 2024 2025 LEM
Sebenta ME 2024 2025 LEM
Sebenta ME 2024 2025 LEM
Métodos Estatı́sticos
Material de Apoio às Aulas
1a Frequência - Capı́tulos I e II
a
2 Frequência - Capı́tulos III, IV, V e VI
Deolinda M. L. D. Rasteiro
Departamento de Fı́sica e Matemática
1. Probabilidades 3
5. Estimação 62
Definições
• Possibilidade de repetição;
• Carácter imprevisı́vel;
• Apresentam regularidade estatı́stica.
2. A = B: A ⊂ B e B ⊂ A; (A e B dizem-se idênticos )
• A=Ω\A
• A\B =A∩B
3
Propriedades
1. A ∩ A = ∅
2. A ∪ A = Ω
3. Comutativa
A∩B = B∩A
A∪B = B∪A
4. Associativa
A ∩ (B ∩ C) = (A ∩ B) ∩ C
A ∪ (B ∪ C) = (A ∪ B) ∪ C
5. Distributiva
A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)
A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C)
6. A ∩ Ω = A; A ∪ ∅ = A
7. A ∪ Ω = Ω; A ∩ ∅ = ∅
8. A ⊂ B ⇒ A ∪ B = B e A ∩ B = A
9. Leis de De Morgan
A∩B = A∪B
A∪B = A∩B
4
1.2 Definição de probabilidade
Definição [Clássica]
Admita-se que Ω é um espaço finito e que todos os acontecimentos elementares são equipossı́veis. A
probabilidade de um acontecimento (qualquer subconjunto de Ω) A se realizar é dada por
♯A
P (A) = .
♯Ω
• P (Ω) = 1
• P (∅) = 0
• ∀A ∈ Ω, 0 ≤ P (A) ≤ 1.
Definição [Axiomática]
Seja Ω um espaço de resultados e A e Ai , i = 1, 2, ..., acontecimentos quaisquer de Ω. Uma probabilidade
é uma aplicação P que satisfaz os seguintes axiomas:
(1) 0 ≤ P (A) ≤ 1
(2) P (Ω) = 1
+∞
[
(3) Para o acontecimento reunião Ai de Ω,
i=1
+∞
[ +∞
X
P( Ai ) = P (Ai ), se Ai ∩ Aj = ∅ para i 6= j.
i=1 i=1
Nota
A partir de Ω é possı́vel formar várias famı́lias de subconjuntos deste espaço (pensemos no caso
de Ω não ser finito). A definição axiomática de probabilidade, definida anteriormente no domı́nio Ω,
extende-se à famı́lia (chamemos-lhe ̥) de todos os subconjuntos de Ω, que verifica:
(1) Ω ∈ ̥;
(2) Se A ∈ ̥ então A ∈ ̥;
+∞
[
(3) Se Ai ∈ ̥, i ∈ IN, então Ai ∈ ̥.
i=1
5
Propriedades de uma probabilidade
1. P (∅) = 0
Caso particular:
Se A e B ∈ Ω e A ∩ B = ∅ ⇒ P (A ∪ B) = P (A) + P (B).
3. Se A e B ∈ Ω, P (A \ B) = P (A) − P (A ∩ B)
4. Se A e B ∈ Ω e B ⊂ A ⇒ P (B) ≤ P (A)
5. A ∈ Ω, P ( A ) = 1 − P (A)
6. A, B ∈ Ω, P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
7. Se Ai ∈ Ω, i = 1, ..., n,
n
[ n
X
P( Ai ) ≤ P (Ai );
i=1 i=1
P (A1 ∩ ... ∩ An ) = P (A1 )P (A2 /A1 )P (A3 /A1 ∩ A2 )...P (An /A1 ∩ A2 ∩ ... ∩ An−1 )
6
1.4 Acontecimentos independentes
Definição [Independência] Os acontecimentos A e B dizem-se independentes se e só se
P (A ∩ B) = P (A)P (B).
Consequência: Sejam A e B acontecimentos de Ω tais que P (A)P (B) > 0. A e B são independentes
se e só se
P (A/B) = P (A).
Nota: Não confundir acontecimentos disjuntos com acontecimentos independentes.
Ai ∩ Aj = ∅, i 6= j (disjuntos)
[n
Ai = Ω (exaustivos)
i=1
Ai ∩ Aj = ∅, i 6= j
[n
Ai = Ω.
i=1
P (B/Ai )P (Ai )
P (Ai /B) = n , i = 2, ..., n.
X
P (B/Ai ) P (Ai )
i=1
7
Exercı́cios
Capı́tulo I - Probabilidades
1. Uma caixa contém 5 lâmpadas das quais 2 são defeituosas. Estas têm os números 3 e 5. Considere
a experiência aleatória ”extração de duas lâmpadas ao acaso, uma a seguir à outra, sem reposição
da primeira”.
(c) Se as lâmpadas forem extraı́das ao acaso, os resultados possı́veis são equiprováveis. Calcule a
probabilidade dos acontecimentos A, B, C e D.
2. Calcule a probabilidade de, ao lançar três vezes uma moeda equilibrada, obter:
Determine P (A ∩ C).
6. Supondo que A e B são acontecimentos independentes com probabilidade não nula prove que os
acontecimentos A e B, A e B, A e B também são independentes.
7. Seja Ω o espaço de resultados associado a uma experiência aleatória. Sejam A e B dois aconteci-
mentos contidos em Ω não vazios. Sabe-se que A ⊂ B. O valor de P[(A ∪ B) ∩ B] é:
8
8. Seja Ω o espaço de resultados associado a uma experiência aleatória. Sejam A e B dois aconteci-
1
mentos (A ⊂ Ω e B ⊂ Ω). Sabe-se que P(A) = 0.3, P(B/A) = e P(A ∪ B) = 0.8. Qual é o valor
3
de P(B)?
(A) 0.3 (B) 0.4 (C) 0.1 (D) 0.2
9. Seja Ω o espaço de resultados associado a uma experiência aleatória. Sejam A e B dois aconteci-
mentos (A ⊂ Ω e B ⊂ Ω). Sabe-se que P(A) = 0.3, P(B) = 0.4 e P(A ∩ B) = 0.1. O valor de
P(A/B) é
2 4 3 1
(A) (B) (C) (D)
3 7 7 3
10. Seja Ω o espaço de resultados associado a uma experiência aleatória. Sejam A e B dois aconteci-
8
mentos equiprováveis e independentes. Sabe-se que P(A ∪ B) = . O valor de P(B) é:
9
1 3 1 2
(A) (B) (C) (D)
4 4 3 3
11. Seja Ω o espaço de resultados associado a uma experiência aleatória. Sejam A e B dois aconteci-
1
mentos (A ⊂ Ω e B ⊂ Ω). Sabe-se que P(A) = 0.6, P(B) = 0.6 e P(B/A) = . O valor de P(B ∩A)
3
é
2
(A) 0.4 (B) 0 (C) (D) 1
3
12. Foi examinada uma coleção de 100 programas de computador, para detetar erros de ”sintaxe”,
”input/output” e de ”outro tipo”. Verificou-se que:
9
(a) Mostre que a percentagem de chamadas recebidas na central durante o perı́odo da manhã é
de 29.8% .
(b) Considerando que a probabilidade de uma chamada, recebida na central, ser efetuada no
perı́odo da tarde é de 40% , calcule a probabilidade de uma chamada ser feita durante a noite
dado que é uma chamada genuı́na.
15. Em determinada linha de montagem 2% das peças ficam mal colocadas. Um programa para detetar
falhas de montagem tem as seguintes propriedades:
• se a peça está mal colocada, o programa indica essa falha com probabilidade 0.99;
• se a peça está correctamente colocada, o programa indica falha com probabilidade 0.005.
(a) Determine a probabilidade de, ao ser efetuado o referido teste, o programa indicar falha.
(b) Se o teste indicar a existência de uma falha, qual a probabilidade de efetivamente existirem
peças mal colocadas?
16. Uma empresa de fabrico de peças dispões de três setores de produção: A, B e C. Sabe-se que:
(a) Mostre que a probabilidade da peça ser defeituosa, sabendo que provém de A é 0.16.
(b) Calcule a probabilidade da peça não provir de B sabendo que é defeituosa.
(c) Sabendo que, das peças não defeituosas 40% provêm de C, qual a probabilidade da peça ser
proveniente de C?
17. Dos utilizadores de telefones móveis duma determinada localidade, 50% estão ligados à rede A, 40%
à rede B e 10% à rede C. Após um estudo de opinião de mercado conclui-se que:
18. O fabrico de uma peça consta de duas operações. Inicialmente a peça é moldada numa máquina M e,
em seguida, passa por uma de duas impressoras, I1 ou I2 . A probabilidade de uma peça apresentar
defeito de moldagem é 0.4 e 70% das peças são impressas em I1 . Além disso, a probabilidade de
surgir um defeito de impressão é de 0.05 para I1 e de 0.02 para I2 . Note que defeitos de moldagem
e de impressão são independentes entre si. No final de determinado dia de laboração, da produção
total da fábrica retira-se uma peça ao acaso.
10
(b) Qual a probabilidade da peça apresentar um qualquer defeito?
(c) Supondo que a peça apresenta defeito de impressão, calcule a probabilidade de ter sido impressa
em I1 .
19. Uma empresa de desenvolvimento de software efetuou um estudo sobre a probabilidade de ocorrência
de erros de programação entre os seus colaboradores. Classificou o tipo de programas que desenvol-
vem segundo a sua ordem de complexidade em dois nı́veis: média complexidade e alta complexidade.
Verificou que
(a) Determine a probabilidade dos programas terem complexidade média sabendo que ocorreram
erros.
(b) Quando não se verifica a ocorrência de erros, é mais provável que os programas tenham com-
plexidade média? Justifique.
20. Uma companhia de seguros classifica os seus segurados em três categorias: baixo risco, risco médio
e risco elevado. Os seus registos indicam que a probabilidade de um segurado se envolver em pelo
menos um acidente, por ano, é 0.01, 0.10, e 0.25 se o segurado pertence à categoria de baixo, médio
ou risco elevado, respetivamente. Admita que a probabilidade de um segurado ser classificado na
categoria de baixo risco é de 0.1 enquanto que na de risco médio é 0.6.
(a) Qual a probabilidade de, num ano, um dos segurados tenha pelo menos um acidente?
(b) Sabendo que um dos segurados teve pelo menos um acidente no último ano, qual a probabili-
dade de pertencer à categoria de risco elevado?
(c) Sabendo que um dos segurados não teve acidentes no último ano, qual a probabilidade dele
pertencer à categoria de risco médio?
21. Numa fábrica as máquinas I, II e III produzem peças do mesmo comprimento na proporção de
35:25:40. Sabe-se que 2% das peças produzidas pela máquina I são defeituosas e 1% das peças
produzidas pela máquina II são defeituosas. Sabe-se ainda que 1.2% das peças são produzidas pela
máquina III e são defeituosas.
(a) Se for escolhida aleatoriamente uma peça da produção da fábrica, qual a probabilidade de ser
defeituosa?
(b) Se for selecionada uma peça defeituosa, qual a probabilidade de ter sido produzida pela
máquina II?
11
Soluções dos Exercı́cios
Capı́tulo I - Probabilidades
1. (c) 0.4; 0.4; 0.1; 0.3
4. 0.1
7. A
8. B
9. A
10. C
11. B
12
2 Capı́tulo II - Variáveis Aleatórias e Distribuições de Probabili-
dade Discretas
2.1 Introdução
Definição Seja Ω um espaço de resultados associado a uma experiência aleatória. Designa-se por
variável aleatória (v.a.) uma função (correspondência unı́voca) X de domı́nio Ω e contradomı́nio em IR.
X : Ω −→ IR
w −→ X(w)
Exemplos de Ilustração
1. Lançamento de duas moedas equilibradas, uma a seguir à outra, anotando as faces que ficam
voltadas para cima.
Ω = {(C, C), (C, C ), (C, C), (C, C)}, com C :“saı́da de cara”.
Seja X a v.a. que representa (por exemplo) o número de caras obtidas no lançamento das duas
moedas.
X(w) ←número de caras no elemento w de Ω.
2. Lançamento de dois dados, anotando os números de pontos das faces que ficam voltadas para cima.
Ω = {(i, j), i, j = 1, 2, 3, 4, 5, 6}.
Seja X a v.a. que representa a soma dos pontos obtidos.
(Uma v.a. é uma aplicação que estabelece uma relação entre subconjuntos de Ω e subconjuntos de IR
e vice-versa)
13
Propriedade
Sendo E um qualquer subconjunto de IR e X uma variável aleatória, X −1 (E) é um subconjunto de
Ω.
Como P está definida neste domı́nio, podemos sempre calcular P (X −1 (E))! É assim introduzida em
IR uma probabilidade, denotada por PX , definida por
Notação
X −1 (B) = {w ∈ Ω : X(w) ∈ B} ≡ {X ∈ B}
⇒ PX (B) = P (X −1 (B)) = P (X ∈ B)
Na nossa incursão pelas variáveis aleatórias vamos considerar dois tipos de variáveis: as discretas
e as (absolutamente) contı́nuas (Capı́tulo III). Esta classificação é ditada pelos próprios fenómenos
aleatórios em estudo e consequente leitura, mas também porque estas variáveis obedecem a certas regras
(matemáticas) para que possam ser classificadas deste modo.
(1) 0 ≤ p(x) ≤ 1, ∀x ∈ IR
X
(2) p(x) = 1.
x
P (X = x) se x ∈ S
Observação Se X tem suporte S então p(x) = .
0 se x ∈ S
Notas
• Identificamos sempre as v.a.’s por letras maiúsculas (X) e as suas concretizações por letras minúsculas
(x).
Definição Seja X uma v.a. discreta. Chama-se função distribuição de X à função F : IR −→ [0, 1]
definida por
F (x) = P (X ≤ x), ∀x ∈ IR.
14
Se X tem suporte S então X
F (x) = P (X = a).
a ∈S∩]−∞,x]
↓
“valores do suporte de X e que são inferiores ou iguais a x”
(5) F admite um número finito ou infinito numerável de pontos de descontinuidade (pontos do suporte
de X)
Generalização
As n (n ≥ 2) variáveis aleatórias X1 , X2 , ..., Xn dizem-se independentes se e só se
n
Y
∀x1 , x2 , ..., xn ∈ IR, P (X1 ≤ x1 ∩ X2 ≤ x2 ∩ ... ∩ Xn ≤ xn ) = P (Xi ≤ xi ).
i=1
15
Parâmetros de localização e de dispersão
Definição Seja X uma v.a. discreta de suporte S. A esperança matemática de X (ou valor médio
de X ou valor esperado de X), caso exista, é definida por
X
E(X) = xP (X = x) .
x∈S
Notas
−A existência do valor médio de uma v.a. X depende da convergência da série anterior.
−Se a v.a. X é discreta com suporte finito, então E(X) existe sempre!
−O valor médio de uma v.a. é um parâmetro de localização (tendência central).
2. Seja X uma v.a. discreta de suporte S e g : IR → IR é tal que g(X) é uma v.a. discreta. Tem-se
X
E[ g(X) ] = g(x)P (X = x).
x∈S
4. Sejam X1 , X2 , ..., Xn (n ∈ IN) v.a.’s todas definidas sobre o mesmo espaço Ω e tais que E(Xi )
existe para i = 1, 2, ..., n. Então
" n # n
X X
E ai Xi + b = ai E(Xi ) + b,
i=1 i=1
" n
# n
X X
•E Xi = E(Xi ).
i=1 i=1
16
X
= (x − µ)2 P (X = x)
x∈S
Definição Chama-se
p desvio-padrão de X à raiz quadrada positiva da variância de X, e denota-se
por σ(X) = σ = V (X).
Nota A variância e o desvio padrão de uma v.a. X são ambos parâmetros de dispersão; no entanto,
o desvio padrão é mais usado, uma vez que vem expresso nas mesmas unidades de X.
Propriedades da variância
3. Seja X uma v.a. tal que E(X) e E(X 2 ) existem e a, b ∈ IR. Então
V (aX + b) = a2 V (X).
• V (X + b) = V (X);
• V (aX) = a2 V (X);
• V (−X) = V (X).
F (x+ −
p ) ≥ p ∧ F (xp ) ≤ p
Vimos que associado a uma variável aleatória temos um modelo matemático que descreve (e resume)
o comportamento dessa mesma variável e, consequentemente, o fenómeno aleatório em estudo. Deste
modelo fazem parte a sua Distribuição de probabilidade (caracterizada pelas funções de probabilidade
ou distribuição), os seus parâmetros de localização e de dispersão.
Nesta seção vamos conhecer alguns modelos, Leis, Famı́lias de distribuições, que são especiais porque
uma mesma lei pode ser usada numa grande variedade de aplicações que envolvem fenómenos aleatórios.
Notemos a utilidade que uma expressão comum, isto é, que um modelo para a distribuição de variáveis
aleatórias associadas a diferentes experiências aleatórias tem, pois simplifica o seu estudo e o nosso
trabalho!!!
Estas distribuições estão bem estudadas e tabeladas. De entre um vasto leque de distribuições es-
peciais, estudaremos apenas algumas, discretas nesta seção e contı́nuas no Capı́tulo III, essenciais num
estudo introdutório a esta área.
17
2.3.1 Distribuição de Bernoulli
Seja A um acontecimento associado a uma determinada experiência aleatória, tal que P (A) = p , com
p ∈]0, 1[.
Considere-se a variável aleatória X definida do modo seguinte
1 se A ocorre
X= .
0 se A não ocorre
A variável assim definida é uma v.a. discreta de suporte S = {0, 1} e função de probabilidade
1−p se x = 0
px (1 − p)1−x se x ∈ {0, 1}
p(x) = p se x = 1 = .
0 se x ∈ S
0 se x ∈ S
• A função (lei) de probabilidade assim definida é denominada por lei de Bernoulli de parâmetro
p, denotada por B(p) (ou Bernoulli(p)).
• Diz-se que a v.a. X segue uma lei de Bernoulli (ou X tem distribuição de Bernoulli) de
parâmetro p, e escreve-se simbolicamente X ∼ B(p).
Nota A distribuição de Bernoulli está associada a experiências aleatórias com apenas dois resultados
possı́veis, usualmente denominados por sucesso e insucesso, com probabilidade de ocorrer sucesso p (o
seu parâmetro!) e insucesso q = 1 − p. Uma experiência aleatória assim caracterizada chama-se prova
(ou tentativa) de Bernoulli.
E(X) = p
V (X) = p(1 − p)
Seja A um acontecimento associado a uma determinada experiência aleatória, tal que P (A) = p , com
p ∈]0, 1[.
Suponha agora que esta mesma experiência é realizada n vezes, com n > 1, sempre nas mesmas
condições (note que os resultados das sucessivas experiências são independentes e logo P (A) = p em
qualquer realização).
Considere-se a variável aleatória
X: número de vezes que ocorre o acontecimento A, nas n realizações da experiência
aleatória
Observações
18
• A probabilidade (por exemplo) de ocorrer exatamente x vezes o acontecimento A, e de seguida
n − x vezes A, é dada por
| ∩ {z
P (A ... ∩ A}) = P (A)...P (A) P (A)...P (A) = px (1 − p)n−x
| ∩ {z
... ∩ A} ∩ A
| {z }| {z }
x vezes n−x vezes x vezes n−x vezes
O número
• de maneiras distintas de ocorrer x vezes o acontecimento A, nas n realizações, é Cxn =
n n!
=
x (n − x)!x!
X é uma v.a. discreta de suporte S = {0, 1, ..., n} e função de probabilidade dada por
n
px (1 − p)n−x se x ∈ {0, 1, ..., n}
p(x) = P (X = x) = x .
0 se x ∈ S
Diz-se que a v.a. X segue uma lei Binomial (ou X tem distribuição Binomial) de parâmetros
n e p, e escreve-se simbolicamente X ∼ B(n, p).
Diz-se que a v.a. X segue uma lei Binomial (ou X tem distribuição Binomial) de parâmetros
n e p, e escreve-se simbolicamente X ∼ B(n, p).
19
Figura 1: Consulta da distribuição Binomial nas Tabelas de ME
Suponha que se tem um número finito de N objetos, dos quais M são de um tipo (sucesso) e os restantes
N − M de outro tipo (insucesso). Considere a experiência aleatória: extração, ao acaso, de um objeto.
Suponha agora que esta mesma experiência é realizada n vezes, isto é, extração sucessiva, e sem
reposição, de n dos N objetos (note que os resultados das sucessivas experiências não são independentes).
Seja
X: número de objetos do tipo sucesso obtidos nas n extrações
Observações:
• x ≤ n ∧ x ≤ M ⇐⇒ x ≤ min(n, M )
n−x ≤n ∧ n−x≤ N −M
⇐⇒ x ≥ 0 ∧ x ≥ n − (N − M )
⇐⇒ x ≥ max(0, n − (N − M ))
Então
S = {max(0, n − (N − M )), 1, . . . , min(n, M )}
M N −M
• O número de casos favoráveis à ocorrência de x sucessos, nas n extrações, é
x n−x
N
• O número de casos possı́veis nas n extrações, é
n
20
• A probabilidade de obter exatamente x sucessos, nas n extrações, é dada por
M N −M
x n−x
P (X = x) = , para x ∈ S
N
n
Diz-se que a v.a. X segue a lei Hipergeométrica (ou X tem distribuição Hipergeométrica)
de parâmetros n, N e M, e escreve-se simbolicamente X ∼ H(n, N, M).
Propriedades
• Se X ∼ H(n, N, M ) então
M
E(X) = n
N
M M N −n
V (X) = n 1−
N N N −1
Notas:
Tal como no caso da Binomial, a distribuição Hipergeométrica é usada na contagem do número de
sucessos que ocorrem em n realizações de uma experiência aleatória com apenas dois resultados possı́veis
(sucesso ou insucesso). No entanto, a Hipergeométrica é usada quando a probabilidade do sucesso é
alterada em cada realização.
Uma das aplicações mais interessantes destas distribuições é na área da Amostragem, onde uma
amostra de dimensão n é seleccionada numa população de dimensão N . Uma leitura dos parâmetros da
Hipergeométrica, (n, N, M ) , é
n: dimensão da amostra
N : dimensão da população (finita)
M : número de sucessos na população
Prova-se, no entanto, que em certas condições, a distribuição H(n, N, M ) pode ser aproximada pela
M
distribuição B(n, p) , com p = .
N
21
Na prática,
n
se ˙ B n, M
≤ 0.1 então H(n, N, M ) ∼ N
N
↓
“aproximadamente (no limite)”
Seja λ um número real positivo. Diz-se que uma v.a. X segue a lei de Poisson de parâmetro λ, e escreve-se
simbolicamente X ∼ P(λ), se X for discreta de suporte S = IN0 , com função de probabilidade
( λx
e−λ se x ∈ IN0
p(x) = P (X = x) = x! .
0 se x ∈ S
• P (X = x) > 0, ∀x ∈ IN0
+∞
X
• P (X = x) = 1
x=0
Propriedades
• E(X) = V (X) = λ
Notas
Concluir que uma certa v.a. segue a lei de Poisson (ao contrário das leis Binomial e Hipergeométrica)
não é imediato, e sai fora do âmbito do nosso curso. No entanto, esta distribuição é aplicada na contagem
de eventos independentes que ocorrem durante um dado intervalo de tempo ou numa dada região espacial.
Esta distribuição também é conhecida pela distribuição dos acontecimentos raros, pois a probabilidade
de ocorrer mais do que um evento num intervalo muito pequeno é nula.
Prova-se que a distribuição B(n, p) , com p muito pequeno e n suficientemente grande (n ≥ 20), pode
ser aproximada pela distribuição P(λ) , com λ = np. Na prática,
22
Figura 2: Consulta da distribuição de Poisson nas Tabelas de ME
Definição Seja Ω o espaço de resultados associado a uma experiência aleatória. Designa-se por
variável aleatória bidimensional (ou vector aleatório de dimensão dois) uma função X de domı́nio Ω e
contradomı́nio em IR2 .
X : Ω −→ IR2
w −→ X(w) = (X1 (w), X2 (w))
Exemplo de Ilustração
Lançamento de dois dados, anotando os números de pontos das faces que ficam voltadas para cima.
Ω = {(i, j) : i, j ∈ {1, 2, 3, 4, 5, 6}}.
Seja X = (X1 , X2 ) o vetor aleatório que representa a soma, X1 , e a diferença, X2 , dos pontos
obtidos.
Notas
− Uma variável aleatória bidimensional é um vetor cujas componentes são variáveis aleatórias unidi-
mensionais.
Por uma questão de clareza e simplicidade na exposição dos conceitos, no nosso estudo vamos considerar
apenas variáveis aleatórias bidimensionais. No entanto, todos os conceitos aqui apresentados generalizam-
se facilmente para o caso k-dimensional.
− Os vetores aleatórios podem ser discretos (todas as componentes do vetor são v.a.’s discretas),
contı́nuos (todas as componentes do vetor são v.a.’s contı́nuas) ou mistos. Embora neste curso se analise
23
apenas o caso discreto, os conceitos aqui apresentados generalizam-se para o caso contı́nuo. O caso misto
está fora do âmbito do nosso estudo.
Definição Um vetor aleatório (X, Y ) diz-se discreto se existir um conjunto finito ou infinito nu-
merável S tal que
S = {(x, y) ∈ IR2 : P (X = x, Y = y) > 0}
e tal que X
P ((X, Y ) ∈ S) = P (X = x, Y = y) = 1.
(x,y)∈S
Definição Sejam X e Y duas variáveis aleatórias. A função de probabilidade conjunta do par (X, Y )
é dada por
pXY (x, y) = P (X = x ∩ Y = y), ∀(x, y) ∈ IR2 .
↓
“probabilidade de, simultaneamente,
X tomar o valor x e Y tomar o valor y”
Propriedades:
X X
= P (X = a ∩ Y = b).
a ∈SX ∩]−∞,x] b ∈SY ∩]−∞,y]
(2) ∀(x1 , y1 ), (x2 , y2 ) ∈ IR2 , se x1 < x2 e y1 < y2 ⇒ FXY (x1 , y1 ) ≤ FXY (x2 , y2 ) (FXY é não decrescente)
24
Definições Seja (X, Y ) um vetor aleatório discreto com função de probabilidade conjunta pXY .
(de modo análogo se define função de probabilidade condicionada de X dado Y = y, com pY (y) > 0)
pY /X=x é uma função de probabilidade.
Definição Seja (X, Y ) um vetor aleatório tal que E(X) e E(Y ) existem. Chama-se esperança
matemática (valor médio ou valor esperado) do vetor (X, Y ) ao vetor (E(X), E(Y )).
Propriedade Seja (X, Y ) um vetor aleatório discreto de suporte S e g : IR2 → IR tal que g(X, Y )
é uma variável aleatória. Tem-se
X
E[ g(X, Y ) ] = g(x, y)P (X = x, Y = y).
(x,y)∈S
25
Definição Seja (X, Y ) um vetor aleatório discreto tal que E(X) = µX e E(Y ) = µY . A Covariância
entre X e Y , denotada por cov(X, Y ), é definida por
Algumas propriedades :
1. V (X + Y ) = V (X) + V (Y ) + 2 cov(X, Y )
2. V (X − Y ) = V (X) + V (Y ) − 2 cov(X, Y )
Casos particulares:
" n # n
X X
i) V Xi = V (Xi );
i=1 i=1
ii) V (X1 − X2 ) = V (X1 ) + V (X2 ).
Nota Se X e Y são independentes então cov(X, Y ) = 0 (!), mas a implicação contrária já não é
válida!
Definição Seja (X, Y ) um vetor aleatório. O coeficiente de correlação linear entre X e Y , denotado
por ρXY , é dado por
cov(X, Y ) cov(X, Y )
ρXY = p = .
V (X) V (Y ) σX σY
Nota:
−1 ≤ ρXY ≤ 1
26
Exemplo
1. Uma fábrica possui duas linhas de produção de um certo motor. Considere o vetor aleatório (X, Y ),
onde
X: número de motores produzidos, diariamente, na linha I
X 0 1 2
Y
0 0 0.06 0.19
1 0.03 0.07 0.18
2 0.04 0.06 0.1
3 0.04 0.08 0.15
x 0 1 2 y 0 1 2 3
pX (x) 0.11 0.27 0.62 pY (y) 0.25 0.28 0.2 0.27
27
Exercı́cios
1. Uma moeda apresenta cara duas vezes mais frequentemente que coroa. Essa moeda é lançada três
vezes e X é a variável aleatória que representa o número total de caras que ocorreram.
2. Suponha que o número de computadores utilizados diariamente numa determinada empresa é uma
variável aleatória X com função de probabilidade,
(
k2x
se x = 1, 2, 3, 4
P (X = x) = p(x) = x! .
0 se caso contrário
28
4. Seja X uma variável aleatória discreta definida por:
k+1 k k−1 k
P (X = xi )
8 8 8 8
1
(a) Determine as constantes k e m sabendo que E(X) = .
4
(b) Calcule E(X − 2) e V(3X − 2).
(c) Obtenha a função distribuição da v.a. X.
(d) Calcule: P (X ≤ −5), P (X ≤ −1), P (−1 < X ≤ 3), P (X ≥ 4), P (X < 4) e P (X ≤ 6).
xi -2 -1 0 1 2
1 1 1
p(xi ) k k
3 15 3
onde a e b designam números reais. Sabendo que valor médio desta variável é 1.25, os valores de a
e b podem ser respetivamente
√ √
1 1 1 1 2 3 1 10
(A) − ; (B) ; (C) ; (D) ;
2 4 4 2 9 3 8 4
7. (Exercı́cio ao cuidado do aluno) Seja X uma v. a. discreta de Suporte S ⊂ [a, b], com a e b
dois números inteiros positivos à sua escolha.
29
i. Calcule as funções de probabilidade e distribuição de X.
ii. Calcule, se possı́vel, as seguintes probabilidades:
(i) P (X ≥ 0) (ii) P (0 < X ≤ 7)
(iii) P (X ≤ 1.5/X ≥ 0.5) (iv) P (1 < X < 3/X ≥ 2)
iii. Considere a variável aleatória g(X) = X 2 − 4.
Sem usar o suporte de g(X), calcule E[g(X)] e V [g(X)].
8. Uma caixa contém 20 peças das quais 5 são defeituosas. Tiram-se 6 peças da caixa, com reposição
da peça extraı́da em cada tiragem. Seja X o número de peças defeituosas encontradas.
9. Considere o exercı́cio no 1. A lei da variável aleatória aı́ definida é especial. Identifique-a, justifi-
cando a sua resposta.
10. Uma loja quer vender rapidamente os 100 computadores portáteis que tem em armazém, pelo que
realizou uma promoção com descontos oferecendo o sistema operativo. O processo de instalação
do sistema operativo não é completamente fiável e 10 dos portáteis necessitarão de assistência
complementar.
Uma empresa comprou na loja 20 portáteis, selecionados aleatoriamente no armazém.
(a) Indique (justificando) a lei de probabilidade do número de portáteis comprados pela empresa,
que necessitarão de assistência.
(b) Qual a probabilidade de nenhum dos portáteis apresentar problemas?
(c) Indique uma expressão matemática que permita determinar a probabilidade de mais de 5
portáteis necessitarem de assistência.
(d) Cada um dos portáteis é vendido a 1.520 euros e a sua eventual assistência custará à loja 55
euros. Indique o lucro esperado da loja com a venda dos portáteis à empresa.
11. Considere a experiência aleatória ”lançamento de um dado equilibrado”. Suponha que se efetua
uma sucessão de 20 realizações desta experiência. Seja X a variável aleatória que representa o
número de faces 5 que ocorreram nas 20 realizações da experiência. Determine:
12. A informação obtida em experiências anteriores diz-nos que a probabilidade de um certo leitor ótico
fornecer uma leitura errada é de 1%. Suponha que, num determinado perı́odo de tempo, se obtêm
18 leituras com esse leitor ótico. A probabilidade de se obter, nesse perı́odo de tempo, duas ou mais
leituras erradas é:
13. De um grupo de 1000 habitantes de certa região, há 20% que são proprietários da casa que habitam.
Se se recolher, ao acaso, uma amostra de 10 indivı́duos, qual a probabilidade de 6 terem casa
própria?
30
14. Apenas 30% dos habitantes de uma grande cidade pensam que o sistema de trânsito vigente é
adequado. Se forem selecionados 20 habitantes, encontre a probabilidade de, no máximo, 2 concor-
darem com o sistema de trânsito.
15. Suponha que 10% dos vidros fabricados por certa máquina são defeituosos. Se forem selecionados,
ao acaso, 10 vidros da produção total da máquina, qual a probabilidade de
16. Durante os Censos 2021, nos inquéritos à população feitos de forma independente uns dos outros,
verificou-se que 25% das pessoas precisavam de ajuda para preencher o inquérito.
(a) Considere que num dia esse inquérito foi realizado, pelo mesmo profissional, a 16 pessoas.
i. A probabilidade de mais de 4 terem precisado de ajuda é:
ii. As pessoas que precisam de ajuda demoram 60 minutos a preencher o inquérito e as que
não precisam de ajuda demoram 30 minutos. Quantas horas é de esperar que, no total, o
profissional tenha necessitado para recolher as respostas das 16 pessoas?
(b) Suponha agora que o inquérito foi realizado a 144 pessoas, qual a probabilidade de no máximo
40 pessoas terem precisado de ajuda?
17. Admita que é engenheiro de controle de qualidade numa empresa de produção de hardware para
computadores. A sua empresa recebeu um grande lote de componentes eletrónicos de um determi-
nado fornecedor que afirma que cada lote só tem 5% de componentes defeituosas. O lote contém 500
componentes e é da sua responsabilidade inspecionar uma amostra aleatória de 50 componentes. O
valor exato da probabilidade de encontrar 3 componentes defeituosas na amostra de 50 componentes
é:
18. Uma empresa efetuou um estudo sobre a probabilidade de ocorrência de erros no trabalho dos seus
colaboradores. Classificou o tipo de tarefas que desenvolvem segundo a sua complexidade em dois
nı́veis: média complexidade e alta complexidade. Verificou que
19. O número de chamadas que chegam num perı́odo de 5 minutos à central telefónica de uma empresa
é uma variável aleatória com distribuição de Poisson de parâmetro 10.
31
i. chegarem exatamente 8 chamadas;
ii. chegarem menos de 5 chamadas;
iii. chegarem, no mı́nimo, 3 chamadas;
iv. não chegar alguma chamada.
(b) Qual a probabilidade de chegarem à central telefónica 35 chamadas, num perı́odo de 10 minutos
consecutivos? Justifique.
20. O número de visitantes que entra num cibercafe ao longo dos vários perı́odos diários segue uma lei
de Poisson. No entanto, o número médio de visitantes varia consoante o perı́odo do dia: no perı́odo
da manhã espera-se 3 visitantes e no perı́odo da tarde 15.
Assuma independência entre o número de visitantes ao cibercafe nos dois perı́odos diários.
(a) Qual a probabilidade de numa manhã de um dia qualquer, o número de visitantes ao cibercafe
ser pelo menos cinco?
(b) Qual a probabilidade de, num dia qualquer, o número total de visitantes ao cibercafe nos
perı́odos da manhã e da tarde ser menor que 31?
(c) Qual a probabilidade de, num dia qualquer, o número de visitantes na manhã ser igual a 5 e
na tarde ser igual a 20?
21. Determinada editora publica um livro com uma tiragem de 100 000 exemplares. A probabilidade
de que um dos livros seja encadernado incorrectamente é 10−4 . Calcule a probabilidade aproximada
de que o número de livros mal encadernados da tiragem seja
(a) exactamente 5;
(b) pelo menos 4;
(c) não mais do que 2.
22. O número de petroleiros que chegam em cada dia a determinada refinaria é uma variável aleatória
com distribuição de Poisson de média 2. As atuais instalações do porto podem atender 3 petroleiros
por dia; se acontecer que mais de 3 navios pretendam entrar no porto, os excedentes a 3 deverão
seguir para outro destino.
(a) Em determinado dia, qual a probabilidade de se ter de mandar petroleiros para outro porto?
(b) Qual o número esperado de petroleiros a chegarem por dia?
(c) Qual o número mais provável de petroleiros a chegarem por dia?
(d) De quanto deverão ser aumentadas as atuais instalações do porto para permitir manobrar
todos os petroleiros em 95% dos dias?
(e) Deduza a lei de probabilidade do número de petroleiros a serem atendidos por dia.
(f) Qual o número esperado de petroleiros a serem atendidos por dia?
23. O número de acidentes de trabalho, por mês, numa obra de construção civil é uma variável aleatória
com distribuição de Poisson de valor médio 2.
32
24. Sejam X e Y duas variáveis aleatórias reais independentes tais que X ∼ P(0.2) e Y ∼ P(0.4).
Determine P(X + Y = 3).
25. Uma máquina eletrónica tem, em média, 2 avarias por mês. Considerando que o número de avarias
mensal segue uma distribuição de Poisson, a probabilidade de, num ano, se terem verificado pelo
menos 11 avarias é:
26. O número de defeitos por artigo produzido numa certa linha de produção segue uma distribuição
de Poisson de valor esperado 0.01. Para serem distribuı́dos, esses artigos são embalados em caixas
de 10 unidades.
27. Na sede de uma empresa, é produzida diariamente uma grande quantidade de peças. A probalilidade
de uma peça ter defeitos é 0.01. Antes de enviar a produção para as filiais, o responsável pela linha
de produção tem como obrigação efetuar um controlo de qualidade, pelo que inspeciona um lote de
20 peças, extraı́das, ao acaso e sem reposição, das que foram produzidas. O responsável inviabiliza
o envio se encontrar mais do que duas peças com defeitos nessa amostra.
(a) Qual é a probabilidade do envio ser viabilizado pelo responsável da linha de produção?
(b) Qual é o número esperado de peças defeituosas na amostra inspecionada?
(c) Admita que, na produção da empresa, o número de peças que é necessário inspecionar sucessi-
vamente até serem encontradas duas peças com defeitos é uma variável aleatória Y . Determine
a lei de probabilidade da variável aleatória Y .
28. Seja X a variável aleatória relativa ao número de defeitos encontrados numa unidade de determinado
artigo e Y a v.a. que indica o número da fábrica que o produziu. A tabela seguinte representa a
função de probabilidade conjunta do vector (X, Y ):
X 0 1 2 3
Y
1 1 3 1
1
8 16 16 8
1 1 1 1
2
16 16 8 4
(a) Determine as leis de probabilidade marginais de X e Y .
(b) Calcule P (X = 2), P (X ≥ 2), P (X ≤ Y ) e P (Y = 3).
(c) Determine E(X), V(X), Cov (X, Y ) e ρ XY . (Nota: E(Y ) = 1.5, V(Y ) = 0.25).
(d) O número de defeitos que um artigo apresenta é independente da fábrica que o produziu?
(e) Sabendo que determinado artigo foi produzido pela fábrica 2, qual a probabilidade de apre-
sentar defeitos?
33
29. A tabela seguinte indica a função de probabilidade conjunta das variáveis aleatórias X e Y :
Y -1 0 1
X
-1 0 p 0
1 1
0 4 0 4
1
1 0 4 0
31. Numa dada loja de componentes para computadores, as vendas diárias de discos rı́gidos das marcas
1 e 2, respetivamente X1 e X2 , têm a seguinte função de probabilidade conjunta:
X1 0 1 2
X2
0 0.12 0.25 0.13
1 0.05 0.30 0.01
2 0.03 0.10 0.01
34
33. Seja X a variável aleatória que representa o número total de alunos que frequentaram o horário de
atendimento e Y o número de questões/dúvidas, em 3 possı́veis, que um aluno não consegue escla-
recer até ao dia da frequência. A função de probabilidade conjunta do vetor (X, Y ) é representada
pela tabela,
Y 0 1 2 3
X
5 0.08 0.07 0.02 0.00
10 0.12 0.11 0.06 0.04
20 0.17 0.15 0.1 0.08
34. Considere o vetor aleatório (X, Y ), em que X representa o número de ocorrências de erro detetadas
por um colaborador num determinado teste, e Y representa o tipo de colaborador (0 se o colabo-
rador é não experiente ou 1 se o colaborador é experiente) caracterizado pela seguinte função de
probabilidade conjunta.
X 0 1 2
Y
0 0.28 0.08 0.04
1 0.18 0.06 0.36
(a) Determine as leis de probabilidade marginal do número de ocorrências de erro detetadas por
um colaborador e do tipo de colaborador.
(b) Construa a função de probabilidade do número de ocorrências de erro detetadas por um
colaborador sabendo que este é experiente.
(c) Concorda com a afirmação ”A probabilidade de serem detetadas 2 ocorrências de erro é igual
à probabilidade de um colaborador não ser experiente.”? Justifique.
(d) Justifique que existe uma relação linear positiva moderada entre o tipo de colaborador e o
número de ocorrências de erro detetadas?
35. Considere o vetor aleatório (X, Y ), em que X representa o número de ocorrências de erro detetadas
por um colaborador num determinado teste, e Y representa o tipo de colaborador (0 se o colabo-
rador é não experiente ou 1 se o colaborador é experiente) caracterizado pela seguinte função de
35
probabilidade conjunta
P
X 0 1 2
Y
0 0.28 a 0.04 b
1 c d e 0.6
P
0.46 f 0.4
(a) Determine as leis de probabilidade marginal do número de ocorrências de erro detetadas por
um colaborador e do tipo de colaborador.
(b) Determine a probabilidade do colaborador não ser experiente dado que se detetaram ocorrências
de erro.
(c) Determine a probabilidade de serem detetadas ocorrências de erro e o trabalhador ser experi-
ente.
(d) Verifique que X e Y não são independentes.
36. Considere o vetor aleatório (X, Y ) que representa o número de discos externos das marcas A e
B, respetivamente, vendidos diariamente numa loja e que é caracterizado pela seguinte função de
probabilidade conjunta.
Y 0 1 2
X
0 a 0.06 0.04
1 0.09 b 0.01
2 0.05 0.02 0.01
(a) Sabendo que em 80% dos dias não se vendem leitores da marca A, determine o valor das
constantes a e b.
(b) Determine as leis de probabilidade marginal do número de discos externos das marcas A e B
vendidas diariamente na loja.
(c) Calcule P (Y = y/X = 2), ∀y ∈ IR e comente o seu significado.
37. Numa determinada região, o número de filhos dos sexos feminino e masculino, por casal, é bem
modelado pelas variáveis aleatórias reais X e Y , respetivamente.
A função de probabilidade conjunta de (X, Y ) é dada na forma de tabela, por
Y 0 1 2 3
X
0 0.15 0.10 0.05 0.02
1 0.10 0.10 0.05 0.10
2 0.09 0.08 0.10 0
3 0.04 0.02 0 0
36
(e) As variáveis aleatórias X e Y são independentes? Justifique.
38. Numa fábrica, há três linhas de produção de um artigo (X), sendo que o artigo é classificado quanto
ao acabamento (Y ), de acordo com a seguinte tabela:
Y
X 1 2 Total
1 0.06 b 0.25
2 0.04 c e
3 a d 0.4
(A) 2.00 (B) 1.85 (C) 2.15 (D) Nenhuma das anteriores
37
Soluções dos Exercı́cios
38
16. (a) i. C ii. 10 horas (b) 0.8079
17. C
18. (a) 0.006 (b) 0.0345
19. (a) i. 0.1126 ii. 0.0293 iii. 0.9972 iv. 0.5 × 10−4 (b) 0.0007
20. (a) 0.1847 (b) 0.9967 (c) 0.00421
21. (a) 0.0378 (b) 0.9897 (c) 0.0028
22. (a) 0.1429 (b) 2 (c) 1 ou 2 (d) x = 4 (mais um petroleiro)
yi 0 1 2 3 c.c
(e) (f) 1.782
p(yi ) 0.1353 0.2707 0.2707 0.3233 0
23. (a) 0.1353 (b) 0.5543 (c) 0.0038
24. 0.0198
25. D
26. (a) B (b) B
27. (a) 0.9990 (b) 0.02 (c) S = {2, 3, . . . } e P (Y = k) = (k − 1)(0.99)k−2 (0.01)2
xi 0 1 2 3 c.c 5 11 7 30 79
28. (a) 3 2 5 6 (b) 16 , 16 , 16 , 0 (c) 16 , 64 , 0.125, 0.225
p(xi ) 16 16 16 16 0
yi 1 2 c.c
1 1
p(yi ) 2 2 0
(d) Não (e) 0.875
1 xi -1 0 1 c.c
29. (a) p = 4 (b) (c)
P (X = xi /Y = 0) 0.5 0 0.5 0
xi -1 0 1 c.c
p(xi ) 0.25 0.5 0.25 0
yi -1 0 1 c.c
p(yi ) 0.25 0.5 0.25 0
xi 1 2 c.c yi 1 2 3 4 c.c 3 9 6 8 21
30. (a) 14 18 5 7 9 11 (b) 32 , 32 , 32 , 32 , 1, 32
p(xi ) 32 32 0 p(yi ) 32 32 32 32 0
yi 1 2 3 4 c.c
(c) 3 4 5 6 (d)Não
P (Y = yi /X = 2) 18 18 18 18 0
x1i 0 1 2 c.c
31. (a) (b) 0.95; 0.64
p(x1i ) 0.2 0.65 0.15 0
x2i 0 1 2 c.c
p(x2i ) 0.5 0.36 0.14 0
x 0 1 2 c.c
(c) 0.39 (d) (e) Não
p(x) 0.6 0.25 0.15 0
Y 0 1
X
32. (a) 0 0.245 0.245 (b) 0.3
1 0.21 0.21
2 0.045 0.045
x 5 10 20 c.c y 0 1 2 3 c.c
33. (a) (b) 0.08;
p(x) 0.17 0.33 0.5 0 p(y) 0.37 0.33 0.18 0.12 0
(c) i. P.F.; ii. P.V.; iii. P.V.; iv. P.V.
39
x 0 1 2 c.c y 0 1 c.c
34. (a) (b)
P (X = x/Y = 1) = (c) Sim, ambas são
p(x) 0.46 0.14 0.4 0 p(y) 0.4 0.6 0
0.3 , x=0 iguais a 0.4; (d) ρ =
0.1 , x=1 0.4764 ∈ [0.3, 0.7]
0.6 , x=2
0 , x∈/ {0, 1, 2}
x 0 1 2 c.c y 0 1 c.c
35. (a) (b) 0.2222;
p(x) 0.46 0.14 0.4 0 p(y) 0.4 0.6 0
(c) 0.4200;
(d) ...
5
, y=0
8
1
, y=1
36. (a) a = 0.7; b = 0.02; (c) P (Y = y/X = 2) = 4
1
(b)
, y=2
x 0 1 2 c.c 8
0 , y∈
/ {0, 1, 2}
p(x) 0.8 0.12 0.08 0
y 0 1 2 c.c
p(y) 0.84 0.1 0.06 0
x 0 1 2 3 c.c y 0 1 2 3 c.c
37. (a) (b) 0.33;
p(x) 0.32 0.35 0.277 0.06 0 p(y) 0.38 0.3 0.2 0.12 0
(c) 0.4545; (d) -0.0142; (e) Não, pois a cov(X, Y ) 6= 0
38. (a) a = 0.05; b = 0.19; c = 0.31 : d = 0.35; e = 0.35 ; (b) 0.24 (c) B
40
3 Capı́tulo III - Variáveis Aleatórias e Distribuições de Probabi-
lidade Contı́nuas
Definição Uma v.a. X diz-se contı́nua se existir uma função f : IR −→ IR que verifique
(i) f (x) ≥ 0, ∀x ∈ IR (não negativa)
Z +∞
(ii) |f (x)| dx < ∞ (integrável em IR)
−∞
Z +∞
(iii) f (x) dx = 1
−∞
Z b
e tal que ∀ a, b ∈ IR, P ( X ∈]a, b[ ) = f (x) dx.
a
Uma função f com estas caracterı́sticas chama-se função densidade de probabilidade de X, e permite
calcular a probabilidade de X assumir valores num qualquer intervalo real.
Definição Seja X uma v.a. contı́nua com função densidade de probabilidade f . Chama-se função distribuição
de X à função F : IR −→ [0, 1] definida por
F (x) = P (X ≤ x)
Z x
= f (a) da, ∀x ∈ IR.
−∞
Nota A definição de função distribuição é a mesma quer as variáveis aleatórias sejam discretas ou contı́nuas
(a integração no caso contı́nuo é a extensão “natural” da soma (caso discreto)).
Os parâmetros de localização e de dispersão de uma v.a. contı́nua definem-se de modo análogo ao caso discreto.
Definições
Seja X uma v.a. contı́nua de densidade f .
41
⊲ Seja g : IR → IR tal que g(X) é uma v.a. contı́nua. Então
Z +∞
E[ g(X) ] = g(x)f (x) dx.
−∞
Z +∞
Exemplo: k ∈ IN (arbitrariamente fixo), E(X k ) = xk f (x) dx
−∞
F (Md ) = 0.5 .
Seja [a, b] um intervalo real não vazio. Diz-se que uma v.a. X segue a lei (ou X tem distribuição) Uniforme
no intervalo [a, b], e escreve-se simbolicamente X ∼ U[a,b] , se X for uma variável contı́nua com função densidade
( 1
se x ∈ [a, b] 1
f (x) = b−a = 1 [a,b] (x)
0 se x < a ∨ x > b b−a
Propriedades
• Se X ∼ U[a,b] então
a+b
E(X) =
2
(b − a)2
V (X) =
12
Nota
A distribuição Uniforme é usada para descrever medidas que variam aleatoriamente num certo intervalo não
vazio [a, b] e cuja probabilidade de tomar valores num sub-intervalo de [a, b] é proporcional ao seu comprimento.
De facto, se X ∼ U[a,b] ,
1
∀[c, d] ⊆ [a, b], P (c ≤ X ≤ d) = k(d − c), com k = .
b−a
42
3.2.2 Distribuição Exponencial
Seja λ um parâmetro real positivo. Diz-se que uma v.a. X tem distribuição Exponencial de parâmetro λ, e
escreve-se simbolicamente X ∼ E(λ), se X for uma variável contı́nua com função densidade
λ e−λx se x ≥ 0
f (x) = = λ e−λx 1 [0,+∞[ (x)
0 se x < 0
Propriedades
• Se X ∼ E(λ) então
1
E(X) =
λ
1
V (X) =
λ2
Nota
Se a distribuição de Poisson é aplicada na contagem de eventos independentes num certo intervalo de tempo,
a distribuição Exponencial é usada para representar intervalos de tempo entre eventos independentes!!
Sejam µ ∈ IR e σ ∈ IR+ . Diz-se que uma v.a. X tem distribuição Normal de parâmetros µ e σ, e escreve-se
simbolicamente X ∼ N (µ, σ), se X for uma variável contı́nua com função densidade
2
1 x−µ
1 −
f (x) = √ e 2 σ , ∀x ∈ IR.
2πσ
Nota Diz-se também que X é Normalmente distribuı́da, ou que X segue a lei Normal, ou ainda que X é uma
v.a. Gaussiana (de Gauss), de parâmetros µ e σ.
43
Caracterı́sticas principais:
• Forma de “sino”
• Simétrica relativamente a x = µ
Z b
1 1 x−µ 2
• P (X ∈ [a, b]) = √ e− 2 ( σ ) dx = ...!?
a 2πσ
Parâmetros
Mostra-se que
44
Caso particular: µ = 0 e σ = 1.
• Se Z ∼ N (0, 1) então
Z z
1 1 2
FZ (z) = P (Z ≤ z) = √ e− 2 t dt, ∀z ∈ IR.
−∞ 2π
• Estão disponı́veis (em tabelas ou máquinas de calcular) as probabilidades FZ (z), para alguns valores de z.
Em particular, nas tabelas de PE podem ser consultadas as probabilidades FZ (z), para alguns z ≥ 0!
2. Se X ∼ N (µ, σ) e a, b ∈ IR (a 6= 0) então
√
Y = aX + b ∼ N aµ + b, a2 σ 2
“a combinação linear de v.a.’s independentes com distribuição normal é (ainda) uma v.a. normalmente
distribuı́da”
45
Casos particulares
Sejam X1 , X2 , ...Xn v.a.’s independentes e tais que Xi ∼ N (µ, σ), com µ ∈ IR e σ ∈ IR+ para i = 1, 2, ...n.
Então
n
X √
Xi ∼ N nµ, nσ
i=1
n
1X σ
Xi ∼ N µ, √
n i=1 n
Sejam X1 , X2 , ..., Xn uma sequência de variáveis aleatórias independentes e identicamente distribuı́das com
E(X) = µ e V (X) = σ 2 . Para n suficientemente grande, tem-se
X − E(X) √ X − µ
= n ∼
˙ N (0, 1).
σ(X) σ
Notas
• A aproximação à Normal centrada e reduzida pode ser efetuada na prática para n > 30; no entanto, esta
será tanto melhor quanto maior for o valor de n.
O T.L.C. permite alargar este resultado a qualquer famı́lia, desde que se considere uma sequência de variáveis
aleatórias independentes e identicamente distribuı́das de tamanho bastante razoável!
• Se X ∼ B(n, p) [E(X) = np e V (X) = np(1 − p)], para n suficientemente grande e p ∈]0.1, 0.9[,
p X − np
X∼
˙ N np, np(1 − p) ⇔ Z = p ∼
˙ N (0, 1)
np(1 − p)
Nota
n
X
Neste caso, X = Xi com Xi ∼ B(p) para i = 1, ..., n.
i=1
Se p ≤ 0.1 então X ∼
˙ P(np);
Se p ≥ 0.9 então Y = n − X ∼P(n(1
˙ − p))
46
• Se X ∼ P(λ) [E(X) = V (X) = λ], para λ suficientemente grande,
√ X−λ
˙ N λ, λ ⇒ Z = √
X∼ ∼
˙ N (0, 1)
λ
Nota
n
X
Neste caso, X = Xi com Xi ∼ P( nλ ) para i = 1, ..., n.
i=1
Notas
• A aproximação à Normal é tanto melhor quanto maior for o valor de n (no caso da Binomial) ou de λ (caso
da Poisson), mas na prática pode ser efetuada com resultados razoáveis desde que n > 20 ou λ > 20.
• Na aproximação de uma distribuição discreta à normal , como nos casos anteriores, deve estar presente que
a normal é uma distribuição contı́nua. Com o objetivo de reduzir o erro de aproximação é usual efetuar-se uma
correção de continuidade. Não a efetuaremos nas aulas de PE, mas fica a nota de que se X é uma v.a. discreta,
a correção de continuidade consiste em converter X numa v.a. contı́nua, do modo seguinte (por exemplo):
P (X = x) ≃ P (x − 0.5 ≤ X ≤ x + 0.5)
Seja n ∈ IN. Diz-se que uma v.a. X tem distribuição Qui-quadrado com n graus de liberdade, e escreve-se
simbolicamente X ∼ χ2n , se X for uma variável contı́nua com função densidade
1
e− 2 x 2 −1 , ∀x ∈ IR+ ,
x n
f (x) =
2 2 Γ( n2 )
n
R +∞
onde Γ(α) = 0 xα−1 e−x dx, α > 0 (chamada função Gama)
n
X
• Se Z1 , Z2 , ..., Zn são v.a.’s independentes e identicamente distribuı́das com Zi ∼ N (0, 1), então Zi2 ∼ χ2n .
i=1
• Se X ∼ χ2n então
E(X) = n
V (X) = 2n
47
Notas
• A distribuição Qui-quadrado é uma distribuição assimétrica, enviesada à direita. À medida que o número
de graus de liberdade n aumenta, o enviesamento diminui e aproxima-se da distribuição normal.
• A distribuição Qui-quadrado tem um papel fundamental no estudo da variância de uma população, como
veremos mais tarde.
• Tabela de PE :
Seja X ∼ χ2n .
Para alguns valores de n ∈ IN e p ∈]0, 1[, pode ser consultado na Tabela de PE o quantil de ordem p de X,
isto é, xp :
−1
P (X ≤ xp ) = p ⇔ FX (xp ) = p ⇔ xp = FX (p).
Seja n ∈ IN. Diz-se que uma v.a. X tem distribuição t-Student com n graus de liberdade, e escreve-se
simbolicamente X ∼ tn , se X for uma variável contı́nua com função densidade
− n+1
Γ( n+1
2 ) x2 2
f (x) = √ 1+ , ∀x ∈ IR,
nπ Γ( n2 ) n
com Γ a função Gama.
Z
q ∼ tn .
Y
n
• Se X ∼ tn então
n
V (X) = n−2 se n > 2
48
Notas
• A distribuição t-Student é uma distribuição simétrica relativamente a x = 0 e tem forma de “sino”, tal
como a normal, mas a t-Student tem caudas mais “pesadas”. À medida que o número de graus de liberdade
n aumenta (n > 30), aproxima-se da distribuição normal centrada e reduzida.
• A distribuição t-Student tem um papel fundamental no estudo da esperança de uma população.
• Tabela de PE : Para X ∼ tn , pode ser consultado o quantil de ordem p de X, para alguns valores de
n ∈ IN e p ∈]0, 1[.
49
Exercı́cios
1. Uma estação de serviço enche os seus depósitos uma vez por semana. A quantidade de combustı́vel procurada
por semana é uma variável aleatória (v.a.) X com função densidade f , definida por
5(1 − x)4 se 0 < x ≤ 1
f (x) = .
0 se x ≤ 0 ∨ x > 1
Esboço do gráfico de f
(a) Qual a probabilidade de, numa semana qualquer, a quantidade de combustı́vel procurada naquela
estação de serviço não exceder 0.5 (unidades de medida)? Interprete geometricamente o resultado
obtido.
(b) A função distribuição de X é dada por
0 , x<0
F (x) = 1 − (1 − x)5 , 0≤x<1 .
1 , x≥1
Esboço do gráfico de F
Usando F , determine:
i. P (0.2 < X < 0.5);
ii. a capacidade dos depósitos por forma a que a probabilidade de se esvaziarem numa determinada
semana seja de 5%.
2. O tempo diário (em horas) de acesso à internet por uma determinada pessoa é representado por uma v.a.
X com função densidade e função distribuição dadas, respetivamente, por
50
0 , x<0
1
x se 0 ≤ x ≤ 5
x2
1
25
50 , 0≤x≤5
f (x) = (10 − x) se 5 < x ≤ 10 e F (x) = (10−x)2 .
25
0 se x < 0 ∨ x > 10 1−
50 , 5 ≤ x ≤ 10
1 , x > 10
175
Assuma que E(X) = 5 e E(X 2 ) = 6 .
Determine:
(a) o valor da constante k;
(b) o valor esperado, variância e desvio padrão de X;
(c) a função distribuição de X.
4. Alguns cabos utilizados nas instalações de telefones podem ser reaproveitados. Assume-se que o comprimento
dos cabos segue uma lei Uniforme no intervalo de 1 a 15, U[1,15] , polegadas. Para um cabo escolhido ao acaso,
calcule:
(a) o seu comprimento médio e mediana;
(b) a sua variância e desvio padrão;
(c) a probabilidade de que o seu comprimento seja superior a 5 polegadas;
(d) a probabilidade de que o seu comprimento se situe entre 0 e 8 polegadas.
5. A duração de vida, em milhares de horas, de uma componente de certo tipo de aparelho de radar é uma v.
a. X com distribuição Exponencial de parâmetro 0.1, isto é, com função densidade e distribuição:
0 se x ≤ 0 0 se x ≤ 0
f (x) = −0.1x F (x) = −0.1x .
0.1 e se x > 0 1− e se x > 0
(a) Determine a probabilidade de uma componente, escolhida ao acaso, durar menos de 4 mil horas.
(b) Indique a duração média de vida de uma componente e o respetivo desvio padrão.
6. Seja X uma variável aleatória real cujas funções densidade e distribuição são respetivamente
0 , x<6
(
0 , x∈ / [6, 12]
x−6
f (x) = 1 F (x) = , 6 ≤ x < 12
, 6 ≤ x ≤ 12
6
6
1 , x ≥ 12
51
1
(b) Sabendo que E(X 2 ) = 84 e considerando Y = X − 2 determine
4
i. o valor esperado e a variância de Y ;
ii. a probabilidade da variável aleatória Y não assumir valores positivos.
7. A tensão de corrente X numa instalação eléctrica tem distribuição Normal de média 220 V e desvio padrão
2 V ; X ∼ N (220, 2).
(a) Calcule σ de modo a que 9.85% das medições apresentem erros superiores a 6.45 mm.
(b) Determine a percentagem de medições cujo erro varia entre −1 e 1 mm.
10. Determinada empresa opera no mercado da União Europeia na área da distribuição de encomendas. A entrega
de encomendas é executada em duas etapas. O tempo de entrega duma encomenda na primeira etapa tem
distribuição normal de média 24h e desvio-padrão 4h, enquanto que o tempo de entrega na segunda etapa,
que leva finalmente a encomenda ao destinatário, segue distribuição normal de média 8h e desvio-padrão 3h.
Os tempos nas duas etapas são independentes.
(a) Calcule a probabilidade do tempo de entrega duma encomenda na primeira etapa exceder 12h.
(b) Sabendo que na primeira etapa uma encomenda demorou mais de 24h, qual a probabilidade de ser
entregue ao destinatário durante as próximas 8h?
(c) Qual a probabilidade duma encomenda ser entregue ao destinatário num perı́odo superior a dois dias
após o seu envio?
11. O tempo de combustão de uma fita de magnésio de diâmetro A é normalmente distribuı́do de média µA =
420 seg e desvio padrão σA = 80 seg; para outra fita de diâmetro B, o tempo de combustão é também
normalmente distribuı́do mas com µB = 280 seg e σB = 45 seg. Admitindo independência entre os tempos
de combustão das fitas tipos A e B, calcule:
(a) a probabilidade de o tempo de combustão de uma fita tipo A variar entre 400 e 480 seg;
(b) a probabilidade de o tempo de combustão de uma fita de diâmetro B ser superior ao de uma fita de
diâmetro A.
52
12. O peso de uma peça, produzida com determinado material, segue uma distribuição normal de média 140 g e
variância 625 g 2.
(a) Determine a probabilidade de uma peça ter peso superior a 120 g, sabendo que o seu peso não excede
150 g.
(b) As peças deste tipo são embaladas em caixas contendo 50 unidades. O peso de cada caixa também é
aleatório, normalmente distribuı́do de média 1 kg e desvio-padrão 20 g.
Determine a probabilidade de o peso de uma caixa completa exceder 8.5 kg.
(c) Qual a probabilidade de, numa caixa completa, no máximo uma das peças ter peso superior a 150 g?
13. Suponha que o consumo de água num dado dia da semana, numa determinada localidade, segue uma dis-
tribuição normal de média 200 m3 e desvio padrão 10 m3 . A capacidade do reservatório que abastece a
localidade (e apenas esta) é de 4240 m3 . Sempre que o nı́vel de água no reservatório cai 10% abaixo da sua
capacidade é acionado um sistema de alarme.
(a) Qual a probabilidade de o consumo de água, num dado dia da semana, estar compreendido entre 200
e 210 m3 ?
(b) Suponha que num dado dia a quantidade de água no reservatório se situa 5 % abaixo da sua capa-
cidade; o abastecimento do referido reservatório processa-se, nesse dia, a uma taxa que segue uma
distribuição normal de média 100 m3 e desvio padrão 30 m3 . Supondo que consumo e abastecimento
são independentes, qual a probabilidade de o alarme ser acionado?
14. O diâmetro (exterior) de um eixo produzido por uma empresa é uma variável aleatória X com distribuição
normal de valor médio 10 cm e desvio padrão 0.02 cm. Um eixo satisfaz as especificações (da empresa) se
o seu diâmetro diferir em valor absoluto do respetivo valor esperado de, no máximo, 0.05 cm. Um eixo que
verifique as especificações é vendido pela empresa com um lucro de 5 euros; caso contrário, é devolvido à
empresa, causando-lhe um prejuı́zo de 1 euro.
(a) Calcule a probabilidade de um eixo verificar as especificações da empresa.
(b) Defina a variável aleatória que representa o lucro obtido pela empresa com a venda de um eixo. Qual
o valor esperado e a variância do lucro que um eixo, escolhido ao acaso, dará à empresa.
(c) Determine a probabilidade de a empresa ter um lucro total superior a 490 euros num lote de 100 eixos,
selecionados aleatória e independentemente da produção.
15. Admita que foi realizado um estudo sobre as despesas mensais de alojamento de um estudante em Coimbra.
Nesse estudo apurou-se que essa despesa obedece a uma distribuição normal de média 250 euros e desvio-
padrão 50 euros.
(a) Qual a probabilidade de um estudante, escolhido ao acaso, gastar mais de 324.5 euros por mês em
alojamento?
(b) Suponha que a Câmara de Coimbra concluiu que 20% dessas despesas de alojamento são demasiado
elevadas. Qual o valor, arredondado às unidades, a partir do qual se considera que essas despesas são
demasiado elevadas?
(c) Considere agora que se reuniu uma amostra com despesas de alojamento de 64 estudantes. Qual é a
probabilidade da despesa média com alojamento desses estudantes estar compreendida entre 250 euros
e 262.5 euros?
16. Seja X variável aleatória com distribuição normal de valor médio 10 kg e desvio padrão 2 kg, que representa a
quantidade de lixo orgânico produzido semanalmente por cada agregado familiar numa determinada cidade.
O departamento de gestão da recolha do lixo da Câmara Municipal dessa cidade, considera que a quantidade
expectável de lixo produzido por agregado familiar se situa entre os 8 e os 12 kg.
(a) Determine a probabilidade de que um agregado familiar, escolhido ao acaso, produzir semanalmente
uma quantidade de lixo expectável.
53
(b) Qual a probabilidade de que em 10 agregados familiares, escolhidos aleatoriamente, pelo menos 2
produzam uma quantidade fora dos parâmetros esperados?
(c) Admita que o camião que recolhe o lixo orgânico para compostagem naquela zona tem uma capacidade
de recolha de 1.3 toneladas. Determine a probabilidade do lixo orgânico de 120 agregados familiares
poder ser recolhido apenas com uma só viagem do referido camião.
17. Em certos ambientes controlados, com uma infraestrutura de rede estável com configurações de servidor
consistentes e baixa variabilidade na carga de trabalho, podemos admitir que o tempo de resposta do servidor
segue uma distribuição normal. Suponha que se pretendem comparar dois servidores independentes com estas
caracterı́sticas. O tempo de resposta do servidor A segue uma distribuição normal de média 200 milissegundos
e desvio padrão 20 milissegundos e o tempo de resposta do servidor B segue uma distribuição normal de
média 180 milissegundos e desvio padrão 30 milissegundos.
(a) Determine a probabilidade de pelo menos um dos servidores ter um tempo de resposta inferior a 180
milissegundos.
(b) Em 10 acessos independentes aos servidores A e B, determine a probabilidade do tempo médio de
resposta do servidor B ser inferior ao tempo médio de resposta do servidor A.
(c) O tempo de resposta do servidor A supera em pelo menos t milissegundos o tempo de resposta do
servidor B no máximo em 65% dos casos. O valor mı́nimo de t arredondado às unidades é
18. Considere que existem quatro etapas consecutivas de processamento e análise de imagens para posterior
integração em apps. O tempo médio gasto em cada uma dessas etapas pelo algoritmo A é, respetivamente,
10.5, 10.8, 10.4 e 10.7 milissegundos. Admite-se que os tempos dispendidos em cada etapa são independentes
e têm distribuições normais cujos desvios-padrão são, respetivamente, 0.2, 0.4, 0.4 e 0.6.
(a) Estabeleça um limite mı́nimo para o tempo gasto pelo algoritmo A em 98% dos casos.
(b) Se o tempo total gasto nas 4 etapas pelo algoritmo B seguir uma distribuição normal de média 42.6
milissegundos e variância 0.9, a probabilidade deste algoritmo ser mais rápido que o algoritmo A é,
usando 4 casas decimais,
19. Um inspetor de controlo de qualidade rejeita qualquer lote de rolamentos esféricos se 3 ou mais defeituosos
são encontrados num lote de 20 testados. Admita que a probabilidade de um rolamento ser defeituoso é 20%.
(a) Determine a probabilidade de o lote ser rejeitado.
(b) Qual o número esperado de rolamentos defeituosos num lote?
(c) Admitindo que vai analisar um lote de 100 rolamentos, calcule um valor aproximado para a probabili-
dade de encontrar pelo menos 24 defeituosos.
20. O número de vı́rus detetados por mês por um departamento de informática segue uma lei de Poisson de
média 5.
(a) Se num determinado mês se detetaram menos de 5 vı́rus, qual a probabilidade de terem sido detetados
exactamente 4 vı́rus?
(b) Identifique a distribuição do número de vı́rus detetados durante um ano (12 meses consecutivos). Para
esse perı́odo de tempo, calcule um valor aproximado para a probabilidade de se detetarem pelo menos
40 vı́rus.
21. O tempo de execução, em segundos, de um determinado algoritmo varia linearmente com a dimensão do
problema, em milhares de unidades, segundo a seguinte função densidade de probabilidade e correspondente
função distribuição
54
0 , x<0
ax , 0 ≤ x ≤ 2 ax2
f (x) = ; F (x) = , 0≤x≤2 .
0 , outros valores de x
2
1 , x>2
4 2
sendo o seu valor esperado igual a com uma variância de .
3 9
(a) Prove que o valor da constante a é 0.5.
(b) Sabe-se que, para problemas de uma certa dimensão, o tempo de execução do algoritmo não ultrapassa
1 segundo. Para problemas dessa dimensão, a probabilidade do tempo de execução ser superior a 0.5
segundos é:
(c) Considere X1 , X2 , . . . , X100 , 100 variáveis aleatórias independentes e identicamente distribuı́das com
X, correspondentes aos tempos de execução do algoritmo para 100 problemas diferentes.
100
X
i. Deduza a lei aproximada da variável aleatória Xi .
i=1
ii. Determine a probabilidade do tempo total de execução dos 100 problemas ser no máximo 2 minutos.
22. O tempo de execução, em segundos, de um determinado algoritmo varia quadraticamente com a dimensão do
problema, em milhares de unidades, segundo a seguinte função densidade de probabilidade e correspondente
função distribuição
( 0 , x<0
2 2
x + 2x2 , 0 ≤ x ≤ 1 x (2x + 1)
f (x) = 3 ; F (x) = , 0≤x≤1 .
0 , outros valores de x
3
1 , x>1
sendo o seu valor esperado igual a 0.7222 com uma variância de 0.0451.
(a) Se numa dada altura já passaram 0.5 segundos desde o inı́cio da execução do algoritmo, a probabilidade
desta terminar nos próximos 0.2 segundos é:
23. Considere que o tempo de viagem de autocarro entre Coimbra e Porto segue uma distribuição Uniforme
entre 80 a 90 minutos.
(a) Sabendo que já decorreram 82 minutos desde o inı́cio da viagem, a probabilidade da chegada não se
realizar dentro de 5 minutos é
(b) Numa amostra aleatória de 31 viagens, qual a probabilidade de a média dos tempos de viagem ser
inferior a 85 minutos?
24. Um monitor emite um sinal de alerta quando uma ação é necessária como parte de um processo de produção.
O intervalo, X (em horas), entre sinais sucessivos segue uma distribuição exponencial com as seguintes
funções densidade e distribuição, respetivamente.
55
0 se x < 0 0 se x<0
f (x) = −0.08x ; F (x) = −0.08x .
0.08 e se x ≥ 0 1− e se x≥0
(a) A probabilidade do intervalo entre dois sinais consecutivos ser superior a 10 horas e inferior a 20 horas
é:
(A) 0.2474 (B) 0.6512 (C) 0.6680 (D) 0.2306
56
CAPÍTULO III - Soluções dos Exercı́cios
R2 100
X √
400 200
21. (a) Note que 0
f (x) dx = 1 (b) C (ci) Xi ∼
˙ N 3 , 3 (cii) 0.0023
i=1
q
22. (a) A ˙ N 0.7222, 0.0451
(bi) X ∼ n (bii) 0.1340
57
4 Capı́tulo IV - Amostragem e Distribuições Amostrais
Neste capı́tulo serão dadas algumas noções e resultados teóricos fundamentais em Estatı́stica. O estudo de carac-
terı́sticas populacionais, a partir de amostras, assenta nestes resultados.
População X y
Amostra AleatóriaX1 , X2 , ..., Xn
Definições
Uma amostra aleatória da v.a. X é um conjunto de n v.a.’s X1 , X2 , ..., Xn independentes e com a mesma
distribuição de X (dizem-se independentes e identicamente distribuı́das (i.i.d.) com X).
Estatı́stica é uma função da amostra aleatória, e logo uma variável aleatória, cuja expressão não contém
parâmetros desconhecidos.
p
• O desvio padrão amostral é dado por Sn = Sn2 .
n
1 X 2 n 2
Exercı́cio: Verifique que Sn2 = X − X .
n − 1 i=1 i n−1
A média e a variância amostrais são estatı́sticas (especiais no nosso estudo) e, logo, variáveis aleatórias, com
distribuições próprias, com parâmetros de localização e dispersão, que dependem da população em estudo. As suas
distribuições são designadas distribuições amostrais.
58
4.2 Distribuição da Média Amostral
Considere-se uma amostra aleatória X1 , X2 , ..., Xn da v.a. (população) X com parâmetros E(X) = µ e V (X) = σ 2 .
Usando propriedades da esperança e da variância, verifica-se que:
σ2 σ
E(X) = µ e V (X) = ⇒ σ(X) = √ .
n n
Distribuições da média amostral X:
• Usando o Teorema do Limite Central (Capı́tulo III) podemos concluir para n suficientemente grande que
√ X −µ
n ∼
˙ N (0, 1).
σ
• Se X ∼ N (µ, σ),
√ X −µ
n ∼ N (0, 1)
σ
√ X −µ
n ∼ tn−1
Sn
59
Exercı́cios
1. A quantidade de chuva que cai por dia, expressa em litros por metro quadrado, pode ser descrita por uma
v. a. X com distribuição contı́nua, admitindo a densidade
21
8192×107 40x5 − x6 se 0 ≤ x ≤ 40
f (x) = .
0 se caso contrário
(a) Indique as propriedades de que as v. a.’s que constituem a amostra aleatória de X gozam.
100
1 X
(b) Considere a v.a. X 100 = Xi .
100 i=1
2. A energia em Joules (J) de qualquer partı́cula de um sistema é uma variável aleatória com distribuição Expo-
nencial de parâmetro 2. A energia do sistema é a soma da energia das suas partı́culas que são independentes.
Admita que determinado sistema β contém 1600 partı́culas.
(a) Indique, justificando, a lei aproximada da energia do sistema β.
(b) Calcule a probabilidade (aproximada) da energia do sistema β variar entre 780 e 840 J.
3. O erro de medição do comprimento do raio de um circulo, em mm, é uma variável aleatória X com distribuição
normal de média zero e desvio padrão 5. Considere uma amostra aleatória X1 , X2 , ..., X10 , daquela população,
e as seguintes estatı́sticas:
10
1 X 5X1 + 5X10
T1 = Xi T2 =
10 i=1 10
60
Capı́tulo IV - Soluções dos Exercı́cios
5. (b) ≃ 0
61
5 Capı́tulo IV Estimação
5.1 Introdução
Problema
Seja X a v.a. em estudo, com função de probabilidade/densidade f (x, θ), onde θ é um (ou mais) parâmetro(s)
desconhecido(s).
Que valor(es) atribuir a θ ? Ou a g(θ) ?
Exemplos
λx
• X ∼ P(λ) f (x, λ) = e−λ , ∀x ∈ IN0 −→ θ = λ
x!
1
• X ∼ E(λ) f (x, λ) = λ e−λx 1 [0,+∞[ (x) −→ θ = λ, g(λ) =
λ
1 1 x−µ 2
• X ∼ N (µ, σ) f (x, µ, σ) = √ e− 2 ( σ ) , ∀x ∈ IR −→ θ = (µ, σ)
2πσ
População X y
Amostra AleatóriaX1 , X2 , ..., Xn
↓
Inferência Estatı́stica
Estimador é qualquer Estatı́stica usada para estimar um parâmetro populacional (ou função desse parâmetro).
Estimativa é um valor do estimador para uma amostra em concreto.
Notação Estimador do parâmetro θ → Θ b
62
Exemplos
n n
1X 1X
µ µ
b=X = Xi x= xi
n i=1 n i=1
n n
1 X 2 1 X 2
σ2 b2 = Sn2 =
σ Xi − X s2n = (xi − x)
n − 1 i=1 n − 1 i=1
..
.
(parâmetros (Estimador) (Estimativa)
desconhecidos)
Observação
Os valores possı́veis de um Estimador (note-se v.a.) são as estimativas obtidas em cada concretização da
amostra aleatória.
• Um estimador Θ b do parâmetro θ diz-se enviesado se não for cêntrico e o seu enviesamento é dado por
b b
viés( Θ ) = E( Θ ) − θ.
• A eficiência de um estimador cêntrico Θb é dada por V ( Θ
b ).
Assim, dados dois estimadores cêntricos do parâmetro θ , Θb1 e Θ
b2 , Θ
b 1 diz-se mais eficiente do que Θ
b2
b b
se V ( Θ1 ) < V ( Θ2 ).
Entre estimadores não enviesados, é dada preferência ao estimador com menor variância, isto é, ao mais eficiente.
Exemplo
Considerando duas amostras aleatórias de uma população X, de tamanhos n e m, respectivamente, com n > m,
as médias amostrais X n e X m são estimadores cêntricos de µ = E(X). No entanto, X n é mais eficiente do que
X m . De facto,
V (X) V (X)
V (X n ) = < V (X m ) =
n m
b do parâmetro θ é dada pelo seu erro quadrático médio (EQM),
• A eficiência de um estimador Θ
definido por
b ) = E[ (Θ
EQM ( Θ b − θ)2 ] = V ( Θ
b ) + [viés( Θ
b ) ]2 .
Entre estimadores enviesados e não enviesados, é dada preferência ao estimador com menor erro quadrático
médio (o mais eficiente). Note-se que um estimador Θ b 1 enviesado pode ser mais eficiente do que um estimador
b b b
cêntrico Θ2 , bastando que EQM ( Θ1 ) < V (Θ2 ).
63
5.3 Estimação por Intervalos
Como determinar um intervalo no qual se espera encontrar, com uma certa confiança, o valor de um parâmetro
populacional θ (ou de g(θ) )?
Definição
Um intervalo de confiança (1 − α)% para o parâmetro θ (ou g(θ)) é um intervalo aleatório ]L1 , L2 [, com L1 e
L2 duas estatı́sticas amostrais (v.a.’s) tais que
Seja X uma variável aleatória cuja distribuição contém um parâmetro θ desconhecido. Pretende-se um intervalo
de confiança (1 − α)% para θ (ou para g(θ)).
Considere-se uma amostra aleatória X1 , X2 , ..., Xn , de X.
Nota: Variável Fulcral é uma função da amostra aleatória X1 , X2 , ..., Xn e do parâmetro θ, mas com distri-
buição (exata ou aproximada) independente de θ.
ICθ =]l1 , l2 [
Nota: O intervalo ]L1 , L2 [ é aleatório, com probabilidade 1 − α de conter θ; isto é, se forem recolhidas
amostras em número bastante elevado, espera-se que (1 − α)% dos intervalos estimados com base nessas
amostras contenha θ; o intervalo ]l1 , l2 [ é apenas uma estimativa, calculado com confiança (1 − α)%, mas ao
qual não se pode atribuir uma “probabilidade” de conter θ.
64
Exemplo
• Intervalo de confiança para o valor médio (caso de uma população normal com σ conhecido)
Seja (X1 , X2 , . . . , Xn ) uma amostra aleatória relativa à v.a. X ∼ N (µ, σ), sendo σ conhecido. Vimos que um
estimador para a média da população µ é dado pela estatı́stica X. Neste caso, segue-se que
X −µ
Zn = √ ∼ N(0, 1)
σ/ n
Fixado o valor de α e designando por zα/2 o valor tal que P (Z > zα/2 ) = α/2, tem-se
X −µ
P − zα/2 < Z < zα/2 = 1 − α ⇔ P − zα/2 < √ < zα/2 = 1 − α
σ/ n
σ σ
⇔ P X − zα/2 √ < µ < X + zα/2 √ = 1 − α
n n
Para uma realização da amostra aleatória, ou seja, uma amostra concreta (x1 , x2 , . . . , xn ), e designando por x
o valor concreto da estatı́stica X, tem-se que
o intervalo com (1 − α) × 100% de confiança para o parâmetro µ, numa população normal com σ
conhecido, é:
σ σ
µ ∈ x − zα/2 √ , x + zα/2 √
n n
65
Exercı́cios complementares
1- A resistência das cordas produzidas por determinada fábrica tem distribuição normal. A fábrica testou uma
amostra de 51 cordas tendo obtido uma resistência média de 300 Kg e desvio padrão 24 Kg.
(a) Determine um intervalo de confiança 95% para a resistência média deste tipo de cordas.
(b) Determine um intervalo de confiança 90% para o desvio padrão.
2- O conteúdo médio de nicotina de uma amostra de 10 cigarros de uma certa marca é de 1 mg (miligramas).
O laboratório sabe, pela longa experiência neste tipo de análise, que o conteúdo de nicotina é uma v.a. com
distribuição normal de desvio padrão 0.15 mg.
(a) Determine um intervalo de confiança 90% para o conteúdo médio de nicotina.
(b) Com a mesma confiança, quantos cigarros deveriam ser ana-lisados de modo a que o erro máximo
cometido na estimação não ultrapasse 0.01?
3- Realizou-se um inquérito telefónico para estimar a proporção da população de um paı́s, favorável a determi-
nada reforma fiscal.
No inquérito realizado a 50 pessoas, escolhidas aleatoriamente, 84% manifestou-se favorável à reforma fiscal.
Determine um intervalo de confiança 95% para a proporção da população favorável à reforma fiscal.
66
Exercı́cios
CAPÍTULO V - Estimação
1. Uma fábrica produz cabos eléctricos cujo diâmetro X (em milı́metros) segue uma lei Uniforme no intervalo
de 5 a 5 + θ, X ∼ U[5, 5+θ] , onde θ é um parâmetro real desconhecido.
Considere uma amostra aleatória (X1 , X2 , . . . , Xn ) de X (n ∈ IN).
classes ]5, 5.2] ]5.2, 5.4] ]5.4, 5.6] ]5.6, 5.8] ]5.8, 6]
efectivos 4 3 5 4 4
2. Seja (X1 , X2 , . . . , Xn ) uma amostra aleatória de dimensão n, n ∈ IN, de uma população X cuja lei de
probabilidade é caracterizada pela seguinte função densidade
(
2 x
1− se 0 < x < θ
fθ (x) = θ θ , onde θ ∈ IR+ .
0 se caso contrário
(b) Construa, a partir de Θ̂1 , um outro estimador de θ, Θ̂2 , que seja cêntrico.
(c) Suponha que se recolheu, ao acaso, uma amostra de X, de dimensão 100, (x1 , x2 , . . . , x100 ), para a qual
se constatou que x = 20.2 . Indique uma estimativa cêntrica de θ. Sugira uma estimativa para E(X).
3. Considere uma variável aleatória X cuja distribuição depende de um parâmetro θ, sendo E(X) = θ e
V (X) = θ2 + 1. De uma amostra aleatória de dimensão 320 sabe-se que x = 0.0694 e que s2 = 1.6748.
Indique, justificando, estimativas cêntricas para a média, para o desvio-padrão de X e para o parâmetro θ.
4. Seja X uma variável aleatória real cuja distribuição de probabilidade depende de um parâmetro desconhecido,
θ
θ, com θ ∈]0, 1[. Sabe-se que E(X) = .
4
nX1 −2X2 −Xn
(a) Recolheu-se uma amostra de X, X1 X2 , · · · , Xn com n > 2. O estimador T = 2 é um
estimador cêntrico de θ?
(b) Foi recolhida uma amostra de X, de dimensão 40, cuja média é 0.125. A partir desta amostra uma
estimativa cêntrica de θ é
67
5. Uma máquina de parafusos está regulada para produzir em série peças de diâmetro médio 150 mm. Admite-
se que os diâmetros são normalmente distribuı́dos. Uma amostra aleatória de 20 parafusos, extraı́da da
população, forneceu os seguintes valores:
20
X 20
X
xi = 2900; x2i = 432500.
i=1 i=1
Em face destes valores e utilizando um grau de confiança de 0.95, verifique se será de admitir irregularidade
de produção na máquina supondo:
(a) σ conhecido e igual a 25 mm;
(b) σ desconhecido.
6. Para estudar a tensão de ruptura de certo tipo de algodão fizeram-se 10 observações com os seguintes
resultados, em Kg:
7.4; 7.8; 7.1; 6.9; 7.3; 7.6; 7.3; 7.4; 7.7; 7.3
Admitindo que a tensão de ruptura segue uma distribuição normal com variância 0.08, determine:
(a) uma estimativa para a tensão de ruptura média;
(b) um intervalo com 95% de confiança para a tensão de ruptura média;
(c) se pretender que o erro dessa estimativa não ultrapasse 0.07, em 95 % dos casos, quantos elementos
deveria incluir na amostra?
7. Sabe-se que as classificações X de determinado curso são normalmente distribuı́das. Foi recolhida uma
amostra de 42 classificações para os quais se obteve
42
X 42
X
xi = 588 e x2i = 8400.
i=1 i=1
125.3; 124.8; 124.8; 125.1; 125.0; 125.1; 124.7; 125.4; 125.2; 125.0
68
(b) Admitindo a normalidade da população, determine um intervalo de confiança para a variância da
população em estudo, ao grau de confiança de 0.95. Que conclusão pode tirar sobre a variação do nı́vel
de poluição de peixe para peixe relativamente ao valor médio deste nı́vel?
11. Num laboratório registaram-se os seguintes pontos de fusão de chumbo (em ◦ C) numa amostra proveniente
de determinado fornecedor:
O que pode concluir, com confiança 95%, sobre o desempenho da empresa relativamente às condições
de entrega referidas?
14. De uma população activa de 500 pessoas, de certa região, foram encontrados 41 desempregados. Determine
um intervalo de confiança a 95% para a taxa de desempregados dessa região.
15. Um grupo de cientistas defende a tese de que a taxa de mortalidade devida a certa doença é aproximadamente
10%.
(a) Supondo verdadeira a tese daqueles cientistas, calcule a probabilidade de em 10 pessoas, observadas
ao acaso entre as afectadas pela referida doença, haver pelo menos uma que acabe por falecer devido à
mesma.
69
(b) Com o objectivo de tirar conclusões sobre a veracidade daquela tese, recolheu-se uma amostra de 500
pessoas afectadas pela doença, das quais faleceram 60. Determine um intervalo real que contenha, com
uma confiança de 0.9, a proporção de indivı́duos que faleceram com tal doença. Terão os cientistas
razão?
16. Seja (X1 , X2 , ..., Xn ) uma amostra aleatória de dimensão n de uma variável aleatória real X de média µ e
variância σ 2 .
n
X
1
(a) Prove que X = n Xi é um estimador cêntrico de µ.
i=1
(b) Com o objectivo de estudar a duração de vida média de determinado tipo de peças, recolheu-se uma
amostra de 110 elementos que se resumiu no quadro seguinte:
17. A empresa ”DELIVER NOW”opera na área da distribuição de encomendas. O tempo de entrega duma
encomenda, X, através desta nova empresa ainda não está bem caracterizado.
(a) Considere duas amostras aleatórias, X1 , X2 , ..., Xn e X1′ , X2′ , ..., Xm
′
, com m < n, de X.
i. Defina amostra aleatória.
ii. Mostre que as médias amostrais, respectivamente X n e X m , são estimadores centrados para o
tempo médio de entrega duma encomenda, e compare-os em termos da sua variância. Qual das
duas médias amostrais diria que é a mais eficiente? Justifique.
(b) A empresa garante que todas as encomendas chegam ao seu destinatário, em média, em menos de 48
horas, com uma variabilidade máxima de 8 horas. Para avaliar este desempenho, foram recolhidos os
tempos (em horas) relativos a uma amostra de 51 encomendas, tendo-se obtido os seguintes resultados:
51
X 51
X
xi = 3250; x2i = 277500.
i=1 i=1
O que pode concluir, com confiança 95%, sobre o desempenho da empresa relativamente às condições
de entrega referidas?
18. Seja X uma variável aleatória real que representa o comprimento (em cm) dos parafusos produzidos por uma
determinada fábrica. Suponha que X tem distribuição normal de média 2θ.
(a) Com o objetivo de estimar o valor de θ, considerou-se
n
1X
X= Xi , n ∈ IN
n i=1
i. Determine estimativas pontuais para a média e para o desvio padrão do comprimento dos parafusos.
70
ii. O dono da fábrica afirma que o desvio no comprimento dos parafusos produzidos é 0.5 cm. Averigue
ao grau 0.98 se a afirmação do fabricante é verdadeira.
iii. Determine um intervalo com 98% de confiança para o comprimento médio dos parafusos.
iv. Se pretender, mantendo o grau de confiança utilizado na alı́nea anterior, diminuir a amplitude do
intervalo de confiança para o comprimento médio dos parafusos, deve:
19. Um conjunto de professores está preocupado com o impacto do número de horas semanais necessárias para
executar os trabalhos de outras unidades curriculares. Em primeiro lugar será necessário perceber em média
quantas horas por semana os alunos dedicam à realização desses trabalhos. Admite-se que o desvio-padrão é
de aproximadamente 5 horas. Um estudo realizado com 200 estudantes forneceu como média do número de
horas semanais necessárias para executar os trabalhos de outras unidades curriculares, o valor de 15 horas.
(a) Com base nesta amostra, determine um intervalo com 98% de confiança para a média do número de
horas semanais necessárias para executar os trabalhos de outras unidades curriculares.
(b) A interpretação correta do intervalo de confiança obtido na alı́nea anterior é (escolha a opção correcta)
(A) Existe uma probabilidade de 98% de que o verdadeiro valor da média do número de horas semanais
necessárias para executar os trabalhos de outras unidades curriculares pertença a esse intervalo.
(B) Existe uma probabilidade de 98% de que um estudante, seleccionado aleatoriamente, tenha dedi-
cado um número de horas semanais a executar os trabalhos das unidades curriculares que pertence
a esse intervalo.
(C) Estamos 98% confiantes de que a média do número de horas semanais necessárias para executar
os trabalhos de outras unidades curriculares pertence a esse intervalo.
(D) Estamos 98% confiantes de que a média da amostra recolhida do número de horas semanais ne-
cessárias para executar os trabalhos de outras unidades curriculares, pertence a esse intervalo.
(c) Se pretendermos um intervalo de confiança de menor amplitude do que o obtido na alı́nea a) o que
podemos mudar no novo estudo (escolha a opção correcta)
(A) Aumentar o grau de confiança e aumentar a dimensão da amostra;
(B) Aumentar o grau de confiança e diminuir a dimensão da amostra;
(C) Diminuir o grau de confiança e aumentar a dimensão da amostra;
(D) Diminuir o grau de confiança e diminuir a dimensão da amostra.
20. Um certo tipo de cabo elétrico foi testado em laboratório para determinar o nı́vel de voltagem, X, a que
certas falhas tendem a ocorrer. Testados 10 cabos selecionados aleatoriamente foi possı́vel concluir que
10
X 10
X
xi = 332 ; x2i = 11028
i=1 i=1
71
Capı́tulo V - Soluções dos Exercı́cios
5. Estimação
72
6 Capı́tulo VI - Testes de Hipóteses Paramétricos
Vamos considerar neste capı́tulo outro aspecto do processo de inferência estatı́stica: os testes de hipóteses. O
objectivo é decidir se uma conjectura sobre determinada caracterı́stica da(s) população(ões) em estudo é ou não
apoiada pela evidência obtida de dados amostrais. Por exemplo, será que a média populacional difere de um valor
pré-especificado?
As hipóteses serão formuladas sobre o(s) valor(es) do(s) parâmetro(s) desconhecidos da população, θ . Nos
testes paramétricos admitem-se certos pressupostos, uma lei de probabilidade para a população em estudo por
exemplo, ao contrário do que acontece nos testes não paramétricos e que não serão abordados na disciplina.
NOTAÇÃO E METODOLOGIA
O primeiro passo na condução de um teste de hipóteses é especificar as duas hipóteses do teste. Em geral,
começa-se por formular a hipótese alternativa (H1 ), que é a hipótese que se pretende verificar (hipótese proposta
pelo investigador). H1 contém, regra geral, uma desigualdade (<, > ou 6=). Definida H1 , formula-se a hipótese
complementar de H1 , que se designa por hipótese nula (H0 ), e que é a hipótese que, à partida se julga inverosı́mil.
H0 contém, regra geral, uma igualdade (=).
Consideramos três tipos de testes:
1. Teste bilateral
H0 : θ = θ0
H1 : θ 6= θ0
2. Teste unilateral à direita
H0 : θ = θ0 (ou θ 6 θ0 )
H1 : θ > θ0
3. Teste unilateral à esquerda
H0 : θ = θ0 (ou θ > θ0 )
H1 : θ < θ0
Dir-se-á que se pretende testar H0 contra H1 , pelo que frequentemente se escreve:
H0 vs H1
o réu é inocente (H0 ) vs o réu é culpado (H1 )
Ao efectuar um teste, assumimos sempre que a hipótese H0 é verdadeira, e não havendo evidência para provar
o contrário decide-se não rejeitar H0 . Há duas possibilidades de se tomar uma decisão errada. Os dois tipos de
erros que podem ser cometidos são:
erro tipo I: rejeitar H0 sendo H0 verdadeira;
erro tipo II: não rejeitar H0 sendo H0 falsa;
α é designado o nı́vel de significância do teste. A escolha de α depende do que se pretende estudar, pois
quanto maior for α mais provável será rejeitar H0 sendo esta verdadeira!!!
Uma vez recolhida a amostra, observamos o valor de alguma estatı́stica (função da amostra aleatória) cuja
distribuição de probabilidade é conhecida sob o pressuposto de H0 ser verdadeira. Tal estatı́stica é chamada
estatı́stica de teste.
Nota: Qualquer estatı́stica utilizada na construção de um intervalo de confiança para um parâmetro (variável
fulcral) pode ser usada num teste de hipóteses sobre esse parâmetro.
O nı́vel de significância do teste, α, e a distribuição de probabilidade da estatı́stica de teste vão ser utilizados
para definir a chamada região crı́tica ou região de rejeição. Se o valor observado da estatı́stica de teste “cair”
na região crı́tica decidimos rejeitar H0 (e aceitar H1 ); caso contrário decidimos não rejeitar H0 .
73
Em resumo:
Exemplo
A resistência dos cabos fabricados por uma determinada empresa é uma v.a. de valor médio 816 Kg e desvio
padrão 45 Kg. Adoptando-se uma nova técnica de fabrico espera aumentar-se essa resistência. Para testar tal
hipótese, a empresa testou uma amostra de 50 cabos fabricados segundo o novo processo, tendo obtido uma
resistência média de 839 Kg e um desvio padrão de 44 kg.
Pode aceitar-se a hipótese de o novo processo de fabrico aumentar a resistência dos cabos, ao nı́vel de signi-
ficância de 0.001?
74
Exercı́cios
1. Uma empresa garante que, se os seus pneus forem utilizados em condições normais, têm um tempo médio
de vida superior a 40000 Km. Uma amostra constituı́da por 31 pneus, utilizados em condições normais,
proporcionou os seguintes dados: x = 43200 e s31 = 8000 km.
Teste, ao nı́vel de significância de 5%, se os pneus têm a vida média que a empresa reivindica.
2. Um molde de injecção tem produzido peças de um determinado material isolante térmico com uma resistência
à compressão de valor médio 5.18 kg/cm2 e variância 0.0625 (kg/cm2 )2 . As últimas 12 peças produzidas
nesse molde foram recolhidas e ensaiadas, tendo-se obtido para a resistência média à compressão o valor
4.95 kg/cm2 . Assuma que a resistência à compressão tem distribuição normal.
Poder-se-á afirmar, ao nı́vel de significância de 0.05, que as peças produzidas recentemente são menos resis-
tentes do que o habitual?
3. Considere uma fábrica que produz cabos eléctricos cujos diâmetros são normalmente distribuı́dos com valor
médio µ e desvio padrão σ > 0. Seleccionaram-se aleatoriamente 20 cabos eléctricos da produção da fábrica
e registaram-se os seguintes valores:
20
X 20
X
xi = 130.27; x2i = 849.98 .
i=1 i=1
26
X 26
X
xi = 52; (xi − x)2 = 13 .
i=1 i=1
Admitindo a normalidade da população subjacente aos dados, teste, ao nı́vel de significância de 5%, se secção
de controlo de qualidade tem razão.
6. Sabe-se que o tempo diário (em horas) de utilização de um determinado terminal de computador é normal-
mente distribuı́do. Foram observados os tempos de utilização durante 10 dias consecutivos, tendo sido obtido
os resultados seguintes:
10
X 10
X
xi = 56; (xi − x)2 = 129.6 .
i=1 i=1
75
(a) Estime pontualmente o tempo médio diário (em horas) de utilização do referido terminal e a variância.
(b) Determine intervalos de confiança a 95% para a média e variância da população em estudo.
(c) Teste, ao nı́vel de significância de 5%:
(i) se o tempo médio diário de utilização do terminal é superior a 6 horas;
(ii) se o desvio padrão excede as 8 horas.
7. Um agente de compras de um determinado supermercado testou uma amostra aleatória de 100 latas de
conserva na própria fábrica de enlatados. O peso médio (em decagramas) encontrado por lata foi de 15.97
com s100 = 0.15. O fabricante afirma que o peso lı́quido médio por lata era de 16. Pode esta afirmação ser
rejeitada? (use α = 0.1)
8. Uma determinada pessoa, interessada em alugar uma loja, é informada que a renda média na área é de
750 euros. Suponha que, para o tipo de zona em questão, é possı́vel dizer que as rendas têm distribuição
aproximadamente normal com desvio padrão 50 euros. Para uma amostra aleatória de 15 lojas, a renda
média foi de 800 euros.
A pessoa em causa está convencida de que o valor de 750 euros para a renda média está desactualizada.
Terá a pessoa razão? Justifique convenientemente a sua resposta, utilizando um teste adequado a 2% de
significância.
76
Capı́tulo VI - Soluções dos Exercı́cios
77