Teoria Básica Cadeias de Markov (2015)
Teoria Básica Cadeias de Markov (2015)
Teoria Básica Cadeias de Markov (2015)
13 de Outubro de 2015
Mateus Mendes Magela
13 de Outubro de 2015
Agradecimentos
Aos meus pais, pela bravura diante de todas as dificuldades, pela dedicação que
sempre tiveram na minha educação, por todo carinho e amor dedicados ao
Henrique, pelos exemplos de dignidade, honestidade e sobretudo trabalho.
A minha irmã pela amizade e carinho.
A minha esposa Flávia, minha heroı́na, que sempre me apoiou e incentivou nas
horas difı́ceis. Por estar sempre ao meu lado, pelo seu carinho, por sua atenção,
pelo seu amor. Te amo.
Ao meu filho Henrique, pelo seu amor incondicional.
A minha nova famı́lia, Garcia, Inês e Amanda, pela confiança, por todo apoio
recebido e pelo carinho e amor dedicados ao Henrique.
Ao meu orientador Prof. Dr. Florêncio Guimarães Filho por tudo que me ensinou,
devo a ele a oportunidade que tive de chegar até aqui, sua dedicação e competência
como professor são exemplos que levarei por toda minha vida.
A Escola São Domingos pela confiança e pelo carinho que sempre tiveram comigo,
por me proporcionar conhecimento não apenas profissional, sobretudo a formação
do meu caráter. Pelos grandes amigos aqui aı́ encontrei. Muito obrigado por tudo.
Resumo
Markov chains play a rising and important role in problems solving in several
knowledge areas such as: Administration, Biology, Genetics, Meteorology and
Game theory. This paper aims show the use of Markov chains stationary
distribution. A review about prerequisites necessary for comprehending the theory
will be presented in the first chapters. Then, we will introduce the general theory
of Markov chains focusing on some of their applications. The last chapter will
highlight the Page Rank algorithm, an important feature of Markov chain used by
Google to place on top the most interesting web pages related to the researched
topic.
1 Introdução 9
2.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.3.3 Evento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.6.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.6.2 Independência . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4 Matrizes Estocásticas 48
4.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
5 Cadeias de Markov 63
5.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
5.3.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
7
5.3.2 Definição de uma cadeia de Markov . . . . . . . . . . . . . . . 70
5.6.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
6.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
6.3.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
Bibliografia 111
8
9
1 Introdução
Esta dissertação, de caráter elementar, pretende introduzir os principais elementos
teóricos sobre as cadeias de Markov.
De maneira simples podemos descrever um sistema em cadeia de Markov discreto,
como sendo um processo estocástico discreto em que o estado do sistema no
instante futuro não se altera pelo seu histórico, mas apenas é afetado pelo seu
estado presente. Esta caracterśtica confere as cadeias de Markov o apelido de
processo desmemoriado.
A finalidade das cadeias de Markov é prever um estado futuro apenas com relação
ao estado atual do sistema. Como exemplo: um matemático vai lançar uma moeda
honesta quatro vezes. Qual a probabilidade de que o resultado seja cara, cara, cara,
cara? A resposta é 6,25%. Agora, suponhamos que o jogador já tivesse jogado a
moeda uma vez, e o resultado tenha sido cara, como pode a partir daı́ prever o
futuro? Esse é um tı́pico exemplo de uma cadeia de Markov.
Através das cadeias de Markov, foi possı́vel compreender melhor fenômenos
cientı́ficos e sociais em diversas áreas do conhecimento.Como exemplos podemos
destacar o engenheiro da computação, que necessita construir um algoritmo de
busca que classifica páginas da internet levando em consideração sua relevância na
web. O sociólogo, que necessita entender como memes, ou de que forma
caracterı́sticas culturais espalham-se pela sociedade. O genteticista, que necessita
construir o mapa genético de uma espécie. O meteorologista, que precisa prever
cenários climáticos para uma determinada região. Ou até mesmo um biólogo, que
necessecita estudar o comportamento futuro da população de uma determinada
espécie marinha submetida a pesca industrial.
Essas aplicações decorrem em virtude da existência de uma distribuição de
probabilidades estacionária das cadeias de Markov regulares, cujo valor é
determinado por meio de uma artmética elementar envolvendo matrizes, tornando
sua aplicação uma tarefa simples para os programas algébricos de computação já
existentes.
As cadeias de Markov são assim denominadas em homenagem ao matemático russo
Andrei A. Markov (1856 - 1922). Ele analisou a sequência de vogais e consoantes
no poema Eugene Onegin (1883). Ele verificou empiricamente que uma vogal era
seguida de uma consoante em 87% das vezes e que um consoante era seguida por
uma vogal 66% das vezes. Este trabalho ficou conhecido como cadeias de Markov.
Na época ele não imaginava que seu trabalho tivesse alguma outra aplicação.
Dentre os principais matemáticos que contribuı́ram para o seu avanço dessa teoria
podemos destacar o matemático russo Andrei Kolmorogov.
10
11
2.1 Introdução
12
2.3.2 Espaço Amostral
A = {1, 2, 3, 4, 5, 6}
2.3.3 Evento
E = {2, 4, 6}
É importante observarmos que podemos combinar eventos para obter novos eventos
usando as operações elementares dos conjuntos.
Exemplos:
a) A ∪ B é o evento que ocorre se, e somente se, ocorre apenas A, ocorre apenas B
ou ocorre ambos;
b) A ∩ B é o evento que ocorre se, e somente se, ocorrem A e B simultâneamente.
13
Definição: Dois eventos A e B são chamados de mutuamente exclusivos se eles são
disjuntos, ou seja, se A ∩ B = . Podemos dizer em outras palavras, A e B são
multuamente exclusivos se, e somente se, não podem ocorrer simultâneamente.
Exemplo 2.3.3.2: Seja A o evento em que o resultado no lançamento de um dado
seja um número par e B o evento em que o resultado no lançamento de um dado
seja um número ı́mpar. Então temos:
A = {2, 4, 6} ; B = {1, 3, 5}
Os eventos A e B são multuamente exclusivos uma vez que não é possı́vel que um
número seja par e ı́mpar simultâneamente.
14
dada por
a
P(E) = b
A = {0, 1, 2, 3}
15
Então pela definição,
3 3 1 7
P (A) = P (1) + P (2) + P (3) = + + =
8 8 8 8
1 1 1
P (B) = P (0) + P (3) = + =
8 8 4
número de elemento de A
P(E) = número de elementos de S
16
probabilidade de um apostador ganhar na Mega-Sena com apenas um cartão de
seis números é
1 ∼
= 0, 000001997%
50.063.860
É mais provável jogar uma moeda 25 vezes seguidas e conseguir sempre o mesmo
resultado do que ganhar o prêmio da loteria.
1 ∼
= 0, 000002980%
33.554.432
Seja E um evento arbitrário num espaço amostral S com P (E) > 0. A probabilidade
de que um evento A ocorra na certeza da ocorrência de um evento E inidcada por
P (A|E) é definida por:
P (A∩E)
P(A|E) = P (E)
17
P(A∩E) = P (E) · P (A|E)
Podemos observar no diagrama a seguir que P (A |E) mede, num certo sentido, a
probabilidade relativa de A com relação ao espaço reduzido E.
18
Queremos encontrar a probabilidade da amostra retirada pertencer a cultura A
considerando como espaço amostral reduzido somente as sementes que germinaram.
O experimento foi realizado com um total de 800 sementes dentre as quais 773
germinaram. Das 773 sementes que germinaram, 392 pertencem a cultura A. Sendo
assim, a probabilidade condicional de retirar uma semente da cultura A sabendo
que a semente germinou é dada por
392 ∼
= 50%
773
Exemplo 2.5.2: Flávia quer enviar uma carta a Amanda. A probabilidade de
8 9
Flávia escreva a carta é de 10
. A probabilidade de que o correio não a perca é de 10
.
9
A proabilidade de que o carteiro a entregue é de 10
. Dado que Amanda não recebeu
a carta, qual a probabilidade condicional de que Flávia não tenha escrito a carta?
19
Teorema da Probabilidade Composta: Sejam A e B dois conjuntos quaisquer
tais que A ∩ B é não vazio. Então temos:
1) P (A ∩ B) = P (A)P (B|A) = P (B)P (A|B);
2) Se P (A1 ∩ A2 ∩ · · · ∩ An ) 6= 0, então P (A1 ∩ A2 ∩ · · · ∩ An ) =
P (A1 )P (A2 |A1 )P (A3 |(A1 ∩ A2 )) · · · P (An |A1 ∩ A2 ∩ · · · ∩ An−1 ).
Demonstração: 1) Sabemos que
P (A ∩ B) P (B ∩ A)
P (A|B) = P (B|A) = .
P (B) P (A)
Daı́ segue que,
P (A ∩ B) = P (B)P (A|B);
P (B ∩ A) = P (A)P (B|A);
Como P (A ∩ A) = P (B ∩ A) temos que
P (A1 ∩ A2 ∩ A3 ) = P (A3 |(A1 ∩ A2 ))P (A1 ∩ A2 ) = P (A3 |(A1 ∩ A2 ))P (A2 |A1 )P (A1 ),
20
que 8 das 12 peças são não defeituosas. Se a primeira peça é não defeituosa, então a
7
probabilidade de que a segunda peça escolhida seja não defeituosa é 11
, pois 7 das 11
peças restantes são não defeituosas. Se as duas primeiras peças escolhidas são não
6
defeituosas, então a probabilidade da terceira peça escolhida ser não defeituosa é 10
.
Assim, pelo teorema do produdo segue que a probabilidade de se retirar três peças
não defeituosas é dada por
8 7 6 14
· · =
12 11 10 55
2.6.1 Introdução
21
Figura 2.4: Diagrama de árvore
Cada resultado pode ser identificado como um caminho através da árvore. Cada
caminho é composto por segmentos chamados de ramos. Nesta árvore, há nove
caminhos com três ramos cada. o processo descrito acima, pode ser realizado para
qualquer experiência que ocorre em etapas. Exigimos apenas que haja num número
finito de resultados em cada etapa e que saibamos as probabilidades para qualquer
resultado na enésima etapa dado o conhecimento do resultado da (n−1)-ésima etapa.
Para cada n obtemos uma árvore Tn . A probabilidade de que um caminho particular
22
da árvore ocorra é dado pelo teorema da multiplicação como sendo o produto das
probabilidades de cada ramo do caminho. Por exemplo, a probabilidade de se escolher
a moeda A e a partir daı́ obter o número 3 no lançamento de dado honesto é dado
pelo produto:
1 1 1 1
. . =
2 2 6 24
2.6.2 Independência
23
1
P (A ∩ B) =
4
Portanto, P(A∩B) = P (A) · P (B)
Consequentemente, A e B são eventos independentes.
12 11 36 12
P (BB) = · P (RB) = ·
48 47 48 47
24
Sendo assim, a probabilidade do morador sortear uma vaga sendo o segundo na
ordem é de
12 11 36 12 12 11 36 12 47 12 1
P (BB) + P (RB) = · + · = + = · = =
48 47 48 47 48 47 47 48 47 48 4
12 11 10 12 36 11 36 35 12 36 12 11
P (BBB)+P (BRB)+P (RRB)+P (RBB) = · · + · · + · · + · ·
48 47 46 48 47 46 48 47 46 48 47 46
12 11 10 36 11 35 36 36 11
= · + · + · + ·
48 47 46 47 46 46 47 46 47
12 11.10 + 36.11 + 35.36 + 36.11
=
48 46.47
12 2162 1
= · =
48 2162 4
Então, a probabilidade de uma vaga boa sair em primeiro, segundo, terceiro.
Agora supomos que em um determinado momento do sorteiro temos b vagas boas e
r vagas ruins. A probabilidade de um morador sortear uma vaga boa nessa situação
é dada por
b
.
b+r
E a probabilidade do próximo morador sortear uma vaga boa é dada por
b b−1 r b b(b + r − 1) b
· + · = =
b+r b+r−1 b+r b+r−1 (b + r)(b + r − 1) b+r
25
Portanto, não existem motivos para que os protestos dos moradores quanto a
ordem do sorteio.
Uma outra forma de esclarecer esse problema é pensar no resultado do sorteio como
sendo uma lista em que cada sorteio resume-se a uma lista de vagas boas (B) ou
ruins (R). Dessa forma queremos saber se existe uma posição mais privilegiada na
lista final.
Note que, o total de listas distintas é dada por
48!
12! · 36!
Fixando uma vaga boa arbitrariamente em qualquer posição na lista, o número de
listas distintas dessa forma é dado por
47!
11! · 36!
Sendo assim, a probabilidade de que uma vaga boa aparecer em uma posição
arbitraria na lista é
47!
11!·36! 12 1
48!
= =
12!·36!
48 4
Portanto, a probabilidade de uma vaga boa aparecer em qualquer posição na lista é
mesma, não havendo dessa forma uma posição privilegiada na ordem do sorteio.
26
27
3 Matrizes
Segundo uma lenda, o primerio quadrado mágico surgiu há 4000 anos, inscrito
sobre um casco de tartaruga que se arrastava saindo do rio Lo, na China. O rio
havia provocado uma grande enchente, e o imperador Yu ordenou que se fizesse
sacrifı́cios para agradar o deus do rio. Em contrapartida, o deus enviou uma
tartaruga, cujo padrão numérico inscrito no seu casco, destinava-se a ajudar o
imperador a controlar o rio. Uma vez descoberto o arranjo numérico, os
matemáticos chineses começaram a construir quadrados maiores que funcionassem
da mesma forma. Esses quadrados eram reconhecidos como detentores de grandes
propriedades mágicas. Há evidências de que os quadrados mágicos foram levados
para Índia por mercadores chineses que lidavam não somente com especiarias, mas
também com ideias matemáticas. Os quadrados mágicos também foram populares
na cultura islâmica medieval. Uma das primeiras exibições de quadrados mágicos
na Europa é o quadrado que aparece na gravura Melancholia, de Albrecht Durer.
28
Figura 3.3: Quadrado Mágico de Durer
4, a Júpter, enquanto o 9 x 9, era atribuı́do à Lua. Uma explicação para o uso que
Durer fez do quadrado é que este refletia a crença mı́stica de que o espı́rito alegre
de Júpter podia se contrapor ao senso de melancolia presente na gravura.
Entretanto, a ideia de tratar blocos numéricos como um único número decolou
apenas há 150 anos com um pequeno grupo de matemáticos que reconheceram seu
potencial. Doravante, o progresso de uma álgebra unidimensional para uma álgebra
de múltipla dimensões demonstrou ser incrivelvente potente para aplicações
sofisticadas.
Augustin-Louis Cauchy (1789 - 1857), matemático francês, foi o primeiro a nomear
a essas configurações numéricas de tableau, que em francês, significa tabela em
1826, mas o nome matriz surgiu em 1850 com James Joseph Sylvester. Entretanto,
foi Arthur Cayley em 1858, na sua publicação de Memoir on the Theory of
Matrices, quem formulou a primeira definição abstrata de matriz. Cayley também
forneceu uma álgebra matricial, definindo adição, multiplicação de matrizes,
multiplicação por escalar e matriz invertı́vel. Foi a partir dos trabalhos de Cayley
que as matrizes passaram a ter relevância e gradativamente foram superando os
determinantes em grau de importância.
As matrizes estão envolvidas em diversas áreas do conhecimento e em diversas
atividades humanas, como por exemplo: nos jogos eletrônicos, os programas de
29
informática, a aplicação de bancos de dados e internet, nos sistemas de rede elétrica
e de transportes, são apenas alguns exemplos em que a aplicação de matrizes é
fundamental.
Neste capı́tulo apresentaremos as definições básicas da teoria de matrizes
necessárias no desenvolvimento e na ánalise do estudos das cadeias de Markov.
HOMENS MULHERES
AL 757000 494000
ES 1076000 783000
30
Podemos representar a tabela acima na forma de uma matriz M dada por
757000 494000
M=
1076000 783000
Dessa forma defimos matriz como sendo qualquer arranjo retangular de informações
numéricas organizadas em linhas e colunas.
As linhas são contadas de cima para baixo. A primeira e a segunda linha da matriz
M são respectivamente
31
quais 137 pernaneceram, 7 se transferiram para o curso B e 8 se transferiram para o
curso C. A linha 2 representa a quantidade de alunos oriundos do curso B dentre os
quais 12 alunos se transferiram para o curso A, 115 permaneceram no curso B e 13
se transferiram para o curso C. A linha 3 representa a quantidade de alunos
procedentes do curso C dentre os quais 14 se transferiram para o curso A, 15 se
transferiram para o curso B e 119 permaneceram matriculados no curso C.
Podemos dizer também por exemplo que a coluna 1 representa a quantidade de
alunos matriculados no curso A após encerrado o perı́odo de transferências dentre
os quais, 137 já frequentavam o curso A, 12 estudavam no curso B e 14 estudavam
no curso C. A segunda coluna representa a quantidade de alunos matriculados no
curso B após encerrado o perı́odo de transferências dentre os quais 7 estudavam no
curso A, 115 permaneceram no curso B e 15 são oriundos do curso C. A terceira
linha representa a quantidade de alunos matriculados no curso C após encerrado o
perı́odo de transferências dentre os quais 8 estudavam no curso A, 13 estudavam no
curso B e 119 permaneceram matriculados no curso C.
Analisando a matriz T, qual a quantidade total do número de alunos transferidos?
32
a11 + a12 + a13 = 147.
Com base nos dados, e admitindo que é possı́vel até 20 carros passarem por minuto
cada vez que o semáforo se abre, em um perı́odo de 2 horas, qual o número máximo
de veı́culos podem passar da rua 3 para a rua 1?
Solução: Segue da matriz M que o semáforo que permite aos veı́culos passarem da
rua 3 para a rua 1 fica aberto por 0.5 minutos a cada 2 minutos, isto é, a cada uma
hora este semáforo fica aberto por 30 x 0.5 = 15 minutos. Agora considerando o
fluxo máximo de carros, temos 20 x 15 = 300 carros passando da rua 3 para a rua 1
em uma hora. Portanto, em duas horas, podem passar da rua 3 para a rua 1, 600
carros.
Definição: Uma matriz é uma tabela retangular com m linhas e n colunas cujos os
elementos aij representam elementos com dupla entrada, ou seja, com ı́ndices
duplos em que 1 ≤ i≤ m e 1 ≤ j≤ n sendo m,n inteiros positivos.
Representamos uma matriz A = (aij ) de ordem m x n, na qual o elemento aij
encontra-se na interseção da i-ésima linha com a j-ésima coluna da seguinte forma:
33
a11 a12 ··· a1n
a21 a22 · · · a2n
A=
.. .. ... ..
. . .
am1 am2 · · · amn
a11 = 3 · 1 − 2 · 1 = 3 − 2 = 1 a12 = 3 · 1 − 2 · 2 = 3 − 4 = −1
a21 = 3 · 2 − 2 · 1 = 6 − 2 = 4 a22 = 3 · 2 − 2 · 2 = 6 − 4 = 2
a31 = 3 · 3 − 2 · 1 = 9 − 2 = 7 a32 = 3 · 3 − 2 · 2 = 9 − 4 = 5
34
15 10 12
A = 10 11 13
14 12 11
35
janeiro de 2015, e que essa empresa, tenha três fábricas situadas em distintas parte
do paı́s e a produção de cada um de seus quatro produtos, é medida em milhões de
unidades. Assim, podemos representar sua produção através de uma matriz A, de
modo que, cada elemento aij representa a produção em milhões de unidades da
fábrica i e do produto j.
7 5 0 1
A= 0 4 3 7
3 2 0 2
36
2015, fazemos isso somando os elementos correspondentes nos dois quadros.
Essa situação representa uma adição de matrizes, conforme demonstrada a seguir:
7 5 0 1 9 4 1 0 7+9 5+4 0+1 1+0
A+B= 0 4 3 7 + 0 5 1 8 = 0+0 4+5 3+1 7+8
3 2 0 2 4 1 1 0 3+4 2+1 0+1 2+0
37
Volume Álgebra Geometria
1 170 150
2 120 140
3 120 140
Único 350 410
Tabela 3.5: Tabela II: Quantidades de exemplares no segundo semestre (em milhares
de unidades)
Quantos livros de Álgebra e Geometria de cada volume serão lançados por essa
editora nesse ano?
Solução: Para determinarmos o total de livros lançados é preciso somar os
elementos correspondentes nas duas tabelas.
Tabela 3.6: Tabela III: Quantidades de exemplares no ano (em milhares de unidades)
Esse problema pode ser resolvido através da soma de duas matrizes, conforme
mostrado a seguir:
38
200 250 170 150 370 400
220 230 120 140 340 370
A+B=
+
=
260 240 120 140 380 380
300 310 350 410 650 720
Note que a soma de matrizes segue uma soma algébrica convencional entre os
elementos correspondentes (de mesmo ı́ndice duplo). Portanto, podemos somar
duas matrizes somente quando elas forem de mesma ordem, isto é, se ambas
tiverem o mesmo número de linhas e colunas.
Definição: Definimos a soma de duas matrizes, como sendo a soma entre os seus
elementos correspondentes, isto é, de mesma posição.
De modo geral, dadas as matrizes A = (aij ) e B = (bij ), definimos a soma
A + B = (cij ) como sendo:
a a12 · · · a1n b b12 · · · b1n c c12 · · · c1n
11 11 11
a21 a22 · · · a2n b21 b22 · · · b2n c21 c22 · · · c2n
+ =
.. .. .. .. .. .. .. .. ..
.. .. ..
. . .
. . . . . . . . .
am1 am2 · · · amn bm1 bm2 · · · bmn cm1 cm2 · · · cmn
39
3.3.2 Propriedades da Adição de Matrizes
40
3.3.3 Multiplicação de Matrizes
7 x 3 + 5 x 9 + 0 x 8 + 1 x 2 = 68 (milhões de reais)
41
cada elemento cij é dado por:
↓ ↓
∗ ∗ ∗ ∗ 2 ∗ ∗ ∗ ∗
−→ 4 5 6 · ∗ 0 ∗ = ∗ ∗
4. 2+5. 0+6. 4
∗ ∗ ∗ ∗ 4 ∗ ∗ ∗ ∗
42
Logo,
↓ ↓
∗ ∗ ∗ ∗ 2 ∗ ∗ ∗ ∗
−→ 4 5 6 · ∗ 0 ∗ = ∗ 32 ∗
∗ ∗ ∗ ∗ 4 ∗ ∗ ∗ ∗
c11 = 1 · 1 + 2 · (−1) + 3 · 2 = 5
c12 = 1 · 2 + 2 · 0 + 3 · 2 = 14
c13 = 1 · 3 + 2 · 3 + 3 · 1 = 12
c21 = 4 · 1 + 5 · (−1) + 6 · 2 = 11
c22 = 4 · 2 + 5 · 0 + 6 · 0 = 32
c23 = 4 · 3 + 5 · 3 + 6 · 1 = 33
c31 = 1 · 1 + (−1) · (−1) + 2 · 2 = 6
c32 = 1 · 2 + (−1) · 0 + 2 · 4 = 10
c33 = 1 · 3 + (−1) · 3 + 2 · 1 = 2
43
Exemplo 3.3.3.2: Dados os aeroportos de Londrina-PR (L) e Porto Alegre - RS
(P), e os aéroportos de Esmeraladas - MG (E), Brası́lia DF (B) e Três Lagoas - MS
(T). A figura a seguir, mostra as possı́veis rotas de voos diretos entre essas cidades.
L P E B T
L 0 1 1 1 1
P 1 0 0 1 1
E 1 0 0 0 0
B 1 1 0 0 0
T 1 1 0 0 0
Dessa forma podemos observar que não existem voos diretos entre as cidades de
44
Esmeralda, Brası́lia e Três Lagoas.
Podemos interpretar a matriz AA = A2 como sendo a tabela das possı́veis rotas de
voos entre as cidades com exatamente uma escala.
0 1 1 1 1 0 1 1 1 1 4 2 0 1 1
1 0 0 1 1 1 0 0 1 1 2 3 1 1 1
0 0 · 1 0 0 0 0 = 0 1 1
1 0 0 1 1
1 1 0 0 0 1 1 0 0 0 1 1 0 2 2
1 1 0 0 0 1 1 0 0 0 1 1 1 2 2
Note que, há três possibilidades de viagens de ida e volta a Porto Alegre passando
por outras cidades, mas não há rotas entre as cidades e Londrina e Esmeralda com
uma escala.
(AB)C = A(BC)
45
Pp
xij = (ab)ik ckj
i=1
Pp Pn
= k=1 ( s=1 ais bsk )ckj
Pp Pn
= k=1 ( s=1 ais bsk ckj )
Pn Pp
= s=1 ( k=1 ais bsk ckj )
Pn Pp
= s=1 ais ( k=1 bsk ckj )
Pn
= s=1 ais (bc)sj
= (a (bc))ij = yij
Portanto, X = Y , como querı́amos mostrar.
A(B + C) = AB + AC
46
3.3.6 Álgebra Numérica versus Álgebra Matricial
47
48
4 Matrizes Estocásticas
4.1 Introdução
em que a primeira coluna corresponde a hipótese de que no dia seguinte em que ele
dirigiu até o trabalho, ele dirige ou toma um ônibus no dia seguinte com igual
probabilidade. A segunda coluna corresponde a hipótese de que ele nunca vai ao
trabalho de ônibus dois dias seguidos.
Definição: Uma matriz quadrada é denominada matriz estocástica quando todos
os seus elementos são números reais não negativos e a soma dos elementos em cada
coluna é sempre igual a 1.
Exemplo 4.1.2: A matriz P é estocástica.
3/4 1/2 0 0
0 1/4 3/5 1/3
P=
1/8 1/4 1/5 1/3
1/8 0 1/5 1/3
Pois, todos os seus elementos são maiores ou igual zero e a soma dos elementos de
cada coluna é igual a 1.
Teorema 4.1.1: Sejam A = (aij ) e B = (bij ) matrizes estocásticas de ordem m.
Então o produto AB é uma matriz estocástica. Em particular, todas as potênicas
Ak com k inteiro positivo, são matrizes estocásticas.
Demonstração: Considere as matrizes quadradas A = aij e B= bij de mesma
ordem. Sabemos que o produto AB é dado por AB= cij , em que
49
Afim de mostrar que o produto AB é estocástica, tomamos arbitrariamente uma
coluna k de AB. Somando seus elementos obtemos
50
Agora suponha que um biólogo especialista em comportamento migratório, realizou
um estudo sobre a migração da tartaruga-de-couro após o perı́odo da desova afim
de estabelecer um padrão migratório para espécie. Ele constatou empiricamente
que dentre as fêmeas monitoradas que partiram dos EUA, 50% delas migraram
para o México após a desova e que 50% migraram para a Europa. Dentre as fêmeas
que partiram do México, 20% migraram para os EUA, 50% retornaram ao México e
que 30% migraram para a Europa. Dentre as fêmeas que partiram da Europa,
todas migraram para o México após o perı́odo de desova.
Considere:
x = número de fêmeas que partiram dos EUA
y = número de fêmeas que partiram do México
z = número de fêmeas que partiram da Europa
x’ = número de fêmeas que migraram para os EUA
y’ = número de fêmeas que migraram para o México
z’ = número de fêmeas que migraram para Europa
51
Indicando por M a matriz
0 0, 2 0
M = 0, 5 0, 5 1
0, 5 0, 3 0
e denotando
0
x x
0
0
v= y v = y
z z0
obtemos a seguinte equação
v0 = M v
Vamos admitir que as taxas de migração sejam mantidas a cada ano. Além disso
vamos supor que a população monitorada permanece constante.
Para o próximo perı́odo de desova a população de tartarugas-de-couro que migrou
para, EUA, México e Europa será dada por
v 0 = M (M v)
v 0 = M 2 v.
Observe que
0 0, 2 0 0 0, 2 0 0, 1 0, 1 0, 2
M 2 = 0, 5 0, 5 1 = 0, 75 0, 65 0, 5
0, 5 0, 5 1
0, 5 0, 3 0 0, 5 0, 3 0 0, 15 0, 25 0, 3
52
Portanto, a cada ano a população que migra é obtida pela multiplicação da
população anterior matriz M . Daı́ se conclui que decorridos k anos, a população
que migra é dada por
M k v.
Por este motivo diz - se que o fluxo migratório das tartarugas-de-couro monitoradas
é representada pela matriz M . Podemos observar através da matriz M , que após a
desova, apenas migraram para os EUA, animais que partiram do México. Mas no
segundo perı́odo do ciclo migratório de desova, todos os locais de observação EUA,
México e Europa receberão animais vindo de todos os três locais de partida. Isto
pode ser visto do fato de que todas as entradas de M 2 são positivas.
Observe que o produto de uma matriz com entradas positivas por uma matriz
estocástica resulta sempre numa matriz com entradas positivas.
Aw = λw
53
Aw = w
é um autovetor da matriz
3 0
A=
8 −1
associado ao autovalor λ = 3, pois Aw = 3w. Vejamos:
3 0 1 3 1
= = 3
8 −1 2 6 2
Ak w = λk w
Aw = λw.
54
Agora segue da equação acima que
An w = λn w, n ∈ N.
An+1 w = λn+1 w.
Teorema 4.3.2. Toda matriz quadrada não nula A = (aij ) tem pelo menos um
ponto fixo se, somente se, o determinante da matriz A - I é nulo, em que I é a
matriz identidade.
Demonstração: A matriz A = (aij ) tem ponto fixo se, somente se, existe um
55
vetor w, não nulo, dado por
w1
w2
w=
..
.
wm
tal que Aw = w, isto é,
a11 a12 ··· a1m w1 w1
a21 a22 · · · a2m
w2 w2
=
.. .. .. .. ..
..
.
. . . . .
am1 am2 · · · amm wm wm
Então, segue que
a11 w1 + a12 w2 + · · · + a1m wm = w1
a w + a w + ··· + a w = w
21 1 22 2 2m m 2
.
..
a w + a w + ··· + a w = w
m1 1 m2 2 mm m m
56
Como um sistema homogêneo possui solução não trivial se, somente se, o
determinante da matriz dos coeficientes é nulo, concluı́mos que
(a11 − 1) a12 ··· a1m
(a22 − 1) ···
a21 a2m
=0
.. .. ..
..
.
. . .
· · · (amm − 1)
am1 am2
Portanto podemos concluir que uma matriz quadrada possui ponto fixo não nulo se,
e somente se, det(A - I) = 0.
Teorema 4.3.3. Toda matriz estocástica A tem pelo menos um ponto fixo.
Então, o vetor
57
2/5
w=
3/5
1 2 1 3
2.5 + 3.5
1/2 1/3 2/5 2/5
= =
1/2 2/3 3/5 1 2 2 3 3/5
. + .
2 5 3 5
Portanto,
Aw = w.
A(x, y) = (x, y)
58
1 1
2 3
x
1 2 y
2 3
Logo
1 1
x + y=x
2 3
1 2
x+ y =y
2 3
3
O que equivale a y = x.
2
Então
3 3 5 2 3
(x, y) = x, x = x 1, = x , .
2 2 2 5 5
Definição: Se o vetor w é um ponto fixo de A e além disso w1 + w2 + · · · + wm = 1
com wi ≥ 0 com i = 1, · · · , m. Dizemos que w é um vetor fixo de probabilidade.
Teorema Fundamental da Matriz Estocástica Regular: Seja P uma matriz
estocástica regular. Então, P possui um único vetor de probabilidade fixo w e
todas as coordenadas de w são positivas.
Demonstração: Como P é uma matriz estocástica, pelo teorema 4.3.3 P possui
pelo menos um ponto fixo w, logo
P w = w.
P m w = w.
59
Seja P m = (aij ), aij > 0, 1 ≤ i, j ≤ n.
Então,
a11 a12 · · · a1n w1 w1
a21 a22 · · ·
a2n w2 w2
= .
.. .. .. .. ..
..
.
. . . . .
an1 an2 · · · ann wn wn
Trocando w por −w, se necessário, podemos supor que w possui alguma coordenada
positiva. Vamos mostrar que todas as coordenadas de w são positivas.
60
a11 w1 + a12 w2 + · · · + a1k wk + a1k+1 wk+1 + · · · + a1n wn = w1
a w + a w + ··· + a w + a
2k+1 wk+1 + · · · + a2n wn = w2
21 1 22 2 2k k
.
..
a w + a w + ··· + a w + a
kk+1 wk+1 + · · · + akn wn = wk
k1 1 k2 2 kk k
a1k+1 wk+1 · · · + a1n wn = w1 − (a11 w1 + a12 w2 + · · · + a1k wk )
2k+1 wk+1 · · · + a2n wn = w2 − (a21 w1 + a22 w2 + · · · + a2k wk )
a
..
.
kk+1 wk+1 · · · + akn wn = wk − (ak1 w1 + ak2 w2 + · · · + akk wk ) .
a
k
! k
!
X X
wk+1 (a1k+1 + · · · + akk+1 )+· · ·+wn (a1n + · · · + akn ) = w1 1 − ai1 +· · ·+wk 1− aik
i=1 i=1
k k
!
X X
0 < wk+1 (a1k+1 + · · · + akk+1 ) + · · ·+ wn (a1n + · · · + akn ) = wj 1− aij ≤0
| {z } | {z } |{z} | {z }
>0 >0 >0 >0 j=1 i=1
| {z }
≤0
61
1
Tomando w∗ = w, concluı́mos que w é um vetor de probabilidade
w1 + · · · + wn
fixo, com todas as coordenadas positivas.
Agora vamos mostrar que o vetor de probabilidade de P é único. Suponhamos que
existam dois vetores de probabilidade u e v, u 6= v, tais que u e v são pontos fixos
de P . Então
P u = u e P v = v.
Além disso
n
X n
X n
X
(u − v)i = ui − vi = 1 − 1 = 0.
i=1 i=1 i=1
Como u − v 6= 0 então o vetor u − v possui pelo menos uma coordenada maior que
zero e pelo menos uma coordenada menor que zero. Mas isso contraria ao que
demonstrado anteriormente.
Logo, P possui um único vetor de probabilidade fixo, como querı́amos demonstrar.
62
63
5 Cadeias de Markov
5.1 Introdução
Imagine cada colisão como um evento independente, como uma virada em uma
moeda honesta. Após 10 colisões, o feijão cai em um recipiente que representa a
razão entre a deflaxão entre esquerda e direita ou ainda como sendo cara ou coroa.
Essa curvatura é conhecida como distribuição binomial. Aparenta que a média do
destino desses eventos é de alguma forma predeterminada, conhecida hoje como
Teorema Central do Limite.
Isso representou uma ideia filosófica perigosa para alguns. Parul Nekrasov, um
teólogo por formação que mais tarde acabou seguindo os passos da matemática, era
um influente proponente da doutrina religiosa do livre arbı́trio. Ele não admitia a
ideia de termos esse destino estatı́stico predeterminado. Ele afirmava que a
independência era uma condição necessária para a lei dos grandes números desde
que a independência descrevesse esses exemplos simples como os que utilizam
feijões, dados ou moedas, os quais o resultado de um evento anterior não afeta a
probabilidade da ocorrência do evento futuro. No entanto, como podemos observar,
64
a grande parte dos fenômenos da fı́sica, são claramente dependentes de um
resultado anterior.
Quando a probabilidade de algum evento depende ou é condicional a um evento
anterior, dizemos que eles são eventos dependentes.
Essa afirmação irritou um matemático russo, Andrey A. Markov, o qual manteve
publicamente um desafeto com Nekrasov. Markov estendeu os trabalhos realizados
por Bernoulli sobre variáveis dependentes utilizando uma construção engenhosa.
Imagine uma moeda a qual não seja independente, mas dependente apenas do
resultado anterior, então esse processo teria uma memória de curto prazo. Esse
processo pode ser visualizado utilizando uma máquina hipotética composta por
dois potes, os quais chamamos de estados. Em um estado temos uma mistura de 50
bolas pretas e 50 bolas brancas indistinguı́veis. Enquanto no outro, temos uma
mistura com mais bolas pretas do que brancas. Um pote podemos chamar de
estado 0 (zero), ele representa a ocorrência anterior a uma bola preta, e o outro,
podemos chamar de 1 (um), ele representa a bola branca tendo ocorrido
anteriormente.
Para iniciarmos o uso da máquina, simplismente começamos em um dos estados
retirando uma bola. A partir daı́, iremos para o estado 0 ou 1, dependendo do
resultado daquele evento. Como esse processo possui dois estados, podemos
identificar 4 possı́veis transições de estados. Se estamos no estado 0 e ocorre uma
bola preta, permanecemos no estado 0, e retiramos uma outra bola. Se uma bola
branca é retirada, o processo passa para o estado 1, o qual também pode
permanecer em si mesmo, ou passar para o estado 0 se uma bola preta for retirada.
A probabilidade de uma bola branca ser retirada em relação uma bola preta é
claramente não independente
65
Figura 5.2: Máquina de dois estados
66
5.2 Andrei Andreyevich Markov
Markov conviveu grande parte de sua infância com uma saúde muito frágil,
apresentando dificuldades até mesmo para andar. Na adolescência demonstrou seu
talento excepcional para a matemática, mas não teve o mesmo sucesso nas outras
disciplinas. Publicou seu primeiro artigo quando ainda cursava o equivalente ao
Ensino Médio cujo tema abordado foi Equações Diferenciais Lineares e, mesmo
apresentando resultados já conhecidos, o artigo despertou a atenção de dois
importantes professores da Universidade de São Petersburg, Aleksandr Korkin e
Yegor Ivanovich Zolotarev.
A partir daı́, ficou evidente que a Matemática era o caminho natural para Markov
e, em 1874, ingressou na Faculdade de Fı́sica e Matemática de São Petersburgo. Por
lá, matriculou-se no seminário dirigido pelos professores Korkin e Zolotarev, mas
também assistiu a muitas palestras do professor Pafnuty Chebyshev, na época chefe
do departamento de matemática.
67
Markov se formou em 1878 ganhando nesse ano o prêmio de melhor artigo publicado
envolvendo o tema Integração de Equações Diferenciais por meio de Funções
Contı́nuas. Querendo tornar-se professor, trabalhou em seu mestrado ao longo de
dois anos obtendo o tı́tulo em 1880 com um trabalho sobre Formas Quadráticas
Binárias com Determinantes Positivos. Esse trabalho foi muito elogiado por
Chebyshev e representou uma dos melhores trabalhos realizados sobre Teorias dos
Nmeros de toda a Matemática Russa. Embora sua dissertação tenha sido publicada
simultaneamente em francês, ela não foi absorvida imediatamente por matemáticos
da Europa Ocidental, dando a medida do quanto Markov havia se aprofundado no
assunto. Terminado o mestrado, Markov começou a lecionar na Universidade de São
Petersburgo, enquanto trabalhava em seu doutoramento, concluindo-o em 1884 com
a tese sobre Aplicações de Frações Contı́nuas.
Agora professor, Markov havia ganhado notabilidade social suficiente para assumir
sua antiga paixão por Maria Ivanova Valvatyeva, pedindo-a em casamento. Os
dois já se conheciam desde crianças, pois ela era a filha do proprietário da fazenda
em que seu pai gerenciava. No entanto, a mãe de Ivanova não aceitava a ideia de
que sua filha casasse com o filho do gerente da fazenda. Entretanto, os esfor{ccos
para evitar a união não foram suficientes e, em 1883, a mãe de Ivanova concedeu a
anuncia e o casamento aconteceu naquele mesmo ano.
Markov construiu uma sólida carreira como professor na Universidade de São
Petersburgo e, além disso, ingressou na Academia Russa de Ciências indicado por
Chebyshev, em 1883. Aposentou-se formalmente em 1905, mas continuou a ensinar
por alguns anos.
Markov foi o porta-voz mais elegante das ideias e direções de pesquisa em Teoria
de Probabilidades de Chebyshev. Ele é lembrado particularmente pelo estudo
desenvolvido sobre Sequências de Variáveis Aleatórias em que a próxima variável é
68
determinada no máximo pelo estado presente, mas é independente da forma pelo
qual o estado atual surgiu de seus antecessores. Markov analisou a sequência de
vogais e consoantes no poema Eugene Onegin, escrito por Alexander Pushkin em
1883. Ele verificou empiricamente que uma vogal era seguida por uma consoante
em 87% das vezes e que uma consoante era seguida por uma vogal 66% das vezes.
Este trabalho é conhecido como Cadeias de Markov e representa um marco na
Teoria das Probabilidades. Em 1923, Nobert Winer tornou-se o primeiro a tratar
rigorosamente os Processos Contı́nuos Markovianos. As bases de uma teoria geral
foi fornecida durante a década de 1930 por Andrei Kolmogorov.
Markov viveu um perı́odo de grande atividade polı́tica na Rússia e, por ter opiniões
firmes, tornou-se um militante polı́tico. Em 1913, a dinastia Romanov, que estava
no poder na Rússia desde 1613, comemorou seus 300 anos de poder, mas Markov
fez questão de demonstrar toda sua desaprovação pela celebração. Com o inı́cio
da Revolução Russa em 1917, Markov foi enviado para Zaraisk, uma pequena
cidade do interior da Rússia, onde ensinou matemática na escola secundária sem
receber qualquer remuneração. Por fim, retornou a São Petersburgo, apresentando
uma saúde debilitada, vindo a falecer em julho de 1922 depois de meses de sofrimento.
5.3.1 Introdução
69
Em particular, os conceitos e ferramentas necessários para a análise da convergência
de uma cadeia de Markov regular para sua distribuição estacionária.
Um conceito muito importante que será apresentado é sobre a matriz de transição
de uma cadeia de Markov, elemento esse fundamental na teoria. A partir da matriz
de transição, podemos caracterizá - la e doravante estudarmos sua distribuição
de probabilidade estacionária utilizando operações matriciais básicas facilmente
programadas. Isso é uma particularidade importante na aplicação da teoria.
Considere um processo estocástico finito {Xn }n>0 em que cada variável aleatória
Xi assume, com certa probabilidade, um estado si ∈ {s1 , s2 , · · · , sn } com
i = 1, 2, · · · , n.
Definição: Uma cadeia de Markov finita é um processo estocástico finito tal que:
Podemos dizer outras palavras, que uma cadeia de Markov é um processo estocástico
desmemoriado, isto é, o resultado de qualquer tentativa depende apenas do resultado
da tentativa imediatamente anterior, não dependendo das demais tentativas.
A condição acima é conhecida como propriedade de Markov.
Seja {Xn }∞
n=0 uma cadeia de Markov, se Xn = sj , dizemos que a cadeia de Markov,
70
denotada por:
pij ≥ 0
n
X
pij = 1
j=1
71
Exemplo 5.3.2.1. O que é maior: a probabilidade de que neve depois de uma de
sol quente ou depois de um dia nublado e frio?
Situações como essa podem serem estudadas e modeladas pelas cadeias de Markov
como segue na situação a seguir.
Na terra de Nárnia nunca ocorrem dois dias ensolarados seguidos. Se em um dia
faz sol, então para o dia seguinte fica igualmente propenso a nevar ou chover. Se
1
chover, no dia seguinte a probabilidade de chover novamente é de 2
e fica igualmente
propenso nevar ou fazer sol. Caso tenhamos um dia com preciptação de neve, para
1
o dia seguinte temos a probabilidade de nevar novamente de 2
e a de chover ou fazer
sol igualmente propensos. Dessa forma a matriz de transição é dada por
0, 5 0, 5 0, 25
P = 0, 25 0 0, 25
0, 25 0, 5 0, 5
Ao usarmos uma cadeia de Markov para explicar um fenômeno da natureza, é
fundamental conhecermos alguns detalhes. Em função da independência temporal,
que está presente no conceito das cadeias de Markov. Então podemos ignorar o
tempo de 10 dias atrás para prever o tempo amanhã. Entretanto, isso não significa
dizer que o futuro não dependa do passado, ou ainda, que o passado não influência
no futuro. Ao contrário, uma série de eventos contém mais informações que dois
eventos isolados. Contudo, para prever o tempo amanhã, e em virtude das cadeias
de Markov, sabemos que podemos desprezar o tempo de 10 dias atrás.
Na verdade, com a probabilidade, apenas medimos a chance de que algo venha
acontecer, isso não quer dizer que sabemos com certeza o que vai acontecer.
Exemplo 5.3.2.2. Um homem joga em duas máquinas distintas de caça nı́quel. A
72
primeira paga o prêmio com probabilidade c, e a segunda com probabilidade d. Se
ele perde, ele joga novamente na mesma máquina, se vence, ele muda para a outra
máquina. Seja si o estado em que ele ele joga na máquina i. Então a matriz de
transição é dada por
c 1−d
P=
1−c d
Exemplo 5.3.2.3. Um psicólogo faz as seguintes hipóteses, quanto ao
comportamento de ratos sujeitos a um horário especial de alimentação. Para
qualquer tentativa particular, 80% dos ratos que foram para direita no experimento
anterior irão para a direita na próxima tenativa, e 60% dos que foram para a
esquerda no experimento anterior irão para a direita na próxima tentativa. Os
estados do sistema são D (direita) e E (esquerda). A matriz de tarnsição é dada por
0, 8 0, 6
P=
0, 2 0, 4
Exemplo 5.3.2.4. Uma empresa de aluguel de automóveis tem três lojas. Um
cliente pode alugar um carro em qualquer uma das lojas e devolvê-lo também em
qualquer uma das três lojas. Por meio de um estudo realizado por essa empresa,
estima-se que os clientes devolvem os automóveis às diferentes lojas, de acordo
com as seguintes probabilidades representadas na matriz de transição a seguir, que
dependem apenas da loja onde o automóvel foi alugado
0, 8 0, 3 0, 2
P = 0, 1 0, 2 0, 6
0, 1 0, 5 0, 2
73
Nesta matriz o valor p23 = 0.6 corresponde à probabilidade de um carro ser alugado
na loja 2 ser devolvido à loja 3.
Exemplo 5.3.2.5. Em sociologia é conveniente classificar as pessoas por faixa de
renda: classe baixa, classe média ou classe alta. Sociólogos descubriram que o fator
predominante que influência a classe de renda de uma pessoa, é a classe de renda
de seus pais. A matriz de transição P mostra as probabilidades de um indivı́duo
mudar de classe social dependendo apenas da classe de renda de seus pais.
Nesta seção iremos apresentar vários exemplos simples de cadeias de Markov. Esses
exemplos dizem a respeito ao que chamamos de passeio aleatório.
74
Sejam X1 , X2 , · · · , Xn , · · · variáveisaleatórias independentes e igualmente
= s0 + ni=1 Xi , com n ≥ 1. O processo
P
distribuı́das. Sejam, s0 = c e sn
estocástico {sn , n ≥ 0} é chamado de passeio aleatório simples. Em outras palavras,
uma passeio aleatório simples consiste de uma partı́cula inicialmente num ponto
x ∈ Z, que se move em Z e a cada instante pode pular d eum ponto x para um
dos pontos vizinhos, x + 1 ou x − 1, com probabilidade p de saltar para direita e
probabilidade q = 1 − p de saltar para esquerda. Se p = q = 12 , então dizemos que é
um passeio aleatório simétrico em que sn denota a posição da partı́cula no instante
n.
Imagine um homem que se move em linha reta em passos com comprimento 1, cada
passo corresponde a se deslocar uma unidade para a direita com probabilidade p ou
uma unidade para a esquerda, com probabilidade q. Move-se até atingir um dos
dois pontos extremos que são chamados de pontos de fronteira. As possibilidades
de seu comportamento nestes pontos determinam vários tipos diferentes de cadeias
de Markov. Os estados são as posições possı́veis. Nos exemplos a seguir, estaremos
levando em consideração o caso com 5 estados. Os estados 0 e 4 são os estados de
fronteiras.
Exemplo 5.4.1. Um homem está num ponto de coordenada inteira sobre o eixo x
entre a origem e o ponto 4. Ele dá um passo de uma unidade para a direita com
probabilidade p ou para a esquerda com probabilidade q = 1 − p, exceto quando ele
estiver na origem, caso em que dá um passo para a direita chegando ao ponto 1, ou
quando estiver sobre o ponto 4, caso em que dá um passo para esquerda chegando
ao ponto 3. Indiquemos por Xn a sua posição, após n passos. Esta é uma (C.M.),
cujo espaço de estados é S = {0, 1, 2, 3, 4}, em que cada estado si = i representa que
o homem está sobre o eixo x no ponto de abscissa i, com i = 0, 1, 2, 3, 4. A matriz
de transição é dada por
75
0 q 0 0 0
1 0 q 0 0
P= 0 p 0
q 0
0 0 p 0 1
0 0 0 p 0
Cada coluna da matriz, exceto a primeira e a última, correspondem ao fato de que
o homem se move do estado si para o estado si+1 , com probabilidade p ou para o
estado si−1 com probabilidade q = 1 − p. A primeira coluna corresponde ao fato
de que o homem passa do estado s0 sempre para o estado s1 e a última coluna
corresponde ao fato de que o homem sempre passa do estado s4 para o estado s3 .
Exemplo 5.4.2. Supomos agora que sempre que o homem atinge um dos estados de
fronteira vai diretamente para o estado do centro s3 . A matriz de transição é dada por
0 q 1 0 0
0 0 q 0 0
P= 1 p 0
q 0
0 0 p 0 1
0 0 1 0 0
Exemplo 5.4.3. Suponha agora que quando o homem atinge um estado de fronteira
1
ele permanece nesse estado, com probabilidade 2
e se move para o outro estado de
fronteira também com probabilidade 21 . Nesse caso a matriz de transição é dada por
76
0, 5 q 0 0 0, 5
0 0 q 0 0
P= 0
p 0 q 0
0 0 p 0 p
0, 5 0 0 p 0, 5
Exemplo 5.4.4. A seguir, consideramos uma versão modificada do passeio
aleatório. Se o processo está em um dos três estados interiores,então tem igual
probabilidade de se deslocar para a direita, para a esquerda, ou permanecer em
seu estado atual. Se for na fronteira, não pode permanecer, entretanto tem igual
probabilidade de se deslocar para qualquer um dos outros quatro estados. A matriz
de transição é dada por
0 1/3 0 0 1/4
1/4 1/3 1/3 0 1/4
P = 1/4 1/3 1/3 1/3 1/4
1/4 0 1/3 1/3 1/4
1/4 0 0 1/3 0
77
sj →sk1 →sk2 → · · · →sn−1→si
Teorema 5.5.1. Seja P a matriz de transição de um processo em cadeia de Markov.
Se p = (pi ) é a distribuição de probabilidades do sistema num instante arbitrário,
então P pi é a distribuição de probabilidades do sistema após um estágio e P n pi é
a distribuição de probabilidades do sistema após n estágios. Em particular, temos que
Ou seja,
pi1 p1 + pi2 p2 + · · · + pin pn
78
p11 p1 + p12 p2 + · · · + p1n pn
p21 p1 + p22 p2 + · · · + p2n pn
∗
p =
..
.
pn1 p1 + pn2 p2 + · · · + pnn pn
Por outro lado, isso mostra que o vetor p∗ é exatamente o produto da matriz
P = (pij ) pelo vetor pi .
Portanto, p∗ = P p. Sendo assim tem - se
79
p(n+k) = P n pk = P n ej .
(n)
Entretanto, P n ej é a j-ésima coluna da matriz P n . Dessa forma, pij é a i-ésima
componente da j-ésima coluna de P n . Portanto, p(n) = P n , como querı́amos
demonstrar.
Suponhamos agora, que em um instante arbitrário, a probabilidade de que o sistema
esteja no estado si seja pij . Indicamos estas probabilidades pelo vetor
p1
p2
p=
..
.
pn
80
(n)
p1
(n)
p2
p(n) =
..
.
(n)
pn
Nesse caso, o espaço de estados é definido tal que S = {s1 = ônibus, s2 = carro}
Então, queremos conhecer, qual a probabilidade de que o sistema passe do estado s1
para o estado s2 , em exatamente 4 estágios.
Primeiramente, calculamos P 4
0 0, 5 0 0, 5 0 0, 5 0 0, 5 0, 375 0, 3125
P4 = =
1 0, 5 1 0, 5 1 0, 5 1 0, 5 0, 625 0, 6875
81
para decidir se iria ao trabalho de carro ou ônibus. Ele definiu que iria dirindo
para o trabalho se, e somente se, o resultado do lançamento do dado fosse 6,
caso contrário iria de ônibus. Com isso podemos assumir que a distribuição
inicial de probabilidades do processo é, p(0) = (5/6, 1/6) é a distribuição inicial de
probabilidades do sistema.
Logo, a distribuição de probabilidades após 4 dias é dada por:
0, 375 0, 3125 5/6 35/96
p(4) = P 4 p(0) = =
0, 625 0, 6875 1/6 61/96
Em outras palavras, após espera-se que o homem tenha ido ao trabalho de ônibus
em 36,4% das vezes e tenha ido de carro em 63,6% das vezes.
5.6.1 Introdução
82
de haver bastante chuva ou uma seca, será a mesma. Suponhamos também,
para simplificar o modelo, que estas probabilidades permaneçam inalteradas com
o decorrer dos anos, o que não ocorre na prática, embora possamos usar essa
simplificação, como recurso para termos um indicador da situação.
A longo prazo, o que podemos esperar com maior probabilidade. Que essa região
sofra com perı́odos de muita chuva? Ou com perı́odos com escassez de chuvas?
As cadeias de Markov mostram-se eficazes na resolução desse tipo de problema.
Sendo assim, muito importantes na avaliação de propostas de intervenção na
realidade utilizando conhecimentos algébricos. Esse capı́tulo dedica-se na análise
do comportamento estacionário da distribuição de probabilidade de uma cadeia de
Markov regular, essencial na aplicação.
As cadeias de Markov regulares, exercem papel fundamental nas aplicações, em
virtude de sua distribuição estacionária de probabilidades, sobretudo, pois sua
convergência para sua distribuição é obtida por meio de operações matriciais
elementares aplicadas na matriz de transição as quais são facilmente programadas
e esta é uma importante particularidade nas aplicações das cadeias regulares, o que
propcia apresentar o tema em turmas de Ensino Médio. A contemporalidade do
tema e suas diversas aplicações corroboram para o desenvolvimento do pensamento
crı́tico e investigativo dos alunos, potencializando a aprendizagem de temas como
probabilidades e matrizes.
83
5.6.2 Distribuição Estacionária de uma cadeia de Markov
Regular
Definição: Uma cadeia de Markov é dita regular se, e somente se, a partir de um
estado inicial arbitrário é possı́vel acessar qualquer estado após um certo número de
passos, em outras palavras, se sua matriz de transição P for uma matriz estocática
regular.
Lema 5.6.2: Seja P uma matriz de transição de ordem r com todas as entradas
são positivas. Seja a menor entrada da matriz P . Seja x um vetor coluna com r
coordenadas, sendo M0 sua maior coordenada e m0 sua menor coordenada, e sejam
M1 e m1 respectivamente a maior e a menor coordenada do vetor P x. Então
M1 ≤ M0 , m0 ≤ m1 M1 − m1 ≤ (1 − 2)(M0 − m0 ).
P x∗i = a · m0 + (1 − a) · M0 = M0 − a(M0 − m0 )
M1 ≤ M0 − (M0 − m0 ).
84
Segue dos resultados anteriores que
Mn − mn ≤ (1 − 2)(Mn−1 − mn−1 )
dn ≤ (1 − 2)n d0 = (1 − 2)n
85
da matriz P n sejam sempre iguais a 1, o mesmo deve ser verdade para o limite.
Isso completa a demonstração para o caso me que todas as entradas da matriz são
positivas.
Consideramos agora que P seja regular. Seja N tal que, cada potência P N não
tenha entradas zero. Tome ∗ a menor das entradas de P N . Aplicando a primeira
parte da demonstração para a matriz P N , temos
dkN ≤ (1 − 2∗ )k
86
tende a componente wi de w. Em outras palavras, a longo prazo, a probabilidade de
que qualquer estado j ocorra é aproximadamente igual a componente wi do único
vetor de probabilidade fixo w de P .
Dessa forma, observamos que a influência do estado inicial ou da distribuição inicial
de probabilidades do processo diminui a medida em que o número de estágios do
processo aumenta. Além disso, toda sequência de distribuição de probabilidades
tende ao vetor de probabilidade fixo de P , o qual representa a distribuição
estacionária de uma cadeia de Markov.
Essa caracterı́stica permite com que as cadeia de Markov Regulares, sejam um
ótimo modelo de modelagem matemática para a análise de previsões a longo prazo.
Exemplo 5.6.1. Suponhamos que em uma determinada região, observa-se que
se chover bastante durante o ano, a probabilidade de que chova bastante no ano
1
seguinte é de 4
, e que a probabilidade de que se tenha uma escassez de chuva
3
é de 4
. Ainda sabemos que, se houver uma escassez de chuvas em um ano,
no ano seguinte a probabilidade de haver bastante chuva ou uma seca, será a
mesma. Suponhamos também, para simplificar o modelo, que estas probabilidades
permaneçam inalteradas com o decorrer dos anos, o que não ocorre na prática,
embora possamos usar essa simplificação, como recurso para termos um indicador
da situação. Sendo assim, a matriz de transição desse processo em cadeia de Markov
é dada por
0, 25 0, 5
M =
0, 75 0, 5
Note que M é uma matriz estocástica regular, uam vez que todos os seus elementos
são positivos. Sendo assim, podemos concluir que, quaisquer que sejam as
87
probabilidades iniciais, a distribuição de probabilidades a longo prazo é dada pelo
vetor de probabilidades fixo da matriz M .
Mw = w
0, 25 0, 5 x x wchuva
= =
0, 75 0, 5 1−x 1−x wseca
0, 25x + 0, 5 − 0, 5x = x
x + 2 − 2x = 4x
2 3
Da equação acima segue que, x = 5
= 0, 4 e 1 - x = 5
= 0, 6.
wchuva 0, 4
=
wseca 0, 6
Portanto, a longo prazo, a probabilidade de termos nessa região um ano ocm
bastante chuva é de 40%, enquanto que a probabilidade de termos um ano com
escassez de chuvas é de 60%, dentro das hipóteses simplificadoras. Com base nesses
88
a dados podemos concluir, que a região tenderá a uma ligeira aridez.
Exemplo 5.6.2 Suponhamos que em um municı́pio, a cada ano 3% da população
da zona rural, migra para a zona urbana, enquanto 1% da população da zona urbana
migra para a zona rural. Se todas essas porcentagens não mudarem, qual deve ser a
relação entre as populações urbana e rural desse municı́pio a longo prazo?
A Matriz de transição desse processo markoviano regular é dada por
0.99 0.03
0.01 0.97
0, 99x + 0, 03 − 0, 03x = x
0, 04x = 0, 03
Então temos que x = 0,75. Logo, wrural = 25% e wurbana = 75%. Portanto, se
89
não houver modificações nas politicas públicas de migração daquela região, teremos
a longo prazo, 25% da população vivendo na zona rural do municı́pio e 75% da
população vivendo na zona urbana.
Exemplo 5.6.3 Observa-se experiemntalmente que, em condições naturais e sem ser
submetida à pesca industrial, a quantidade de uma certa espécie de peixe varia do
seguinte modo: se em um ano a população diminui, a probabilidade de que diminua
ainda mais no ano seguinte é de 60% e, se em um determinado ano a população
aumenta, a probabilidade de que diminua no ano seguinte é de 30%. Entretanto,
observa-se que, sendo essa mesma espécie de peixe submetida à pesca industrial,
quando a população de peixes aumenta num determinado ano, a probabilidade
de que dimiua no ano seguinte se altera para 50%, enquanto que se a população
diminua no ano seguinte continua sendo 60%. Deseja-se conhecer, como a longo
prazo, a pesca industrial estará afetando a população de peixes dessa espeécie.
Desse modo, seria possı́vel determinar, se a pesca industrial deve diminuir para
preservar a espécie ou até mesmo para determinar que essa atividade comercial tem
potencial para expansão. Os estado desse processo são: diminuição da população
de peixes (D) e aumento da população de peixes (A). Então, vamos analisar as
probabilidades de evolução populacional dessa espécie de peixe, sem haver pesca
industrial, a matriz de probabilidades de transição desse processo markoviano é
dada por
0, 7 0, 4
0, 3 0, 6
90
0, 7 0, 4 x x
=
0, 3 0, 6 1−x 1−x
Então,
0, 7x + 0, 4 − 0, 4x = x
0, 3x − 0, 6 − 0, 6x = 1 − x
0, 7x + 0, 4 − 0, 4x = x
0, 7x = 0, 4
4 3
x= 7
=⇒ 1 − x = 7
4
Portanto, a probabilidade da população dessa espécie de peixes aumentar é wA = 7
91
Da equação acima segue que
0, 5x + 0, 4 − 0, 4x = x
0, 5x + 0, 6 − 0, 6x = 1 − x
0, 5x + 0, 4 − 0, 4x = x
0, 9x = 0, 4
4 5
x= 9
=⇒ 1 − x = 9
4
Desse modo temos, wA = 9
e wD = 59 . Como a probabilidade da população diminuir
é maior, se a espécie for submetida à pesca industrial, sua sobrevivência será
ameaçada e, portanto a pesca deve ser diminuı́da ou até mesmo proibida.
Podemos observar que os processos markovianos, podem ser modelados e estudados,
afim de estabelecermos cenários a longo prazo, os quais podem oferecer informações
úteis para tomadas de decisão como por exemplo, na gestão de recursos naturais e
na elaboração de polı́ticas públicas.
pii = 1.
92
Uma cadeia de Markov é denominada absorvente se existe pelo menos um estado
absorvente e se for possı́vel, a partir de qualquer estado arbitrário, existir uma
sequência de transições até um estado absorvente. Um estado que não é absorvente
é demoninado estado de transição.
Exemplo 5.7.1. Suponhamos uma cadeia de Markov em que sua matriz de
transição é dada por
A B C D E
1 1 1 1
0 4 4
A 4 4
0 1 0 0 0 B
1 1 1
2 0 4 4 0 C
0 1 0 0 0 D
0 0 0 0 1 E
93
A B C D
1 1
2 2
0 0 A
1 1
2
0 2 0 B
1 1
2
0 0 2
C
0 0 0 1 D
94
95
6.1 Introdução
96
Atualmente, há outros fatores adicionais que influênciam na ordenação dos sites.
Entretanto, a essência do ranqueamento para qualquer usuário da ferramenta de
busca é a mesma, o PageRank.
Em 1995, dois jovens estudantes de ciências da computação, Larry Page com 22 anos
e Sergey Brin com 21, criaram um mecanismo de pesquisa inicialmente chamado
de BackRub, que chegou a ser utlizado em servidores da universidade de Stanford
durante mais de um ano, e acabacou em desuso por usar uma largura de banda
excessiva para os padrões que a universidade tinha disponı́vel naquela época.
A partir daı́, eles decidiram que o mecanismo de busca por eles criado, precisava
de um outro nome. Após diversas sugestões, optaram por escolher Google, um
brincadeira com a palavra ”googol”, termo matemático para designar o número
representado pelo dı́gito 1 seguido de cem dı́gitos 0.
10100
Andy Bechtolsheim, doou um cheque no valor 100 mil dólares para uma entidade que
ainda inexistente: uma empresa chamada Google Inc. Improvisado em uma garagem
no endereço 232 Santa margarida, Menlo Park, o Google inicia seus trabalhos. A
formalização da criação da empresa na Califórnia ocorreu em 4 de setembro de 1998.
Em seguida, Larry e Sergey abrem uma conta em um banco em nome da nova
empresa e depositam o cheque doado por Andy Bechtolsheim. Com o crescimento
da empresa foi necessário abandonar o pequeno escritório na garagem, e transferir-se
97
para um novo endereço, mais amplo e que atendesse a nova demanda da empresa e
por isso em fevereiro do ano de 1999, o Google inaugura sua nova sede no endereço
165 University Avenue em Palo Alto, com apenas oito funcionários.
A partir daı́, o Google teve uma ascensão meteórica e hoje é o site mais popular de
pesquisa na internet e uma das maiores empresas de todo o mundo.
6.3.1 Introdução
98
desenvolvimento e estrutura da internet, e principalmente, alterou o formato das
informações e serviços oferecidos via a rede mundial de computadores.
Ferramentas de pesquisa como o Google se propoem a realizar três ações básicas:
Definição: Uma rede é dita admissı́vel se, e somente se, todos os sites possuem
pelos menos uma link de saı́da.
Definição: Uma rede é dita fortemente conectada se é possı́vel passar de uma
página para outra qualquer apenas clicando nos links.
Exemplo 6.3.2.1. A princı́pio consideremos um caso simples para ilustrar a
importância dos sites de uma determinada rede da internet, representada pelo grafo
99
a seguir:
No exemplo acima, a rede é composta por 4 sites. Cada flecha orientada representa
um link existente de um site para o outro. Trata-se de uma Web admissı́vel, isto é,
cada página possui pelo menos um link de saı́da.
Considere que um usuário, estando no site 1 tem igual probabilidade de acessar os
demais sites com os quais ele possui link de saı́da, ou seja xi o ı́ndice de importância
do site i, com xi ≥ 0 para qualquer página i.
Inicialmente poderiamos encontrar a importância do site 4, somando as importâncias
dos sites 1 e 2, ou seja, x4 = x1 + x2 . Entretanto, podemos observar que o site 1
possui link de saı́da para os sites 2,3 e 4.
Desse modo, a importância da página 1 deve ser dividida igualmente em três.
Da mesma forma, como a página 2 possui link de saı́da para as páginas 3 e 4 sua
importância deve ser dividida em duas partes iguais.
Portanto, x4 = 13 x1 + 12 x2 .
As importâncias dos demais sites seguem equações análogas. Dessa forma, obtemos
a seguinte matriz de transição.
100
0 0 1 1/2
1/3 0 0 0
P =
1/3 1/2 0 1/2
1/3 1/2 0 0
Observe que P não representa uma cadeia de Markov absorvente, e
1/2 3/4 0 1/2
2
0 0 1/3 1/6
P =
1/3 1/4 1/3 1/6
1/6 0 1/3 1/6
0, 3872645672 0, 3872851923 0, 3871504167 0, 3872007577
0, 1277596375 0, 1277831474 0, 1277928625 0, 1278153643
P 16 =
0, 28944822217 0, 28941951440 0, 28947241393 0, 28943110624
0, 19552757300 0, 19551214576 0, 19558430667 0, 19555277158
0, 3872216851 0, 3872216899 0, 3872216784 0, 3872216866
0, 12778315422 0, 12778315296 0, 12778315897 0, 12778315637
P 32 =
0, 2894482101 0, 2894482090 0, 2894482087 0, 2894482076
0, 19554695050 0, 19554694812 0, 19554695279 0, 19554694930
0, 3872216844 0, 3872216844 0, 3872216844 0, 3872216844
0, 12778315585 0, 12778315585 0, 12778315585 0, 12778315585
P 1024 =
0, 2894482090 0, 2894482090 0, 2894482090 0, 2894482090
0, 19554695062 0, 19554695062 0, 19554695062 0, 19554695062
101
Sabemos que P é uma matriz de transição de uma cadeia de Markov regular. Note
que as componentes dos vetores linhas de probabilidades da matriz P n para valores
de n suficientemente grandes tornam-se constantes, ou seja, essa cadeia de Markov
possui uma distribuição estacionária.
Dessa forma podemos concluir que a probabilidade de que um usuário acesse a
página 1 após 1024 entradas ou sáidas entre os links dessa rede é igual a 38,72%,
que é também a probabilidade de que se acesse o site 1 depois de 1024 cliques de
links saindo da página 2,3 ou 4. Portanto, a probabilidade de um usuário acessar a
página 1 após 1024 entradas ou saı́das entre esses links é 38,72%, enquanto que para
as páginas 2,3 e 4 as probabilidades são respectivamente 12,77%,28,94% e 19,55%,
isto é, o site 2 é o menos acessado nessa rede de links. Por outro lado, a página 1
é a mais popular, isto é, aquela que possui uma maior frequência de vizualições e
acessos.
Para análisar a convergência de uma cadeia de Markov regular para uma distribuição
estacionária de modo prático basta encontrar um autovetor da matriz de transição
P associado ao autovalor 1 e nesse caso temos:
Pw = w
0 0 1 1/2 w1 w1
1/3 0 0 0 w2 w2
=
1/3 1/2 0 1/2 w3 w3
1/3 1/2 0 0 w4 w4
102
Desse modo a equação anterior envolvendo autovetor e autovalor, pode ser conduzida
a um problema de sistema linear homogêneo dado por:
w1 − w3 − w24 = 0
w1
− w2 = 0
3
w1 w2 w4
3
+ 2
− w3 + 2
=0
w1 w2
− w4 = 0
3
+ 2
12 4 9 6
w1 = 31
w2 = 31
w3 = 31
w4 = 31
103
Portanto, o vetor de probabilidade
12
31
4
31
w=
9
31
6
31
104
1 1 1
2 4 4
P =
1 1 1
4 4 2
1 1 1
4 4 2
Pw = w
1 1 1
2 4 4
x x
1 1 1 y = y
4 4 2
1 1 1
4 4 2
z z
Portanto,
x
w = 43 x .
5
4
x
Entretanto devemos ter x1 = 13 , daı́ segue que
1
3
w=
1 .
4
5
12
105
6.3.3 Web não Fortemente Conectada
Na internet muitas páginas são criadas a todo momento e algumas dessas páginas
podem conter apenas um autolink, isto é, um único link para si mesmo. Essas
páginas trazem problemas para a aplicação do algoritmo PangRank, pois nesse caso,
a cadeia é absorvente e não regular. Sendo assim, o teorema da convergência não se
aplica. Para esses casos é possı́vel fazer uma modificação na matriz original de links
P substituindo-a, por uma matriz M , em que M é uma soma afim de P e A, tal que
M = (1 − m)P + mA
1
em que 0 < m < 1 e A = aij = n
∀i, j, sendo A uma matriz quadrada de ordem
n. O valor utilizado pelo Google é m = 0, 15. Observe que, quanto menor o valor
de m, mais peso se atribui a matriz original de links P e menos peso é atribuido
a matriz A. Nesse sentido, dizemos que a matriz A é uma matriz neutra, pois ela
distribui sua importância igualmente entre todos os links da web.
Exemplo 6.3.3.1. Considere uma processo em cadeia de Markov representado pela
seguinte matriz de transição
106
1
0 2
0 0 0 0 0
1 1
0 0 0 0 0
3 2
1
1 0 0 0 0 0
3
1
0 0 3
1 0 0 0
P =
1 1
0 2
0 0 0 3
0
1 1
0 0 3
0 2
0 0
1
0 0 0 0 0 3
1
M = (1 − m)P + mA
em que m = 0, 15 e
107
1 1 1 1 1 1 1
7 7 7 7 7 7 7
1 1 1 1 1 1 1
7 7 7 7 7 7 7
1 1 1 1 1 1 1
7 7 7 7 7 7 7
A=
1 1 1 1 1 1 1
7 7 7 7 7 7 7
1 1 1 1 1 1 1
7 7 7 7 7 7 7
1 1 1 1 1 1 1
7 7 7 7 7 7 7
1 1 1 1 1 1 1
7 7 7 7 7 7 7
Então temos:
M = (1 − 0, 15)P + 0, 15A
108
1
0 2
0 0 0 0 0
1 1 1 1 1 1 1
7 7 7 7 7 7 7
1 1
0 0 0 0 0
3 2
1 1 1 1 1 1 1
7 7 7 7 7 7 7
1
1 0 0 0 0 0
3
1 1 1 1 1 1 1
7 7 7 7 7 7 7
1
0 0 3
1 0 0 0
M = 0, 85 + 0, 15 1 1 1 1 1 1 1
7 7 7 7 7 7 7
1 1
0 2
0 0 0 3
0
1 1 1 1 1 1 1
7 7 7 7 7 7 7
1 1
0 0 3
0 2
0 0
1 1 1 1 1 1 1
7 7 7 7 7 7 7
1
0 0 0 0 0 3
1
1 1 1 1 1 1 1
7 7 7 7 7 7 7
1
Essa substituição distribui igualmente a probabilidade de 7
para um site qualquer
passar para outro site arbitrário.
0, 021 0, 446 0, 021 0, 021 0, 021 0, 021 0, 021
0, 021 0, 021 0, 304 0, 021 0, 446 0, 021 0, 021
0, 871 0, 021 0, 021 0, 021 0, 021 0, 304 0, 021
M =
0, 021 0, 021 0, 304 0, 871 0, 021 0, 021 0, 021
0, 021 0, 446 0, 021 0, 021 0, 021 0, 304 0, 021
0, 021 0, 021 0, 304 0, 021 0, 446 0, 021 0, 021
0, 021 0, 021 0, 021 0, 021 0, 021 0, 304 0, 871
109
Calculando a potência M 1000 temos:
0, 055 0, 055 0, 055 0, 055 0, 055 0, 055 0, 055
0, 080 0, 080 0, 080 0, 080 0, 080 0, 080 0, 080
0, 091 0, 091 0, 091 0, 091 0, 091 0, 091 0, 091
P 1000 =
0, 316 0, 316 0, 316 0, 316 0, 316 0, 316 0, 316
0, 078 0, 078 0, 078 0, 078 0, 078 0, 078 0, 078
0, 080 0, 080 0, 080 0, 080 0, 080 0, 080 0, 080
0, 295 0, 295 0, 295 0, 295 0, 295 0, 295 0, 295
110
Bibliografia
[1] KEMENY, G.J.; SNELL, L.J. Finite Markov Chains. New York: Springer -
Verlag, 1976.
[5] SÁ, C.C; ROCHA, J. Treze Viagens pelo Mundo da Matemática. Segunda
Edição. Rio de Janeiro: SBM, 2012.
[6] CRILLY, T. 50 cosas que hay que saber sobre Matemáticas. Quinta
Edição. Buenos Aires: Ariel, 2011.
[10] MELO, M.P. Ordenação das páginas do Google - Page Rank. 2009.
Dissertação. (Mestrado em Ciências) - Instituto de Matemática e Estatı́stica da
Universidade de São Paulo, São Paulo, 2009.
112