Tema IV Cadenas de Markov
Tema IV Cadenas de Markov
Tema IV Cadenas de Markov
Competencias Específicas:
Competencias Genéricas:
Las cadenas de Markov tienen la propiedad particular de que las probabilidades que
describen la forma en que el proceso evolucionara en el futuro dependen solo del estado
actual en que se encuentra el proceso y, por lo tanto, son independientes de los eventos que
ocurrieron en el pasado. Muchos procesos se ajustan a esta descripción, por lo que las
cadenas de Markov constituyen una clase de modelo probabilístico de gran importancia.
Procesos Estocásticos
Este tipo de procesos se conocen como procesos estocásticos de tiempo discreto con
espacio de estados finito.
Matriz de transición. Es una matriz cuadrada con elementos no negativos tales que la suma
de los elementos de cada renglón es uno.
Matriz estocástica. Es una matriz cuadrada en la que cada una de sus filas es un vector de
probabilidad.
Ejemplo de clima
El clima en el pueblo de Centerville puede cambiar con rapidez de un día a otro. Sin
embargo, las posibilidades de tener clima seco (sin lluvia) mañana es de alguna forma mayor
si hoy está seco, es decir, si no llueve. En particular, la probabilidad de que mañana este seco
es de 0.8 si hoy está seco, pero es de solo 0.6 si hoy llueve. Estas probabilidades no cambian
si se considera la información acerca del clima en los días anteriores a hoy.
La evolución del clima día tras día en Centerville es un proceso estocástico. Si se comienza
en algún día inicial (etiquetado como día 0), el clima se observa cada día t, para t = 0, 1, 2, . .
El estado del sistema en el día t puede ser
{ }
Ejemplo de inventarios
Suponga que , de manera que la semana 1 se inicia con tres camaras a mano.
* +
es un proceso estocástico donde la variable aleatoria representa el estado del sistema en
el tiempo t, a saber
Como propietario de la tienda, Dave desearía aprender más acerca de cómo evoluciona este
proceso estocástico a través del tiempo mientras se utilice la política de pedidos actual que
se describe a continuación
.
Al final de cada semana t (sabado en la noche), la tienda hace un pedido que le entregan en
el momento de abrir la tienda el lunes. La tienda usa la siguiente política para ordenar:
𝑚𝑎𝑥* − 𝐷𝑡+ + 𝑆 𝑋𝑡
𝑋𝑡+
𝑚 𝑥*𝑋𝑡 − 𝐷𝑡+ + 𝑆 𝑋𝑡 ≥
Para t = 0, 1, 2, . . .
Sea Xi una variable aleatoria que caracteriza el estado del sistema en puntos discretos en el
tiempo t = 1, 2… . La familia de variables aleatorias {Xi} forma un proceso estocástico con
una cantidad finita o infinita de estados.
* +
≥ ( )
( )
La matriz P define una cadena de Markov. Tiene la propiedad de que todas sus
probabilidades de transición son estacionarias e independientes a lo largo del tiempo.
1 5
Estado del sistema
2 ( 5 5)
el siguiente año
3
Las probabilidades de transición muestran que la condición de la tierra puede o deteriorarse
o permanecer como está pero nunca mejorar. Por ejemplo, si la condición de la tierra es
buena en este año (estado 1) hay 20% de que no cambie el año siguiente, 50% de
probabilidad de que sea regular (estado 2), y 30% de probabilidad de que se deteriorará a
una condición mala (estado 3). El jardinero modifica las probabilidades de transición P
utilizando un fertilizante orgánico. En este caso, la matriz de transición se vuelve:
1 2 3
1
2 ( )
3 5 55
( ) ( )
( ) ( ) ( ) ( )
( ) ( ) ( ) ( )
( ) ( )
1 2 3
1 33
2 ( )
3
5 55
La condición inicial de la tierra es buena, es decir a(0) = (1,0,0). Determine las probabilidades
absolutas de los tres estados del sistema después de 1,8 y 16 temporadas de siembra.
5 5 55
( ) ( 5 5 5 )
5 55 5 5
5 5 5
( ) ( 5 5 5 )
5 55 5 5 5
( )
( ) ( ) ( )
5 55
5 5 55
( ) ( )( ( )
5 5 5 ) 5 5 55
5 5
5 5 5
( ) ( ) ( ( )
5 5 5 ) 5 5 5
5 5 5
Las filas de P8 y el vector de probabilidades absolutas a(8) son casi idénticos. El resultado es
más evidente para P(16). Ello las probabilidades absolutas se vuelven independientes del a(0)
inicial. Las probabilidades resultantes se conocen como probabilidades de estado estable.
Ejemplo #3 Autobuses del sureste es una compañía de arrendamiento de autobuses que los
renta en 3 regiones: Norte, Central y Sur; de datos estadísticos se ha determinado que de los
autobuses que se rentan cada mes, en el norte 40% van a una región del norte, 20%
terminan en la región central y 40% van la región del sur. De manera similar la compañía ha
determinado que cada mes 50% de los autobuses que se rentan en la región central se
devuelven en la misma, 20% van a la región del norte y el 30% restante van a la región del
sur. Por último de los autobuses que se rentan en la región del sur, 35% van a la región del
norte, 50% van a la región central y 15% se devuelven en la región del sur. Determinar la
matriz de transición de un paso y de n pasos.
N C S
N
C ( )
S
( )( ) ( )
En la matriz de transición P2, se puede apreciar que un autobus que parte de la región norte,
al siguiente mes la probabilidad de estar en la región norte es de 0.34, en la región central
de 0.38 y en la región del sur de 0.28. De igual manera se obtiene las probabilidades para las
regiones central y sur. A continuación se calculan las matrices de transición de P3, P4 y de
P8, redondeando las probabilidades a 5 dígitos.
( )( ) ( )
( )( ) ( )
( )( )
( )
La matriz de transición de ocho pasos tiene la característica de que los tres renglones poseen
elementos idénticos, lo que significa que la probabilidad de que un autobús esté en un
estado en particular es independiente del estado en que estaba ocho pasos antes. A estas
probabilidades a las que se llegan después de n pasos, se les denomina probabilidades de
estado estable y en algunas ocasiones probabilidades en equilibrio o probabilidades a largo
plazo. En la siguiente sección se utilizará un procedimiento más directo para calcular estas
probabilidades.
( )
( ) ( ) ( ) ( + ) ( + ) ( + ) ( + )
( )( ) ( )
Esta expresión se puede utilizar para calcular las probabilidades para cada periodo, dado
una probabilidad inicial, por ejemplo si las probabilidades iniciales de cada una de las tres
regiones es de:
( 5 )
Calcular la probabilidad de que los autobuses se encontrarán en cada región después de un
periodo y después dos periodos.
Periodo 0 N C S Periodo 1
( )( ) ( )
Periodo 1 N C S Periodo 2
( )( ) ( )
( )( ) ( )
5
5 5
5
− 5
− 5 5
(− ⁄5 ⁄5 ⁄ | ) ( ⁄5 ⁄ | ⁄5 )
⁄5 − ⁄ ⁄ − ⁄ ⁄ − ⁄5
− ⁄ ⁄ 55⁄
⁄ || ⁄ || ⁄
⁄ ⁄ 5 ⁄
( )
( )
Los individuos que están en Movistar tienen una probabilidad de 30% de quedarse en la
misma operadora, una de 50% de cambiar a Tigo, y una de 20% para pasarse a Comcel.
Los individuos que están en Tigo tienen una probabilidad de 70% de quedarse en la misma
operadora, una de 10% de cambiarse a Movistar, y una de 20% para pasarse a Comcel.
Los individuos que están en Comcel tienen una probabilidad de 50% de quedarse en la
misma operadora, una de 30% de cambiar a Tigo , y una de 20% para pasarse a Movistar.
Solución
Matriz T M T C
M 0.3 0.5 0.2
T 0.1 0.7 0.2
C 0.2 0.3 0.5
Matriz de Transición
Y así sucesivamente
Entonces para conocer cuál sería la distribución de los clientes por operador en el periodo
uno, procedemos así:
5
( )( )
5
( )
Por lo tanto en el periodo siguiente Movistar tendrá en 20% de los clientes, tigo el 48% y
Comcel 32% restantes
Así mismo podemos proceder para los siguientes periodos, encontrando que
M T C
P0 0.3 0.3 0.4
P1 0.2 0.48 0.32
P2 0.172 0.532 0.296
P3 0.164 0.5472 0.2888
P4 0.16168 0.55168 0.28664
P5 0.161 0.553008 0.285992
P6 0.1607992 0.5534032 0.2857976
P7 0.1607396 0.55352112 0.28573928
P8 0.160721848 0.553556368 0.285721784
P9 0.160716548 0.553566917 0.285716535
P10 0.160714963 0.553570076 0.285714961
P11 0.160714489 0.553571023 0.285714488
P12 0.160714347 0.553571307 0.285714346
P13
P14
P15
P16
Como observamos a partir del periodo 9 los cambios en la distribución de los clientes es
mínima, por lo cual se asume que el valor del estado estable es [ 0.1607 0.5535 0.2857]
Tomando valores aproximados y de 4 dígitos.
Los estados de una cadena de Markov se clasifican con base en la probabilidad de transición
pij de P.
( )
Los estados 1 y 2 son transitorios porque no se puede volver a entrar a ellos una vez que el
sistema se queda “atrapado” en los estados 3 y 4. Un conjunto cerrado lo constituyen los
estados 3 y 4, que en cierta forma desempeñan el papel de un estado absorbente. Por
definición, todos los estados de un conjunto cerrado deben comunicarse, lo cual significa
que es posible ir de cualquier estado a cualquier otro estado del conjunto en una o más
( )
transiciones; es decir, para todas las ≥ . Observe que cada uno de los
estados 3 y 4 puede ser absorbente si p33 =p44.
Se dice que una cadena de Markov es ergódica si todos los estados son recurrentes y
aperiódica (no periódica). En este caso las probabilidades absolutas después de n
( )
transiciones, ( ) , siempre convergen de forma única a una distribución limitante
(estado estable) que es independiente de las probabilidades iniciales a(0).
( )
5 55
Para demostrar el cálculo del tiempo del primer paso a un estado específico desde todos los
demás, considere el paso de los estados 2 y 3, (regular y malo) al estado 1 (bueno).Por lo
tanto, j=1 y
( − ) − 5 5
( ) ( ) ( )
55 − 5
De modo que
5 5 5
( ) ( )( ) ( )
Por lo tanto, se requerirán 12.5 temporadas en promedio, para pasar la tierra regular a tierra
buena, y 13.34 temporadas para ir de la tierra mala a la tierra buena. Pueden realizarse
cálculos similares para obtener desde ( − ) ( − )
5
( 5 5)
( | )
La disposición requiere que todos los estados absorbentes ocupen la esquina sureste de la
nueva matriz. Por ejemplo, considere la siguiente matriz de transición:
1 2 3 4
1
2
( )
3 5
4
La matriz P puede reacomodarse y particionarse como
1 2 3 4
1
2 (5 | )
3
4
( ) ( ) ( )
5
Dada la definición de A y N y el vector columna unitario 1 (de todos los elementos1), se
puede demostrar que:
(a) Para una pieza que se inicia en la máquina 1, determine el promedio de visitas a cada
estado.
(b) Si un lote de 1000 unidades se inicia en la máquina I, determine el promedio de unidades
buenas completadas.
Para la cadena de Markov, el proceso tiene 6 estados: iniciar en 1(s1), inspeccionar después
de I (i1), iniciar en II (s2), inspección después de II (i2), desechar después de la inspección I o
II (J), y buena después de II (G). Los estados J y G son estados absorbentes. La matriz de
transiciones se da como
S1 i1 s2 i2 J G
S1
I1
S2 |
I2 |
J
G ( )
Por lo tanto,
S1 i1 s2 i2 J G
S1 5 5
I1
S2 ( ) ( )
I2
5 5
Obtenemos
− 5
( − ) (− − ) ( )
− 5
−
5
( − ) ( )( ) ( )
5
La fila superior de (I - N)-1 muestra que, en promedio, la máquina I es visitada 1.07 veces, la
inspección I es visitada 1.02 veces, la máquina II es visitada .98 veces, y la inspección II es
visitada .93 veces. La razón por la que el número de visitas en la máquina I y la inspección I
sea mayor que 1 son el retrabajo y la reinspección. Por otra parte, los valores
correspondientes para la máquina II son menores que 1 porque algunas piezas se desechan
antes de que lleguen a la máquina II. En realidad, en condiciones perfectas (ningunas piezas
se desechan o retrabajan), la matriz (I - N)-1 demostrará que cada estación es visitada
exactamente una vez (compruébelo asignando una probabilidad de transición de 1 a todos
los estados). Por supuesto, la permanencia en cada estado podría diferir. Por ejemplo, si los
tiempos de procesamiento en las máquinas I y II son de 20 y 30 minutos y si los tiempos de
inspección en I y II son de 5 y 7 minutos, entonces una pieza que inicia en la máquina 1 será
procesada (es decir, desechada o terminada) en (1.07 x 20) + (1.02 x 5) + (.98 x 30) + (.93 x 7)
= 62.41 minutos.
Para determinar la cantidad de piezas terminadas en un lote inicial de 1000 piezas, podemos
ver en la fila superior de (I - N)-1 A que
Esto significa que 1000 X .84 = 840 piezas serán terminadas en cada lote inicial de 1000.