09a - Programacion Dinamica Probabilistica
09a - Programacion Dinamica Probabilistica
09a - Programacion Dinamica Probabilistica
PDP
DEFINICIONES
LOGRO DE LA SESION:
Al trmino de la sesin el estudiante
resuelve problemas de programacin PROBLEMA 1
dinmica haciendo uso del clculo recursivo
incluyendo probabilidades, minimizando el
proceso de clculo al considerar solamente
los estados y las decisiones necesarias en PROBLEMA 2
cada etapa en que se divide el problema,
alcanzando la solucin ptima.
PROGRAMACION DINAMICA PROBABILISTICA
DEFINICIONES
Autores
La Programacin Dinmica Probabilstica difiere de la
Hillier-Lieberman Determinstica en que el estado de la siguiente etapa
no est determinado por completo por el estado y la
Hamdy Taha poltica de decisin de la etapa actual. En su lugar
existe una distribucin de probabilidad para determinar
cul ser el siguiente estado. Sin embargo, esta
Richard Bronson distribucin de probabilidad si queda bien determinada
por el estado y la decisin de la etapa actual.
PROGRAMACION DINAMICA PROBABILISTICA
DEFINICIONES
Autores
La Programacin Dinmica Probabilstica difiere de la
Hillier-Lieberman Determinstica en que los estados y los retornos o
retribuciones en cada etapa son probabilsticos.
Hamdy Taha
Richard Bronson
PROGRAMACION DINAMICA PROBABILISTICA
DEFINICIONES
Autores
Un proceso de decisin de N etapas es probabilstico,
Hillier-Lieberman si el rendimiento asociado con al menos una decisin
del proceso es aleatorio. Esta aleatoriedad
Hamdy Taha generalmente se presenta en una de dos formas:
ESTRUCTURA BASICA DE LA
PROGRAMACION DINAMICA DETERMINISTICA
Etapa Etapa
n n+1
C1
Estado: Sn Xn Sn+1
fn(sn,xn) f *n+1(sn+1)
PROGRAMACION DINAMICA PROBABILISTICA
ESTRUCTURA BASICA DE LA
PROGRAMACION DINAMICA PROBABILISTICA
Etapa
n+1
C1 1 f *n+1 (1)
Etapa
n p1
C2
Estado: Sn Xn p2 2 f *n+1 (2)
pm
fn(sn,xn)
Cm
PDP
DEFINICIONES
PROBLEMA 1
PROBLEMA 2
PROGRAMACION DINAMICA PROBABILISTICA
Segn la asignacin a los equipos, la probabilidad de fracaso cambia segn lo indicado en la tabla siguiente:
Solucin
Etapa 3 (Equipo C)
f3(s3,x3) = p3 Solucin ptima
s3
x3 =0 x3 =1 x3 =2 f3*(s3) x 3*
0 0.8 - - 0.8 0
1 - 0.5 - 0.5 1
2 - - 0.3 0.3 2
PROGRAMACION DINAMICA PROBABILISTICA
Etapa 3 (Equipo C)
f3(s3,x3) = p3 Solucin ptima
s3
x3 =0 x3 =1 x3 =2 f3*(s3) x 3*
0 0.8 - - 0.8 0
1 - 0.5 - 0.5 1
2 - - 0.3 0.3 2
Etapa 2 (Equipo B)
f2(s2,x2) = p2 * f3(s2-x2) Solucin ptima
s2
x2 =0 x2 =1 x2 =2 f2*(s2) x 2*
0 (0.6)(0.8)=0.48 - - 0.48 0
1 (0.6)(0.5)=0.30 (0.4)(0.8)=0.32 - 0.30 0
2 (0.6)(0.3)=0.18 (0.4)(0.5)=0.20 (0.2)(0.8)=0.16 0.16 2
PROGRAMACION DINAMICA PROBABILISTICA
Etapa 2 (Equipo B)
f2(s2,x2) = p2 * f3(s2-x2) Solucin ptima
s2
x2 =0 x2 =1 x2 =2 f2*(s2) x 2*
0 (0.6)(0.8)=0.48 - - 0.48 0
1 (0.6)(0.5)=0.30 (0.4)(0.8)=0.32 - 0.30 0
2 (0.6)(0.3)=0.18 (0.4)(0.5)=0.20 (0.2)(0.8)=0.16 0.16 2
Etapa 1 (Equipo A)
f1(s1,x1) = p1 * f2(s1-x1) Solucin ptima
s1
x1 =0 x1 =1 x1 =2 f1*(s1) x1 *
2 (0.4)(0.16)=0.064 (0.2)(0.3)=0.06 (0.15)(0.48)=0.072 0.06 1
PDP
DEFINICIONES
PROBLEMA 1
PROBLEMA 2
PROGRAMACION DINAMICA PROBABILISTICA
Solucin
Etapas: Clientes
Estados: Galones de leche disponibles
Decisin: Cuntos galones enviar a cada cliente?
Variables:
xn = Galones enviados al cliente n (no necesariamente el cliente coger todos)
dn = Demanda del cliente n ( galones comprados por el cliente)
in(xn)=2dn + 0.5(xn-dn)
Etapa 3
f 3(s 3,x 3)= i 3(x 3) Solucin ptima
s3
x 3 =0 x 3 =1 x 3 =2 x 3 =3 f 3*(s 3) x 3*
0 0 - - - 0 0
1 - 2 - - 2 1
2 - - 3.4 - 3.4 2
3 - - - 4.35 4.35 3
Etapa 2
f 2(s 2,x 2)= i 2(x 2)+f 3(s 2-x 2) Solucin ptima
s2
x 2 =0 x 2 =1 x 2 =2 x 2 =3 f 2*(s 2) x 2*
3 0+4.35=4.35 2+3.4=5.40 3.25+2-=5.25 4.35 5.40 1
4 - 2+4.35=6.35 3.25+3.4=6.65 4.35+2=6.35 6.65 2
5 - - 3.25+4.35=7.60 4.35+3.4=7.75 7.75 3
6 - - - 4.35+4.35=8.70 8.70 3
PROGRAMACION DINAMICA PROBABILISTICA
Etapa 2
f 2(s 2,x 2)= i 2(x 2)+f 3(s 2-x 2) Solucin ptima
s2
x 2 =0 x 2 =1 x 2 =2 x 2 =3 f 2*(s 2) x 2*
3 0+4.35=4.35 2+3.4=5.40 3.25+2-=5.25 4.35 5.40 1
4 - 2+4.35=6.35 3.25+3.4=6.65 4.35+2=6.35 6.65 2
5 - - 3.25+4.35=7.60 4.35+3.4=7.75 7.75 3
6 - - - 4.35+4.35=8.70 8.70 3
Etapa 1
f 1(s 1,x 1)= i 1(x 1)+f 2(s 1-x 1) Solucin ptima
s1
x 1 =0 x 1 =1 x 1 =2 x 1 =3 f 1*(s 1) x 1*
6 0+8.70=8.70 2+7.75=9.75 3.10+6.65=9.75 4.20+5.40=9.60 9.75 1 (no 2)
PDP
DEFINICIONES
PROBLEMA 1
PROBLEMA 2