09a Programacion Dinamica Probabilistica
09a Programacion Dinamica Probabilistica
09a Programacion Dinamica Probabilistica
INTRODUCCION
La Programación Dinámica Probabilística difiere de la Determinística en que los estados y los retornos o
retribuciones en cada etapa son probabilísticos.
Hamdy Taha
Un proceso de decisión de N etapas es probabilístico, si el rendimiento asociado con al menos una decisión
del proceso es aleatorio. Esta aleatoriedad generalmente se presenta en una de dos formas:
Los estados son determinados exclusivamente por las decisiones, pero los rendimientos
asociados con uno o más de los estados son inciertos.
Los rendimientos son determinados exclusivamente por los estados, pero los estados que se
presentan a partir de una o más de las decisiones son inciertos.
Richard Bronson
Debido a la estructura probabilística, la relación entre las funciones de costo o contribución entre las
etapas necesariamente es más complicada que en el caso determinístico.
1
c1 *
f n+1(1)
p1
Estado: sn Decisión xn p2 c2 2
*
PROBLEMA 1
Un proyecto de investigación sobre cierto problema de ingeniería tiene 3 equipos de investigadores que
buscan resolver el problema desde 3 puntos de vista diferentes. Se estima que en las circunstancias actuales la
probabilidad de que los equipos A, B, C fracasen es de: 0.40, 0.60 y 0.80 respectivamente. Así, la probabilidad
de que los 3 equipos fracasen es de: 0.40x0.6x0.8 = 0.192. (Un 19.2%). El objetivo es minimizar la probabilidad
de fracaso de los 3 equipos y por ello se asignarán al proyecto 2 nuevos científicos de alto nivel.
Según la asignación a los equipos, la probabilidad de fracaso cambia según lo indicado en la tabla siguiente.
Probabilidad de fracaso
# de científicos de los equipos
adicionales asignados A B C
0 0.40 0.60 0.80
1 0.20 0.40 0.50
2 0.15 0.20 0.30
¿Cómo deben asignarse los 2 nuevos científicos para minimizar la probabilidad de que los 3 equipos fracasen?
Solución:
Etapa 3 (Equipo C)
f3(s3,x3) = p3 Solución óptima
s3 x3 =0 x3 =1 x3 =2 f3*(s3) x3*
0 0.8 - - 0.8 0
1 - 0.5 - 0.5 1
2 - - 0.3 0.3 2
Etapa 2 (Equipo B)
f2(s2,x2) = p2 * f3(s2-x2) Solución óptima
s2
x2 =0 x2 =1 x2 =2 f2*(s2) x2*
0 (0.6)(0.8)=0.48 - - 0.48 0
1 (0.6)(0.5)=0.30 (0.4)(0.8)=0.32 - 0.30 0
2 (0.6)(0.3)=0.18 (0.4)(0.5)=0.20 (0.2)(0.8)=0.16 0.16 2
Etapa 1 (Equipo A)
f1(s1,x1) = p1 * f2(s1-x1) Solución óptima
s1
x1 =0 x1 =1 x1 =2 f1*(s1) x1*
2 (0.4)(0.16)=0.064 (0.2)(0.3)=0.06 (0.15)(0.48)=0.072 0.06 1
PROBLEMA 2
Solución:
Etapa 3
0 0 - - - 0 0
1 - 2 - - 2 1
2 - - 3.4 - 3.4 2
3 - - - 4.35 4.35 3
Etapa 2
f2(s2,x2)= i2(x2)+f3(s2-x2) Solución óptima
s2
x2 =0 x2 =1 x2 =2 x2 =3 f2*(s2) x2*
Etapa 1
f1(s1,x1)= i1(x1)+f2(s1-x1) Solución óptima
s1
x1 =0 x1 =1 x1 =2 x1 =3 f1*(s1) x*1
6 0+8.70=8.70 2+7.75=9.75 3.10+6.65=9.75 4.20+5.40=9.60 9.75 1 (no 2)
$9.75 es el ingreso esperado (en el cual se consideraron las probabilidades), para determinar la utilidad recuerde que la cantidad
de inversión es siempre $6.