Juegos Dinamicos Con Informacion Incompleta

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 7

Instituto Politécnico Nacional

Escuela Superior de Física y Matemáticas

4. Juegos Dinámicos con Información Incompleta

4.1 Definiciones Generales.

Los juegos dinámicos con información incompleta tienen las siguientes características:
 Los jugadores poseen información privada sobre preferencias y habilidades cuando
escogen sus estrategias.

La diferencia esencial con los juegos con información imperfecta es que la presencia
de asimetrías en la información se genera antes de haber seleccionado las estrategias.

 Un jugador tiene que tomar una decisión tras la acción realizada por alguno de sus
rivales.
En los capítulos anteriores se habla de equilibrios como el equilibrio de Nash para juegos
estáticos con información completa, el equilibrio de Nash perfecto para subjuegos en los
juegos dinámicos con información completa, y el equilibrio bayesiano de Nash en los juegos
estáticos con información incompleta; en este capítulo se introduce un nuevo equilibrio para
los juegos dinámicos con información incompleta: El equilibrio bayesiano perfecto.
Se define el equilibrio bayesiano perfecto como las estrategias y conjeturas que satisfacen
los siguientes requisitos1:

 Requisito 1:
En cada conjunto de información, el jugador que decide debe formarse una conjetura
sobre el nodo del conjunto de información al que se ha llegado en el juego. Para un
conjunto de información con más de un elemento, una conjetura es una distribución
de probabilidad sobre los nodos del conjunto de información; para un conjunto de
información con un único elemento, la conjetura del jugador asigna probabilidad
uno al único nodo de decisión.

 Requisito 2:
En cada conjunto de información, la acción tomada por el jugador al que le toca
tirar y su estrategia subsiguiente deben de ser óptimas, dada la conjetura del jugador
en ese conjunto de información y las subsiguientes estrategias de los demás
jugadores.

1
Gibbons, Robert.(1992) Un Primer Curso de Teoría de Juegos. Barcelona: Antoni Bosch, pg. 179,180,182.
Instituto Politécnico Nacional
Escuela Superior de Física y Matemáticas

 Requisito 3.
En conjuntos de información sobre la trayectoria de equilibrio, las conjeturas se
determinan de acuerdo con la regla de Bayes y las estrategias de equilibrio de los
jugadores.

Un conjunto de información está en la trayectoria de equilibrio si se alcanza con


probabilidad positiva cuando el juego se desarrolla según las estrategias de
equilibrio, y fuera de dicha trayectoria si es seguro que no se alcanza. Aquí
“equilibrio” puede significar equilibrio de Nash, perfecto en subjuegos, bayesiano o
bayesiano perfecto).

 Requisito 4:
En conjuntos de información fuera de la trayectoria de equilibrio, las conjeturas se
determinan según la regla de Bayes y las estrategias de los jugadores donde sea
posible.

Es preferible ver la aplicación de estos requisitos en un ejemplo, la aplicación más común de


los juegos dinámicos con información incompleta son los juegos de señalización.

4.2 Juegos de señalización

Los juegos de señalización consisten en dos jugadores: Un emisor (E) y un receptor (R). El
emisor, el cual conoce la información completa del juego, enviará un mensaje (o señal) al
receptor, este al observar el mensaje podrá escoger una acción; el receptor no conoce el tipo
de mensaje emitido.
El desarrollo del juego es:
1. El azar escoge un tipo t, del conjunto de tipos factibles T ={t1,…,tI}que asigna al
siguiente emisor según una distribución de probabilidad p(ti).
2. El emisor observa ti y elige un mensaje mj del conjunto de mensajes factibles M=
{m1,…, mj}.
3. El receptor observa el mensaje pero no el tipo, y elige a continuación una acción a k,
la cúal también debe de ser factible, se le llamará al conjunto factible de acciones
A={a1,…,ak}
4. Las ganancias son dadas por UE (ti,mj,ak) y UR(ti,mj,ak).
En la siguiente figura se muestra una representación en forma extensiva, donde:
T= {t1,t2}, M={m1,m2}, A={a1,a2} y Prob{t1}=p
Instituto Politécnico Nacional
Escuela Superior de Física y Matemáticas

Emisor
a1 a1
m1 t1 m2

a2
p
a2

Receptor Azar Receptor

a1 a1
1-p

m1 t2 m2
a2
a2
Emisor

Ejemplo: (Adaptación de un ejemplo de Morrow)


Tras ser demandado por negligencia, un profesional (J1) ofrece una cantidad q, que puede
ser mil o cinco mil euros, al demandante (J2) para que éste retire la demanda, y el
demandante acepta retirarla o no lo acepta, en cuyo caso se celebra el juicio. La
probabilidad a priori de que haya habido negligencia, que es de dominio público, es ½,
pero el demandante sí sabe si ha sido negligente. Si se celebra el juicio, se sabrá a verdad,
aunque resultará costoso (un coste de dos mil euros para cada uno, y una indemnización
de I = 5 000 euros, que el demandado habrá de pagar al demandante si resulta culpable).

En donde:
N= Negligente A= Acepto
D= Diligente NA= No Acepto
Instituto Politécnico Nacional
Escuela Superior de Física y Matemáticas

El emisor es J1, al cual le pertenecen los tipos N y D, los mensajes que puede emitir están
denotados por q=1 y q=5. El receptor, J2, tiene dos acciones a decidir: A (Aceptar) y NA (No
Aceptar).
Se denota h3 y h4 a los conjuntos de información de J2 que siguen a los mensajes q=1 y q=5.
Requisito 1 de señalización:
Una vez emitido el mensaje mj de M, el receptor debe hacer una conjetura sobre los tipos
que podrían haber enviado mj, esta conjetura tiene una distribución de probabilidad
denotada por µ(ti|mj), donde µ(ti|mj) ≥ 0 para cada ti en T y
∑ µ(𝑡𝑖 |𝑚𝑗 ) = 1
𝑡𝑖 ∈𝑇
Requisito 2 de señalización:
Receptor: Para cada mj en M, la acción (a*(mj)) del receptor debe maximizar la utilidad
esperada del receptor dada la conjetura µ(ti|mj) sobre qué tipos podrían haber enviado mj.

Emisor: Para cada ti en T, el mensaje (m*(ti)) del emisor debe maximizar la utilidad del
emisor dada la estrategia del receptor (a*(mj)).

 Para (mensaje) q=1, sin importar los tipos:

La acción óptima de J2 sería Aceptar, ya que el pago esperado es con seguridad 1.

1 1
1( ) + 1( ) = 1
2 2

Si se analiza el caso de No aceptar se tiene que el pago esperado sería:

1 1 𝐼 1
(𝐼 − 2) ( ) + (−2) ( ) = − 2 =
2 2 2 2

Además q=1 es la respuesta óptima de J1 no importando cual estrategia escoja J2


que responda al mensaje q=1 con A.

Pagos esperados con A:

1 1
(−1) ( ) + (−1) ( ) = −1
2 2

Pagos esperados con NA:


Instituto Politécnico Nacional
Escuela Superior de Física y Matemáticas

1 1 𝐼 9
(−𝐼 − 2) ( ) + (−2) ( ) = − − 2 = −
2 2 2 2

Entonces las estrategias óptimas serán por parte del emisor sin importar los tipos (sea
negligente o no) escoger q=1 y por parte del receptor será Aceptar sin importar cuál
sea el mensaje recibido, esto es, µ(1|A).

Se cumplen los Requisitos 1 y 2.

 Para (mensaje) q=5, sin importar los tipos:

La acción óptima para J2 también sería Aceptar.

Se dice que un conjunto de información está dentro de la trayectoria de equilibrio


cuando dicho conjunto es correspondiente al mensaje de la estrategia óptima del emisor.
Para los mensajes en la trayectoria de equilibrio se aplica el requisito 3.

Requisito 3 de señalización:
La conjetura del receptor en el conjunto de información correspondiente a mj debe
derivarse de la regla de Bayes y la estrategia del emisor:

𝑝(𝑡𝑖 )
µ(𝑡𝑖 |𝑚𝑗 ) =
∑𝑡𝑖 ∈𝑇𝑖 𝑝(𝑡𝑖 )

Una vez que se tienen las estrategias a*(mj), m*(ti) y una conjetura µ(ti|mj) que satisfacen
los requisitos 1, 2 y 3 anteriores; se ha encontrado un equilibrio bayesiano perfecto.

La conjetura µ(1|A) cumple con el requisito 3 ya que:


0.5 1
µ(1|A) = 0.5+0.5 = 2

Entonces se encuentra un equilibrio agrupador con estrategias puras, esto es porque sea el
tipo que sea J1 decide q =1.
Nótese que q=5 está fuera de la trayectoria de equilibrio.
 Analizando los casos en que J1 decidiera q=1 cuando su tipo es Diligente y q=5
cuando su tipo es Negligente.

Si vemos los cálculos anteriores sabemos que la respuesta óptima de J2 será Aceptar
sin importar la oferta.
Instituto Politécnico Nacional
Escuela Superior de Física y Matemáticas

Pero si se analizan los pagos esperados para J1 con la acción de J2 Aceptar:

o Diligente con mensaje q=1, el pago es de -1.


o Negligente con mensaje q=1, el pago es de -1.
o Diligente con mensaje q=5, el pago es de -5
o Negligente con mensaje q= 5, el pago es de -5.

Se puede notar que la respuesta q=1 cuando su tipo es Diligente y q=5 cuando su tipo
es Negligente no es la óptima ya que se obtiene un pago de -1 con q=1 cuando el tipo
es Negligente, en vez de -5.

 Analizando los casos cuando J1 emita q=1 para el tipo Negligente y q=5 para el tipo
Diligente.
Los pagos esperados para J2 son A= 1 y NA= 3 para q=1 con tipo Negligente, por
lo tanto la respuesta óptima del J2 es NA.
Los pagos esperados para J2 son A=5 y NA= -2 para q=5 con tipo Diligente, por
lo tanto la respuesta óptima del J2 es A.
Pero como en el caso anterior la decisión óptima para J1 cuando el tipo es
Diligente es q=1.
Así se puede concluir que no existe equilibrio con estrategias puras de separación.
Los juegos de señalización tienen distintas aplicaciones, algunas de ellas son las siguientes:
 Modelo de Akerlof para el mercado de los coches usados.
 Modelo de Spence sobre un trabajador el cual da señales de su capacidad mediante
su nivel de estudios.
 Modelo de Rothschild y Stiglitz, un asegurado da señales de su alto grado de aversión
al riesgo mediante la aceptación de un aseguramiento parcial.
 Modelo de Milgrom y Roberts, en el que una empresa capaz de producir a bajo coste
da señales de esta capacidad vendiendo a un bajo precio.
 Modelo de Sobel, un demandante en un caso con buenas posibilidades ante los
tribunales da señales de dichas posibilidades exigiendo una alta indemnización para
retirar la demanda.

4.3 Refinamiento del equilibrio bayesiano perfecto.

El refinamiento del equilibrio bayesiano incluye en su análisis dos nuevos requisitos.


En un equilibrio bayesiano perfecto se impide que el jugador i juegue una estrategia
estrictamente dominada a partir de algún conjunto de información, por esto no es razonable
que el jugador j crea que i utilizará esa estrategia.
Instituto Politécnico Nacional
Escuela Superior de Física y Matemáticas

Requisito 5
Si el conjunto de información que sigue a mj está fuera de la trayectoria de equilibrio y mj
está dominado para el tipo ti, entonces la conjetura del receptor debería asignar probabilidad
0 al tipo ti.

Requisito 6
Si el conjunto de información que sigue a mj está fuera de la trayectoria de equilibrio y mj
está dominado en equilibrio para el tipo ti, entonces la conjetura del receptor debería asignar
probabilidad 0 al tipo ti.
Estos requisitos se pueden ver de manera clara en el juego de “Cerveza y Quiche”, se llega
a la conclusión de que el receptor debe preguntarse si el comportamiento pasado del emisor
fue racional o no al emitir la señal, eso es una especie de inducción hacia delante.

También podría gustarte