Gibbons - Un Primer Curso de Teoría de Los Juegos Cap2
Gibbons - Un Primer Curso de Teoría de Los Juegos Cap2
Gibbons - Un Primer Curso de Teoría de Los Juegos Cap2
56 / JUEGOS DINÁMICOS CON INFORMACiÓN COMPLETA (c. 2) Juegos dinámicos con información completa y perfecta / 57
siguiente y (3) las ganancias de los jugadores para cada combinación po- en subjuegos: un equilibrio de Nash es perfecto en subjuegos si ignora
sible de jugadas son información del dominio público. las amenazas que no son creíbles en un sentido que definiremos con más
Resolvemos un juego por inducción hacia atrás de la siguiente forma: precisión. Veremos que pueden existir múltiples equilibrios de Nash en
cuando al jugador 2 le corresponda decidir en la segunda etapa del juego, un juego de la clase definida por (1)-(3)" pero que el único equilibrio de
se enfrentará al siguiente problema, dada la acción al previamente adop- Nash perfecto en subjuegos es el equilibrio asociado con el resultado ob-
tada por el jugador 1: tenido por inducción hacia atrás. Éste es un ejemplo de la observación,
hecha en la sección 1.1.C, de que algunos juegos tienen múltiplesequili"
max 'u2(á.l,az). brios de Nash pero tienen un equilibrio que destaca como la soluciónmás
azEAz
llamativa del juego.
Supongamos que para cada ajen Al, el problema de optimización del Concluirnos esta sección explorando los supuestos de racionalidad
jugador 2 tiene una única solución que podemos denotar con Rz(al)' Ésta inherentes en los argumentos de inducción hacia atrás. Considere~os
es la reacción (o mejor respuesta) a la acción del jugador 1. Dado que para ello elsiguiente juego de tres etapas en el que el jugador 1 decide dos
el jugador 1 puede resolver el problema de maximización del jugador 2 veces:
tanto como el propio jugador 2, el jugador 1 debería prever la reacción del
jugador 2 a cada acción al que 1 pudiera tomar, de forma que el"problema
1. El jugador 1 escoge J o D donde J finaliza el juego con ganancias de 2
de 1 en la primera etapa se concreta en
para el jugador 1 y Opara el jugador 2. c.
2. El jugador 2 observa la elección de 1. Si 1 escoge D entonces 2 escoge
max 'Ul (al,Rz(al»).
alEA] J' o D', donde l' finaliza el juego con ganancias de 1 para ambos
Supongamos que este problema de optimización del jugador 1 tiene jugadores.
también una solución úlúca que podemos denominar aj. Llamaremos 3. El jugador 1 observa la elección de 2(y recuerda su propia decis~~t:J:
~
a (aj,Rz(aj» el resultado por inducción hacia atrás de este juego. El resultado la primera etapa). Si las deCisiones anteriores fueroniJ,y, pi enton2es
por inducción hacia atrás ignora las amenazas no creíbles: el jugador 1 1 escoge J" o D" finalizando ambas el juego, J" c0rtganane5.asde 3
prevé que el jugador 2 responderá óptimamente a cualquier acción que 1 para el jugador 1 y Opara el jugador 2 y D" con ganancias ,de O Y: 2
pueda escoger jugando Rz(al); el jugador 1 ignora las amenazas por parte respectiv~mente.,; ,
del jugador 2 que no favorezcan a 2 cuando el juego llegue a su segunda ,_.; _~ : . ..;,.:_a..;.:.:_:.:.:.l._.~:.,~. ;--:~.:.'~..<S- .., .: l:..:'::.~~¿'
etapa. Esta descripción verbal puede trélducirse al siguiente,juego en fempª.dg
Recordemos que en el capítulo 1 usamos la representación en forma árbol. (Ésta es la representación en forma extensiva que definiremos. de
. normal para estudiar juegos estáticos con información completa y hos forma más general en la sección 2.4.) La ganancia superior en el par .
concentramos en la noción del equilibrio de Nash como concepto para so- de ganancias que aparecen en el extremo de cada rama del árbol es la
lucionar tales juegos. Sin embargo, en la discusión sobre juegos dinámicos ganancia del jugador 1; la inferior es la del jugador 2, ~;,'
de esta sección no hemos hecho mención alguna ni de la representación Para calcular el resultado por inducc:ión hacia atrás de este' juego
en forma normal ni del equilibrio de Nash. Al contrario, hemos dado una empezamos por la tercera etapa (es dear,la segunda decisión deLjugador
descripción verbal de un juego en (1)-(3) y hemos definido el resultado 1). Aquí el jugador 1 se enfrenta a una elección entre una ,ganancia de.3
por inducción hacia atrás como solución del juego. En la sección 2.4.A por medio de 1" o una ganancia de Oa trayés de 'J)"; de forma que!" ~
veremos que la descripción verbal en (1)-(3) es la representación en forma óptimo. Por tanto, en la segunda etapa, el jugador2 prevé que si él júego (,
...
,
extensiva del juego. En esta sección estableceremos la relación entre las llega a su te;cera etapa el jugador 1 escogerá J", lo que le proporcionaría
representaciones en forma extensiva y normal, y veremos que para juegos una ganancia de O.Por tanto,~n la ¡¡egunda etapala decisión del jugador 2
dinámicos la representación en forma extensiva es a menudo más con- es entre una ganancia de 1 por medio dé l' o una ganancia de Oa través de
veniente. En la sección 2.4.B definiremos el equilibrio perfecto de Nash D', de forma que l' es óptimo. Consecuentemente, eh la primera etapa el
58 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2)
Juegos dil1tÍmicos COI1 il1formacióll completa y perfecta / 59
Este argumento establece que el resultado por inducción hacia atrás Stackelberg (1934) pr!Jpuso un modelo dinámico de duopolio en el cu~l
es que el jugador 1escoge I en la primera etapa y séacaba el'juegb: Aun unae'mpresa dominante (o líder) decide primero y una empresa subordI-
cuando el uso de la inducción hacia atrás establece que el juego sé acaba nada (o seguidora) decide en segundo lugar. En al~nosmome~üos de
en la primera etapa, UIlaparte importante del'afgUiriento ftáhl dé 10 que la historia de la industria automovilística estadourudense: por ~Jel1lplo,
ocurriría si el juego no se acabase en esta primera etapa. En la segunda General Motors parece haber jugado este papel de líder. Es mmedlat.o am-
etapa, por ejemplo, cuando el jugador 2 prevé que si el juego llega a la pliar esta des~ripción al caso en que haya más de una empresa segUidora,
terc;era etapa el jugador 1 elegirá I"¡ 2 está suponiendo que 1es racional. como Ford~ Chrysler y otras. Siguiendo a Stackelberg, de~arrollarelJlos el
Este supuesto puede parecer inconsistente coil el hecho de qué 2 tiene modelo bajo el supuesto de que las empresas escogen cantidades, como en
,.'0
la oportunidad de decidir en la segunda etapa sólo si 1 se desVÍa del el modelo de Coumot (donde las empresas deciden simultáneamente en
resultado obtenido por inducción hacia atrás. Es decir, puede parecer que . ente como aqUlO. DeJ'amos como ejercicio el desarrollo
veZ d e suceSlvam ,
si 1juega D en la primera etapa, 2 no puede suponer en la segunda etapa de un modelo de tomas de decisiones sucesivas en el que las empresas
que 1 sea racional, pero 'esto no es, así: si 1 juega D, en la primera etapa . s tal como
escogen 1os preclO " lo hacen (simultáneamente)
' ' . en el modelo ele
está claro que no puede ser información del dominio público que los dos
Bertrartd. ,
jugadores sean racionales; pero existen razones para que 1escogietaD El desarrollo temporal del juego es el sig'uiente: (1) La empresa 1
que no contradicen el supuesto de2 de que 1esracionaL3 Una posibilidad
1 a d ql >
escoge una can t'd _ O., (2) la empresa 2 observa ,11 .y escoge entonces
.
es que sea información del dominio público que el jugador 1 es racional una cantidad q2 ? O; (3) las ganancias de la empresa ~Vlenen dadas pOI la
cantidad agregada es Q ==qI + q2, j e es el coste marginal constante de Recordemos que en el equilibrio de Nash del juego de Cournot del
producción (siendo cero los costes fijos). capítulo 1, cada empresa produce (a-"'e)/3. Por tanto, la cantidad agregada
Para hallar el resultado por inducción hacia atrás de este juego, calcu- obtenida por inducción hacia atrás en el juego de Stackelberg, 3(a - e)/4,
lamos en primer lugar la reacción de la empresa 2 a una cantidad arbitra- es mayor que la cantidad agregada en el equilibrio de Nash del juego de
riamente fijada por la empresa 1. R2(ql) es una solución de Cournot, 2(a - c)/3, de forma que, el precio de equilibrio de me;cado es
inferior en el juego de Stackelberg. Sin embargo, en el juego de Stackelberg
maX7r2(ql,q2)==maxq2[a - ql - q2 - el, la empresa 1 podía haber escogido la cantidad correspondiente al juego
Q22:0 qz 2:0
de Coumot, (a - e)/3, en cuyo caso la empresa 2 habría respondido con su
lo que resulta en
cantidad de Coumot. Por tanto, en el juego de Stackelberg, la empresa 1
a-ql-e podría haber alcanzado el nivel de beneficios de Coumot, pero escogió no
R2(ql) ==" 2 ' hacerlo, por lo que los beneficios de la empre~a 1 en el juego de Stackelberg
siempre, queql < a-e .. La misma' ecuación pár_aR2(ql) apareCiÓ en deben'ser mayores que sus beneficios en el juego de Cournot. Pero el
nuestro aniilisisdél' juego de Coumot con' qecisiones sinlultáneas en la precio de equilibrio es inferior e:';lel juego de Stackelberg, de forma que ros
sección D.A. La diferencia' es que aquí R2(iJ.~)e~~eal~e~:lte la reacción beneficios agregados son menores. Por tanto, el hecho de que la empresa
por parte de la~mpresa 2:á la cailtidadobservad~ que fijala empresa i, 1 esté mejor implica que la empresa 2 está peor en el juego de Stackelberg
mientras que en el análisis de Coumot R2(qI) es la mejor respuestacle h:i queen el jueg() de Coumot.
empresa 2 a una cantidad hipotética que'será sil!lultáneamenteescogida La observación de que la empresa 2 se encuentra en peor situación en ..
' ,"
por la empresa 1. '." el juego de Stackelberg que en el juego de Coumot ilustra una diferencia
Dado q:r,e}a empresa l. p~ede resolver el p~?b~~made la. empresa importante que existe entre los. problemas de decisión uni cimultiperL
2 tantoc0fi.lo,.l.a,propia e~p¡'~~a 2, I~, e0presá 1debería prever q~e ia sonale~:. En la teoría de la decisión con un único agente, eltenermás .
elección:'del~éantidad ql coinCidirá co"nla reaéciónR2(ql)' Por tanto, el información nunca puede hacer que el agente decisor esté peor. En teorÍa
problema d~ laen:,.pr~sa 1 en la primera etapa del juego se concreta en de juegos, sin embargo, tener más información (o más precisamente, que ".
otros jugadores sepan que uno tiene más información) puede hacer que un
"maX7fl (ql,R2(ql») ==maxqIfa - ql - R2(qi) -:- el jugador esté peor. '
'_Q¡2:0, ,.' ,.' Ql2:0 • . . '. .
.. a- ql.""'"C Eil el juego de Stackelberg, la información en cuestión es la cantidad
==maxql '2 . ,.
de la empresa 1: la empresa 2 conoce ql y (tan importante como' estb)
Q¡2:0 .
lo que resulta' en la empresa 1 sabe que la empresa 2 conoce ºl' Para ver el efecto que'
esta información tiene, consideremos un,juego de decisión suc~siva algo
a-c a-c distinto, en el que la empresa 1 escoge qr, después de lo cual la empresa
qi == -. -2- Y R2(qi) ==-4-
2 escoge q2, pero lo hace sin haber observado. 111. Si la empresa 2 cree
que es el resultado por inducción hacia atrás del juego del duopolio de que la empresa 1 ha escogido su cantidad de Stackelberg qi ==(a - e)/2, la
Stackelberg.4 '.. '. mejor respuesta para la empresa 2 es de nuevo R2(qi) ==,(a-e)/4. Pero si la
empresa 1 prevé que la empresa 2 creerá que ello vaya a ser así y, por tanto,
4 De la misma forma que el "equilibrio de Cournot" y el "equilibrio de Bertrand" se
refieren típicamente al equilibrio de Nash de los juegos de Cournot y Bertrand, la mención escoja esta cantidad, la empresa 1 prefiere escoger su mejor respuesta a
del "equilibrio de Stackelberg" significa a menudo que el juego es de decisiones sucesivas en (a - e)/4 (es decir, 3(a - c)/8) en lugar de su cantidad de Stackelberg
vez de ~u:nultáneas. Sin embargo, como se ha constatado en la secciÓ'nanterior, los juegos (a - c)/2. Por todo ello, la empresa 2 no debe confiar en que la empresa 1
con deaslones sucesivas poseen a menudo múltiples equilibrios de Nash, de los cuales sólo
uno está asociado can el resultado obtenido por inducción hacia atrás del juego, Por tanto, el
escoja su cantidad de Stackelberg. Más bien, el único equilibrio de Nash de
"equi1ib~o de Stackelherg" puede referirse tanto a la naturaleza secuencial del juego como al este juego secuencial es que ambas empresas escojan la cantidad (a - e)/3,
uso de unrnterio de solución más poderoso que el mero equilibrio de Nash. precisamente el equilibrio de Nash del juego de Cournot, en el que las dos
62 I JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2)
Juegos dinámicos con infonlwción completa y perfecta / 1\3
empresas deciden simu1táneamente.5 Por lo tanto, que la empresa 1 sepa cuya condición de primer orden es
que la empresa 2 conoce q¡ va en contra' de la empresa 2.
R'(L) - w = O.
2.1.C Salarios y nivel de empleo en una empresa con fuerte
implantación sindical / Pendiente = w
R
En el modelo de Leontief, (1946) de relación entre una empresa y un
único sindicato (es decir, un sindicato que tiene el poder de monopolio de R(L)
ofrecer la fuerza de trabajo a la empresa), el sindicato tiene poder exclusi vo
sobre los salarios, pero la empresa tiene el ¿Ónrrolexclusivo del nivel de
empleo. (Conclusiones cualitativamente similares emergen en un modelo
más realista en el cual la empresa y el sindicato negocian los salarios,
pero la empresa retiene el poder exclusivo sobre el nivel de empleo.) La
función de utilidad del sindicato es U(7JJ,L), donde w es el salario que el
sindicato pide a la empresa y L es el nivel de empleo. Supongamos que
U(w,L) es creciente en los dos argumentos w y L. La función de beneficios
L * (w) L
de la empresa eS7r(w,L) = R(L) :- wL, donde R(L) son los ingresos que
la empresa obtiene si emplea L trabajadores (y toma de forma óptima las
correspondientes decisiones de producción y de estrategia de mercado). Figura 2.1.1
Supongamos que R(L) es creciente y cóncava;
Supongamos que el desarrollo telT\pora1del juego es: (1) el sindicato Para garantizar que la condición de primer orden R'(L) -w =. O ~enga
efectúa una demanda salarial, w; (2) la empresa observ.a (y acepta) lJ) yes- solución, suponemos que R'(O) = 00 y que R'(oo) = O,tal como tndlCa la
coge entonces el nivel de empleo, L;.(3) las ganancias son U(w,L) Y7r(w,L). figura 2.1.1.
Podemos decir bastantes cosas sobre el resultado por inducción hacia atrás La figura 2.1.2 representa L * (w) en función de tu (pero ~tiliza l~s e!es
de este juego, aun sin haber supuesto ninguna forma funcional concreta de forma que faciliten la comparación con gráficos postenores) e lnchca
de U(w,L) y R(L), pero no podemos calcular el resultado explícitamente. que L*(w) corta cada una de las curvas de isobeneficio de la e~1presa
. En primer lugar caracterizamos la mejor respuesta de la empresa en la en su punto máximo.6 Manteniendo L constante, ~a empr~s~ ~sta t.anto
etapa (2), L*(w), a una demanda salarial arbitraria por parte del sindicato mejor cuanto menor sea w, de forma que las curvas :sobenefIClo ¡Dfenores
en la etapa (1), w. Dado w, la empresa escoge el nivel L*(w) que soluciona representan niveles de beneficio más altos. La fi.gura 2.1.3 representa
las curvas de indiferencia del sindicato. Mantemendo L constante, el
sindicato está tanto mejor cuanto más alto sea w, de forma que las curvas
max7r(w,L) =maxR(L) - wL, de indiferencia más altas corresponden a niveles de utilidad mayores del
L2:0 L2:0
sindicato.
6 Esta última propiedad es simplemente otra manera~e decir que L *('UJ) maximiza 7f( ["w)
5 Esto es un ejemplo de la afirmación hecha en la sección 1.1.A:en';,n Juego en forma normal dado 'UJ. Si el sindicato pide 'UJ', por ejemplo, la elecoon de L por larte d~ l~ empresa se
los jugadores escogen sus estrategias simultáneamente, pero ello no implica necesariamente' concreta en la elección de un punto en la recta hOrizontal w = 'UJ. El maxnno nivel de
que actúen simultáneamente; es suficiente con que cada uno tome su decisión sin conocer las beneficio posible se alcanza escogiendo L de forma que la curva de isobeneficio que posa por
decisiones de los demás. Véase la sección 2.4.A para más discusión sobre esta cuestión. (L,u/) sea tangente a la restricción 'UJ = 1J)'.
64 / JUEGOS DfNAMICOS CON INFORÑ1ACIÓN COMPLETA (c. 2)
Juegos dinámicos con información completa y perfecta / 65
w L *(w)
' ...'
w Curva de indiferencia
del sindicato
w*
L*(w)
L
Curvas de isobeneficio de la empresa
L* (w*) L
Figura 2.1.2
'Figura 2.1.4.
,
'.
w En términos de las curvas de indiferencia representadas en la figura
2.1.3, al sindicato le gustarla escoger la demanda salarial w que propor- ',.,.,'
cione un resultado (w,L * (w» que esté en la curva de indiferencia más alta
posible; La soluciÓn al problema del sindicato es w*, la demanda salarial
que hace que la curva de indiferencia del sindicato que pasa por el punto
(w*,L*(w*» sea tangente a L*(w) en ese punto (véase la figura 2.1.4)'- Por
lo tanto, (w* ,L*(w*» es el resultado por inducción hacia atrás de este juego "~o
de salarios y nivel de empleo.
Es fácil ver que (w* ,L * (w*» es ineficiente: tanto la utilidad del sindi-
L
cato como los beneficios de la empresa aumentarían si w y L estuvieran en
Curvas de indiferencia del sindicato la región sombreada de la figura 2.1.5. Esta ineficiencia hace que resulte
difícil de entender que en la práctica las empresas parezca que retienen
Figura 2.1.3 el control exclusivo sobre el nivel de ocupación. (Si permitimos que la
empresa y el sindicato negocien los salarios pero mantenemos el control
exclusivo de la empresa sobre el nivel de empleo obtenemos un resultado
Consideremos ahora el problema del sindicato en la etapa (1). Dado igualmente ineficiente.) Espinosa y Rhee (1989)proponen una explicación
que el sindicato puede resolver el problema de la.empresa en la segunda a este enigma basada en el hecho de que el sindicato yla empresa negocian
etapa, tanto como la propia empresa, el sindicato deberla prever que la repetidamente a lo largo del tiempo (normalmente cada tres años en Esta-
reacción por parte de la empresa a su demanda salarial w será escoger el dos Unidos). En ese juego repetido, siempre que la elección de.w por parte
nivel de empleo L*(w). Por tanto, el problema del sindicato en la primera del sindicato y la elección de L por parte de la empresa caigan en la región
etapa se concreta en
sombreada de la figura 2.1.5 puede existir un equilibrio, aun cuando esos
'.: .'
que el jugador 2 puede recibir 1 - 8i en el segundo periodo rechazando por inducción hacia atrás, el jugador 1 ofrecerá el acuerdo (j(s),l- f(s»
'"
la oferta S] del jugador 1 en este periodo, pero el valor en este periodo de en el primer periodo y el jugador 2 aceptará, donde fes) = 1 - 50 - os)
1',
recibir 1 - si el periodo siguiente es sólo de 50 - si). Por tanto, el jugador es la fracción del jugador 1 en el primer periodo del juego anterior de tres
2 aceptará 1 - s] si y sólo si 1 - s] 2: 50 - si) o s] ::; 1 - 50 - si). El periodos cuando el acuerdo (s,1 - s) se imponía exógenamente en el tercer
problema de la decisión del jugador 1 en el primer periodo, por tanto, se
periodo.
concreta en escoger entre recibir 1 - 50 - si) en este periodo (ofreciendo
Sea s A la ganancia más alta que el jugador 1 puede recibir en cualquier
1- SI = 50-si) al jugador 2) o recibir si en el próximo periodo (ofreciendo
resultado por inducción hacia atrás del juego completo. Consideremos el
cualquier 1 - S1 ::; 50- si) al jugador 2). El valor descontado de la última
uso de SA como la ganancia del jugador1 en el tercer periodo, tal como
opción es 5si = 52s, que es menor que 1 - $0- si) = 1- 5(1"':5s) obtenible
lo hemos descrito anteriormente; esto producirá un nuevo resultado por
por medio de la primera opción, de forma que la oferta óptima del jugador
inducción hacia atrás en el que" la ganancia en el primer penado del
1 en el primer periodo es si = 1 - 50 - si) == 1 ::,.'5(1- 58).'Por tanto, en
jugador 1 es fCsA).Dado que fes) = 1- 5 + 02Ses creciente'en s; f(sA)
el resultado por inducción hacia atrás de este juego de tres periodos, el
es la ganancia en el primer periodo más alta posible; ya quesA es la
jugador 1 ofrece el reparto (si ,1 - si) al jugador 2, quien acepta.
ganancia más alta posible en el tercer periodo. Pero SA es también la
Consideremos ahora el caso en que el horizonte es infinito. El desarro- ganancia más alta posible en el primer periodo; de forma que!(sA) =
llo temporal es el mismo que hemos descrito anterio~ente, excepto que el SAo Argumentos similares demuestran que f(sB) = SB, donde SB es la
acuerdo exógeno del paso (3) esreemplazado por una sucesión infinita de ganancia más baja posible que el jugador 1 puede obtener en cualquier
pasos (3a), (3b), (4á), (4b) yasísuéesivamerite. El jugador 1 hacela"oferta resultado por inducción hacia atrás del juego completo. El único valor de
en los peripdiJsÍII1par~s, el jugador 2 en 10s.pares;1~!1egQ<;iii<,:ión con~ s que satisface fes) = s, es"1/(1 + o), que denotaremos con s*.Por tanto;
tinúa hasta que un9 elelos dos jugadore~ acepta,un¡t9f~rta. Nos gustaría sA = SE 0= s. de forma que, existe un único resultado por inducción hacia
hallar el resultado PO! inducción pacia atrás de esteJuego pe horizonte atrás d~l juego completo: en el primer periodo el jugador 1 ofrece un
infinito moviél}-dcmoshacia atrás, tal como lo hemos hecho en los casos acuerdo (s' = 1/(1+0),1- s'" = 5/0 + o» al jugador 2, quien acepta. \.'
analizados hasta ahora. Sin embargo, co~oel jueg~podría continuar
,é
hasta el infinito, no existe un último momento a partir del cual iniciar tal '" ,
análisis. Afo~nadamente, la,siguiente idea (aplicada.()riginalmente por 2.2 Juegos en dos etapas con información completa
Shaked y Sutton [1~84])nos permité truncar el juego de horizonte infinito .pero imperfecta :, -
y aplicar la lógica del Giso'en el que ell10rizonte ~. fuíi:to:el juego q~e
empieza en el,tercer periopo (si se alcanza) es idéntico al jueg~ completo
2.2.A.Teoña: Perfección en subjuegos .
(empezando desde el primer periodo); en ambos cas~s el jugador 1 hace
la primera oferta, los jugadores se alternan haciendo las siguientes ofertas
Enriquecemos ahora la clase de juegos analizacia eIlla sección anterior: ,~ "
Analizaremos el siguiente juego sencillo, al cual (sin mucha inspi- 1. Los jugadores 1 y 2escogen simultáneamente las acciones 1/,1 y "-z de
ración) llamaremos juego en dos etapas con información perfecta pero los conjuntos factibles Al Y Az respectivamente.
incompleta: 2. Las ganancias son Hi(al,az,0,;(o.L(1,Z),o'4(al,l/,z» parai = 1,2.
de los inversores saca el dinero en la fecha 2, el banco devuelve R a cada ganancias de (r,r); (2) ninguno de los inversores saca el dinero en la fecha
inversor y el juego se acaba. 1 pero lo hacen en la fecha 2, lo que conduce a unas ganancias de (R,R) en
En la sección 2.4 discutiremos cómo representar formalmente este la fecha 2.
juego. Sin embargo, por ahora procederemos de modo informal. Repre-
sentemos las ganancias de los dos inversores en las fechas 1 y 2 (en función
de sus decisiones sobre sacar dinero en esas fechas) con el siguiente par Sacar No sacar
de juegos en forma normal. Nótese que el juego en forma normal co- Sacar r,r D,2r - D
rrespondiente a la fecha 1 no es típico: si ambos inversores escogen no
No Sacar 2r - D,D R,R
sacar dinero en la fecha 1, no se especifica ninguna ganancia, sino que los
inversores pasan al juego en forma normal correspondiente a la fecha 2.
Figura 2.2.1
Sacar No sacar
Sacar T,T D,2r-'--D El primero de estos resultados puede interpretarse. como el de un
pánico bancario. Si el inversor 1 cree que el inversor 2 sacará su dinero
No Sacar 2r - D,D siguiente etapa
en la fecha 1, su mejor respuesta es sacar también el dinero, aun cuando
Fecha 1 a ambos les iría mejor si esperasen a la fecha 2 para sacar el dinero. Este
juego del pánico bancario difiere del dilema de los presos discutido en el
. capítulo 1 en un aspecto importante: ambos juegos poseen un equilibrio de:
Sacar No sacar Nash que conduce a unas ganancias socialmente ineficientes; en el dilem.a
de los presos éste es el único equilibrio (y loes en estrategias dominantes),
Sacar R,R 2R- D,D
mientras que en este juego existe también un segundo eqUilibrio qúe
NoSacar D,2R - D, R,R es eficiente. Por tanto, este modelo no predíce cuándo va a ocurrir un
pánico bancario, pero muestra que es un fenómeno que'p~~de ocurrir en
Fecha 2
equilibrio. Véase un modelo más rico en Diamond y DybVig (1983):.
Para analizar este juego procedemos hacia atrás. Considérese el juego
/, -,
en forma normal correspondiente a la fecha 2. Como R > D (y por 2.2.C Aranceles y competencia internacional imperfecta
tanto 2R - D > R), "sacar" domina estrictamente a "no sacar", de forma
que existe un único equilibrio de Nash de este juego: ambos inversores Nos ocupamos ahora de una aplicación de economía internacional. Con-
sacan el dinero, lo que conduce a unas ganancias de (R,R). Como no hay sideremos dos países idénticos, que denominamos con i = 1,2. Cada país
descuento, podemos simplemeI1te sustituir estas ganancias en el juego en tiene un gobierno que escoge un arancel, una empresa que produce tanto
forma normal correspondiente a la fecha 1, tal como indica la figura 2.2.1. para el consumo interno como para la exportación y unos consumidores
Dado que r < D (y por tanto 2r - D < 1'), esta versión de un periodo del que compran en el mercado interno, ya sea de la empresa nacional o efe
juego de dos periodos tiene dos equilibrios de Nash en estrategias puras: la extranjera. Si la cantidad total en el mercado del país i es Qir el precio
(l) ambos inversores sacan el dinero, lo que conduce a unas ganancias de equilibrio del mercado es Pi(Qi) = a - Q.¡. La empresa del país i (que
de (,.,.,.);(2) ninguno de los dos inversores saca el dinero, lo que lleva a en adelante llamaremos empresa ~)produce hi para el consumo interior
unas ganancias de (R,R). Por tanto, el juego original del pánico bancario y ei para la exportación. Por tanto, Qí = hí + ej. Las empresas tienen
de dos periodos tiene dos resültados perfectos en subjuegos (y, por tanto, un coste marginal constante e y no tienen costes fijos. Por tanto, el coste
no se ajusta totalmente a la clase de juegos definida en la sección2.2.A): total de producción de la empresa i es Cí(hí,ei) = c(hí + eí). Las empresas
(1) ambos inversores sacan el dinero en la fecha 1, lo que conduce a unas también incurren en un coste arancelario sobre las exportaciones: si la
.,
74 I JUEGOS DINÁMICOS CON INFORMACiÓN COMPLETA Ce. 2) fllegos eH dos etapas de ill{omlOcíó/I I 75
empresa iexporta ei al país ,7 cuando el gobierno j ha establecido una tasa Suponiendo que e; :::;a - c, tenemos que
arancelaria de tj, la empresa i debe pagar tjei al gobierno j,
• 1( ,,)
, El desarrollo temporal del juego es el siguiente: Primero, ambos go- 11,; = '2 a - ej - e , (22,1)
Supongamos que losgobie~os hanestogido los aranceles tI y t2. Si Recordemos (en la sección 1.2.A) que la cantidad de equilibrio escogida
es un equilibrio de Nash del juego (de dos mercados) restante
(hj,ej,hi,ei) por las dos'empresas en el juego de Cournot es (a - c)/3, pero que este
entrelas empresas 1 y2 entonces, para cada i, (hi,ei> debe solucionar resultado se obtuvo bajo el supuesto de costes marginales simétricos. En
el equilibrio descrito en (2.2.3),por el contrario, las decisiones arancelarias
de los gobiernos hacen que los costes marginales sean asimétricos (como
'!'~ en el ejercicio 1.6). En el mercado i, por ejemplo, el coste marginal ele
Como 1r'i(t"tj,h"e"h;,e;) puede escribi~e como la sum~ de los benefi- la empresa i .es c, pero el delaempresa j es c + ti. Como el coste de la
~io,sde la empresa i en ~l.mercado i (los cuales son función de hi y e; empresa j es más alto, ésta quiere producir menos .. Pero si la empresa j
Ullicamente) y lm~beneficIOSde la empresa i en el mercado j (los cua- va a producir menos, el precio de ,equilibrio será'.Il~J~al~~,deforma que la
les son función, de ei, h;.y tj. únicamente), el problema de optimización empresai querrá producir más, en cuyo caso la empresa j querrá producir
en los dos mercados para la empresa i se simplifica al separarse en dos menos todavía. Por tanto, en equilibrio, hi crece con ti y e; decrece (a un
problemas, uno para cada mercado: hi debe solucionar ritIno más rápido) con ti, como indica (2.2.3).
Una vez resuelto el juego entre las dos empresas que queda en la
, max hi[a - (hi + eJ~)- cL segunda etapa, cuandolos gobiernos han escogido las tasas arancelarias,
.-~ h,::::O ' ,
podemos ahora representar la interacción entre los dos gobiernos en la
y ei debe solucionar primera etapa con el siguiente juego de decisiones simultáneas. Primero,
los gobiernos escogen las tasas aran,celarias tI y t2 simultáneamente. En
maxei[a - (ei + 11,*) - el - te'. segundo lugar, las ganan9j=ls;spr,~i(t;,t'j,hj,ei,hi,ei) para el gobierno
<,::::0 J J '
i = 1,2, donde hi y ei.son funciones de ti y tj, tal como se indica en (2.2.3),
Hallamos 'ahora el equilibrio d~ Nash de este juego entre los gobiemos.
9 S' .
1 un consUffildor compra un bien a un, precio,p cua~dohab'ríá estado dispuesto a Para simplificar la notación, suprimiremos la dependencia de 11.; de f'i
pagar un valor v, se beneficiade un excedente de v '-' p. Dada la i:ufV~de deináilcla inversa
y de ei de tj: con W;(ti,tj)genotamos a Wi(ti,tj,hi,ei,hi,ei), la ganancia
Pi(Qi) ~ a - Q" si la cantidad vendida en ei mercado i es Qi, puede demostrarSe que el
excedente agregado del consumidor es (l/2)Qr del gobierno i cuando eS.<;9ge1a tasa arancelaria ti, el gobierno .i escoge t j
/,-.
76/ JUEGOS DINÁJVlICOS CON INFORMACIÓN COMPLETA Ce. 2) Juegos en dos etapas de información / 77
y las empresas i y jse comportan según el equilibrio de Nash dado por del libre comercio). (Si es factible tener aranceles negativos, es decir,
(2.2.3). Si (ti Ji) es un equilibrio de Nash de este juego entre los gobiernos, subsidios, el óptimo social consiste en que los gobiernos escojan tI =
entonces, para cada i, ti debe solucionar t2 = -(a - e), lo que hace que la empresa nacional no, produzca nada
para el consumo interior y exporte la cantidad de competencia perfecta
max W;*(ti,t*). al otro país.) Por lo tanto, dado que las empresas i y j se comportan
ti~O )
según el equilibrio de Nash caracterizado en (2.2.3) en la segunda etapa,
Pero W;*(t¡,tiJ es igual a
la interacción entre los gobiernos en la primera etapa es un dilema de los
presos: el único equilibrio de Nash lo es en estrategias dominantes, y es ... ".
(2(a - e) - ti? + (a - e + ti)2 + (a - e - 2t~?
1 + t(a
t
- e - 2t)1 socialmente ineficiente.
18 9 9 3'
por tanto 2.2.0 Torneos
a-e
t~ =--
, 3 Consideremos a dos trabajadores y su capataz. El producto del trabaja-
dor i (i = 1 o 2) es Yi = ei + Eú donde ei es esfuerzo y Ei es ruido. El
para cada i, independientemente de tj. En consecuencia, en este modelo
proceso de producción es el siguiente: Primero, los trabajadores escogen
escoger una .tasa arancelaria de (a - e)j3 es una estrategia dominante
simultáneamente sus niveles no negativos de esfuerzo: ei ?: O. En se--'
de cada gobIerno. (En otros modelos, por ejemplo cuando los costes
gundo lugar, los valores de ruido E] y 1'2 se obtienen independientemente,
margInal.es son crecientes, las estrategias,.de equilibrio de los gobiernos no
de acuerdo con una función dedensidad f(E) con media cero. Entercer
son domInantes.) Sustituye~do ti = t; = (a - e)j3 en (2.2.3) obtenemos
lugar, el producto de los trabajadores es obsen:ado pe~ono su e~fu~i~o~
Los salarios de los trabajadores,' por tanto, pueden depender de lo que
hi = 4(a -:-e) e~ = a - e
9 y , 9 han producido, pero no (directamente) de su esfuerzo.
como las cantidades escogidas por las empresas en la segunda etapa. Por Supongamos que el capataz decide inducir a los trabajadores a esfor-
tanto, el resultado perfecto en subjuegos de este juego -de aranceles es zarse más y para ello les hace competir en un torneo;.tal y como origi-
(ti =5 =(a - e)j3,hj=hi= 4(u-:- e)j9,ej = ei = (a --' e)j9)~ ' nalmente analizaron Lazear y Rosen (1981).10 El salario recibido 'por el
En el resultado perfecto en subjuegos, la cantidad agregada en cada vencedor del torneo (es decir, el trabajador quemás:produica)eswA;"el
mercado es S(a - e)j9. Sin embargo, si los gobiernos hubieran escogido salario recibido por el perdedor es WB. La ganancia:deun trabajador que
unas tasas, ar~ncelarias iguales a cero, la cantidad agregada en cada mer- reciba un salario W y realice un esfuerzO e es u(w,e) = w - g(e), donde la
cado habna SIdo 2(a - e)/3, exactamente igual que en el modelo de Cour- desutilidad del esfuerzo, g(e), es creciente y convexa (es decir; g'(e) > O Y
not. Por tanto, el excedente de los consumidores en el mercado i (el cual, g"(e) > O). La ganancia del capataz es Yl + YF-WA - WB.
como hemos visto anteriormente, es simplemente la mitad del cuadrado Transcribimos ahora esta aplicación'a lostérininos de la clase de juegos
de la cantidad agregada en el mercado i) es menor, cuando los gobiernos discutida en la sección 2.2.A. El capat~~'~"eIRíg~dor 1~cuya acción al es
esc?ge.n l~s tasas arancelarias que son estrategias dominantes, de lo que escoger lbs salarios W A y W B que se pagarán en el torneo. No hay jugador
~ena SIelIgieran unos aranceles iguales a cero. De hecho, unos aranceles 2. Los trabajadores son los jugadores 3 y4;quienes observan los salarios .
Iguales a cero son socialmente óptimos en el sentido de escogidos en la primera etapa y deci~e,!-1~n.t,?~cessünultáneamente sus
acciones a3 Y a4, es decir los esfuér~o~'~l'y'é~:(Consideraremos más áde-
max W¡(t],t2) + Wi(t2,tl),
tl,t2~O lO Para no complicar la exposición de esta aplicación; ignoramos varios detalles técnicos,
tales como las condiciones bajo las cuales la 'condición de primer orden del trabajador es
de fOlIDaque existe unincentivo para que los gobiernos firmen un acuerdo
suficiente. No obstante, el análisis eXige illI mayor cálculo de probabilidades que en los casos
en el que se comprometan a eliminar los aranceles (es decir, en favor anteriores. Esta aplicación puede saltarse sin pérdida de continuidad. '
Juegos el1 das etapas de ¡,¡[anuacirÍu ! 79
78 / ]VEGaS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2)
lante la posibilidad de que, dados los salarios elegidos por el capataz, los
trabajadores prefieran no participar en el torneo y acepten en cambio una
Prob{Yi(e;) > Yj(ej)} =Prob{Ei > ej + éj - e;}
oferta de empleo alternativo.) Finalmente, las ganancias de los jugadores
son las establecidas anteriormente. Dado que lo que se produce (y por , ' =1 Prob{Ei>e;+Ej-e,IEj}f(Ej)dEj
tanto también los salarios) es función no sólo de las decisiones de los ju- . €j
Como g(e) es ~onvexa, un premio mayor por ganar (es d~cir, .U.Jl valor
::. mayor d eWA-WB ) I'nduce a un mayor
'
esfuerzo, cosa harto
,
mtU.lliva. Por
"',1::'" donde Yi(ei) = ei + Ei',La condición de primer orden de (2.2.4) es' tra parte con un mismo premio, no vale tanto la pena esforzarse cuando
-,,) :
"
)8Prob{Yi(ei) >
:1 ruido e~ muy fuerte, porque es probable que elresultado del to:neo se
;:\
,-,~~tl
(WA _ WB 8
Yj(e;)} _
- 9
'( ,)
e,. (2.2.5) determine aleatoriamente, y no de acuerdo con elesfuerzo. Por ejemplo,
ei
si Ese distribuye normalmente con varianza a2, entonces
~~~, .'
.,:¡:- ..'
Es decir, el trabajador i escoge ei de forma que la desutilidad marginal de
~:', un esfuerzo extra, g'(e;), sea igual al beneficio marginal de ese esfuerzo
.",.!:.'
adicional, que es el producto de lo que se gana en salario por venCer en el
--");
torneo, WA '-w B, y el aumento marginal de la probabilidad de ganar. que decrece en a, de forma que E' efectivamer:te decrece en a..
"
__
,~i
Por la regla de Bayes,12 Procedemos ahora hacia atrás, hasta la pnmera etapa del Juego. Su-
pongamos que SI,. 1os trabaJ'adores ' acuerdan
' ' participar
, en el torneo
. (en
11 Al escribir (2.2.4),supusimos que la función de densidad del ruido ¡(e) es tal que el t
vez d e acep ar un e, mpleo a lternativo) responderan, a. los salanos ',I! A
:;
~~',' suceso en el qU€ lostrabaj~dores producen exactamente lo mismo OCurr€con probabilidad . d 1
y W B lugan ,o e eqw, 'libn'o de Nash simétrico caractenzado
.. ' . .,. por (2.2.6).
cero y, por tanto;no es necesario considerarlo en la función de utilidad esperada del trabajador
"o,}' i. (Más formalmente, suponemos que la función de densidad ¡(E) es no atómica) En una (1gnoramos, por t anto , la posibilidad de equihbn, os asrmetncos y,de un ,
descripción completa del torneo, sería natural (pero innecesario) especificar que el ganador se equilibrio en el que la elección de los es~erzos por parte de los trabaJa-
,)~
determina a cara o cruz, o (lo que en este modeio resulta eqttivalente) que ambos trabajadores
reciben(wA +wB)/2 .
dores venga dada por la solución de esquma el = e2 = en vez de por la ?:
.~} condición de primer orden (2.2.5).) Supon~amos t~~bIen que la oporlu-
l2La regla de Bayes proporciona una fórmula para P(AIB), la probabilidad (condicional)
,",.l~ de que un suceso A ocurra dado que el suceso B ha ocurrido. Sean P(A), P(B) Y P(A,B) nI'd a d d e emp 1ea alternativo proporcionan' a una utilIdad Un' Como , en' el .
las probabilidades (a priori) (es decir, las probabilidades antes de que tanto A como B hayan equilibrio de Nash simétrico cada jugador gana el tor~eo con probal:lh-
'. '-,' tenido la oportunidad de ocurrir) de que A ocurra, B ocurra y de que ambos A y B ocurran
respectivamente. La regla de Bayes establece que P(AIB) = P(A,B)/ P(B). Esto es, la
dad un medio (es decir, Prob{Yi(e') > Yj(e')} = 1/2), SI capataz qUJ~re :1
..../
inducir a los trabajadores a participar en el torneo debera escoger salanos
'
probabilidad condicional de A dado B es igual a la probabilidad de que ambos 'A y B ocurran
dividida por la probabilidad a priori de que B ocurra. que satisfagan
~_l.>t'
80 / JUEGOS DlNAMICOS CON INFORMACIÓN COMPLETA (c. 2)
Juegos repetidos / 81
(
(WA - WB) l
J
f(Ój)2dój = 1,
Jugador 1
2,2 6,1
Figura 2.3.2
2.3Juegos repetidos
Llamaremos a este juego repetido el dilema de los presos en:dos etapas.
En esta sección analizarnos si las amenazas y promesas sobre el comporta- Este juego pertenece a la clase de los juegos analizada en la sección 2.2.A.
miento futuro pueden influir en el comportamiento presente en situacio- Aquí los jugadores 3 y 4 son idénticos a los jugadores 1 y 2, los espaCios
nes que se repiten en el tiempo. Buena parte de lo que hay que entender de acciones A3 y A4 son idénticos a Al y AZ Y las ganancias ui(al,a2,a3,a1l
en estas situaciones se ha visto ya en el caso de dos periodos; pocas ideas son simplemente la suma de las ganancias en la'pnmera etapa (ái.;a2)
nuevas se requieren para entender los juegos con un horizonte infinito. y en la segunda etapa (a3,a4)' Además, el dilema de los presos en d.ós
Hemos definido también el equilibrio de Nash perfecto en subjuegos. Esta etapas satisface el supuesto que hicimos en la sección 2.2.A: para cada
defirüción tiene una expresión más sencilla para el caso especial de los jue- resultado factible de la primera etapa del juego, (al,a21, el juego restant.e
gos repetidos que en el general de los juegos dinámicos con információn en la segunda etapa entre los jugadores 3 y 4 tiene un único equilibrio
completa que considerarnos en la sección 2.4.B. La introducirnos aquí para de Nash, que denotamos por (a3(al,a21,a,i(al,a2»' De hecho, el dilema .~'.
tacilitar la exposición posterior. . '.
de los presos en dos etapas satisface este supuesto de forma clara, como
seguidamente indicamos. En la sección 2.2.A peTInitini.osla posibilidad de
2.3.A Teoría: Juegos repetidos en dos etapas
que el equilibrio de Nash del juego restante en la segunda etapa dependa
del resultado de la primera etapa -de aquí la notación (a; (al ,a2) ,a¡ (al ,a2»
Consideremos el dilema de los presos dado en forma normal de la figura en vez de simplemente (aj,a¡). (En el juego de los aranceles, por ejemplo;
2.3.1. Supongamos que hay dos participantes en este juego que deciden las cantidades de equilibrio escogidas por las empresas en la segunda
simultáneamente en dos ocasiones, habiendo observado el resultad"ode li,'l etapa dependían de los aranceles escogidos por los gobiernos en la primera
primera decisión antes de decidir por segunda vez, y supongamos que las etapa.) Sin embargo, en el dilema de los presos en dos étapas, el único
• [IleSOS repef idos / 83
82 / JuEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2)
equilibrio del juego de la segunda etapa es (I¡,h), independientemente lora al caso de dos periodos, pero consideramos la posi-
del resultado de la primera etapa. .. vodlvdemqo:::1 J'uego de etapa G tenga múltiples equilibrios :le ..NilSh,¡
blhda e . d . d [y C ll1utan é1
Siguiendo el procedimiento descrito en la sección 2.2.A para calcular el 3 3 1~as estrateglils enOillma as ./. d /
en l a fi gura 2 .., . 1
resultado perfecto en subjuegos de tal juego, analizamos la primera etapa como
. de los presos d e l a fi gura 23.. I , pero las estrategias enOJ1Unal
. 'b .ilS
del dilema de los presos en dos etapas teniendo en cuenta que el resultado dIlem; sido añadidas al juego de forma que ahora existen dos eqUlh nos
Di ha '. (1 J) como en el dilema de los presos, y
del juego restante en la segunda etapa será el equilibrio de Nash de ese N h en estrategIas puras. ¡,2 . "1' I
de as d ' (D D) Natura men te, es artl' f)' cial añadir un eqUllt mo a
1
juego, es decir, (IIJú con ganancias de (1,1). Por tanto, la interacción en
la primera etapa entre los jugadores en el dilema de los p~esos en dos a~ora a de~as pr~~os2de esta manera, pero nuestro interés en este juego
dIlema, e os 't'vo que sustan h' va. En la próxima sección veremos que
etapas se concreta en el juego de una jugada de la figura 2.3.2, en el que es mas exposll , 'h d uilibrios
las ganancias 0,1) de la segunda etapa se han sumado á' cada par de . tidos infinitamente comparten este espm I e eq ..
los Juegos ~epe '1' d etapa que se repiten infinitamente tienen
ganancias de la primera etapa. El juego de la figura 23.2 tiene también un u'Iti les mc1uso SI os Juegos e . "
único equilibrio de Nash: (IIJZ). Por tanto, el único resultado perfecto en m . ~ 'uilibrio de Nash, como en el dilema de los presos. Por tal~to, en
un UNCOeq. . de etapa artificial en el contexto Sl1nple
subjuegos del dilema de los presos en dos etapas es (¡¡Jz) en la primera . , n analIZamos un Juego
etapa, seguidC? de (I¡Jz) en ¡la segunda etapa. No se puede conseguir est~::cC1:riodos, y nos preparamos con ello para el análisis poster~or de
de p ..' 'co en un contexto con honzonte
cooperación, es decir, (DI,Dz) en ninguna etapa del resultado perfecto en un juego de etapa con mteres economl ,
subjuegos. infinito.
Este argumento continúa siendo válido en situaciones más generales.
(Aquí nos apartamos momentáneamente del caso de dos periodos para
permitir cualquier número finito de repeticiones, T.) Denotemos con
G = {A¡, ... , An; Ul; ... ,un} un juego estático con información completa 1,1 5,0 0,0
en el que los jugadores 1 a n escogen simultáneamente las acciones a¡ a an 0,5 4,4 0,0
de los espacios de acciones A¡ a An respeftivamente, siendo las ganancias 0,0 0,0 3,3
U¡(al;', . ,an) a un(a¡, ... ,an). Llamaremos al juego G, juego deetapadel
juego repetido.
Figura 2.3.3
Proposición. Si el juego de etapa G .tiene un únicQequilibrio de Nash, entonces, . . .. 22 A Si G tiene un único resultado perfecto en
dos etapas de la clase defin~da en Ia.s~cClon ~lt~d'o perfecto en subjuegos: en cada etapa se
para cualquier T finito, el juego repetido G(T) tiene un ú~ico resultado perfecto subjuegos, entonces G(T) hene un unlCOres
en subjuegos: en cada etapa se juega el equilibrio de Nash de G.i3 juega .el resultado perfecto en subjuegOdsfide.~. la nodón de resultado perfecto en subjuegos
14E '-' tamente hablando hemos e ni o
S'HC ' '. 'd l .. 22 A El dilema de los presos en dos etapas
13 Se ~btienen resUltados análogos si el juego de etapa G es un júego dinámicó con in- ól 1 1 se de juegos defim a en a seccJOn . . . .
s o para a e a da resultado factible del juego de la primera eta pa eXlste
formadón completa. Supongamos que G es un juego dinámico con inJonnádón completa y pertenece a esta clase, porque para ca d l gunda etapa Sin embarg0. el
perfecta de la clase definida en la secdón 21.A. Si G tiene un úr¡jco resultado por inducdón Tb' d N sh en el juego que que a en a se .
un único eqU11 no e ~ . n el . e o de e~apa de la figura 2.3.3 no pertenece a
hada atrás, G(T) tiene un único resultado perfecto en subjuegos: en cada etapa se juega el juego en dos etapas Tepehdo, basadh.oe u'~pfes equilibrios de Nash. No vamos a extender
resultado por inducdón hacia atrás de G. Sinillarmente, supongamos que G es un juego en tIque el ¡U.ego de etapa ene m. . 11
es a c ase, por b' os de forma que sea apiJea ) e a
formalmente la definición del resultado perfecto en su Jueg
84 / JUEGOS DlNÁ,vllCOS CON INFORfvIAC¡ÓN COMPLETA (e. 2)
Juegos rq;elidos / 85
en la primera etapa los jugadores prevén que el resultado de la segunda 2.3.4 corresponde al resultado perfecto en subjuegos «Cl,Cz),(D],D2») del
etapa será un equilibrio de Nash del juego de etapa. Puesto que este juego repetido, puesto que el resultado previsto en la segunda etapa es
Juego de etapa tiene más de un equi.librio de Nash, ahora es posible que (Dl,Dz) como consecuencia de (Cl,C2). Por lo tanto, como hemos afirmado'
los Jugadores prevean que a resultados diferentes en la primera etapa anteriormente, se puede alcanzar la cooperación en la primera etapa de
les sIguen equilibrios diferentes del juego de etapa en la segunda etapa. un resultado perfecto en subjuegos del juego repetido. Esto es un ejemplo
Supongamos, por ejemplo, que los jugadores prevén que (Dl,Dz) será el de un resultado más general: si G = {Al,'" ,An; uI- ... ,un} es un juego
resultado de la segunda etapa si el de la primera etapa es (Cl,CZ), pero estático con información completa que tiene múltiples equilibrios, pueden
que (II,1z) será el resultado de la segunda etapa si el resultado de la existir resultados perfectos en subjuegos del juego repetido G(T) en los
primera etapa es cualquiera de los ocho restantes. La interacción entre que, para cualquier t < T, el resultado de la etapa t no es un equilibrio
los jugadores en la primera etapa se concreta entonces en el juego de una de Nash de G. Volveremos sobre esta idea en el análisis de un juego con
etapa de la figura 2.3.4, donde (3,3) se ha sumado a la casilla (C],Cz) y 0,1) horizonte infinito en la próxima sección.
se ha sumado a las otras ocho casillas.
La conclusión principal que debemos sacar de este ejemplo es que
las amenazas o las promesas creíbles sobre el comportamiento futuro
pueden influir en el c~mportamiento presente. Sin emba'rgo, desde otra
2,2 g,1 1,1 perspectiva, puede que quizás el concepto de perfección en subjuegos
! 1-:'" --
no utilice una definición de credibilidad lo suficientemente fuerte. Al
1,6 ]1 1,1 derivar el resultado perfecto en subjuegos «C],CZ),(D1,Dz», por ejemplo,
1,1 1,1 hemos supuesto que Jos'jugadores prevén q~e (DI,Dz) s~rá el resultaclü,
~''!.
de la segunda ronda si el resitltado en la primera etapa es (C],Cz), y q~~
Figura 2.3.4 (I¡'!z) será el resultado en la segunda etapa si eIde la primera ronda es
cualquiera de los ()chorestantes. Pero jugar (11,!2)enléi.se~da etapa, con
Existen tres equilibrios de Nash con estrategias puras en el juego unas ganancias de 0, 1), puede parecer poco atractivo~a:hdo (DI,Dz),
de la figura 2.3.4: (1],1z), (Cl,CZ) y (D],Dz). Como i'l1 la figura 2.3.2, con una ganancia de (3, 3), está también disp¿nible cci~oe'luilibrio de
los equilibrios de Nash de este juego de una etapa corresponden a los Nash del juego de etapa que queda. Dicho en términos poco preciSos.
resultados perfectos en subjuegos del juego repetido original. Denotemos parecería natural que los jugadores renegociiü-an:15.SiJC1,cz) no es'~i
con «w,x),(y,z) un resultado del juego repetido: (w,x) en la primera etapa resultado de la primera etap~ del-juego, e~d~'~{~e~u'p'~~equ~~~'j~g~á
y (!J,z) en la segunda. El equilibrio de Nash (1],1z) de la figura 2.3.4 (I¡'!z) en la segu~cl,~~ta,pa, cada jugadorp_~t;4-;;"p~TIs~que_lo p~sadQ;
corresponde al resultado perfecto en subjuegos «(1],[Z),(1],[2» del juego pasado está, y que se debe jugar el eqüilibriodel juegbdeetapa (Dl,D~)
repetlLio,puesto que el resultado previsto en la segunda etapa es (11,!z) unánimemente preferido. Pero si (DI,Dz)va a serelr~sÚltado de la
como consecuencia de cualquier resultado en la primera etapa excepto de segunda etapa independientemente de cuál sea el rescltadoenla primera
(C'],C'2). De la misma forma, el equilibrio de Nash (D],Dz) de la figura ronda, el incentivo para jugar (Cl,Cz) en ia prirñ~~áet~p.a_desaparece: la
~.3.4 corresponde al resultado perfecto en subjuegos «Dl,Dz),(11'!Z» del interacción entre los dos jugadores en la p'riill~;a~tapa' s~~~~.duce
al juego
Juego repetido. Estos dos resultados perfectos en subjuegos del juego de una etapa en el que la gánancia (3, 3Yse'ha~stÜÍ1adóacada casilla del
repehdo simplemente enlazan los resultados de los equilibrios de Nash juego de etapa de la figura 2.3.3; d'e'fo~a que Ji e~ la mejor respuesta a
de los juegos de etapa, pero el tercer equilibrio de Nash de la figura Cj del jugador i. ' '. . ."._.. '.
','
2.3.4 genera un resultado cualitativamente diferente: (Cl,Cz) de la figura
15 Decimos que es impreciso p~rq~~"renegociar" sugiere que hay comunicadón (o incluso
todo.juego en dos etapas repetido, en primer lugar porque el cambio el) las definidones es negodadón) entre la primera y la"Segunda e,tapa. Si esto fuera posible, debería añadirse a
nunuscnlo y, en segundo lugar, porque en las secciones Z.3.B y 2.4.B aparecen definidones la descripdón y análisis del jue¡;¡m.'Aquí súpimemos que no es así, de forma que lo que
mduso mas generales.
entendemos por "renegodar" no-esotra cosa que un ejerddo de introspección.
Juegos repetidos / 87
86 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e 2)
y demostrar el teorema de Friedman (1971) (también llamado teorema de el valor presente de las ganancias, es decir, la ganancia total que podría
tradición oral o teorema folk).I6 ingresarse en un banco ahora de forma que produjera el mismo saldo al
final de la sucesión.
1,1 5,0 00
t=I
0,5 4,4
También podemos utilizar 5 para reinterpretar lo que l~amamos un
juego repetido infinitamente como un juego repetido que se acaba después
de un número aleatorio de repeticiones. Supongamos que al finalizar cada
c..
Figura 2.3.6
etapa se lanza una moneda (trucada) para determinar si el juego se acaba ';-',
ejemplo, pero la suma de ganancias es infinita en ambos casos. , Recor- presente 7f1+ 57f2+ 527f3+ ... refleja tanto el valor temporal del dinero como
demos (en el modelo de negociación de Rubinstein <;lela sección 2.1.D) la posibilidad de que el juego se acabe. '.'
que el factor de descuento 5 = l/O + 1') es el valor actual de lila peseta Consideremos el dilema de los presos repetido infinitalIlente en elque
que se vaya a recibir en el periodo siguiente, donde l' es el tipo de interés el factor de descuento de cada jugador es 5"y la ganancia de cq9,aj:ugador
por periodo. Dados un factor de descuento y las ganancias de un jugador en el juego repetido es el valor presente de las ganan.ciasdel jugad()f,ep
obtenidos de una sucesión infinita de juegos de etapa, podemos calcular los juegos de etapa. Demostraremos que la cooperación, es decir,(D1,D2),
puede ocurrir en cada etapa de un resultado perfecto en subjuegos del
juego repetido infinitamente, aun cuando el único equilibrio de Nash
del juego de etapa es la no cooperación, es decir, (1},h) El argumerlto
es del mismo estilo que nuestro análisis del juego repetido en dos etapas
16 El teorema de tradición oral original se referia a las ganancias en todos los equilibrios basado en la figura 2.3.3 (el juego de etapa en el que añadimos un segundo
de Nash de un,juego repetido infinitamente. A este resultado se le llamó teorema de tradición equilibrio de Nash al dilem,! de los presos): si los jugadores cooperan
oral por ser ampliamente conocido entre los teóricos de juegos de íos "años cincuenia, aun
hoy entonces juegan un equilibrio con ganancias altas mañana; en caso
sin que nadie lo hubiera publicado. El teorema de Friedman (1971) se refiere a lasgánancias
en ciertos equilibrios de Nash perfectos en subjuegos de un juego repebdo infinitamente y, contrario juegan un equilibrio Con ganancias bajas mañana. La diferencia
por tanto, refuerza el teorema de tradición oral original al utilizar un criterio de solución más entre el juego repetido en dos etapas y el juego repetido infinitamente es
fuerte, el equilibrio de Nash perfecto en subjuegos en vez del equilibrio de Nash. Sin embargo, que aquí el equilibrio con gananciéls áltasquepodría jugarse mañana no
el antiguo nombre ha prevalecido: al teore;na de Friedman (y a otros resultados posteriores)
se les llama a veces teoremas ele tradición oral, aun cuando' no hayan sido ampliamente
se ha añadido artificialmente, sirlOque representa continuar cooperando
conocidos entre los teóricos de juegos antes de ser publicados. a partir de mañana y en lo Sucesivo.
Juegos repetidos ! 91
90 I JUEGOS Dú'\JÁMICOS CON INFORMACIÓN COMPLETA (c. 2)
Supongamos que el jugadori empieza el juego repetido infinitamente ue el jugador j recibe por realizar esta elección de forma óptima (ahora
cooperando y sigue cooperando en cada juego de etapa siguiente si y sólo q cada vez que aparezca). Si jugar Dj es óptimo entonces
y ,
si ambos jugadores han cooperado en cada ronda previa. Formalmente,
.Ia estrategia, del jugador i es: V=4+ól/,
.::
..,'
92 I JUEGOS DfNÁMICOS CON INFORMACiÓN COMPLETA (e. 2)
Juegos repetidos I 93
¡áclor de desCllento 6. Para cada t, los resultados de las t - 1 jugadas anteriores del
juego repetido en dos etapas consideramos una estrategia en la que la
jllego de etapa son conocidos antes de que empiece la t-ésima etapa. La ganancia
decisión del jugador .¡ en la segunda etapa era contingente del resultado
de cada jugador en G(co,o) es el valor presente de las ganancias que el jugador
outiene en la sucesión infinita de juegos de etapa. de la primera etapa: jugar Ci en la primera etapa y jugar li en la segunda
a menos que el resultado de la primera sea (C¡,Cz), en cuyo caso jugar Di
en la segunda etapa.
En cualquier juego (repetido o no), la estrategia de un jugador es un
En el juego repetido finitamente G(T) o en el repetido infinitamente
plan completo de acción, es decir, especifica una acción factible del jugador
G(co/i), la historia de! juego hasta la etapa t es el registro de las decisiones
en cada contingencia en la que le pudiera corresponder actuar. Dicho de
de los jugadores desde la etapa 1 hasta la t. Los jugadores podrían ha-
forma algo más frívola, si un j~ga_dordejara una estrateg!a a su abogado
ber escogido (un, ... ,un¡) en la etapa 1, (un, ... ,unz) en la etapa 2,. .. , y
anles de que el juego empezase, el abogado podría sustituir al jugador
(U¡u ... /lnt) en la etapa t por ejemplo, donde para cada jugador i y etapa
en el juego, sin necesitar en ningún caso de instrucciones adicionales
s la acción Uis pertenece al espacio de acciones Ai.
sobre cómo jugar. En un juego estático con información completa, por
ejemplo, una estrategia es simplemente una acción. (Por esto describimos
Definición. En e! juego repetido finitamente G(T) o en el juego' repetido infini-
lal juego como G = {S¡,,,,,Sn;'U¡, ... ,un} en el capitulo t pero aquí
tamente G(co,8), la estrategia de un jugador determina la acción que el jugador
pu:de describirse también como G = {A], ... ,An; U¡, '" ,un}: en un juego
realizará en cada etapa para cada posible historia de/juego hasta la etapa anterior.
estallco con información 120mpletael ~spacio de estrategias del jugador i,
Si, es simplemente el espacio de acciones Ai.) Sin embargo, en un juego
dinámico, una estrategia es más complicada. Pasemos ahora a los subjuegos. Un subjuego es una parte de un juego,
la parte que queda por jugar empezando en cualquier momento en el que
Consideremos el dilema de los presos en dos etapas analizado en la
la historia completa del juego hasta entonces sea información deI'doIÍúrÜo
sección anterior. Cada jugador acruados veces, de forma que podría
público entre los jugadores. (Más adelante en esta sección damos una
pensarse que una estrategia es simplemente un par dé irIstrucciones (b,c),
definición precisa en el caso de los juegos repetidos G(T) y G(co,8);en l(i
donde b es la decisión en la primera etapa y e es la decisión en la segunda
sección 2.4.B damos una definición precisa para juegos dinámicos con in-
elapa. Pero existen cuatro resultados posibles de la prÍ11leraetapa, (1¡,1z),
formación completa en general.) En el dilema de los presos en dos etapas,
U¡,Dz),(D1,1ú y (D¡,Dú, que representan cuatro contingencias diferentes
por ejemplo, hay cuatro subjuegos que corresponden a los juegos de la
en las que al jugador l~ podría corresponder actuar. Por tanto, la estrategia
segunda etapa que siguen a los cuatro resultados posibles de la primera
de cada jugador consta de cinco instrucciones, que indicamos mediante
etapa. Del mismo modo, en el juego repetido en dos etapas basado en
(V¡W,x,y,z), donde v es la decisión en la primera etapa y w,x,y y zson''!as
la figura 2.3.3, hay nueve subjuegos que corresponden a los nueve re-
decisiones en la segunda etapa correspondientes a (11,h), (11,Dz), (D¡Jz) y
sultados posibles en el juego de la primera etapa. En el juego repetido
(D¡,Dz) respectivamente. Usando esta notación, las instrucciones "jugar b
finita mente G(T) yen el juego repetido infinitamente G(co,8)la definición
en la primera etapa y jugar e en la segunda pase lo que pase enla primera"
de estrategia está íntimamente ligada a la definición de subjuego: la es-
se describen como (b,c,c,c,c), pero esta notación también puede expresar
trategia de un jugador determina las acciones que el jugador realizará en
estrategias en las que la decisión de la segunda etapa es contingente del
la primera etapa del juego repetido y enla primera etapa de cada uno de
resultado de la primera etapa, tal como (b,c,c,c,b), que significa "jugar b en
sus subjuegos.
la pnmera etapa y jugar e en la segunda ronda a menos que el resultado
de la primera sea (D1,D:J, en cuyo caso jugar b". Del mismo modo, en
Definición. En e/juego repetido finitamente G(T), un sllbjllego que empieza en
el juego. repetido en dos etapas basado en la figura 2.3.3, la estrategia
la etapa t + 1 es e! juego repetido en e! que G se juega T - t veces y que designamos
de cada Jugador consta de diez instrucciones, una decisión en la primera
por G(T - t). Exist~ muchos subjuegos que empiezan en la etapa t + 1, uno para
etapa y nueve decisiones contingentes en la segunda etapa, una para cada
cada una de las posibles historias de! juego hasta la etapa t. En e! juego repetido
resultado posible de la primera etapa. Recordemos que al analizar el
infinitamente G(co,8), cada subjuegoque empieza en la etapa t + 1 es idéntico
94 / JUEGOS DINÁMICOS CON INFOI~MAClÓN COMPLETA (e. 2) ¡liegos "e¡'e/idos / qs
al juego original G(oo,o). Como en el caso con horizonte finito, existen tantos (Dl,Dz). Si el jugador adopta la estrategi~ del disparador p~ra el juego
subjuegos que empiezan en la etapa t + 1 de G(oo,o) como posibles historias del entonces (i) las estrategias del Jugador en un subluego de la
comp leto , 1
juego hasta la etapa t. . era clase son de nuevo la estrategia del disparador, que ya 1e11l0S
nm
Pd strado que es un equilibrio de Nash del juego completo, y (H) la,s
emo . 1 t
Obsérvese que la t-ésima etapa de un juego repetido no es por sí misma estrategias del jugador en un juego de la segunda clase son slmp eme:1.e
un subjuego del juego repetido (suponiendo que t < T en el caso finito). repetir en lo sucesivo el equilibrio del juego de etapa (1¡,1z), que e: ~a,~blen
Un subjuego es una parte del juego original que no sólo empieza en un un equilibrio de Nash del juego completo. Por tanto, un eqmhbllo. de
momento en que la historia del juego hasta entonces es información del Nash en las estrategias del disparador del dilema de los presos repetido
domino público entre todos los jugadores, sino que también incluye todas infinitamente es perfecto en subjuegos.
las decisiones posteriores a ese rnome~toen el juego original. Analizar la
t-ésima etapa aisladamente sería equivaierit~a considerar la t-ésima etapa Ganancia al jugador 2
corno la etapa final del juego repetido .. Tal análisis podría llevarse a cabo
pero no sería relevante para el juego repetido original.
Estamos ahora preparados para la definición de equilibrio de Nash (0,5)
El equilibrio de Nash perfecto en subjuegos es un refinamiento del Aplicamos seguidamente argumentos análogos al juego repetí.do infi-
equilibrio deNash. Es decir, para ser perfecto en subjuegos, las estrategias 'nitamente G(oo,o). Estos argumentos conducen al teorema. de Fnedman
de los jugadores deben ser primero un equilibrio de Nash y pasar luego (1971) para juegos repetidos infinitamente. Para enunciar' el teorema, ne-
una prueba adicionaL cesitarnos dos últimas definiciones. Primero, llamamos factIbles a las ga-
Para demostrar que el equilibrio de Nash en las estrategias del dis- nanCIas. (Xl,"" x n ) en ell'uego de etapa G si son una combinación
.
convexa
parador deLdilema de los presos repetido infinitamente es perfecto en (es decir, una media ponderada donde las ponderaciones son no-negativas
subjuegos, debernos demostra'r que las estrategias del disparador cons- y suman uno) de las ganancias a las estrategias puras de. G. El conju.llto
tituyen un equilibrio de Nash en cada subjuego de este juego repetido de ganancias factibles en el dilema de los pres~s de la figura 2..3.6 es la
infinitamente. Recordemos que cada subjuego de un juego repetido infi- región sombreada de la figura 2.3.7. Las gananCIas alas .estra~eglas puras
nitamente es idéntico al juego completo. En el equilibrio de Nash en las (1, 1), (0,5), (4, 4) Y (5, O) son factibles. Otros pagos factIbles mcluyen los
estrategias del disparador del dilema de los presos repetido infinitamente, , ) para 1 < .,x < 4 que resultan de las medias ponderadas de (1,
pares (X,X
estos subjuegos pueden agruparse en dos clases: (i) subjuegos en los que 1) Y (4, 4), Y los pares (y,z) para y + z = 5 Y O < Y < 5, que resl1.ltan.de
todos los resultados de las etapas anteriores han sido (D¡,D2), y (ii) sub- las medias ponderadas de (O, 5) Y (5, O). Los otro~ pares en (el mtenor
juegos en los que el resultado de al menos una etapa anterior difiere de de) la región sombreada de la figura 2.3.7 son medIas ponderadas de las
96 / JUEGOS DfNÁMICOS CON INFORMACIÓN COMPLETA (e. 2)
Juegos repetidos / 97
.
d".,+ u . e.,' + u,2 . e. +
' '"
= d., + 1 _o oei. Como di ?: Xi > ei, debe ocurrir que (di - xi)/(di - ei) < lpara cada i,
de foimá que eI~valormáximo de esta fracción para cualquier jugador sea
(Dad~ ~ue cualquier desviación desencadena la mismarespuest. d 1 también estrictamente menor que 1.
demas Jugad 1" d . '.' , a e os Queda por demostrar que este equilibrio de Nash es perfecto en sub-
. ores, a umca esviación que necesitamos considerar es la '
ventaJosa) Alt ti .' mas juegos. Es deCir,'que las estrategias del disparador deben constituir un
" . ema vamente, Jugar axi proporcionará una ganancia de x.
en esta et~pa y conducirá a exactamente la misma elección entre a. a' equilibrio de Nash en cada subjuego de G(oo,o). Recordemos -que cada
,~I:/~sIguIente ronda. Lla~emos con Vi al valor presente d~ las ga::~ci:~
(e Juego de etapa que el Jugador i recibe por elegir óptimament (h
es
subjuegode 0(00,0) idéntico al propio G(oo,o). En el equilibrio de Nash
con estrategias del disparador estos subjuegos pueden agruparse en dos
Ycada vez t . e a ora clases: (i) subjuegos en los que los resultados de las etapas anteriores han
que enga que hacerlo en lo sucesivo). Si J'ugar a . es o' ti' ':,.,
entonces " X> P mo, sido (axl, .. -: ;a~n), y (ji) subjuegos'en losqué
el resultado de al menoSú.ri¡{
etapa difiere de (axl,' .. ,axn)' Si los jugadores adoptan la estrategia 'del
Vi = Xi + oVi, disparador en el juego completo, (i) las estrategias'dé los jugadores ériun'
,/0 ,) S"1Jugar subjuego de la primera etapa son de nuevo las estrategias del disparador
o V,-,- x - u. adi es. óptimo, entonces
que, tal como acabamos de demostrar, constituyen un equilibrio de Nash
Vi = di + --e.
o del juego completo, y (ii) las estrategias de los jugadores emin subjuegdcle . ....... '
1-0'" la segunda das e consisten simplemente en repetir el eqcilibno~a~IJiiegÓ
como obtuvimos p' ( . de etapa (ael,' .. ,aen), lo que también es un equilibrio de Nash d~l jrieg;;~"
rio no está co 1 ~eVl~ment~. Supongamos que el mecanismo aleato- completo. Por tanto, el equilibrio de Nash conestrategiasciel cfu;Parador
' . rre aClOna o senalmente. Es suficiente entonces que d. sea
la ganancIa mayor a la . d . ., d ' del juego repetido infinitamente es perfecto en subjuegOs.
. '. . meJor. eSVlaClOn el jugador i entre las difere _ ':.." ,
Por tanto, en la pri.. ' . Recordemos el juego deCoumot estático de la sección 1.2.A: Si la
. . m.ra etapa, y en cualqwer etapa tal que todos los resul- cantidad agregada es Q =; ql + q2, el precio de equilibrio es P(Q) = a - Q,
•.
tal:los antenores hayan 'd ( '" , .
. SI o ax] .... ,ax.,.,), la declslOn ophma del jugador i suponiendo que Q < a. Cada empresa tiene un,coste marginal e y no tiene
--------
102 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2)
Jllegos repel idos / 103
costes fijos. Las empresas escogen sus cantidades simultáneamente, En el También podemos preguntarnos qué pueden conseguir las empresas si
único equilibrio de Nash, cada empresa produce una cantidad (a - c)/3; 6< 9/17. Exploraremos los dos enfoques descritos en la sección ante.rior.
a la que llamaremos la cantidad de Cournot y,denotaremos por qc. Dado Determinamos en primer lugar, para un valor dado de ó, la cantIdad
que en equilibrio la cantidad agregada, 2(0. - e)/3 es mayor que la cantidad
más rentable que las empresas pueden producir si ambas siguen una
de monopolio, qm == (a- c)/2, ambas empresas estarían mejor si cada una
produjera la mitad de la cantidad de monopolio, q¡ = qm/2. ~ trategia del disparador que transforman para siempre en la cantidad .de
Cournot después de cualquier desviación. Sabemos que estas estrategIas
Consideremos el juego repetido infinitamente basado en este juego no pueden seguirse con una cantidad tan baja como la mitad ~e la cant~dad
de etapa de Cournot, cuando las dos empresas tienen el mismo factor de de monopolio, mientras que para cualquier valor de 6, repetIr la cantIdad
descuento 6. Calculemos ahora los valores de 6 para los <fue,cuando las de Coumot para siempre es un equilibrio de Nash perfecto en subjuegos.
"
",', dos empresas juegan la siguiente estrategia;. llegamos aun equilibrio de ' Por tanto, la cantidad más rentable que puede darse con las estrategias del
Nash perfecto en subjuegos de este juego repetido infinitamente: ' clispáradoresfáentre q;,{/2 y qc. Para calcular esta cantidad, consideramos
la estrategia del disparador siguiente:
Prog,!ciT la mitad de la cantidad de monopolio, q;'/2, ~n
e! primer periodo. En el t-ésim,o periúdo~producir qm/"Z Producir q* en el primer periodo. En el t-ésimo periodo,
SI ambas empresas han producido qm/2 en cada uno d~
producir q* si ambas empresas han producido q* en cada
los t- 1 periodos anteriores; en caso éúntnirio¡ producir, uno de los t ~,1 periodos anteriores; en caso contrario,
la cantidad de Cournot, qc. ,
producir la cantidad de Coumot, k
Puesto,qu~ e,!argumento e~ paralelo al dado para eldilem~de los pres;s El beneficio de una empresa si ambas juegan q* es (a - 2q* - c)q*, que
de la sección anterior, seremos breves en la discusión. '"
denotaremos mediante 11"*. Si la empresa i va a producir q* en este periodo,
El beneficio qu~ obtiene ~na e~presa cua~doambas producenqm/2 es la cantidad que maximiza los beneficios de la empresa j en este periodo
(a - c)2/8,.que denotaremos por 1r m/2. ~l beneficio deuna empresa cuando es una solución de
ambas producen qc es (a - c)2/9, que denotaremos por 11"c. Finalmente, si
la empresa i vaa producir qm/2 en este periodo, la cantidad que maximiza
max (a, - qj - q* - c)qj.
los beneficios de la empresa j en este periodo es uria sohición de ' _. qj
Exploramos ahora el segundo enfoque, que incluye la amenaza de perfecto en subjuegos, esta estrategia debe ser un equilibrio de Nash en
hacer efectiva la penalización más fuerte creíble. Abreu (1986) aplica esta cada clase de subjuegos. En los subjuegos de colusión, cada empresa
Idea a unos modelos de Cournot más generales que el nuestro, utilizando debe preferir recibir la mitad del beneficio de monopolio en lo sucesivo a
un factor de descuento arbitrario; nosotros simplemel1te demostramos recibir 7f d este periodo y el valor presente por penalización en el periodo
que el enfoque de Abreu permite que en nuestro modelo se obtenga el siguiente:
resultado de monopolio cuando f¡ = 1/2 (que es menor que 9/17). Consi-
1 1 (2.3.3)
deremos la siguiente estrategia del "palo y la zanahoria"): -- . -7r > 7rd + 8V(x).
1-5 2 m_
Producir la mitad de la cantidad de monopolio, qm/2, en En los subjuegos de penalización, cada empresa debe preferir administrar
el primer periodo. En el t-ésimo periodo, producir qm/2 el castigo a recibir 71" dp este periodo y empezar de nuevo la penalización
si ambas empresas produjeron qm/2 en el periodo t - 1, en el siguiente periodo:
qm/2 si ambas empresas produjeron x en el periodo t - 1,
Y x en cualquier otro caso. V(x) ?: 7r dp(X) + 5V(x). (2.3.4)
Rotemberg y Saloner (1986 y ejercicio 2.14) estudian la colusión en el W10S salarios más altos podrían inducir a que los trilbajado-
desarro 11ildos , , . .
ciclo económico, permitiendo que la intersección con el eje de abci~as de .' preparados solicitasen empleo en la empresa que los ofrecIelil,
res mejor . ,.
la función de demanda fluctúe aleatoriamente de un periodo al otro. En o podrían inducir a los trabajadores ya empleados a trabajar mas mtensa-
cada periodo, todas las empresas observan la intersección con el eje de ab- mente.
cisas de la función de demanda en ese periodo antes de tornar decisiones; Shapiro y Stiglitz (1984) desarrollan un mo.delo ~inámico en el q.ue
en otras aplicaciones,los jugadores observan otras variables de estado l empresas inducen a los trabajadores a trabajar mas pagando salanos
al principio de cada periodo. El incentivo a desviarse de una estrategia :r:os y amenazando con despedir a los que sean descubiertos trabajando
pactada depende tanto del valor de la demanda en este periodo corno poco. Como consecuencia de estos salarios altos, las empresas reducen su
de los posibles valores de la demanda en periodos futuros. (Rotemberg demanda de trabajo, de forma que a1g1.mostrabajadores tendrán empleo
y Salonersuponen que la demanda no está correlacionada serialmente n salarios altos mientras que otros estarán (involuntariamente) parados.
de forma que esta última consideración ,es independiente del valor pre~ ca d ,. 1
Cuanto mayor sea el número de trabajadores para os, mas tIempo e
sente de la demanda, pero otros autores posteriormente han relajado este llevará a un trabajador que haya sido despedido encontrar un nuevo
supuesto.)
empleo, de forma que la amenaza de despido resulta más. efectiva. En
Green y Porter (1984) estudian la colusión cuando las desviaciones el equilibrio competitivo, el salario 'w y la tasa de paro 1J, mduc.en a los
no se pueden detectar perfectamente: en vez de observar las cantidades trabajadores a esforzarse, de tal forma que la demanda de trabajO de las
escogi~~s ~or la otra empresa, cada empresa observa tan sólo el precio empresas al salario lJ) hace que la tasa de desempleo ~ea exactamente 'U,.
de eqwlibno del mercado, que cada periodo recibe sacudidas debidas a Vamos a estudiar los aspectos de este modelo que tienen que ver co~
una perturbación aleatoria inobservable. En este contexto, las empresas los juegos repetidos (pero ignoraremos los relacionados co~ el equilibriq'
no puede,n distinguir cuándo un precio de equilibrio bajo se debe a que competitivo) analizando el caso de una empresa y un trabajador.
una ~ ,mas empresas se han desviado de la estrategia pactada o a que , Consideremos el siguiente juego de etapa. En primer lugar, la empresa
oc:un0 una perturbación adversa. Green y Porter examinan los equili- ofrece al trabajador unsalario,vJ. En segundo lugar, el trabajador a.ceptao
bnos con estrategias del disparador tales que c~alquier precio por debajo rechaza la oferta de la empresa. Si el trabajador rechaza w, se conVIerte en
de un nivel crítico dispara un periodo de penalización durante el cual un trabajador independiente con un salario Wo. Si el trabajador acepta UI,
las empresas juegan sus cantidades de Coumot. En equilibrio, ninguna escoge entre realizar un esfuerzo (lo que le produce una desutilidad e~o no
empresa se desvía. No obstante, una perturbación especialmente mala (lo que no le produce desutilidad). La decisión tornada por el traba~ador
puede hacer que el precio caiga por debajo del nivel crítico, desencade- sobre su esfuerzo no es observada por la empresa, pero lo que el traba)'Jdor
na~do un periodo de penalización. Como algunas penalizaciones ocurren produce es observado tanto por la empresa como por el.!!abajador. La
acc,l~~ntalrnente, las penalizaciones infinitas del, tipo considerado en el producción puede ser alta o baja; para simplificar, suponemos que el
anahSls de las estrategias del disparador no son óptimas. Estrategias de nivel bajo de producción es cero y escribimos, eLnivel~1to como y > O.
dos ~ases del tipo ,analizado por, Abreu podrían parecer prometedoras; Supongamos que si el trabajador realiza un esfuerzo, la producción es ~J,ta
efec?v~mente, Abreu, Pearce y Stacchetti (1986) demuestran que pueden con probabilidad 1, pero que si el trabajador no se esfuerza, la producClon
ser optimas.
es alta con probabilidad p y baja con probabilidad 1 - p. Por tanto, en
este modelo, un nivel bajo de producción es signo inequívoco de falta de
2.3.D Salarios de eficiencia esfuerzo. .tI
empleado en la empresa y realizar un esfuerzo, aunque también le resulta es también análoga a estas estrategias del disparador, pero es ligeramente
m~jor ponerse de independiente a estar empleado en la empresa y no más sutil ya que el trabajador decide en segundo lugar en el juego de etapa
estorzarse. de decisión sucesiva. En un juego repetido basado en un juego de etapa de
El resultado perfecto en subjuegos de este juego de etapa es más decisión simultánea, las desviaciones se detectan sólo al final de la ronda;
bien poco prometedor: dado que la empresa pagaw por adelantado, el sin embargo, cuando el juego de etapa es de decisión sucesiva, una des-
trabajador no tiene ningún incentivo para esforzarse, de forma que la viación del primer jugador se detecta (y debería ser contestada) durante
empresa ofrece w = O(o cualquier w ~ 'Wo) y el trabajador escoge trabajar la misma ronda. La estrategia del trabajador es jugar cooperativamente
como independiente. Sin embargo, en el juego repetido infinitamente, la siempre y cuando todas las jugadas anteriores hayan sido cooperativas,
empresa puede inducir un esfuerzo pagando un salario wsupérior a Wo y pero responder de forma óptima a cualquier desviación de la empresa,
amenazando con despedir al trabajador en cuanto la producción sea baja. sabiendo que el resultado perfecto en subjuegos del juego de etapa se
Demostramos que para algunos valores de los parámetros, la empresa jugará en todas las etapas futuras. En particular, si w 1- w. pero w ~ wo,
encuentra que vale la pena inducir un esfuerzo pagando ese salario. el trabajador acepta la oferta de la empresa pero no se esfuerza.
Uno podría preguntarse por qué la empresa y el trabajador no pueden Derivamos ahora las cond,iciones bajo las cuales estas estrategias son
firmar un contrato c-6mpensatorio que dependa de la producción, deforma un equilibrio de Nash perfecto en subjuegos. Como en las dos secciones
que induzca al esfuerzo. Una razón por la que estos contratos podrían anteriOres, el argumento consta de dos partes: (i) la derivación de las
no ser viables es que a un tribunal le resulta muy dificil. hacer que se condiciones bajo las cuales estas estrategias son un equilibrio de Nash, y '\."
cumplan, quizás porque una medida adecuada de la producción incluye (ü) la demostración de que es perfecto en subjuegos.
la calidad, las dificultades inesperadas en las condiciones de producción, Supongamos que la empresa ofrece w. en el primer periodo. Dada
etc. De un-aforrÍ1.amás general, es probable que loscontf?tos contingen~ la estrategia de la empresa, es óptimo para el trabajador aceptar. Si el
tes a determinadOs volú.menes de producción sean imperfectos (más que trabajador realiza un esfuerzo, está seguro que producirá al nivel alto,
completamente inviables), aunque los incentivos todavía pueden jugar un de forma que la empresa volverá a ofrecer w' yel trabajador volverá a
papel en el juego repetido estudiado aquí. enfrentarse en el periodo siguiente a la misma decisión sobre el esfuerzo
Consideremos las siguientes estrategias en el juego r~petido infinita- a realizar. Por tanto, si la decisión óptima dél trabajador es esforzarse, el
mente, que incluyen el salario 'W. >wo que se determinará más adelante. valor presente de las ganancias del trabajador es
Diremos que la historia del juego es de salarió álto y prod~c2ión alta si todas
las ofertas anteriores han sido 'W., todas las ofertas anteriores han sido Y.: = (w' - e) + 8y':,
aceptadas y todos los niveles de producción anteriores han sido altos. La
o V. = (w' - e)/O - 8). Sin embargo, si el trabajador no se esfuerza,
estrategia de la empresa es ofrecer w = 'W. en el primer periOdo, y ofrecer
producirá al nivel alto con probabilidad p, en cuyo caso la misma decisión
w = 'W. en cada periodo siguiente siempre y cuando la historia del juego
con respecto al esfuerzo se dará en el próximo periodo, pero el trabajador
sea de salario alto, producción alta, pero ofrecer w = Oen caso contrario.
producirá el nivel bajo con probabilidad 1- p,en cuyo caso la empresa
La estrategia del trabajador es aceptar la oferta de la empresa si w ~_ Wo
ofrecerá w = O en lo sucesivo, de forma que en adelante el trabajador
(decidiendo trabajar como independiente en caso contrario) y realizar un
será independiente. Por tanto, si no esforzarse es la decisión óptima del
esfuerzo si la historia del juego, incluyendo la oferta presente, es de salario
trabajador, el valor presente (esperado) de las ganancias del trabajador es
alto y producción alta (no esforzándose en caso contrario).
La ~trategia de la empresa es análoga a las estrategias del dispara-
dor analIzadas en las dos secciones anteriores: jugar cooperativamente V. = w' + {j { pV.+ O -p\. wa_ }
{j'
w
*
2: Wo + '(1
1- p{j
p .
)e == Wo
(1 -
+ 1 + ---
(j
[jO - p)
e
)
(2.3.5)
suficientemente alta para lograr una cooperaclOn sostenIda.
. (j -
Hemos demostrado hasta ahora que si (2.3.5) y (2.3.7) se cumplen, las
Por tanto, para inducir un esfuerzo, la empresa debe pagar no sólo Wo + e .estrategias que estamos considerando son un equilibrio de Nash: .Para
para compensar al trabajador por renunciar a la oportunidad de trabajar demostrar que estas estrategias son perfectas en subjuegos, defJmmos
como independiente y por la desutilidaddel esfuerzo, sino también por primero los subjuegos del juego repetido. Recordemos que cuan~'¡o el
la prima salarial O - {j)e/ [jO - p):NaturaImente, si p está cerca de uno (es juego de etapa obliga a decisiones simultáneas, lo~ subJuegos ~el Juego
',1'
decir, si no esforzarse es difícilmente detectable), la prima salarial debe repetido empiezan entre las etapas del juego repetido. Para el Jue1?ode
ser extremadamente alta para inducir un esfuerzo. Si p == O, por otra parte, etapa de decisiones sucesivas considerado aquí, los subjuegos empIezan
esforzarse es la decisión óptima del trabajador si no sólo entre etapas sino también dentro de cada etapa, después de que el
trabajador observa el salario que la empresa ofrece. Dadas las estrategias
1 (* ) .,. fj de los jugadores, podemos agrupar los subjuegos en dos clases: los que
1 _ 6 w - e 2: w + 1- 6 wo, (2.3.6)
empiezan después de una historia de salario alto y producción alta, y los
análogamente a (2.3.1) y (2.3.2) en los casos con supervisión perfecta de que empiezan después de todas las demás historias. Hemos demosb'ado
las dos secciones anteriores, (2.3.6) es equivalente a ya que las estrategias de los jugadores son un equilibrio de Nash dada
una historia de la primera clase. Queda por hacer lo mismo cor~una
W* >
_wo+ '(1 1- 6)
.+-/5-. e,
historia del segundo tipo: como el trabajador no se esforzará l1\1nca,es
una decisión óptima de la empresa inducir al trabajador a trabajar como
queefectivamenfe es (2.3.5) con p == O. independiente; dado que la empresa ofrecerá V) == O en la siguiente etapa y
Incluso si (2.3.5) se cumple, de forma que la estrategia del trabajador en lo sucesivo, el trabajador no debería esforzarse en esta etapa y debería
sea la mejor respuesta a la estrategia de la empresa, a la empresa tiene aceptar lá oferta presente sólo si 'w 2: O.
también que merecerle la pena pagar w::
Dada la estrategia del trabajador, En este equilibrio, trabajar como independiente es permanente: si se
el problema de la empresa en el primer periodo se c(;mcreta en escoger descubre al trabajador no esforzándose, la empresa ofrece 1J) == O en lo
entre: (1) pagar w == w*, induciendo con ello al esfuerzo y amenazando sucesivo; si la empresa se desvía alguna vez de ofrecer w ==. w*, el t.ra-
co~ ~espedir al trabajador si en algún momento la producción es baja, y bajador nunca volverá a esforzarse, de fiJrma quela empresa no puede
~eclbl~ndo por tanto la ganancia y - w* en cada periodo; y (2) pagar w == O, permitirse emplear al trabajador. Hay varias razC?naspara preguntarse
mdu~l~ndo con ello al trabajador a escoger trabajar como independiente, si es razonable que el trabajo como independiente sea permanente. En
y reCIbiendo de esta forma una ganancia igual a cero en cada periodo. Por nuestro modelo de una empresa y un trabajador, ambos jugadores pre-
tanto, la estrategia de la empresa es una mejor respuesta a la del traba- ferirían volver al equilibrio de salario alto y producción alta del juego
jador si repetido infinitamente, antes que jugar para siempre el resultado perfecto
en subjuegos del juego de etapa. Éste es el problema de la renegociación
y - w* 2: O. (2.3.7)
presentado en la sección 2.3.A. Recordemos que si los jugadores saben que
no se podrán hacer cumplir las penalizaciones, la cooperación inducida
Recordemos que supusimos que y - e > Wo (es decir, que para el trabajador por la amenaza de estas penalizaciones ya no es un equilibrio.
es eficiente estar empleado por la empresa y esforzarse). Necesitamos una En el contexto del mercado de trabajo, la empresa puede preferir no
condición más fuerte si estas estrategias han de formar un equilibrio de renegociar si emplea muchos trabajadores, ya que renegociar con un tra-
Nash perfecto en subjuegos: (2.3.5) y (2.3.7) implican bajador puede estropear el equilibrio de salario alto y producción alta que
1-/5 se está todavía jugando (o aún sé ha de empezar a jugar) con los otros
Y-e>
- 'tilo + ---e
60 - p) , trabajadores. Si hay muchas empresas, la cuestión es si ~aempresa .i con-
,'.
'112 í JUEGOS DlNÁMJCOS CON INFORMACJÓN COMPLETA (c. 2) fllegos repetidos / 113
tratará a trabajadores empleados anteriormente en la empresa .¡. Pudiera la autoridad monetaria observa esta expectativa y escoge el nivel real de
ser que la empresa j no lo hiciera, por miedo a estropear el equilibrio de inflación, -¡r. La ganancia de los empresarios es - (7[- 7[e)2. Es decir,
salario alto y producción alta logrado con sus trabajadores, como en el los empresarios quieren simplemente prever correctamente el nivel de
caso de una única empresa. Algo así puede explicar la falta de movilidad inflación; alcanzan su ganancia máxima (que es cero) cuando -¡r= 7[e. A la .'
~:;,,
de los administrativos jóvenes y varones entre las grandes empresas en autoridad monetaria, por su parte, le gustaría que la inflación fuera cero
Japón. . pero que la producción estuviera en su ruvel de eficiencia (y*). Escribimos
Alternativamente,si los trabajadores despedidos pueden siempre en- la ganancia de la autoridad monetaria como
contrar nuevos empleos que sean preferibles a trabajar como independien-
tes, el salario en esos nuevos empleos (neto de cualquier desutilidad del U(-¡r,y),= ::-C'Tr2 _ (y _y*)2,
esfuerzo) es el que aquí juega el papel del salario en el trabajo por libre
lUo. En el caso extremo en el que un trabajador despedido no sufra nin-
donde el pªiá,meti-o c > O refleja el dilema de laaú,-t?I1d~dITl();l1~;~ria
~n~,~
S115 dos ~lJjeti~os'?llPo!;ga.mos q';le el verdad~!(): !ÚyeI d~ pr,c)~}lc.ción
guna pérdida, no existirán penaliza'ciones por no esforzarse en el juego
repetido infinitamente y, por consiguiente, no existirá ningún equilibrio es i~sigule;tefuIíd¿n del ~velde producción deseado'y de la in£l.ac.i~~
' iIDpfevista'; " , , ,
de Nash perfecto en subjuegos en el que el trabajador se esfuerce. Existe
una aplicación elegante de estas ideas en el contexto de la deuda pública
y =by* + d(-¡r - -¡re),
externa en Bulow y Rogoff (1989): si un país endeudado puede conseguir
el importe de los créditos a largo plazo que recibe de los paíSes acreedores donde b < 1refleja ,la presencia de un poder de monopolio en los mer~
mediante transacciones a corto plazo por adelantado en el mercado inter- cados de productos (de forma. que si no hubiera inflación imprevista; se
nacional de capitales, no hay posibilidad de penaliZ~r eliricumplimiento produCiría a un nivel por debajO del de eficiencia) y d >' O mide el efecto de
de los términos de la deuda en el juego repetido infinitamente entre paíSes la iriflaciQrlin1prevista sobre.la producción a través de los salarios reales;
deudores y acreedores. tal ycomo se describió en el párrafo anterior. Podemos entonces reescribrr
la ganancia de la autoridad monetaria como. .
2.3.E Política monetaria estable en el tiempo
W(-¡r,7[e) = _c-¡r2 - [(b - l)y* +d(-¡r - 7[e)]2.
Consideremos un juego de decisiones sucesivas en el que empresarios y
trabajadores renegocian los salarios nominales, después de lo rualla auto- Para h~llar el resultadop;d~to en subjuego~A~:'~!~'jt;~~9. d~¿~~tp.J~
calculambs primero la elección óptima de-n: por Bme~ela,aut0!fd~9
ridad monetaria escoge la oferta monetaria que, a su vez, determina la tas'a
monetari~¡-a.adas l~s exp~étativas de los einpresarib~ -¡re.MaximiZando
de inflación. Si los contratos salariales no pueden' ser automáticamente
W(-¡r,-¡re) obtenemos
achlalizables, empresarios y trabajadores tratarán de prever la inflaCión
antes de fijar los salarios. Sin embargo, una vez se ha fijado el sala- d '
1l'*(-¡re)
= --:J?[(l - b)y* + d-¡re]. (2.3.8)
rio nominal, un nivel real de inflación superior al previsto erosionará el c+ u-
salario real, haciendo que los empresarios aumenten el empleo y la pro-
Dado qJle.los empresarios prevén que la autoridad monetaria escogerá
ducción. La autoridad monetaria, por tanto, se enfrenta aun dilema al -¡r*(-¡re),
i~$'empresarios escogerán la -¡reque maximice _[-¡r*(7[e)- -¡re]2,lo
tener que escoger entre los costes de la inflación y las ventajas de reducir
que da1r*(-¡re)= -¡re,o,.,
el paro y aumentar la producción ante una evolución impreVista del nivel
de inflación.
-¡re = ---y
d(1 - b) *' = ,-¡r.,
Como en Barro y Cardan (1983), analiZamos una versión en forma c
reducida de este modelo en el siguiente juego de etapa. Primero, los donde el subíndice s denota, "juego de etapa". De forma similar, podría
empresarios forman sus expectativas de inflación, -¡re.En segundo lugar, deCirse que la expectativa' niCiomilque los empresarios deben mantener
~
, ;:~;~~\:i!~W;Ú.;,~,\ ••~r,.lol~J~:~:.i~;~\"1'~'.\I'.I';,;¡,,:,;1;'r,,,,l..l.'~I'
.••.,,.:.,,••;"" ••.:.:"'J.._~' ...•.•.•...•.
~-...:..!...~...:..-'~~L~,I _ •.~I;.l...;.'--:'<'~. ---.---------
nos juegos una de las dos formas es más apropiada que la otra. Vamos a Este árbol empieza con un nodo de decisión correspondiente al jugador
ver cómo los juegos estáticos pueden representarse utilizando la forma ex- 1, donde 1 escoge entre 1 y D. Si el jugador 1 escoge 1,se llega a un nodo
tensiva y cómo los juegos dinámicos pueden ser representados utilizando de decisión del jugador 2, donde 2 escoge entre l' y D'. Del mismo modo,
la forma normal. si el jugador 1 escoge D, se llega a otro nodo de decisión del jugador 2,
Recordemos de la sección l.1.A que la representación en forma normal donde 2 escoge entre l' y D'. Después de cada una de las decisiones de
de un juego requiere precisar: (1) los jugadores, (2) las estrategias posibles 2 se llega a un nodo terminal (es decir, el juego termina) y se reciben las
de cada jugador y (3) las ganancias recibidas por cada jugador para cada gan¡mc;iasindicadas ..
combinación de estrategias posibles. Es inmediato extender el árbol de la figura 2.4.1 para representar
cualquier juego dinámiCo con información completa y perfecta, es decir,
Definición. La representación en fanna extensiva de un juego exige preci~ar: cualquier juego en el queros jugadores toman sus decisiones uno después
(1) los jugadores, (2a) cuándo tiene que jugar cada jtigador,(2b) lo qt{e cada del otro, todas las decisiones previas son información del dominio público
jugador puede hacer cada vez que tiene la oportunidad de jugar, (2c) lo que cada antes de realizar el siguiente movirnientoy las ganancias a los jugadores
jugador sabe cada vez que tiene la oportunidad de jugar y (3) la ganancia recibida con cada combinación factible ,de decisiones son información del domi-
por cada jugador para cada combinación posible de jugadas. nio público. (Los espacios. de-acciones continuos, como en el modelo de
ALmqueno lo dijimos en su momento, eillas secciones 2.1 a 2.3 hemos 5tackelberg, Olos horizontes infinitos, como en el modelo de Rubinstein,
analizado varios j~egos representados en forma extensiva. La contri- presentan dificultades gráficas pero no conceptuales) Deriva~os segui-
bución de esta sección consi~te elldescribir estos juegos en forma deárbol d¡mWl1teJareprese~tfición.en forma ,normal del juego:de la figura 2.4.1.
en vez de utiliZár' palabr~s, porqtie el uso deárbo~es,.~ menudo'facilita C:0l1clpimospOI\últiIIÍ.9esta ~ec;c!9ndt=mostrang,()que los jueglJ,s~~!á~cosc
tanto la explicaci6n co~o el análisis. ' .. , .> .,. - ' .. Plledel1represerÚarse enfofI!la extensiva y descnbiend() cómo represen~ .
Como ejemplo de un juego en formaextensiva, consideremóseI si- tar en formaext~nsiva l()s juegos dinámicos con información ~9rnpleta
glliente representante dé la clase de juegos en dos etapas 'con información pero imperfecta.
completa y perfecta presentada en la sección 2.1.A: Tal como parecen indicar las convenciones sobre nmneración ~l~)as
definiciones de las-formas no,rmaly extensiva, existe una íntiIna relaC;ión
1. El jugador 1 escoge una acción al del conjunto factible Al = {J,D}.
entre las estrategias f¡;ldiblesde un jugador (apartad02)dad.a.s en}a forP:t~
2. El jugador 2 observa al y escoge entonces una acción a2 del conjunto
nornal y la descripcipl1 de cu'ándo dec.ide un jugadorrcqu~'p:ll.~doe'):¡a<;£ú
,42 = {J',D'}.
qp.ésabe(apartados 2ª,?b, 2c) eril? fOI1llaextensiva.;~ani.rep:~~~tar.tiñ
3. Las ganancias son Ul (al,az) y -uz(al,a2), como se indica en el árbol de
juego dinámico en forma normal, necesitamos.h"aducirJ~Wof!!laciónen:
la figura 2.4.1.
forma e?'tensiva en términos de la descripción del espacio de estrategías'
<.. 2,') de cada jugador en la fórma~normal. Para hacer esto, recordemos la
definición de estrategia dada (formalmente) en la sección 2.3.B:
Figura 2.4.2
Defuliciónó Un conju~to de itlfonnación de un jugador es una colección de
nodos de decisió~ que satisface:
.Dados estos espacios dl7estrategias de los dos jugadores, eSÍnil1ediató
",.,' denvar la representación ,en forma normal del juego a partir de surepre- W al jugador le corresponde jugar ett-cada nodo del conjunto de informacióny.
(ii) cuarido en el transcu'rso del juego se llega a 11/1 nodo del conjunto de 111fOl-
¿
120/ JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2) Juegos dinámicos con información completa pero imperfecta / 121
mación, el jugador al que le corresponde decidir no sabe a qué nodo dentro del Como segundo ejemplo del uso de un conjunto de información para
conjunto de infonnación se ha (o no se ha) llegado. representar la ignorancia de las jugadas anteriores, consideremos el si-
guiente juego dinámico con información completa pero imperfecta:
La parte (ii) de esta definición significa que, en un conjunto de información,
el jugador debe tener el mismo conjunto de acciones factibles en cada nodo
de decisión; en caso contrario el jugador seria capaz de inferir a partir del 1. El jugador 1 escoge una acción al del conjunto factible Al = {l,D}.,
conjunto de acciones disponibles si ha llegado o no ha llegado a cierto(s) 2. El jugador 2 observa al y escoge a continuación una acción a2 del
nodo(s). conjunto factible A2 = {J',D'}.
3. El jugador 3 observa si (alA!) = {D,DI} O no y escoge a continuación
Preso 1
una acción a3 del conjunto factible A3 = {I",D"}. -1
4 o 5 1 1 D
4 5 O 1 ':."'
Figura 2.4.3
3
En un juego el! forma extensiva, indicaremos que una colección de
nodos de decisióneonstituye un-conjunto de información con una línea
discontinua, como en la representación en forma extensiva del dilema de
los presos de la figura 2.4.3. Indicaremos a veces a qué jugador- le corres-
ponde mover en los nodos del conjunto de información por medio de una
Figura 2.4.4
leyenda, como en la figura 2.4.3; alternativamente, podemos simplemente
dar nombre a la línea discontinua que une esos'nodos, como en la figura
2.4.4. La interpretación del conjunto de información del preso 2 en la fi- Ahora que hemos definido la noción de conjunto de información, po-
gura 2.4.3 es que cuando al preso 21e corresponde decidir, todo lo que sabe demos ofrecer una definición alternativa de la distinción entre información
es que se ha llegado al conjunto de información (es decir, que el preso 1 perfecta e imperfecta. Definimos previamente la información perfecta di-
ha decidido), pero no a qué nodo se ha llegado (es decir, lo que ha hecho). ciendo que en cada jugada, el jugador al que le corresponde jugar conoce
Veremos en el capítulo 4 que el preso 2 puede tener una opinión de lo que toda la historia del juego hasta ese momento. Una definición equivalente
el preso 1 ha hecho, incluso sin haberlo observado, pero ignoraremos esta es que cada conjunto de información contiene un único elemento: Por
cuestión hasta entonces. el contrario, la información imperfecta significa que existe al menos un'
--~
122 / JUEGOS DINÁMICOS CON INFORMAcrÓN COMPLETA (c. 2) Juegos dinlÍmicos COI1infonl1nóón completa pero imperfecto / 123
cO~j~ntode informaci~n con má~ de un elemento,19Por tanto, la represen- (a) empieza en un nodo de decisión n que sea un conjunto de información con 1111
t~ClQnen forma extensiva de un Juego de decisiones simultáneas (como el único elemento (pero que no sea el primer nodo de decisión del juego),
~lle~a de l~s presos) es un juego con información imperfecta. De forma (b) incluye todos los nodos de decisión y terminales que siguen a n en el árbol
~lml1ar, l~: J~egos en dos etapas estudiados en la sección 2.2.A poseen. (pero no los nodos que no siguen a n) y
l~orm~clOn Imperfecta porque las decisiones. de los jugadores Iy 2 son (e) no intersecta a ningún conjunto de información (es decir, si 1m nodo de
slmultaneas~ como también lo son las decisiones de los jug~dofes 3 y 4.. decisión n' sigue a n en el árbol, todos los otros nodos en el conjunto de
?e forma mas general, un juego dinámico con información co'mpleta pero información que contiene a n' deben también seguir a -n y, por tanto, deben
lm~erfecta~~ede repr,esentarse en forma extensiva utilizandbconjuntos incluirse en el subjuego).
de mformaclOn con mas de un elemento para indicar lo que cada jugador
sabe (y no sabe) cuando le corresponde jugar, tal como hemos hecho en la Debido al comentario entre paréntesis de la parte (a), no contamos el
figura 2.4.4. ." .... ,_. ..", .... ", "
juego completo como un subjuego, pero esto es sólo una cuestión de
" .: '. -- ". - ~
.
estiló: eliirtinar ese comentario entre paréntesis de la definición no tendría
2.4.B Equilibrio de Nash perfecto e~ ~ubjueg~~" ningúri efecto.
~ '-..:. Podemos utilizar el juego de la figura 2.4.1 y el dilema de los presos
En la secció~ 2.3.B di~ós la définición generalder'eqtiilibriOdé~~shper: ~.". de la figura 2.4.3 para ilustrar las partes (a) y (b) de esta definición. En la
fecto .en subJuegos. ~l~ embargo, aplicamos ladefinici6í:lsóloa jueg(Js' . figura 2:4.1 hay dos subjuegos, que empiezan en cada uno de los nodos de
repetido~ porque defimmos' los conceptos de estrategia' ysubjuego sólo' . decisión del jugador 2. En el dilema de los presos (o cualquier otro juego
para los Juego~repetidos. En la secCión2AA dimos la.definición gene" de decisión simultánea) no hay subjuegos. Para ilustrar la parte (c) de la
ral de ,estrategIa. Presentamos ahora la definieióngeneral de subjuego, definición', consideremos el juego de la figura 2.4.4. Sólo hay un subjuego,
despues de lo cual podremos aplicar la definición de equilibrio de Nash el que empieza en el nodo de decisión del jugador 3 que sigue a D por
perfecto en subjuegos a los juegos dinahúcos con inforinación completa parte del jugador 1 y D' por parte del jugador 2. Debido a la parte (c), en
en general. este juego ningún subjuego empieza en ninguno de los nodos de decisión
del jugador 2, aun cuando estos dos nodos son conjuntos de información
, Recordemos que en la sección 2.3.Bdefinimos inforinalmertte un sub-
jue.go como la parte del ju~g,?que'q\teda'pórjugatecipeZáIldbeit cual- . de un único elemento.. .
"Vná trtanera de motivar la parte (c) consiste en áfumar que queremos
qUl~r momento en el que lá.~~storia éOrripletadeljuego has~a eritonces
poder ari~liiar ili1subju~gcipor sí mismo y que qti~rem6s que el a'náiisi's
sea mfo~~.c!6n deldoiriinióp~b~C~ entretbdosiosjugádor~tydiinós
un~ defimclOn formal en el caso de los juegos répetidos,que"eht6nces searei~vaiít~pai~el juego completo. En la figura 2.4.4, si intentáramos
definir un:'subjuego que empezara en el nodo de decisión del jugador 2
~stabam~s, co~sideran.do',Ofrecemos ahora una. definicióh fdrmál' para
Juegos dmarrucos con mformación completa en genera], en téI111iri6sdé la qué sigue a la decisión I del jugador 1, estaríamos creando un subjuego en
representación e.nforma extensiva del juego. el que el jugador 3 ignora la decisión del jugador 2 pero conoce la deeislón
del jugador.1. Tal subjuego no sería relevante para el juego completo
porque en ~ste lÍltimó el jugador 3 no conoce la jugadade 1, sino que tan
Definición. Un subjuego en un juego énforina extensiva
-~.--:': sólo observa si (0.1,0.2) = {D,D/} o no. Recordemos el argumento parecido
porelqlleEÚ-fsimojuego de etapa de 1.111 juego repetido no es en sí mismo
19 . '. ":.~:;C >0 ••••••••
, Est~ ~aracterización de la informaaón perfecta e imperfecta en términos de 20njuntos de un stihjUegodeljuego repetido, suponiendo en el caso finito que t < T.
informaaon con ~o o más elementos está restringida a los juegos cón info~ació" complet; Otra m'anerade motivar la parte (c) es dándonos cuenta de que la
~~~te, com~.veremos en el c~pítulo,4, la ,repre~:,n;a,~ón.."n fonTlae.x.\é~~~~<'l'd{~ ju~i¿. parte (a) sólo garantiza que el jugador al que le corresponde jugar en el
formaclOn perfecta pero Incompleta tiene un conjunto de informaciÓn cóf(inái; dé' uti .
elemento. En este capítulo, sin embargo, restringimos nuestra atención a la infbrmacióh nodo n conoce la historia completa del juego hasta ese momento, no que
completa. ., los demás jugadores también conozcan la historia. La parte (c) garantiza
12~ / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2) JlIegos dinámicos con información completa pero imperfecta / 125
que la historia completa del juego hasta ese momento sea información del Hemos encontrado ya dos ideas íntimamente ligadas al equilibrio de
dominio público en el siguiente sentido: en cualquier nodo que sigue a Nash perfecto en subjuegos: el resultado por inducción hacia atrás defi-
/1, digamos ni, el jugador al que le corresponde decidir,en ni sabe que el nido en la sección 2.1.A y el resultado perfecto en subjuegos definido en
juego llegó al nadan. Por tanto, incluso si ni pertenece a un conjunto de la sección 2.2.A. En términos informales, la diferencia es que un equili-
información con más de un elemento, todos los nodos en ese conjunto de brio es una colección de estrategias (y una estrategia es un plan completo
información siguen a n, de forma que el jugador al que le corresponde de acción), mientras que un resultado describe lo que pasará sólo en las
decidir en ese conjunto de información sabe que el juego ha llegado a un contingencias que se espera que se den, no en cada posible contingencia.
nodo que sigue a n. (Si las dos últimas afirmaciones parecen difíciles es en Para ser más precisos sobre esta diferencia entre equilibrio y resultado, .....
"
parte porque la representación en forma extensiva de un juego especifica y para ilustrar.la noción de equilibrio de Nash perfecto en subjuegos,
lo que el jugadori sabe en cada uno de sus nodos de, decisión, pero no !econs~deramos ahora los.juegos definidos en las secciones2.1.A y 2.2~A.
hace explícito lo que el jugador i sabe en los nodoséfe decisión de j,)
Como se ha descrito anteriormente, la figura 2.4.4 ofrece un ejemplo de Definición. En el juego en dos etapas con información completa y perfecta
cómo podría no cumplirse la parte (c). Podemos ahora reinterpretar este definido en la sección 2.1.A, el resultado por inducción hacia atrás es (aj',R2(aj'»
ejemplo: si caracterizásemos (informalmente)1o que el jugador 3 sabe pero el equilibrio de Naslz perfecto en subjuegos es (aj',R2(al».
en el nodo de decisión del jugador 2 que sigue a la decisión 1 por parte
del jugador 1, diríamos que 3 no conoce la: historia del juego .hast~ ese .C;.,
En este juego, la acción aj' es una estrategia del jugador 1 porque sólo
momento, ya que 3 tiene otros nodos de decisión en lasque 3no sabe sil -hay una contingencia en la que le puede corresponder actuar, el principio
jugó 1 o D. ~;.
del juego. Sin embargo, del jugador 2, R2 (aj') es una acción (concretamente
Dada la definición general de subjuego, podemos;ahora aplicar la la mejor respuesta de 2 a aj') pero no una estrategia; porque unaestrate~
definición de equilibrio de Nash perfecto en subjuegosde la sección 2,3.B. gia para el jugador 2 debe especificar la acción que 2 tomará después' de
cualquier posible decisión de 1 en la primera ronda. La función de mejor "
1',.,
Definición. (Selten 1965):Un equilibrio de Nash es perfecto en subjuegos si las respuesta R2(al), por otro lado, es una estrategia del jugador 2. En este
estrategias de los jugadores constituyen un equilibrio de Nash en cada subjuego. juego, los subjuegos empiezan (y terminan) con el moVimiento del juga-
dor 2 en la segunda etapa. Hay un subjuego para cada acciónfactible,'al
Es inmediato demostrar que cualquier juego dinárrlicü:finito con.infor-
en Al, del jugador L Para demostrar que (aj',R2(al» esUILequilibrio de
mación completa (es decir, cualquier juego dinámico en él q~~ iffi ~&nero
Nash perfecto en subjuegos, debemos por tantodemostraI,que (aj' ;R2(at»"
finito de jugadores tiene un conjunto de estrategias fac~:I:>.!eSftriit~ri:jéné
es un equilibrio de Nash y que las estrategias de losjugadoresconstitu~
un equilibrio de Nash perfecto en subjuegos"posiblemenh~ co~ e'stnltegias
yen un equilibrio de Nash en cada uno de estos subjuegos ... Como los
mixtas. El argumento procede por: construcción, utilizando un procedi-
subjuegos no son más que problemas de decisión unipersonales, se trata
miento parecido a la inducción hacia atrás, y está basad~. en dos o~stTrva-
de exigir que la decisión del jugador 2 sea óptima en cada subjuego, que
ciones. Primero, aunque presentamos el teorema de Nash en el contexto
es exactamente el problema que la función de mejor respuesta, R2(al),
de juegos estáticos con información completa, éste se extiend~ a'todo
juego finito en forma normal con informaciÓn complef~, y hemos visto
(donde un subjuego es un subjuego menor si na contiene más subjuegos). Sustituyamos
que estos juegos pueden ser estáticos o dinámicos. En segundo lugar, un entonces cada t¡no de estos ~up¡I.l~¡;'?~,!??rl~~ g~~S~!ls.de. uno d~7~ equilibrios de Nash. i"
juego dinámico finito con información completa tiene llÍl nÓínerq)lnito Pensemos ahora en los nodos iniciales de estos ~?:bJ1:'ego~como los nodos temunales en .'
~.'. '
de subjuegos, cada uno de los cuales cumple las hipótesisdelte~r~riía dé una versión truncada del juego Oligfua'I."Tctentiffquerriostodos los subjuegos menores de
Nash.20 . -. - '. este juego truncado que contengan estas nadas' ~e~es Y: sustituyamos cada uno de estos
subjuegos con las ganancias de.uno _~~~us equilib~os de Nash. ProcedIendo de esta forma
:~
hacia atrás a lo largo del árbol, s<;9~tje,'!t¡ur ~qUlli~~o ~e Nash perfecto en sub¡uegos,porque
20 Para construir un equilibrio de Nash perfecto en ~ubjuego's,identifiquemos primero las estrategias de los jugadores con~tit;uY~)l, uneqllilibno de Nash (de hecho, un eqUlhbno de
t"dos los subjuegos menores que contienen nodos terminales en el árbol del. juego original Nash perfecto en subjuegosl en cada subjuego.- .
'<.;'
JlIegos di17ál17icos C017 i17forl17aeió17 completa pero imf,,:rfeela /127
126 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2)
terminal, mientras que el equilibrio también especifica la trayectoria en es equivalente a forzar al jugador a considerar una posible con~ngencia
negrita adicional que emana del nodo de decisión del jugador 2 que sigue a en la que le correspondería jugar, ya que si en el transcurso del Juego se
la decisión 1del jugador 1. Es decir, el equilibrio especifica una estrategia llega a ese conjunto de información, el jugador no sabe si se ha ~~~ado ~
completa del jugador 2. ese nodo de decisión o no, precisamente porque el nodo de deClslOnesta
contenido eh un conjunto de información con más de un elemento.
Pero, ¿qué pasa con el otro equilibrio de Nash, (/(D',D'»? En este
equilibrio, la estrategia del jugador 2 es jugar D' no sólo si el jugador 1 Una forma de tratar él problema de los conjuntos de información co~
escoge I (como también ocurría en el primer equilibrio) sino también si el más de un elemento cuando se utiliza inducción hacia atrás, es proce'-
der hacia atrás a lo largo de la forma extensiva hasta que se encuentre ::.:',,,
jugador 1 escoge D. Dado que D' (si sigue a D) conduce a una ganancia
de Odel Jugador 1, la mejor respuesta de 1 a esta estrategia por parte del un conjunto de información con más de un elemento, pero saltándoselo
Jugador 2 es jugar I, consiguiendo con ello una ganancia de 1 (después de y siguiendo haóh arriba"en el árbblha~ta ~~~~nt;:ar~S~~!~t6'~e,,~r;:,.
que el jugador 2 escoja D'), que es mejor que O. Utilizando un lenguaje formación con unúniw elemento. Uegados ahíhabra que consIdera::'.
vago pero sugerente, podría decirse que el jugador 2 está amenazando no sólo lo que el jugador al que le corresponde jugar ené~ecónjUrit'ó"
con jugar D' si el jugilPor 1 juega D. (Estrictamente hablando, 2 no tiene de información con unúnicQ elemento haría'si sealCanzase:ésé itodó"de
la ~~ortu~idad de llevar a cabo esta amenaza antes de que 1 escoja una decisión, sino también la acción que tomaría el í~ga:dár al que le'córres~
acclOn. SI la tuviera, estaría incluida en la forma extensiva.) Si esta ame- ponde jugar en cada ~o de los conjuntos de informacióIl.c'o~.'~~~~e.~
naza funciona (es decir, si 1 escoge jugar I), 2 no tiene la oportunidad de elemento que se han saltadO. "En térininospoco foIirlálés, este procedi~
llevar a cabo su amenaza. Sin embargo, la amenaza no debería funcionar miento proporciona un ~qiiilibrio de NashI'erféctd'en~subjuego~::}:J-:iíá
ya que no es creíble: si al jugador 2 se le diera la oportunidad de llevarl~ segunda manera de tratar el problema 'es proceder' haCi~atrás:<¡Íiló"Ya:rIfó
a cabo (es decir, si el jugador 1 jugara D), 2 decidiría jugar I' antes que D'. de la forma extensiva hasta 'encontrar un conjÜrito'dé-infomúiéioIi:'con ','.'
De un modo más formal, el equilibrio de Nash U,(D',D'» no es perfecto más de un elemento; Forzar entcmces al jugador'alqüe're"corrésp6fiCI~
(: '
en su.bjuegos, porque las estrategias de los jugadores no constituyen un jugar en ese conjunto' de illforma'cióna considerarlo qiieha'riiaellegarsi~
a ese conjunto de inforinádón:(Hacer esto requiere que eljugadot.tengá: .;:'
eqUlhbno de Nash en uno de los subjuegos. En particular, la elección de
D' por parte del jugador 2 no es óptima en el subjuego'que empieza (y una valoración probabilisticá'con reSpecto a:que'nodoseha;lle'g~d~e~:el
acaba) en el nodo de decisión del jugador 2 que sigue a la decisión D del conjunto de información.,Tal~ valoración dependerá Il.a~~eri~é~é,rá~
jugador 1. posibles decisiones de lo~ jugadores 'queestán pór~Círiia'~J:l!.:ékªf:tt~Y.,';g~'~
forma que una pasada de abajo arriba a.la lárgo deláTbol1ÍtiliZáhá:(l~st~:é.; " ,•....
En un juego con información completa y perfecta, la inducción hacia
método no puede proporcionar una solución-),~n.t~os'inf()iin~~I
atr~s elimina las amenazas que no son creíbles. I?ado que cada conjunto ,,'" -,
este procedimiento proporciona un equilibrio bayesiano perfedo.{véáse
de mformación contiene un único elemento, cada nodo de decisión del
árbol representa una contingencia posible en la que podría corresponderle capítulo 4).
actuar a un jugador. El proceso de moverse hacia atrás a lo largo de la
forma extensiva, nodo a nodo, se concreta por tanto en forzar a cada
2.5 Lecturas adicionales
jugador a considerar llevar a cabo todas y cada una de las amenazas que
.•..-•.,
el Jugador pudiera hacer. En un juego con información imperfecta, sin
Sección 2.1: Sobre los salarios y el empleo en empresas con fuerte ~pl~~:
embargo, las cosas no son tan sencillas, ya que tales juegos co'ntienenal
tación sindical, véase ~ m~d~k, de negociación repetida en.Espinosa y
men~s ~n conjunto de información con más de un elem'ento. Aquí se
Rhee (1989; ejercicio 2,lO}y un'modelo de tina única negociación en el que
podna mtentar el mismo enfoque: proceder hacia atrás a lo largo de la
las empresas pueden escoger negociar sobre salarios y empleo o sólo sobre
forma extensiva y alcanzar eventualmente un nodo de decisión contenido
salarios, en Staiger (199¡), Sobre la negociación sucesiva, véase un modelo
en un conjunto de información con más de un elemento. Pero forzar al
al estilo de Rubinstein de negóciación entre una empresa y un sindicato en
jugador a considerar lo que haría si se llegase a ese nodo de decisión no
Ejercicios / 131
130 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2)
2.6 Ejercicios
recibe ganancia alguna antes de que el proyecto se haya podido terminar. otro difícil (D), y que la preparación es útil en los dos empleos, pero más
El coste que queda hasta que el proyecto se complete es R. Ninguno de . en el difícil: YDO < YEO < YES < YDS, donde Yij es lo que el trabajador
los socios puede comprometerse a hacer aportaciones futuras de cara a produce en el trabajo 'i (= E o D) cuando el trabajador tiene un nivel de
completar el proyecto, de forma que deciden establecer el siguiente juego preparación de j (~ O o S). Supongamos que la empresa puede compro-
de dos periodos: En el periodo 1 el socio 1 escoge contribuir con el de cara meterse a pagar salarios diferentes en los dos empleos, 'WE y 'WD; pero
a completar el proyecto. Si esta contribución es suficiente para completar ningl,J.n9de estos dos salarios puede ser menor que el salario alternativo
el proyecto, el juego se acaba y cada socio recibe V. Si esta contribución no del trabajador, que normalizamos a cero.
es suficiente para completar el proyecto (es decir, Cl < R), en el periodo El desarrollo temporal del juego es el siguiente: En el momento O la
2 el socio 2 escoge contribuir con C2con el fin de completar el proyecto. empresa escoge 'WE y 'WD Yel trabajador observa estos salarios. En el ~~-
Si la suma (sin descontar) de las dos contribuciones es suficiente para mento 1 el trabajador entra a formar parte de la empresa y puede adqumr
completar el proyecto, el juego acaba y cada socio recibe V. Si la suma el nivel de preparación S a un coste C. (Ignoramos laproducción'y los
es insuficiente para completar el juego, éste termina y ningún socio recibe salarios en el primer periodo. Puesto que el trabajador no ha adqUirido
nada. aún la preparación, lo eficiente es que se le asigne el trabajo E.) Suponga-
Cada socio debe obtener el dinero con el que contribuye a financiar mos que YDS - YEO > e, de forma que al trabajador leconyiene adquirir
el proyecto de otras actividades lucrativas. La forma óptima de hacerlo la preparación. En el momento 2 la empresa observa si el trabajador ha
es sacar primero dinero de las alternativas menos rentables. El coste (de adquirido o no la preparación y decide entonces si concederle el ascenso
oportunidad) que resulta de una contribución es, por tanto, convexo con al trabajo D o no durante el segundo (y último) periodo de empleo qel
respecto al tamaño de la contribución. Supongamos que el coste de una trabajador.. "".':-
contribución e es e2para cada socio. Supongamos que el socio 1 descuenta Los beneficios de la eID:presa en el segundo periodo son Yij- 'W;,
los beneficios del segundo periodo de acuerdo con el factor de descuento donde el trabajador realiza el trabajo 'i y tiene un nivel de preparación j.
5. Calcúlese el único resultado por inducción hacia atrás de este juego La ganancia del trabajador por realizar eltrabajo i en el segundo periodo
de contribuciones de dos periodos para cada trío de parámetros (V,R,5); es 'Wi o 'Wi - e, dep.endiendo de si el trabajador se ha preparado o no en el
véase el caso con horizonte infinito en Admati y Perry (1991). primer periodo. Hállese el resultado por inducción hacia atrás, Véase un
modelo más complejo en Prendergast (1992).
2.5 Supongamos que una empresa quiere que un trabajador adquiera !.:::' .
0'- .~.
la preparación necesaria para desarrollar una determinada tarea, pero 2.6 Tres oligopolistas operan en un mercado con una demanda inversa
dicha tarea eS tan inconcreta que ningún tribunal podría verificar si el dada por P(Q) = a - Q, donde Q = ql + q2 + q3 Y qj es la cantidad producida:.
trabajador ha adquirido o no la preparación necesaria. (Por ejemplo, por la empresa j. Cada empresa tiene un coste margipal de producción
la empresa podría pedir al trabajador que se familiarizase con "nuestra constante, e, sin costes fijos. Las empresas escogen sus cantidades de la
forma de h¡lCerlas cosas", o se hiciera un experto en "este nuevo mercado siguiente manera: (1) la empresa 1 escoge ql ~. O; (2)las empresas 2y3
en el que podríamos entrar".) La empresa,. por tanto, no puede firmar observanql y escogen entonces simultáneamente q2 y q3 respectivamente.
un contrato para reembolsar al trabajador el coste de esta preparación: ¿Cuál es el resultado perfecto en subjuegos?
incluso si el trabajador adquiere esta preparación, la empresa puede decir
que el trabajador no lo ha hecho, y ningún tribunal podría decidir quién 2.7 Supo~gamos que un sindicato representa en su totalidad a la fuerza
tiene razón. Del mismo modo, el trabajador no puede firmar un contrato de trabajo de todas las empresas de un oligopolio, comO el. Sindicato
para adquirir esta preparación si se le ha pagado por adelantado. .Unido de Trabajadores del Automóvil en el caso de la General Motors,
La empresa podría utilizar, como incentivo para que el trabajador Ford, Chrysler y otras. Sea la sucesión temporal de las jugadas análog~ al
adquiera la preparación, promesas (creíbles) de ascenso de la siguiente modelo de la sección 2.1.C: (1) el sindicato realiza una demanda salanal,
forma. Supongamos que hay dos trabajos en la empresa, uno fácil (E) y "", en todas las empresas; (2) las empresas observan (y aceptan) 'W y las
¡
ti:! I
134 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2) Eje,.cici()~ / 135
ganancias del sindicato escogen simultáneamente los niveles de empleo, resultado perfecto en subjuegos. Demuéstrese que los salarios, nivel de
.Li de la empresa i; (3) las ganancias del sindicato son CIJJ - 71Ja)L, donde 1IJa empleo y beneficios (y, por tanto, también la utilidad del sindicalo y el
es el salario que los miembros del sindicato podrían ganar en un empleo excedente del consumidor) aumentan cuando los aranceles desapilrecen.
alternativo, L = L] + ... + Ln es el nivel total de empleo en las empresas, Véase otros ejemplos en la misma línea, en Huizinga (1989).
y los beneficios de la empresa i son i(w,Lí). A continuación se describen
. losdeterminantes de los beneficios de dicha empresa: todas las empresas 2.10 El juego de decisión simultánea que a continuación se describe se
..tienen la siguiente función de producción: el nivel de producción es igual juega dos veces, habiéndose observado el resultado de la primera etapa
al nivel de empleo; qí = Lí. El precio de equilibrio es P(Q) = Q, - Q antes de que empiece la segunda. No hay descuento. La variable T
cuando la cantidad agregada en el mercado es Q = q] + ... ' + qn. Para no es mayor que 4, de forma que (4, 4) no es una ganancia de equilibrio
complicar las cosas, supongamos que las empresas no tienen más costes del juego jugado una sola vez. ¿Para qué valores de x es la siguiente
que los salariales. ¿Cuál es el resultado petfeéto en subjuegos de este estrategia (jugada por ambos jugadores) un equilibrio de Nash perfecto
juego? ¿Cómo (y por qué) afecta el mimero de empresas a la utilidad del ensubjuegos?
sindicato en el resultado perfectb ..en subjuegos?
Jugar Qí en la primera etapa. Si el resultado de la primera etapa es
(Ql,Q2), jugar Pí en la segunda etapa. Si el resultado de la primera
2.8 Modifiquemos el modelo de torneos dé la sección 2.2.D de forma
.que la producción del trabajadori sea Yí == eí -'- (1/2)8j +Eí, donde Sj 2': ° etapa es (y,Q2) donde y =1 Q], jugar R~ en la segunda etapa. Si el
resultado de la primera etapa es (Q],z) donde z =1 Q2, jugar Si en
representa el sabotaje por parte del jugador j, y la desutilidad del esfuerzo la segunda etapa. Si el resultado de la primera etapa es (y,z)donde
(productivo y destructivo) del jugador i es g(eí) + g(8í), como en Lazear
y =1 Q] y z =1 Q2, jugar Pi en la segunda etapa.
(1989). Demúéstrese que elpremio óptimo WA -W13 es menor que cuando
no hay posibilidad de sabotaje (como en el texto).
2.12 ¿Qué es una estrategia en un juego repetido? ¿Qué es un subjuego en producción de monopolio, ¿cuál es el equilibrio de Nash perfecto en sub-
un juego repetido? ¿Qu¿ es un equilibrio de Nash perfecto en subjuegos? juegos simétrico más rentable al que puede llegarse utilizando estrategias
del disparador?
2.13 Recuérdese el modelo de duopolio de Bertrand estático (con pro-
j'.'
duetos homogéneos) del ejercicio 1.7: las empresas fijan los precios si- 2.16 En el modelo de salarios y nivel de empleo analizado en la sección
multáneamente; la demanda del producto de la empresa i es a - Pi si 2.1.C, el resultado por inducción hacia atrás no es socialmente eficiente.
Pi < Pj, es Osi Pi > Pj y es (a - p¡)/2 si Pi = Pj; los costes marginales son En la práctica, sin embargo, una empresa y un sindicato negocian hoy los
e < a:-Considérese el juego repetido infinitamente basado en este juego términos de un contrato por tres años, renegocian al cabo de tres años
de etapa. Demuéstrese que las empresas pueden utilizar estrategias del los términos de un segundo contrato y así sucesivamente. Por tanto, esta
disparador (que significan jugar para siempre el equilibrio de Nash del . relación se puede caracterizar con más o menos exactitud como un juego
juego de etapa después de cualquier desviación) para mantener--~lnivel repetido, como en Espinosa y Rhee (989)..,-'-"
de precios de monopolio de un equilibrio de Nashperfecto en subjuegos' En este problem~ se denvan condiciones bajo las cuales un eqUilibrio
si ys~lo si O ~ 1/2.' _ de Nash perfecto en subjUegos dél juego repetido infinitamente es superior:
en el, sentido de Paretoal resultado por inducción hacia atrás del juego
2.14 Supongamos que léldemanda fluctúa de formélaleatoria en el juego jugado una sola vez. Denotemos por U* y 'Ir * , respectivamente, la utilidad
de Bertrand repetido infinitamente, descrito en el ejercicio 2.13: en cada del sindicato y los beneficios de la empresa en el resultado por inducción
.periodo, el punto de interacción de la fu~ciónde dema;nda con el eje de hacia atrás del juego jugado una sola vez. Consideremos un par utilidad"-, ,
abcisas es aA. con probabilidad 'Ir.y aB « aA) co~ probabilidad 1 -::'Ir; las beneficio alternativo (U,'Ir) asociado con un par salariá-empleo alteíriatlvó :
demandas en los diferentes perlados son indep~nciientes. Supongamos (w,L). Supongamos que ambas partes tienen elmisinofador de descu~ií.to:
que en cada periodo el nivel de demanda es revelado a ambas empresas O (para cada periodo de tres años). Derívense condiciones sobre (w,L)
antes de que éstas escojan los precios de ese periodo. ¿Cuáles son los tales que: O) (U,'Ir) domine en el sentido de Pareto a (U* ,'Ir:) y(2) (U,'Ir)
niveles de precios de monopolio (P.4 y PB) para los dos niveles de de- sea el resultado de un equilibrio de Nash perfecto en subjuegos del juego
manda? Calcúlese 0*, el fi1enor valorde 8 tal que las empresas pueden repetido infinitamente, donde se juega (U* ,'Ir*) para siempre después de
utilizar estrategias del disparador para mantener estos niveles de precios cualquier desviación. '.- -~
de monopolio (es decir, jugar Pi cuando la demanda es aú para i = A,E) '':'''. ":/."
en un equilibrio de Nash perfecto en subjuegos .. Para cada valor de O 2.17 Consideremos el siguiente juego con horizonte infinIto entre una
entre 1í2 y 0* hállese el precio máximo p(o) tal que las empresas puedan única empresa y una sucesión de trabajadores, cada uno de los cuales vive
utilizar estrategias del disparador para mantener el precio p(o) cuando la durante un periodo del juego. En cada periodo, el trabajador decide. sí
demanda es alta y el precio P B cuando la demanda es baja en lln equilibrio esforzarse y producir por tanto a un nivel y con un coste por elesfuerzo
de Nash perfecto en subjuegos. (Véase Rotemburg y Saloner 1986.) de c, o no esforzarse, no producir nada y no incurrir en ningún coste. Lo
que se produzca es propiedad de la empresa, peto ésta puede compartirlo
2.15 Supongamos que hay 11 empresas en un oligopolio de Cournot. La con el trabajador pagándole un salario como se describe a continuación:
demanda inversa viene dada por P(Q) = a - Q, donde Q = q} + ... + q,.. supongamos que al principio del periodo el trabajador dispone de una
Consideremos el juego repetido infinitamente basado en este juego de oportunidad alternativa con un valor de cero (neto del coste por el es-
etapa. ¿Cuál es el valor menor de -O tal que las empresas pueden utilizar fuerzo) y que no se puede obligar al trabajador a aceptar un salario por
estrategias del disparador para mantener el nivel de producción de mo- debajo de cero. Supongamos también que y > c de forma que esforzarse
nopolio en un equilibrio de Nash perfecto en subjuegos? ¿Cómo varía la es eficiente.
respuesta al cambiar -n? ¿Por qué? Si (j es demasiado pequeño para que Dentro de cada periodo, el desarrollo temporal es el siguiente: pri-
las empresas utilicen estrategias del disparador para mantener el nivel de mero el trabajador escoge un nivel de esfuerzo, a continuación tanto la (;::-:-'
:~
138 / JUEGOS OlNÁMICOS CON INFORMACIÓN COMPLETA (c. 2) Refrrencias /\39
empresa corno el trabajador observan el nivel de producción y finalmente de Nash en estrategias puras? ¿Cuál es el resultado por inducción hacia
la empresa escoge un salario para pagar al trabajador. Supongamos que , 7 'Cuál es el equilibrio deNash perfecto en subJuegos?
atraso ¿
no existe manera de hacer cumplIr los contratos salariales: no hay nin-
guna restricción sobre la elección del salario por parte de la empresa. 2.22Proporciónense las representaciones en for~~ae;xtensiva y,nonnal del
En el juego de un periodo, sin embargo, perfección en subjuegos implica . d 1 pánico bancario discutido en la seCCIOn2.2.B. ¿Cuales son Jos
que la empresa ofrecerá un salario de cero produzca lo que produzca e! Juego e .. 7
equilibrios de Nash perfectos en subjuegos en estrategIas puras.
trabajador, de forma que el trabajador no se esforzará.
Consideremos ahora el problema con horizonte infinito. Recordemos
2.23Un comprador y un vendedor desearían realizar un intercambio. An-
que cada trabajador vive sólo por un periodo. Supongamos, sin embargo,
tes de hacerlo, el comprador puede efectuar una inversión que aumenta
que al principio del periodo t, la historia del juego hasta el periodo t - 1 es
el valor que asigna al objeto a intercanlbiar. Esta inversión no pued: ser
conocida por el trabajador que trabajará eh el periodo t. (Pensemos como'
observada por el comprador y no afecta el valor que el vendedor aSIgna
si esta información.setransrnitiese de generación a generación entre los
al objeto; que normalizamos a cero. (Como ejemplo, pensel~~osen una.
trabajadores.) S)lpongamosque)a empresa descuenta el futuro de acuerdo
empresa que compra otra. En algún momento antes de la [uslon, el com-
con el factor de 'descuento 5 por periodo; Descnoanse las estrategias de:
prador podría haber actuado en el sentido de cambiar los productos que
la empresa y de cada trabajador en un equilibrio perfecto en subjuegos
su empresa planea introducir en el mercado de forma que se complemen~
del juego cOllhorizonte infinito en las que en equilibrio cada trabajador
ten después de la fusión con los productos de la ~mpr~sa comprada. SI
se esfuerza y produce por tanto a un niyely, siempre y cuando el factor
el desarrollo de un producto lleva tiempo y el CIclovItal del producto
de descuento sea lo suficientemente alto. Dése una condición necesaria y
es corto, no hay tiempo suficiente para que el comprador lleve ~ ~a~o
suficiente para ,que su equilibrio exista.
esta inversión después de la fusión.) Para el comprador el valor IIllClal
del objeto es v > O; una inversión de 1 aumenta est~ v~lor a '/)+ 1, ?ero
2.18 ¿Qué es una estrategia (en un juego arbitrario)? ¿Qué es un conjunto cuesta 12. El desarrollo temporal del juego es el SIguIente: en pnmer
de información? ¿Qué es unsubjuego (eh un juego arbitrario)?
lugar, el comprador escoge un nivel de inversión 1e incurre en el cosle
12, En segundo lugar, el comprador no observa 1pero ofrece vender el
2.19En la versión de tres periodos del modelo de la negociación de Rubins- objeto por un precio p. En tercer lugar, el comprador a~epta o rechaza la
tein analizada en la sección 2.1.D, calculamos el resultado por inducción oferta del vendedor: si el comprador acepta, la ganancIa del comprador
hacia atrás. ¿Cuál es el equilibrio de Nash perfecto en subjuegos? es v + 1- p - 12Y la del vendedor es p; si el comprador rechaza, é~tas
ganancias son _12 y cero respectivamente. Demuéstrese que .no eXIste
2.20 Consideremos las siguientes estrategias.en la versión de horizonte ningún equilibrio de Nash perfecto en subjuegos con estrate?las puras
infinito del modelo de la negociación de Rubinstein. (Recordemos la en este juego. Calcúlese el equilibrio de Nash perfecto en SUbJ1,legos. con
convención notacional de que la oferta (s,1 - s) significa que 'el jugador 1 estrategias mixtas en el que la estrategia mixta del comprador. solo.aSIgna
obtendrá s y el jugador 2 obtendrá 1 - s, independientemente de quien . probabilidad positiva a dos niveles de inversión y la e~trategla mIxta del
haga la oferta.) Sea s. = 1/(1 + ó). El jugador 1 siempre ofrece (s" ,1 - s.) vendedor sólo asigna probabilidad positiva a dos precIOS.
y acepta una oferta (s,l - s) sólo si s ~ ós •. El jugador 2 siempre ofrece
(1 - s. ,s*) y acepta una oferta (.s,l - s) sólo si 1 - s ~ 5s.: Demuéstrese
que estas estrategias son un equilibrio de Nash. Demuéstrese que este
equilibrio es perfecto en subjuegos.
2.7 Referencias
2.21 Proporciónense las representaciones en forma extensiva y normal del ABREU, D. 1986. "Extremal Equilibria of Oligopolistic Supergames." JOlll'1wl
juego de la granada descrito en la sección 2.1. ¿Cuáles son los equilibrios of Economic Theory 39:191-225.
".Ij
"'",'