Sesion XII
Sesion XII
Sesion XII
1
ÍNDICE
1. La matriz de ganancias y las estrategias dominantes
2. El equilibrio de Nash
3. Las estrategias mixtas
4. Los juegos repetidos
5. Los juegos consecutivos
2
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS
En estos entornos de interacción, los agentes tienen que tomar decisiones estratégicas; es
decir, decisiones pensando en las acciones del resto de agentes.
¿Por qué? Porque cuando hay interacción estratégica, una decisión de un agente puede ser
muy buena para él cuando otros agentes han decidido de una determinada manera, pero
muy mala para él si los otros agentes han decidido de otra manera.
3
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LA MATRIZ DE GANANCIAS Y LAS ESTRATEGIAS DOMINANTES
Un juego es una situación de interacción estratégica en la que los agentes tienen que tomar
una decisión estratégica.
Los jugadores de un juego son los diferentes agentes que tienen que tomar decisiones
estratégicas en la interacción.
Una estrategia es una decisión (o conjunto de decisiones) que cada jugador puede tomar en
el juego. Cada jugador debe elegir una entre las varias estrategias factibles.
El resultado que obtenga cada jugador (su utilidad si es un individuo, sus beneficios si es una
empresa, …) depende de las estrategias seguidas por todos los jugadores. Por ello, se
construye una matriz de resultados o matriz de ganancias que nos indica, para cada
conjunto de estrategias que hayan podido elegir los jugadores, los resultados que cada uno
de ellos ha obtenido. 4
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LA MATRIZ DE GANANCIAS Y LAS ESTRATEGIAS DOMINANTES
Ya construimos en Microeconomía I la matriz de ganancias de algunos juegos que
representaban determinadas situaciones que se podían producir en un oligopolio.
- Se incluyen tantas filas como posibles estrategias pueda elegir uno de los jugadores.
- Se incluyen tantas columnas como posibles estrategias pueda elegir el otro jugador.
- En cada casilla de la matriz se ponen los resultados o ganancias que obtengan los
jugadores si se alcanza esa combinación de estrategias (el primer número corresponde a
la ganancia del jugador cuyas estrategias se han puesto en las filas y el segundo número
corresponde a la ganancia del jugador cuyas estrategias se han puesto en las columnas).
Veamos un ejemplo:
5
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LA MATRIZ DE GANANCIAS Y LAS ESTRATEGIAS DOMINANTES
Supongamos dos empresas, A y B, que tienen que decidir si emprenden o no una campaña
publicitaria. La decisión que tome cada empresa afectará a los beneficios de ambas según la
siguiente matriz de ganancias:
Para poder predecir qué resultado alcanzarán los jugadores en un juego, vamos a hacer un
supuesto consistente con lo que hemos hecho implícitamente durante las dos asignaturas
de Microeconomía.
Vamos a suponer que los jugadores son racionales; es decir, que se van a comportar
tratando de conseguir una mayor ganancia y que van a saber realizar los cálculos necesarios
para ello. Además, también supondremos que cada jugador sabe que el otro jugador es
racional (y que sabe que el otro jugador sabe que él es racional, etc…).
Vamos a ver cuál es el resultado esperable del juego anterior bajo este supuesto.
7
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LA MATRIZ DE GANANCIAS Y LAS ESTRATEGIAS DOMINANTES
¿Qué decidirá la empresa A? La empresa A no sabe qué estrategia elige la empresa B, pero:
¿Qué decidirá la empresa B? La empresa B no sabe qué estrategia elige la empresa A, pero:
En este caso, cada jugador tiene una estrategia dominante; es decir, una estrategia que es la
óptima, independientemente de qué haga el otro jugador.
Dos individuos son acusados de un delito, pero las pruebas no son concluyentes. La policía
los mantiene incomunicados en dos celdas y, a cada uno, le plantea el siguiente trato:
- Si uno confiesa y el otro no confiesa, entonces el que confiesa será condenado a 1 año de
cárcel y el que no confiesa será condenado a 10 años de cárcel.
11
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LA MATRIZ DE GANANCIAS Y LAS ESTRATEGIAS DOMINANTES
- Si A cree que B va a confesar, la estrategia óptima para A es confesar porque así obtiene
ganancias de –5 en vez de –10.
- Si A cree que B no va a confesar, la estrategia óptima para A es confesar porque así
obtiene ganancias de –1 en vez de –2.
- Si B cree que A va a confesar, la estrategia óptima para B es confesar porque así obtiene
ganancias de –5 en vez de –10.
- Si B cree que A no va a confesar, la estrategia óptima para B es confesar porque así
obtiene ganancias de –1 en vez de –2.
Ambos tienen estrategias dominantes, por lo que el resultado esperable de este juego es el
equilibrio de estrategias dominantes consistente en que tanto A como B confiesen y
obtengan unas ganancias de -5.
14
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LA MATRIZ DE GANANCIAS Y LAS ESTRATEGIAS DOMINANTES
Supongamos una elección entre únicamente dos partidos políticos, cuyo único objetivo es
obtener el máximo número de votos. Cada partido tiene que elegir entre proponer un
programa de izquierda, de centro o de derecha.
No.
¿Qué decidirá la empresa A? La empresa A no sabe qué estrategia elige la empresa B, pero:
¿Qué decidirá la empresa B? La empresa B no sabe qué estrategia elige la empresa A, pero:
En este juego, no hay equilibrio de estrategias dominantes porque no todos los jugadores
tienen una estrategia dominante.
19
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – EL EQUILIBRIO DE NASH
No es totalmente cierto que A no conozca la decisión que va a tomar B, porque sabe que B es
racional. Y si B es racional, B elegirá su estrategia dominante: hacer publicidad.
Por tanto, como A puede deducir que B elegirá hacer publicidad, A tomará su mejor decisión
para ese caso, que es hacer publicidad. El equilibrio en este caso sería que ambos hagan
publicidad y A obtenga unas ganancias de 10 y B unas ganancias de 5.
20
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – EL EQUILIBRIO DE NASH
¿Hay en todos los juegos al menos un jugador con una estrategia dominante?
No.
Para verlo, consideremos el siguiente juego: dos empresas, 1 y 2, que producen cereales de
desayuno tienen que elegir qué tipo de nuevos cereales sacan al mercado. Los beneficios de
cada empresa dependen de su decisión, pero también de la decisión de la otra empresa, de
acuerdo a la siguiente matriz de ganancias:
21
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – EL EQUILIBRIO DE NASH
¿Qué decidirá la empresa 1? La empresa 1 no sabe qué estrategia elige la empresa 2, pero:
- Si la empresa 1 cree que la empresa 2 va a fabricar cereales crujientes, la estrategia óptima para la
empresa 1 es fabricar cereales dulces porque así obtiene ganancias de 10 en vez de –5.
- Si la empresa 1 cree que la empresa 2 va a fabricar cereales dulces, la estrategia óptima para la
empresa 1 es fabricar cereales crujientes porque así obtiene ganancias de 10 en vez de –5.
¿Qué decidirá la empresa 2? La empresa 2 no sabe qué estrategia elige la empresa 1, pero:
- Si la empresa 2 cree que la empresa 1 va a fabricar cereales crujientes, la estrategia óptima para la
empresa 2 es fabricar cereales dulces porque así obtiene ganancias de 10 en vez de –5.
- Si la empresa 2 cree que la empresa 1 va a fabricar cereales dulces, la estrategia óptima para la
empresa 2 es fabricar cereales crujientes porque así obtiene ganancias de 10 en vez de –5.
En este caso, hay dos equilibrios de Nash: que la empresa 1 haga cereales crujientes y la
empresa 2 haga cereales dulces (con lo que ambas obtendrían unos beneficios de 10), y que
la empresa 1 haga cereales dulces y la empresa 2 haga cereales crujientes (con lo que ambas
obtendrían unos beneficios de 10). 24
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – EL EQUILIBRIO DE NASH
25
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – EL EQUILIBRIO DE NASH
A Juana y Jaime les gustaría pasar juntos la noche del sábado. Sin embargo, tienen gustos
diferentes sobre qué hacer: a Jaime le gusta más la ópera y a Juana la lucha libre (Nota: los
libros cuentan este juego con los roles de género al revés que aquí). La matriz de ganancias
es la siguiente:
26
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – EL EQUILIBRIO DE NASH
¿Qué decidirá Juana? Ella no sabe qué estrategia elige Jaime, pero:
- Si Juana cree que Jaime va a comprar la entrada para la lucha libre, la estrategia óptima
para Juana es comprar la entrada para la lucha libre porque así obtiene ganancias de 2 en
vez de 0.
- Si Juana cree que Jaime va a comprar la entrada para la ópera, la estrategia óptima para
Juana es comprar la entrada para la ópera porque así obtiene ganancias de 1 en vez de 0.
- Si Jaime cree que Juana va a comprar la entrada para la lucha libre, la estrategia óptima
para Jaime es comprar la entrada para la lucha libre porque así obtiene ganancias de 1 en
vez de 0.
- Si Jaime cree que Juana va a comprar la entrada para la ópera, la estrategia óptima para
Jaime es comprar la entrada para la ópera porque así obtiene ganancias de 2 en vez de 0.
Hay dos equilibrios de Nash: que ambos compren entradas para la lucha libre (con lo que
Juana obtendría una ganancia de 2 y Jaime una ganancia de 1) y que ambos compren
entradas para la ópera (con lo que Juana obtendría una ganancia de 1 y Jaime una ganancia
de 2).
29
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – EL EQUILIBRIO DE NASH
¿Hay en todos los juegos al menos un equilibrio de Nash tal y como lo hemos definido?
No.
Para verlo, consideremos el siguiente juego: dos individuos, A y B, deben escribir en un papel
“cara” o “cruz”. Si ambos escriben lo mismo (ya sea “cara” o “cruz”), A gana y recibe 1$ de B.
Si no coinciden (es decir, uno escribe “cara” y el otro “cruz”), B gana y recibe 1$ de A. Por
tanto, la matriz de ganancias es:
30
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – EL EQUILIBRIO DE NASH
- Si A cree que B va a escribir “cara”, la estrategia óptima para A es escribir “cara” porque así
obtiene ganancias de 1 en vez de –1.
- Si A cree que B va a escribir “cruz”, la estrategia óptima para A es escribir “cruz” porque así
obtiene ganancias de 1 en vez de –1.
- Si B cree que A va a escribir “cara”, la estrategia óptima para B es escribir “cruz” porque
así obtiene ganancias de 1 en vez de –1.
- Si B cree que A va a escribir “cruz”, la estrategia óptima para B es escribir “cara” porque
así obtiene ganancias de 1 en vez de –1.
No hay ningún equilibrio, tal y como hemos definido las estrategias hasta ahora. En
cualquiera de las cuatro situaciones, hay algún jugador que no ha elegido la estrategia
óptima, dada la estrategia elegida por el otro jugador.
Hasta ahora hemos supuesto que los individuos elegirían una estrategia pura; consistente
en que cada jugador elige indudablemente una determinada acción.
Sin embargo, hay ocasiones en la que los agentes pueden conseguir mejores resultados
eligiendo estrategias mixtas, que consisten en que el jugador elige aleatoriamente entre las
diferentes estrategias puras basándose en unas probabilidades.
Por ejemplo, una estrategia mixta en el juego de “cara” o “cruz” sería escribir “cara” con una
probabilidad de ¾ y escribir “cruz” con una probabilidad de ¼.
Las estrategias puras son un subconjunto de las estrategias mixtas porque corresponden a
las estrategias mixtas en las que la probabilidad de elegir una acción es 1 y el resto 0.
34
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LAS ESTRATEGIAS MIXTAS
Un equilibrio de Nash en estrategias mixtas es aquella situación en la que cada jugador elige
las probabilidades óptimas de elegir cada una de sus opciones, dadas las probabilidades que
ha elegido el otro jugador.
Además, mientras que como hemos visto hay juegos sin ningún equilibrio en estrategias
puras, todo juego tiene algún equilibrio de Nash en estrategias mixtas.
Vamos a verlo con el juego de “cara” o “cruz” que introdujimos en el subtema anterior.
35
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LAS ESTRATEGIAS MIXTAS
Denotamos por p la probabilidad de que el jugador A elija “cara” y por q la probabilidad de que el
jugador B elija “cara”.
Entonces, las ganancias que obtendría A son: pq + (1-p)(1-q) – p(1-q) – q(1-p) = 4pq – 2p – 2q + 1
36
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LAS ESTRATEGIAS MIXTAS
Como las ganancias que obtendría A son [4pq – 2p – 2q + 1] y A debe elegir el valor de p,
veamos qué valor debería elegir.
Para ello, maximizamos esa función con respecto a p. Es decir, derivamos con respecto a p e
igualamos a 0. Es decir, 4q – 2 = 0.
Como consecuencia, A es indiferente entre qué valor de p elegir si B elige q = ½. Si, por el
contrario, B elige q > ½, la estrategia óptima para A es elegir p = 1. Finalmente, si B elige q <
½, la estrategia óptima para A es elegir p = 0. Podemos representar este hecho con una
curva de mejor respuesta. 37
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LAS ESTRATEGIAS MIXTAS
Como las ganancias que obtendría B son [– 4pq + 2p + 2q – 1] y B debe elegir el valor de q,
veamos qué valor debería elegir.
Para ello, maximizamos esa función con respecto a q. Es decir, derivamos con respecto a q e
igualamos a 0. Es decir, – 4p + 2 = 0.
Como consecuencia, B es indiferente entre qué valor de q elegir si A elige p = ½. Si, por el
contrario, A elige p > ½, la estrategia óptima para B es elegir q = 0. Finalmente, si A elige p <
½, la estrategia óptima para B es elegir q = 1. Podemos representar este hecho con una
curva de mejor respuesta. 38
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LAS ESTRATEGIAS MIXTAS
Podemos ver que la única situación en la que los dos jugadores han elegido la mejor
estrategia dada la estrategia del otro jugador es [p = ½, q = ½] y cada uno obtiene una
ganancia esperada de 0.
39
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LAS ESTRATEGIAS MIXTAS
Vamos a ver que un juego puede tener simultáneamente equilibrios en estrategias puras y
algún equilibrio extra en estrategias mixtas.
Lo vamos a ver con el juego de la “batalla de los sexos” que introdujimos en el subtema
anterior.
Ya habíamos visto que este juego tenía dos equilibrios en estrategias puras,
correspondientes a las situaciones en que ambos compraban entradas para el mismo
evento. ¿Hay algún equilibrio adicional cuando consideramos las estrategias mixtas?
40
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LAS ESTRATEGIAS MIXTAS
Denotamos por p la probabilidad de que Juana elija “lucha libre” y por q la probabilidad de
que Jaime elija “lucha libre”.
Entonces, las ganancias que obtendría Juana son: 2pq + (1-p)(1-q) = 3pq – p – q + 1
41
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LAS ESTRATEGIAS MIXTAS
Como las ganancias que obtendría Juana son [3pq – p – q + 1] y ella debe elegir el valor de p,
veamos qué valor debería elegir.
Para ello, maximizamos esa función con respecto a p. Es decir, derivamos con respecto a p e
igualamos a 0. Es decir, 3q – 1 = 0.
Como consecuencia, Juana es indiferente entre qué valor de p elegir si Jaime elige q = 1/3. Si,
por el contrario, Jaime elige q > 1/3, la estrategia óptima para Juana es elegir p = 1.
Finalmente, si Jaime elige q < 1/3, la estrategia óptima para Juana es elegir p = 0. Podemos
representar este hecho con una curva de mejor respuesta. 42
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LAS ESTRATEGIAS MIXTAS
Como las ganancias que obtendría Jaime son [3pq – 2p – 2q + 2] y Jaime debe elegir el valor
de q, veamos qué valor debería elegir.
Para ello, maximizamos esa función con respecto a q. Es decir, derivamos con respecto a q e
igualamos a 0. Es decir, 3p – 2 = 0.
Como consecuencia, Jaime es indiferente entre qué valor de q elegir si Juana elige p = 2/3.
Si, por el contrario, Juana elige p > 2/3, la estrategia óptima para Jaime es elegir q = 1.
Finalmente, si Juana elige p < 2/3, la estrategia óptima para Jaime es elegir q = 0. Podemos
representar este hecho con una curva de mejor respuesta. 43
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LAS ESTRATEGIAS MIXTAS
Podemos ver que hay tres situaciones en la que los dos jugadores han elegido la mejor
estrategia dada la estrategia del otro jugador. Es decir, hay tres equilibrios de Nash en
estrategias mixtas:
47
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LOS JUEGOS REPETIDOS
En el dilema de los prisioneros, la situación de equilibrio que alcanzaban los jugadores no era
una situación eficiente para ellos:
El equilibrio (además de estrategias dominantes) es que ambos confiesen, pero los dos
estarían mejor si ninguno confesara. El problema es que los incentivos individuales les lleva
a cada uno a confesar. Y, cuando ambos lo hacen, los dos terminan en una situación peor.
48
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LOS JUEGOS REPETIDOS
Por ejemplo, en el caso del oligopolio, aunque es cierto que las empresas tienen la tentación
de incumplir el acuerdo en un momento determinado para así obtener en ese momento
unos mayores beneficios, también saben que esas mayores ganancias se producirán durante
un breve periodo. Rápidamente, el resto de empresas reaccionarán y también bajarán los
precios, consiguiendo para todas las empresas un peor resultado. Ante la tentación de unos
mayores beneficios en un breve periodo, el miedo a perder la reputación hace posible
mantener acuerdos implícitos de colusión durante bastante tiempo.
Vamos a analizar en detalle este tipo de razonamientos con un análisis de los juegos
repetidos. 50
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LOS JUEGOS REPETIDOS
Un juego repetido es una situación estratégica en la que los mismos jugadores repiten la
misma interacción en más de una ocasión.
Es especialmente interesante cuando los jugadores repiten una interacción similar a las que
veíamos hace un momento: situaciones en las que hay un equilibrio de estrategias
dominantes, pero ese equilibrio no es una situación eficiente para los agentes. Haremos el
análisis con el caso de la colusión que veíamos:
51
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LOS JUEGOS REPETIDOS
Para poder mantener el acuerdo de cooperación entre ambas empresas (consistente en elegir
ambas un precio alto) en vez de llegar al equilibrio de estrategias dominantes (consistente en elegir
ambas un precio bajo) es clave que, al repetirse el juego, cada empresa pueda elegir una estrategia
como la siguiente:
En la primera interacción, yo coopero (es decir, en este caso, elijo un precio alto). En las siguientes
interacciones, yo coopero si el otro jugador ha cooperado la interacción anterior, pero si el otro
jugador no ha cooperado en la interacción anterior (es decir, en este caso, ha elegido un precio
bajo), yo no cooperaré en las siguientes x interacciones (x puede variar) estrategia “ojo por ojo”
52
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LOS JUEGOS REPETIDOS
Para ver cuándo una estrategia como esta puede tener éxito, es importante diferenciar si el
juego se va a repetir un número finito o infinito de veces.
¿Qué ocurrirá en la penúltima interacción? Cada jugador es racional y sabe que el otro es
racional. Por eso, cada jugador sabe que, haga él lo que haga en la penúltima interacción, el
otro jugador elegirá la estrategia dominante de no cooperar en la última interacción.
¿Qué ocurrirá en la antepenúltima interacción? Cada jugador es racional y sabe que el otro
es racional. Por eso, cada jugador sabe que, haga él lo que haga en la antepenúltima
interacción, el otro jugador elegirá la estrategia dominante de no cooperar en las dos
últimas interacciones.
Etc …
¿Qué ocurrirá en la primera interacción? Cada jugador es racional y sabe que el otro es
racional. Por eso, cada jugador sabe que, haga él lo que haga en la primera interacción, el
otro jugador elegirá la estrategia dominante de no cooperar en las siguientes interacciones.
Es decir, si un juego como este se repite un número finito de ocasiones (sea cual sea este
número), el resultado es que ninguno de los agentes coopera en ninguna de las
interacciones, eligiendo siempre cada uno la estrategia dominante.
57
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LOS JUEGOS REPETIDOS
En este caso, veamos si puede tener éxito una estrategia como “ojo por ojo” con dos
periodos de castigo.
¿Cuál es la mejor estrategia para cada jugador si el otro jugador elige la estrategia “ojo por
ojo”?
- Si el jugador coopera siempre, elegirá la estrategia en este caso de un precio alto en todas
las interacciones. Como está cooperando siempre y el otro jugador ha elegido la estrategia
“ojo por ojo”, el otro jugador también cooperará siempre y cada uno obtendrá unas
ganancias de 50 en cada interacción.
- Si el jugador elige no cooperar en alguna ocasión eligiendo en este caso un precio alto en
esa interacción, obtendrá en esa interacción unas ganancias de, como mucho, 100. Sin
embargo, el otro jugador, al ver que él no ha cooperado, elegirá no cooperar en las dos
siguientes interacciones. Por tanto, en esas dos siguientes interacciones, él conseguirá unas
ganancias de, como mucho, 10. 59
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LOS JUEGOS REPETIDOS
Como es mejor obtener unas ganancias de 50 en cada interacción que obtener 100 en una
interacción y, como mucho, 10 en las dos siguientes, la cooperación puede mantenerse.
(Hemos asumido implícitamente una tasa de descuento de los beneficios futuros de 0, pero
podría generalizarse el argumento incluyendo una tasa de descuento positiva)
Es decir, si el juego se repite un número infinito de ocasiones, las estrategias “ojo por ojo”
consiguen la cooperación en todos los periodos.
60
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LOS JUEGOS REPETIDOS
Los individuos tenemos una vida finita, por lo que interactuamos entre nosotros un número
finito de ocasiones. En consecuencia, se podría pensar que estamos abocados a terminar en
la situación de no cooperación en las interacciones del tipo “dilema del prisionero”.
Sin embargo, en la práctica estrategias del tipo “ojo por ojo” sí consiguen llevar a la
cooperación entre los agentes económicos. Las razones son dos:
61
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LOS JUEGOS REPETIDOS
Por un lado, los jugadores no siempre son racionales o no siempre saben que el otro es
racional. Analizaremos más en detalle este argumento y sus implicaciones en la Clase 14 del
curso.
Por otro lado, aunque vamos a interactuar un número finito de ocasiones, no sabemos
cuántas veces vamos a hacerlo. Si el juego se va a repetir un número finito de veces, pero los
jugadores no saben cuándo se terminará, el argumento recursivo que antes hemos utilizado
para invalidar las estrategias “ojo por ojo” ya no tiene sentido.
Por ejemplo, en el caso de las empresas de una industria, aunque el número de interacciones
será finito, las empresas desconocen cuándo terminará la interacción. Por tanto, las
estrategias del tipo “ojo por ojo” pueden tener sentido.
62
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LOS JUEGOS REPETIDOS
Esto ocurrirá más probablemente en industrias donde la demanda y los costes sean
inciertos. En ese caso, una empresa puede estimar una demanda y unos costes para el
siguiente periodo por el que crea que el precio del acuerdo de colusión debe ser 50$ por
unidad, pero otra puede tener unas estimaciones diferentes por las que el precio del acuerdo
de colusión debería ser 40$. Cuando cada empresa ponga estos precios, la primera creerá
probablemente que la segunda no quiere cooperar.
63
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LOS JUEGOS REPETIDOS
Las estrategias de señales de precios que veíamos en Microeconomía I tendrán por tanto
más probabilidades de éxito en industrias con demanda y costes bastante estables. Por el
contrario, los acuerdos de colusión serán más difíciles de mantener en industrias con
demanda o costes cambiantes.
1- La industria de contadores de agua en EE.UU. antes de 2012 (en ese año surgen los
contadores “inteligentes”) tenía una demanda muy estable y predecible (debe instalarse un
contador de agua por domicilio, ni uno más ni uno menos) y los costes de producción
también son claros. Si juntamos a eso el hecho de que la entrada en esta industria era muy
difícil por la presencia de grandes economías de escala y que la demanda era inelástica, el
acuerdo de colusión entre las pocas empresas del oligopolio era muy estable y ninguna se
saltaba el acuerdo. 64
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LOS JUEGOS REPETIDOS
2- La industria de transporte aéreo tiene una demanda muy cambiante (es muy diferente dependiendo del
día e incluso de la hora del vuelo) y el coste por billete también es diferente (dependiendo del número de
billetes vendidos en cada avión que se haya decidido fletar). Por tanto, es esperable que en esta industria
los acuerdos implícitos de colusión no sean muy estables. Así ha ocurrido en la historia de este sector:
En 1983, American Airlines dijo que fijaría sus tarifas en base a la distancia entre las ciudades que une
cada vuelo de acuerdo a una tabla simple. Dijo hacerlo para “simplificar la estructura de tarifas y contribuir
a resolver la confusión reinante”. Las demás empresas declararon inmediatamente que harían lo mismo.
Esto es un ejemplo claro de una pauta de liderazgo en la fijación de precios para intentar mantener un
acuerdo colusorio, como los que veíamos en Microeconomía I.
Sin embargo, a las dos semanas, Pan Am bajó sus tarifas. Las demás reaccionaron bajando también sus
tarifas y el acuerdo colusorio se rompió. Algo parecido ocurrió en 1992.
65
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LOS JUEGOS CONSECUTIVOS
Los juegos que hemos analizado hasta ahora en esta clase eran situaciones en la que los
jugadores eligen al mismo tiempo su estrategia o lo hacen sin conocer qué ha elegido el otro
jugador. Estos juegos se conocen como juegos simultáneos.
Sin embargo, hay interacciones estratégicas en las que los jugadores eligen de manera
consecutiva: primero elige su estrategia un jugador y el otro jugador ya conoce la estrategia
que ha elegido el primero cuando le toca elegir. Algunos ejemplos de interacción de este tipo
son el modelo de duopolio de Stackelberg o el modelo de duopolio de empresa dominante
que veíamos en Microeconomía I. Estos juegos se conocen como juegos consecutivos o
juegos secuenciales.
Dos empresas, 1 y 2, de cereales de desayuno tienen que elegir qué tipo de nuevos cereales
sacan. Los beneficios de cada empresa dependen de su decisión, pero también de la decisión
de la otra empresa, de acuerdo a la siguiente matriz de ganancias:
EMPRESA 2
Crujientes Dulces
EMPRESA 1 Crujientes –5, –5 10, 20
Dulces 20, 10 –5, –5
Si el juego es simultáneo, hay dos equilibrios de Nash en estrategias puras y otro equilibrio
de Nash en estrategias mixtas (¿puedes calcularlos?)
67
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LOS JUEGOS CONSECUTIVOS
EMPRESA 2
Crujientes Dulces
EMPRESA 1 Crujientes –5, –5 10, 20
Dulces 20, 10 –5, –5
Para ello, es muy interesante representar el juego, no con la matriz de ganancias, sino con
un árbol de decisiones en lo que se llama representación en forma extensiva del juego.
68
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LOS JUEGOS CONSECUTIVOS
En primer lugar, se coloca al jugador que elige primero (es la “raíz” del árbol de decisiones).
De ese jugador, salen tantos “troncos” como posibles decisiones podría tomar ese jugador.
Al final de cada tronco, ponemos al jugador al que le toca elegir segundo. De ese jugador,
salen tantas “ramas” como posibles decisiones podría tomar ese jugador si el primer jugador
tomó la decisión correspondiente a ese “tronco”. Al final de esas “ramas”, se ponen los
resultados que conseguiría cada jugador si esas son las decisiones que toman los jugadores
(poniendo en primer lugar el resultado del jugador que elige en primer lugar).
69
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LOS JUEGOS CONSECUTIVOS
70
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LOS JUEGOS CONSECUTIVOS
- Si yo, empresa 1, elijo producir cereales crujientes, la empresa 2 elegirá producir cereales
dulces porque así ella, empresa 2, obtiene 20 en vez de –5.
- Si yo, empresa 1, elijo producir cereales dulces, la empresa 2 elegirá producir cereales
crujientes porque así ella, empresa 2, obtiene 10 en vez de –5.
71
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LOS JUEGOS CONSECUTIVOS
Una vez que la empresa 1 ha estudiado cómo reaccionará la empresa 2 a cada una de sus posibles
decisiones, la empresa 1 se da cuenta de que:
- si elijo la estrategia de producir cereales crujientes, yo, empresa 1, obtendré un resultado de 10.
- si elijo la estrategia de producir cereales dulces, yo, empresa 1, obtendré un resultado de 20.
72
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LOS JUEGOS CONSECUTIVOS
Por ejemplo, en el juego que acabamos de ver es mejor elegir primero. El estudiante puede
chequear que, si hubiera elegido la empresa 2 primero, el árbol de decisiones sería diferente
y el resultado sería que la empresa 2 elegiría producir cereales dulces, la empresa 1
reaccionaría produciendo cereales crujientes y obtendrán unos resultados de 20 para la
empresa 2 y 10 para la empresa 1.
Dos empresas con CM1 = CM2 = 0 (y sin CF) que se enfrentan a una demanda de mercado de
Q = 30 – P. Como Q es la cantidad total de mercado, tenemos que la demanda es: P = 30 – (q1 + q2)
- La elección simultánea de cantidades (modelo de Cournot), donde cada empresa producía 10 unidades
y obtenía unos beneficios de 100.
- La colusión, donde cada empresa producía 7,5 unidades y cada una obtenía unos beneficios de 112,50.
- La elección consecutiva de cantidades (modelo de Stackelberg), donde la empresa que elegía primero
(empresa líder) producía 15 unidades y la empresa que elegía después producía 7,5 unidades,
obteniendo unos beneficios de 112,50 y 56,25, respectivamente.
74
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS – LOS JUEGOS CONSECUTIVOS
Podemos representar estas situaciones con una matriz de resultados:
Si las empresas eligen simultáneamente, hay un único equilibrio de Nash, que es la situación
de Cournot.
Sin embargo, hay otras situaciones en las que es mejor elegir segundo:
¿Cuál es el resultado del juego si elige primero el jugador A? ¿Y si elige primero el jugador B?
76