Sesion XII

MICROECONOMÍA II
SESIÓN XII: Las decisiones estratégicas: una introducción a la

teoría de juegos (I)
Profesor: Jorge Alcalde-Unzu
1
ÍNDICE
1. La matriz de ganancias y las estrategias dominantes
2. El equilibrio de Nash
3. Las estrategias mixtas
4. Los juegos repetidos
5. Los juegos consecutivos
2
SESIÓN XII – LAS DECISIONES ESTRATÉGICAS: UNA INTRODUCCIÓN A LA TEORÍA DE
JUEGOS
En muchos contextos económicos, el resultado que consigue un agente económico

depende de las decisiones que él toma, pero también de las decisiones que toman otros
agentes. Por ejemplo, en las situaciones de oligopolio que estudiábamos en Microeconomía
I, el beneficio que obtenía una empresa dependía de sus decisiones sobre precio y
producción, pero también de las decisiones que tomaban el resto de empresas de la
industria.
En estos entornos de interacción, los agentes tienen que tomar decisiones estratégicas; es
decir, decisiones pensando en las acciones del resto de agentes.
¿Por qué? Porque cuando hay interacción estratégica, una decisión de un agente puede ser
muy buena para él cuando otros agentes han decidido de una determinada manera, pero
muy mala para él si los otros agentes han decidido de otra manera.
3
JUEGOS – LA MATRIZ DE GANANCIAS Y LAS ESTRATEGIAS DOMINANTES
Un juego es una situación de interacción estratégica en la que los agentes tienen que tomar
una decisión estratégica.
Los jugadores de un juego son los diferentes agentes que tienen que tomar decisiones
estratégicas en la interacción.
Una estrategia es una decisión (o conjunto de decisiones) que cada jugador puede tomar en
el juego. Cada jugador debe elegir una entre las varias estrategias factibles.
El resultado que obtenga cada jugador (su utilidad si es un individuo, sus beneficios si es una
empresa, …) depende de las estrategias seguidas por todos los jugadores. Por ello, se
construye una matriz de resultados o matriz de ganancias que nos indica, para cada
conjunto de estrategias que hayan podido elegir los jugadores, los resultados que cada uno
de ellos ha obtenido. 4
Ya construimos en Microeconomía I la matriz de ganancias de algunos juegos que
representaban determinadas situaciones que se podían producir en un oligopolio.
Repasemos cómo se construye la matriz de ganancias:
- Se incluyen tantas filas como posibles estrategias pueda elegir uno de los jugadores.
- Se incluyen tantas columnas como posibles estrategias pueda elegir el otro jugador.
- En cada casilla de la matriz se ponen los resultados o ganancias que obtengan los
jugadores si se alcanza esa combinación de estrategias (el primer número corresponde a
la ganancia del jugador cuyas estrategias se han puesto en las filas y el segundo número
corresponde a la ganancia del jugador cuyas estrategias se han puesto en las columnas).
Veamos un ejemplo:
5
Supongamos dos empresas, A y B, que tienen que decidir si emprenden o no una campaña
publicitaria. La decisión que tome cada empresa afectará a los beneficios de ambas según la
siguiente matriz de ganancias:
Explicación de los componentes de la matriz de resultados.
¿Qué resultado puede esperarse de este juego?

6
Para poder predecir qué resultado alcanzarán los jugadores en un juego, vamos a hacer un
supuesto consistente con lo que hemos hecho implícitamente durante las dos asignaturas
de Microeconomía.
Vamos a suponer que los jugadores son racionales; es decir, que se van a comportar
tratando de conseguir una mayor ganancia y que van a saber realizar los cálculos necesarios
para ello. Además, también supondremos que cada jugador sabe que el otro jugador es
racional (y que sabe que el otro jugador sabe que él es racional, etc…).
Vamos a ver cuál es el resultado esperable del juego anterior bajo este supuesto.
7
¿Qué decidirá la empresa A? La empresa A no sabe qué estrategia elige la empresa B, pero:
- Si la empresa A cree que la empresa B va a hacer publicidad, la estrategia óptima para la

empresa A es hacer publicidad porque así obtiene ganancias de 10 en vez de 6.
- Si la empresa A cree que la empresa B no va a hacer publicidad, la estrategia óptima para
la empresa A es hacer publicidad porque así obtiene ganancias de 15 en vez de 10.
Por tanto, la mejor estrategia para la empresa A, independientemente de la decisión de la

empresa B, es hacer publicidad. 8
¿Qué decidirá la empresa B? La empresa B no sabe qué estrategia elige la empresa A, pero:
- Si la empresa B cree que la empresa A va a hacer publicidad, la estrategia óptima para la

empresa B es hacer publicidad porque así obtiene ganancias de 5 en vez de 0.
- Si la empresa B cree que la empresa A no va a hacer publicidad, la estrategia óptima para
la empresa B es hacer publicidad porque así obtiene ganancias de 8 en vez de 2.
Por tanto, la mejor estrategia para la empresa B, independientemente de la decisión de la

empresa A, es hacer publicidad. 9
En este caso, cada jugador tiene una estrategia dominante; es decir, una estrategia que es la
óptima, independientemente de qué haga el otro jugador.
Cuando esto ocurre, es fácilmente predecible que el juego terminará en la situación en la

que ambos jugadores eligen su respectiva estrategia dominante. A esa situación se le llama
equilibrio de estrategias dominantes.
En este caso, el equilibrio de estrategias dominantes es que A y B hagan publicidad y, por

tanto, A obtenga una ganancia de 10 y B una ganancia de 5.
10
Repasemos el juego del dilema del prisionero que veíamos en Microeconomía I:
Dos individuos son acusados de un delito, pero las pruebas no son concluyentes. La policía
los mantiene incomunicados en dos celdas y, a cada uno, le plantea el siguiente trato:
- Si ninguno confiesa, cada uno cumplirá una pena de 2 años.
- Si ambos confiesan, cada uno cumplirá una pena de 5 años.
- Si uno confiesa y el otro no confiesa, entonces el que confiesa será condenado a 1 año de
cárcel y el que no confiesa será condenado a 10 años de cárcel.
11
¿Qué decidirá el prisionero A? A no sabe qué estrategia elige B, pero:
- Si A cree que B va a confesar, la estrategia óptima para A es confesar porque así obtiene
ganancias de –5 en vez de –10.
- Si A cree que B no va a confesar, la estrategia óptima para A es confesar porque así
obtiene ganancias de –1 en vez de –2.
Por tanto, la mejor estrategia para A, independientemente de la decisión de B, es confesar.

12
¿Qué decidirá el prisionero B? B no sabe qué estrategia elige A, pero:
- Si B cree que A va a confesar, la estrategia óptima para B es confesar porque así obtiene
ganancias de –5 en vez de –10.
- Si B cree que A no va a confesar, la estrategia óptima para B es confesar porque así
obtiene ganancias de –1 en vez de –2.
Por tanto, la mejor estrategia para B, independientemente de la decisión de A, es confesar.

13
Ambos tienen estrategias dominantes, por lo que el resultado esperable de este juego es el
equilibrio de estrategias dominantes consistente en que tanto A como B confiesen y
obtengan unas ganancias de -5.
14
Veamos otro ejemplo:
Supongamos una elección entre únicamente dos partidos políticos, cuyo único objetivo es
obtener el máximo número de votos. Cada partido tiene que elegir entre proponer un
programa de izquierda, de centro o de derecha.
Hay 10 electores con ideología de izquierda, 10 electores con ideología de centro y 10

electores con ideología de derecha. Cada uno de estos electores votará al partido político
que proponga el programa político más cercano a su ideología. Si los dos partidos
propusieran el mismo programa, la mitad de electores votaría a cada partido.
¿Hay un equilibrio de estrategias dominantes en este juego? Vamos a hacerlo en la pizarra.

15
¿Hay en todos los juegos un equilibrio de estrategias dominantes?
No.
Para verlo, modifiquemos ligeramente el juego de la publicidad que veíamos hace un

momento:
¿Tienen estrategias dominantes los jugadores de este juego?

16
¿Qué decidirá la empresa A? La empresa A no sabe qué estrategia elige la empresa B, pero:
- Si la empresa A cree que la empresa B va a hacer publicidad, la estrategia óptima para la

empresa A es hacer publicidad porque así obtiene ganancias de 10 en vez de 6.
- Si la empresa A cree que la empresa B no va a hacer publicidad, la estrategia óptima para
la empresa A es no hacer publicidad porque así obtiene ganancias de 20 en vez de 15.
Por tanto, A no tiene estrategia dominante. 17

¿Qué decidirá la empresa B? La empresa B no sabe qué estrategia elige la empresa A, pero:
- Si la empresa B cree que la empresa A va a hacer publicidad, la estrategia óptima para la

empresa B es hacer publicidad porque así obtiene ganancias de 5 en vez de 0.
- Si la empresa B cree que la empresa A no va a hacer publicidad, la estrategia óptima para
la empresa B es hacer publicidad porque así obtiene ganancias de 8 en vez de 2.
Por tanto, la mejor estrategia para la empresa B, independientemente de la decisión de la

empresa A, es hacer publicidad. 18
En este juego, no hay equilibrio de estrategias dominantes porque no todos los jugadores
tienen una estrategia dominante.
Entonces, ¿qué resultado podemos esperar de este juego?
Lo vemos en el siguiente subtema.
19
JUEGOS – EL EQUILIBRIO DE NASH
Veamos qué resultado podemos esperar de este juego:
No es totalmente cierto que A no conozca la decisión que va a tomar B, porque sabe que B es
racional. Y si B es racional, B elegirá su estrategia dominante: hacer publicidad.
Por tanto, como A puede deducir que B elegirá hacer publicidad, A tomará su mejor decisión
para ese caso, que es hacer publicidad. El equilibrio en este caso sería que ambos hagan
publicidad y A obtenga unas ganancias de 10 y B unas ganancias de 5.
20
¿Hay en todos los juegos al menos un jugador con una estrategia dominante?
No.
Para verlo, consideremos el siguiente juego: dos empresas, 1 y 2, que producen cereales de
desayuno tienen que elegir qué tipo de nuevos cereales sacan al mercado. Los beneficios de
cada empresa dependen de su decisión, pero también de la decisión de la otra empresa, de
acuerdo a la siguiente matriz de ganancias:
21
¿Qué decidirá la empresa 1? La empresa 1 no sabe qué estrategia elige la empresa 2, pero:
- Si la empresa 1 cree que la empresa 2 va a fabricar cereales crujientes, la estrategia óptima para la
empresa 1 es fabricar cereales dulces porque así obtiene ganancias de 10 en vez de –5.
- Si la empresa 1 cree que la empresa 2 va a fabricar cereales dulces, la estrategia óptima para la
empresa 1 es fabricar cereales crujientes porque así obtiene ganancias de 10 en vez de –5.
Por tanto, la empresa 1 no tiene estrategia dominante.

22
¿Qué decidirá la empresa 2? La empresa 2 no sabe qué estrategia elige la empresa 1, pero:
- Si la empresa 2 cree que la empresa 1 va a fabricar cereales crujientes, la estrategia óptima para la
empresa 2 es fabricar cereales dulces porque así obtiene ganancias de 10 en vez de –5.
- Si la empresa 2 cree que la empresa 1 va a fabricar cereales dulces, la estrategia óptima para la
empresa 2 es fabricar cereales crujientes porque así obtiene ganancias de 10 en vez de –5.
Por tanto, la empresa 2 no tiene estrategia dominante.

23
Veamos qué resultado podemos esperar de este juego:
Para ello, aplicamos el concepto de equilibrio de Nash que aprendimos en Microeconomía I.

Una situación es de equilibrio de Nash si cada jugador ha tomado la decisión óptima dada la
decisión del otro jugador.
En este caso, hay dos equilibrios de Nash: que la empresa 1 haga cereales crujientes y la
empresa 2 haga cereales dulces (con lo que ambas obtendrían unos beneficios de 10), y que
la empresa 1 haga cereales dulces y la empresa 2 haga cereales crujientes (con lo que ambas
obtendrían unos beneficios de 10). 24
Es importante destacar que las situaciones de equilibrio de estrategias dominantes son un

caso particular de equilibrio de Nash, ya que si cada jugador tenía una estrategia que es
óptima independientemente de la decisión tomada por el otro jugador, será
automáticamente la estrategia óptima para la decisión que el otro jugador ha tomado.
25
Veamos otro ejemplo de juego llamado “la batalla de los sexos”:
A Juana y Jaime les gustaría pasar juntos la noche del sábado. Sin embargo, tienen gustos
diferentes sobre qué hacer: a Jaime le gusta más la ópera y a Juana la lucha libre (Nota: los
libros cuentan este juego con los roles de género al revés que aquí). La matriz de ganancias
es la siguiente:
26
¿Qué decidirá Juana? Ella no sabe qué estrategia elige Jaime, pero:
- Si Juana cree que Jaime va a comprar la entrada para la lucha libre, la estrategia óptima
para Juana es comprar la entrada para la lucha libre porque así obtiene ganancias de 2 en
vez de 0.
- Si Juana cree que Jaime va a comprar la entrada para la ópera, la estrategia óptima para
Juana es comprar la entrada para la ópera porque así obtiene ganancias de 1 en vez de 0.
Por tanto, Juana no tiene estrategia dominante. 27

¿Qué decidirá Jaime? Él no sabe qué estrategia elige Juana, pero:
- Si Jaime cree que Juana va a comprar la entrada para la lucha libre, la estrategia óptima
para Jaime es comprar la entrada para la lucha libre porque así obtiene ganancias de 1 en
vez de 0.
- Si Jaime cree que Juana va a comprar la entrada para la ópera, la estrategia óptima para
Jaime es comprar la entrada para la ópera porque así obtiene ganancias de 2 en vez de 0.
Por tanto, Jaime no tiene estrategia dominante. 28

Veamos qué equilibrios de Nash hay en este juego:
Hay dos equilibrios de Nash: que ambos compren entradas para la lucha libre (con lo que
Juana obtendría una ganancia de 2 y Jaime una ganancia de 1) y que ambos compren
entradas para la ópera (con lo que Juana obtendría una ganancia de 1 y Jaime una ganancia
de 2).
29
¿Hay en todos los juegos al menos un equilibrio de Nash tal y como lo hemos definido?
No.
Para verlo, consideremos el siguiente juego: dos individuos, A y B, deben escribir en un papel
“cara” o “cruz”. Si ambos escriben lo mismo (ya sea “cara” o “cruz”), A gana y recibe 1$ de B.
Si no coinciden (es decir, uno escribe “cara” y el otro “cruz”), B gana y recibe 1$ de A. Por
tanto, la matriz de ganancias es:
30
¿Qué decidirá A? A no sabe qué estrategia elige B, pero:
- Si A cree que B va a escribir “cara”, la estrategia óptima para A es escribir “cara” porque así
obtiene ganancias de 1 en vez de –1.
- Si A cree que B va a escribir “cruz”, la estrategia óptima para A es escribir “cruz” porque así
obtiene ganancias de 1 en vez de –1.
Por tanto, A no tiene estrategia dominante.

31
¿Qué decidirá B? B no sabe qué estrategia elige A, pero:
- Si B cree que A va a escribir “cara”, la estrategia óptima para B es escribir “cruz” porque
así obtiene ganancias de 1 en vez de –1.
- Si B cree que A va a escribir “cruz”, la estrategia óptima para B es escribir “cara” porque
así obtiene ganancias de 1 en vez de –1.
Por tanto, B no tiene estrategia dominante.

32
Veamos qué equilibrios de Nash hay en este juego:
No hay ningún equilibrio, tal y como hemos definido las estrategias hasta ahora. En
cualquiera de las cuatro situaciones, hay algún jugador que no ha elegido la estrategia
óptima, dada la estrategia elegida por el otro jugador.
Entonces, ¿qué resultado podemos esperar de este juego?
Lo vemos en el siguiente subtema.

33
JUEGOS – LAS ESTRATEGIAS MIXTAS
Hasta ahora hemos supuesto que los individuos elegirían una estrategia pura; consistente
en que cada jugador elige indudablemente una determinada acción.
Sin embargo, hay ocasiones en la que los agentes pueden conseguir mejores resultados
eligiendo estrategias mixtas, que consisten en que el jugador elige aleatoriamente entre las
diferentes estrategias puras basándose en unas probabilidades.
Por ejemplo, una estrategia mixta en el juego de “cara” o “cruz” sería escribir “cara” con una
probabilidad de ¾ y escribir “cruz” con una probabilidad de ¼.
Las estrategias puras son un subconjunto de las estrategias mixtas porque corresponden a
las estrategias mixtas en las que la probabilidad de elegir una acción es 1 y el resto 0.
34
Un equilibrio de Nash en estrategias mixtas es aquella situación en la que cada jugador elige
las probabilidades óptimas de elegir cada una de sus opciones, dadas las probabilidades que
ha elegido el otro jugador.
Toda situación de equilibrio de Nash en estrategias puras es equilibrio de Nash en

estrategias mixtas.
Además, mientras que como hemos visto hay juegos sin ningún equilibrio en estrategias
puras, todo juego tiene algún equilibrio de Nash en estrategias mixtas.
Vamos a verlo con el juego de “cara” o “cruz” que introdujimos en el subtema anterior.
35
Denotamos por p la probabilidad de que el jugador A elija “cara” y por q la probabilidad de que el
jugador B elija “cara”.
Entonces, las ganancias que obtendría A son: pq + (1-p)(1-q) – p(1-q) – q(1-p) = 4pq – 2p – 2q + 1
y las ganancias que obtendría B son: – pq – (1-p)(1-q) + p(1-q) + q(1-p) = – 4pq + 2p + 2q – 1
36
Como las ganancias que obtendría A son [4pq – 2p – 2q + 1] y A debe elegir el valor de p,
veamos qué valor debería elegir.
Para ello, maximizamos esa función con respecto a p. Es decir, derivamos con respecto a p e
igualamos a 0. Es decir, 4q – 2 = 0.
Como consecuencia, A es indiferente entre qué valor de p elegir si B elige q = ½. Si, por el
contrario, B elige q > ½, la estrategia óptima para A es elegir p = 1. Finalmente, si B elige q <
½, la estrategia óptima para A es elegir p = 0. Podemos representar este hecho con una
curva de mejor respuesta. 37
Como las ganancias que obtendría B son [– 4pq + 2p + 2q – 1] y B debe elegir el valor de q,
Para ello, maximizamos esa función con respecto a q. Es decir, derivamos con respecto a q e
igualamos a 0. Es decir, – 4p + 2 = 0.
Como consecuencia, B es indiferente entre qué valor de q elegir si A elige p = ½. Si, por el
contrario, A elige p > ½, la estrategia óptima para B es elegir q = 0. Finalmente, si A elige p <
½, la estrategia óptima para B es elegir q = 1. Podemos representar este hecho con una
curva de mejor respuesta. 38
Podemos ver que la única situación en la que los dos jugadores han elegido la mejor
estrategia dada la estrategia del otro jugador es [p = ½, q = ½] y cada uno obtiene una
ganancia esperada de 0.
Esa situación es el equilibrio de Nash en estrategias mixtas de este juego.
39
Vamos a ver que un juego puede tener simultáneamente equilibrios en estrategias puras y
algún equilibrio extra en estrategias mixtas.
Lo vamos a ver con el juego de la “batalla de los sexos” que introdujimos en el subtema
anterior.
Ya habíamos visto que este juego tenía dos equilibrios en estrategias puras,
correspondientes a las situaciones en que ambos compraban entradas para el mismo
evento. ¿Hay algún equilibrio adicional cuando consideramos las estrategias mixtas?
40
Denotamos por p la probabilidad de que Juana elija “lucha libre” y por q la probabilidad de
que Jaime elija “lucha libre”.
Entonces, las ganancias que obtendría Juana son: 2pq + (1-p)(1-q) = 3pq – p – q + 1
y las ganancias que obtendría Jaime son: pq + 2(1-p)(1-q) = 3pq – 2p – 2q + 2
41
Como las ganancias que obtendría Juana son [3pq – p – q + 1] y ella debe elegir el valor de p,
Para ello, maximizamos esa función con respecto a p. Es decir, derivamos con respecto a p e
igualamos a 0. Es decir, 3q – 1 = 0.
Como consecuencia, Juana es indiferente entre qué valor de p elegir si Jaime elige q = 1/3. Si,
por el contrario, Jaime elige q > 1/3, la estrategia óptima para Juana es elegir p = 1.
Finalmente, si Jaime elige q < 1/3, la estrategia óptima para Juana es elegir p = 0. Podemos
representar este hecho con una curva de mejor respuesta. 42
Como las ganancias que obtendría Jaime son [3pq – 2p – 2q + 2] y Jaime debe elegir el valor
de q, veamos qué valor debería elegir.
Para ello, maximizamos esa función con respecto a q. Es decir, derivamos con respecto a q e
igualamos a 0. Es decir, 3p – 2 = 0.
Como consecuencia, Jaime es indiferente entre qué valor de q elegir si Juana elige p = 2/3.
Si, por el contrario, Juana elige p > 2/3, la estrategia óptima para Jaime es elegir q = 1.
Finalmente, si Juana elige p < 2/3, la estrategia óptima para Jaime es elegir q = 0. Podemos
representar este hecho con una curva de mejor respuesta. 43
Podemos ver que hay tres situaciones en la que los dos jugadores han elegido la mejor
estrategia dada la estrategia del otro jugador. Es decir, hay tres equilibrios de Nash en
estrategias mixtas:
- [p = 0, q = 0] correspondiente al equilibrio en que ambos compran entradas para la ópera.
- [p = 1, q = 1] correspondiente al equilibrio en que ambos compran entradas para la lucha

libre.
- [p = 2/3, q = 1/3] es un nuevo equilibrio y en él ambos obtienen una ganancia esperada de

44
2/3.
Representamos las curvas de mejor respuesta del

siguiente modo:
Medimos en el eje horizontal la probabilidad de que

Juana (la jugadora que elegía filas) elija “lucha libre”. Es
decir, el eje horizontal mide el valor de p (que,
obviamente, debe estar entre 0 y 1).
Medimos en el eje vertical la probabilidad de que Jaime

(el jugador que elegía columnas) elija “lucha libre”. Es
decir, el eje vertical mide el valor de q (que, obviamente,
debe estar entre 0 y 1).
45
Hemos visto que la estrategia óptima para Juana es:
- Si q = 1/3, cualquier valor de p.
- Si q > 1/3, p = 1.
- Si q < 1/3, p = 0.
Esa es la curva de mejor respuesta de Juana (línea gris
clara).
Hemos visto que la estrategia óptima para Jaime es:

- Si p = 2/3, cualquier valor de q.
- Si p > 2/3, q = 1.
- Si p < 2/3, q = 0.
Esa es la curva de mejor respuesta de Jaime (línea negra). 46
Las intersecciones de las curvas de mejor respuesta son

los equilibrios en estrategias mixtas de este juego.
En este caso, hay tres equilibrios en estrategias mixtas.
47
JUEGOS – LOS JUEGOS REPETIDOS
En el dilema de los prisioneros, la situación de equilibrio que alcanzaban los jugadores no era
una situación eficiente para ellos:
El equilibrio (además de estrategias dominantes) es que ambos confiesen, pero los dos
estarían mejor si ninguno confesara. El problema es que los incentivos individuales les lleva
a cada uno a confesar. Y, cuando ambos lo hacen, los dos terminan en una situación peor.
48
Vimos al final de Microeconomía I que las empresas de un oligopolio se encuentran en una

situación similar cuando tienen que decidir si cumplen o no un acuerdo de colusión:
El equilibrio (además de estrategias dominantes) es que las empresas no cumplan el

acuerdo de colusión de cobrar un precio alto por el producto sino que bajen el precio,
aunque todas las empresas están peor así que si todas cumplieran el acuerdo. El problema
es que los incentivos individuales les lleva a cada empresa a incumplir el acuerdo. Y, cuando
todas lo hacen, todas terminan en una situación peor.
49
Ya decíamos en Microeconomía I que si una interacción como éstas se repetía entre los
mismos jugadores, era posible que los jugadores pudieran crearse una reputación de la que
surgiera la confianza.
Por ejemplo, en el caso del oligopolio, aunque es cierto que las empresas tienen la tentación
de incumplir el acuerdo en un momento determinado para así obtener en ese momento
unos mayores beneficios, también saben que esas mayores ganancias se producirán durante
un breve periodo. Rápidamente, el resto de empresas reaccionarán y también bajarán los
precios, consiguiendo para todas las empresas un peor resultado. Ante la tentación de unos
mayores beneficios en un breve periodo, el miedo a perder la reputación hace posible
mantener acuerdos implícitos de colusión durante bastante tiempo.
Vamos a analizar en detalle este tipo de razonamientos con un análisis de los juegos
repetidos. 50
Un juego repetido es una situación estratégica en la que los mismos jugadores repiten la
misma interacción en más de una ocasión.
Es especialmente interesante cuando los jugadores repiten una interacción similar a las que
veíamos hace un momento: situaciones en las que hay un equilibrio de estrategias
dominantes, pero ese equilibrio no es una situación eficiente para los agentes. Haremos el
análisis con el caso de la colusión que veíamos:
51
Para poder mantener el acuerdo de cooperación entre ambas empresas (consistente en elegir
ambas un precio alto) en vez de llegar al equilibrio de estrategias dominantes (consistente en elegir
ambas un precio bajo) es clave que, al repetirse el juego, cada empresa pueda elegir una estrategia
como la siguiente:
En la primera interacción, yo coopero (es decir, en este caso, elijo un precio alto). En las siguientes
interacciones, yo coopero si el otro jugador ha cooperado la interacción anterior, pero si el otro
jugador no ha cooperado en la interacción anterior (es decir, en este caso, ha elegido un precio
bajo), yo no cooperaré en las siguientes x interacciones (x puede variar) estrategia “ojo por ojo”
52
Para ver cuándo una estrategia como esta puede tener éxito, es importante diferenciar si el
juego se va a repetir un número finito o infinito de veces.
Comenzamos el análisis suponiendo que el juego se va a repetir un número finito de

ocasiones.
¿Qué ocurrirá en la última interacción? Cada jugador elegirá la estrategia dominante de no

cooperar (en este caso, elegir un precio bajo) porque así obtendrá mayores ganancias en esa
ocasión (independientemente de lo que haga el otro) y no podrá ser castigado en el futuro
por el otro jugador porque no hay más interacciones en el futuro. 53
¿Qué ocurrirá en la penúltima interacción? Cada jugador es racional y sabe que el otro es
racional. Por eso, cada jugador sabe que, haga él lo que haga en la penúltima interacción, el
otro jugador elegirá la estrategia dominante de no cooperar en la última interacción.
En consecuencia, él elegirá en la penúltima interacción la estrategia dominante de no

ocasión (independientemente de lo que haga el otro) y sabe que eso no afectará a la
conducta del otro jugador en la última interacción.
54
¿Qué ocurrirá en la antepenúltima interacción? Cada jugador es racional y sabe que el otro
es racional. Por eso, cada jugador sabe que, haga él lo que haga en la antepenúltima
interacción, el otro jugador elegirá la estrategia dominante de no cooperar en las dos
últimas interacciones.
En consecuencia, él elegirá en la antepenúltima interacción la estrategia dominante de no

ocasión (independientemente de lo que haga el otro) y sabe que eso no afectará a la
conducta del otro jugador en las dos últimas interacciones. 55
Etc …
¿Qué ocurrirá en la primera interacción? Cada jugador es racional y sabe que el otro es
racional. Por eso, cada jugador sabe que, haga él lo que haga en la primera interacción, el
otro jugador elegirá la estrategia dominante de no cooperar en las siguientes interacciones.
En consecuencia, él elegirá en la primera interacción la estrategia dominante de no cooperar

(en este caso, elegir un precio bajo) porque así obtendrá mayores ganancias en esa ocasión
(independientemente de lo que haga el otro) y sabe que eso no afectará a la conducta del
otro jugador en las siguientes interacciones. 56
Es decir, si un juego como este se repite un número finito de ocasiones (sea cual sea este
número), el resultado es que ninguno de los agentes coopera en ninguna de las
interacciones, eligiendo siempre cada uno la estrategia dominante.
57
Supongamos ahora que el juego se va a repetir un número infinito de ocasiones.
En este caso, veamos si puede tener éxito una estrategia como “ojo por ojo” con dos
periodos de castigo.
¿Cuál es la mejor estrategia para cada jugador si el otro jugador elige la estrategia “ojo por
ojo”?
Comparemos dos posibilidades: cooperar siempre o no cooperar en alguna o algunas

ocasiones. 58
- Si el jugador coopera siempre, elegirá la estrategia en este caso de un precio alto en todas
las interacciones. Como está cooperando siempre y el otro jugador ha elegido la estrategia
“ojo por ojo”, el otro jugador también cooperará siempre y cada uno obtendrá unas
ganancias de 50 en cada interacción.
- Si el jugador elige no cooperar en alguna ocasión eligiendo en este caso un precio alto en
esa interacción, obtendrá en esa interacción unas ganancias de, como mucho, 100. Sin
embargo, el otro jugador, al ver que él no ha cooperado, elegirá no cooperar en las dos
siguientes interacciones. Por tanto, en esas dos siguientes interacciones, él conseguirá unas
ganancias de, como mucho, 10. 59
Como es mejor obtener unas ganancias de 50 en cada interacción que obtener 100 en una
interacción y, como mucho, 10 en las dos siguientes, la cooperación puede mantenerse.
(Hemos asumido implícitamente una tasa de descuento de los beneficios futuros de 0, pero
podría generalizarse el argumento incluyendo una tasa de descuento positiva)
Es decir, si el juego se repite un número infinito de ocasiones, las estrategias “ojo por ojo”
consiguen la cooperación en todos los periodos.
60
¿Qué ocurre en la realidad?
Los individuos tenemos una vida finita, por lo que interactuamos entre nosotros un número
finito de ocasiones. En consecuencia, se podría pensar que estamos abocados a terminar en
la situación de no cooperación en las interacciones del tipo “dilema del prisionero”.
Sin embargo, en la práctica estrategias del tipo “ojo por ojo” sí consiguen llevar a la
cooperación entre los agentes económicos. Las razones son dos:
61
Por un lado, los jugadores no siempre son racionales o no siempre saben que el otro es
racional. Analizaremos más en detalle este argumento y sus implicaciones en la Clase 14 del
curso.
Por otro lado, aunque vamos a interactuar un número finito de ocasiones, no sabemos
cuántas veces vamos a hacerlo. Si el juego se va a repetir un número finito de veces, pero los
jugadores no saben cuándo se terminará, el argumento recursivo que antes hemos utilizado
para invalidar las estrategias “ojo por ojo” ya no tiene sentido.
Por ejemplo, en el caso de las empresas de una industria, aunque el número de interacciones
será finito, las empresas desconocen cuándo terminará la interacción. Por tanto, las
estrategias del tipo “ojo por ojo” pueden tener sentido.
62
La dificultad para mantener esos acuerdos cooperativos de colusión en el caso de las

empresas es, como veíamos al final de Microeconomía I, que la comunicación entre las
empresas está prohibida (por tanto, los acuerdos tendrían que ser implícitos) y, en algunas
ocasiones, pueden surgir discrepancias sobre cuál es el precio a mantener en el acuerdo
colusorio.
Esto ocurrirá más probablemente en industrias donde la demanda y los costes sean
inciertos. En ese caso, una empresa puede estimar una demanda y unos costes para el
siguiente periodo por el que crea que el precio del acuerdo de colusión debe ser 50$ por
unidad, pero otra puede tener unas estimaciones diferentes por las que el precio del acuerdo
de colusión debería ser 40$. Cuando cada empresa ponga estos precios, la primera creerá
probablemente que la segunda no quiere cooperar.
63
Las estrategias de señales de precios que veíamos en Microeconomía I tendrán por tanto
más probabilidades de éxito en industrias con demanda y costes bastante estables. Por el
contrario, los acuerdos de colusión serán más difíciles de mantener en industrias con
demanda o costes cambiantes.
Veamos dos ejemplos reales:
1- La industria de contadores de agua en EE.UU. antes de 2012 (en ese año surgen los
contadores “inteligentes”) tenía una demanda muy estable y predecible (debe instalarse un
contador de agua por domicilio, ni uno más ni uno menos) y los costes de producción
también son claros. Si juntamos a eso el hecho de que la entrada en esta industria era muy
difícil por la presencia de grandes economías de escala y que la demanda era inelástica, el
acuerdo de colusión entre las pocas empresas del oligopolio era muy estable y ninguna se
saltaba el acuerdo. 64
2- La industria de transporte aéreo tiene una demanda muy cambiante (es muy diferente dependiendo del
día e incluso de la hora del vuelo) y el coste por billete también es diferente (dependiendo del número de
billetes vendidos en cada avión que se haya decidido fletar). Por tanto, es esperable que en esta industria
los acuerdos implícitos de colusión no sean muy estables. Así ha ocurrido en la historia de este sector:
En 1983, American Airlines dijo que fijaría sus tarifas en base a la distancia entre las ciudades que une
cada vuelo de acuerdo a una tabla simple. Dijo hacerlo para “simplificar la estructura de tarifas y contribuir
a resolver la confusión reinante”. Las demás empresas declararon inmediatamente que harían lo mismo.
Esto es un ejemplo claro de una pauta de liderazgo en la fijación de precios para intentar mantener un
acuerdo colusorio, como los que veíamos en Microeconomía I.
Sin embargo, a las dos semanas, Pan Am bajó sus tarifas. Las demás reaccionaron bajando también sus
tarifas y el acuerdo colusorio se rompió. Algo parecido ocurrió en 1992.
65
JUEGOS – LOS JUEGOS CONSECUTIVOS
Los juegos que hemos analizado hasta ahora en esta clase eran situaciones en la que los
jugadores eligen al mismo tiempo su estrategia o lo hacen sin conocer qué ha elegido el otro
jugador. Estos juegos se conocen como juegos simultáneos.
Sin embargo, hay interacciones estratégicas en las que los jugadores eligen de manera
consecutiva: primero elige su estrategia un jugador y el otro jugador ya conoce la estrategia
que ha elegido el primero cuando le toca elegir. Algunos ejemplos de interacción de este tipo
son el modelo de duopolio de Stackelberg o el modelo de duopolio de empresa dominante
que veíamos en Microeconomía I. Estos juegos se conocen como juegos consecutivos o
juegos secuenciales.
En un juego consecutivo, la clave para el primer jugador en elegir es pensar en cómo

reaccionará el segundo jugador a cada una de sus posibles decisiones. En base a cómo
reaccionará el segundo jugador a cada posible decisión, elegirá una u otra estrategia. 66
Comenzamos analizando el siguiente juego, ligeramente modificado respecto a uno que

veíamos antes:
Dos empresas, 1 y 2, de cereales de desayuno tienen que elegir qué tipo de nuevos cereales
sacan. Los beneficios de cada empresa dependen de su decisión, pero también de la decisión
de la otra empresa, de acuerdo a la siguiente matriz de ganancias:
EMPRESA 2
Crujientes Dulces
EMPRESA 1 Crujientes –5, –5 10, 20
Dulces 20, 10 –5, –5
Si el juego es simultáneo, hay dos equilibrios de Nash en estrategias puras y otro equilibrio
de Nash en estrategias mixtas (¿puedes calcularlos?)
67
EMPRESA 2
Crujientes Dulces
EMPRESA 1 Crujientes –5, –5 10, 20
Dulces 20, 10 –5, –5
¿Qué ocurre si el juego es consecutivo? Vamos a hacer el análisis suponiendo que es la

empresa 1 la que elige primero su estrategia.
Para ello, es muy interesante representar el juego, no con la matriz de ganancias, sino con
un árbol de decisiones en lo que se llama representación en forma extensiva del juego.
Veamos cómo se construye esa representación.
68
En primer lugar, se coloca al jugador que elige primero (es la “raíz” del árbol de decisiones).
De ese jugador, salen tantos “troncos” como posibles decisiones podría tomar ese jugador.
Al final de cada tronco, ponemos al jugador al que le toca elegir segundo. De ese jugador,
salen tantas “ramas” como posibles decisiones podría tomar ese jugador si el primer jugador
tomó la decisión correspondiente a ese “tronco”. Al final de esas “ramas”, se ponen los
resultados que conseguiría cada jugador si esas son las decisiones que toman los jugadores
(poniendo en primer lugar el resultado del jugador que elige en primer lugar).
69
¿Cuál será el resultado de este juego consecutivo?
Se calcula mediante un razonamiento que se llama inducción hacia atrás:
70
La empresa 1 sabe que la empresa 2 es racional y, por tanto, sabe que:
- Si yo, empresa 1, elijo producir cereales crujientes, la empresa 2 elegirá producir cereales
dulces porque así ella, empresa 2, obtiene 20 en vez de –5.
- Si yo, empresa 1, elijo producir cereales dulces, la empresa 2 elegirá producir cereales
crujientes porque así ella, empresa 2, obtiene 10 en vez de –5.
71
Una vez que la empresa 1 ha estudiado cómo reaccionará la empresa 2 a cada una de sus posibles
decisiones, la empresa 1 se da cuenta de que:
- si elijo la estrategia de producir cereales crujientes, yo, empresa 1, obtendré un resultado de 10.
- si elijo la estrategia de producir cereales dulces, yo, empresa 1, obtendré un resultado de 20.
En consecuencia, la empresa 1 elegirá producir cereales dulces, la empresa 2 reaccionará produciendo

cereales crujientes y obtendrán unos resultados de 20 para la empresa 1 y 10 para la empresa 2.
72
En los juegos consecutivos, ¿es mejor elegir primero o elegir segundo?
Depende del juego.
Por ejemplo, en el juego que acabamos de ver es mejor elegir primero. El estudiante puede
chequear que, si hubiera elegido la empresa 2 primero, el árbol de decisiones sería diferente
y el resultado sería que la empresa 2 elegiría producir cereales dulces, la empresa 1
reaccionaría produciendo cereales crujientes y obtendrán unos resultados de 20 para la
empresa 2 y 10 para la empresa 1.
Otra situación en la que también es mejor elegir primero es la elección de cantidades en un

oligopolio.
73
Podemos verlo con un ejemplo numérico de duopolio que vimos en Microeconomía I:
Dos empresas con CM1 = CM2 = 0 (y sin CF) que se enfrentan a una demanda de mercado de
Q = 30 – P. Como Q es la cantidad total de mercado, tenemos que la demanda es: P = 30 – (q1 + q2)
En Microeconomía I vimos tres posibles soluciones a este duopolio:
- La elección simultánea de cantidades (modelo de Cournot), donde cada empresa producía 10 unidades
y obtenía unos beneficios de 100.
- La colusión, donde cada empresa producía 7,5 unidades y cada una obtenía unos beneficios de 112,50.
- La elección consecutiva de cantidades (modelo de Stackelberg), donde la empresa que elegía primero
(empresa líder) producía 15 unidades y la empresa que elegía después producía 7,5 unidades,
obteniendo unos beneficios de 112,50 y 56,25, respectivamente.
74
Podemos representar estas situaciones con una matriz de resultados:
Si las empresas eligen simultáneamente, hay un único equilibrio de Nash, que es la situación
de Cournot.
Si las empresas eligen consecutivamente, el primero en elegir tiene ventaja: producirá 15

unidades, de manera que el otro reaccionará produciendo 7,5 unidades (corresponde a la
solución de Stackelberg). Se puede ver con más detalle en la representación en forma
extensiva. 75
Sin embargo, hay otras situaciones en las que es mejor elegir segundo:
Por ejemplo, en el juego de “cara o cruz” que veíamos antes:
¿Cuál es el resultado del juego si elige primero el jugador A? ¿Y si elige primero el jugador B?
76

Sesion XII

Cargado por

Copyright:

Formatos disponibles

Sesion XII

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Sesion XII

Cargado por

Copyright:

Formatos disponibles

MICROECONOMÍA II

SESIÓN XII: Las decisiones estratégicas: una introducción a la

Profesor: Jorge Alcalde-Unzu

En muchos contextos económicos, el resultado que consigue un agente económico

Repasemos cómo se construye la matriz de ganancias:

Explicación de los componentes de la matriz de resultados.

¿Qué resultado puede esperarse de este juego?

- Si la empresa A cree que la empresa B va a hacer publicidad, la estrategia óptima para la

Por tanto, la mejor estrategia para la empresa A, independientemente de la decisión de la

- Si la empresa B cree que la empresa A va a hacer publicidad, la estrategia óptima para la

Por tanto, la mejor estrategia para la empresa B, independientemente de la decisión de la

Cuando esto ocurre, es fácilmente predecible que el juego terminará en la situación en la

En este caso, el equilibrio de estrategias dominantes es que A y B hagan publicidad y, por

Repasemos el juego del dilema del prisionero que veíamos en Microeconomía I:

- Si ninguno confiesa, cada uno cumplirá una pena de 2 años.

- Si ambos confiesan, cada uno cumplirá una pena de 5 años.

¿Qué decidirá el prisionero A? A no sabe qué estrategia elige B, pero:

Por tanto, la mejor estrategia para A, independientemente de la decisión de B, es confesar.

¿Qué decidirá el prisionero B? B no sabe qué estrategia elige A, pero:

Por tanto, la mejor estrategia para B, independientemente de la decisión de A, es confesar.

Veamos otro ejemplo:

Hay 10 electores con ideología de izquierda, 10 electores con ideología de centro y 10

¿Hay un equilibrio de estrategias dominantes en este juego? Vamos a hacerlo en la pizarra.

¿Hay en todos los juegos un equilibrio de estrategias dominantes?

Para verlo, modifiquemos ligeramente el juego de la publicidad que veíamos hace un

¿Tienen estrategias dominantes los jugadores de este juego?

- Si la empresa A cree que la empresa B va a hacer publicidad, la estrategia óptima para la

Por tanto, A no tiene estrategia dominante. 17

- Si la empresa B cree que la empresa A va a hacer publicidad, la estrategia óptima para la

Por tanto, la mejor estrategia para la empresa B, independientemente de la decisión de la

Entonces, ¿qué resultado podemos esperar de este juego?

Lo vemos en el siguiente subtema.

Veamos qué resultado podemos esperar de este juego:

Por tanto, la empresa 1 no tiene estrategia dominante.

Por tanto, la empresa 2 no tiene estrategia dominante.

Veamos qué resultado podemos esperar de este juego:

Para ello, aplicamos el concepto de equilibrio de Nash que aprendimos en Microeconomía I.

Es importante destacar que las situaciones de equilibrio de estrategias dominantes son un

Veamos otro ejemplo de juego llamado “la batalla de los sexos”:

Por tanto, Juana no tiene estrategia dominante. 27

¿Qué decidirá Jaime? Él no sabe qué estrategia elige Juana, pero:

Por tanto, Jaime no tiene estrategia dominante. 28

Veamos qué equilibrios de Nash hay en este juego:

¿Qué decidirá A? A no sabe qué estrategia elige B, pero:

Por tanto, A no tiene estrategia dominante.

¿Qué decidirá B? B no sabe qué estrategia elige A, pero:

Por tanto, B no tiene estrategia dominante.

Veamos qué equilibrios de Nash hay en este juego:

Entonces, ¿qué resultado podemos esperar de este juego?

Lo vemos en el siguiente subtema.

Toda situación de equilibrio de Nash en estrategias puras es equilibrio de Nash en

y las ganancias que obtendría B son: – pq – (1-p)(1-q) + p(1-q) + q(1-p) = – 4pq + 2p + 2q – 1

Esa situación es el equilibrio de Nash en estrategias mixtas de este juego.

y las ganancias que obtendría Jaime son: pq + 2(1-p)(1-q) = 3pq – 2p – 2q + 2

- [p = 0, q = 0] correspondiente al equilibrio en que ambos compran entradas para la ópera.

- [p = 1, q = 1] correspondiente al equilibrio en que ambos compran entradas para la lucha

- [p = 2/3, q = 1/3] es un nuevo equilibrio y en él ambos obtienen una ganancia esperada de

Representamos las curvas de mejor respuesta del

Medimos en el eje horizontal la probabilidad de que

Medimos en el eje vertical la probabilidad de que Jaime