Apuntes Docentes de Teoría de Juegos PDF
Apuntes Docentes de Teoría de Juegos PDF
Apuntes Docentes de Teoría de Juegos PDF
Apuntes docentes
Contenidos
Capítulo 1: Introducción
1
Apuntes Docentes de Teoría de Juegos
2
Apuntes Docentes de Teoría de Juegos
Capítulo Uno
Introducción
1.1.- Qué es la teoría de juegos
La teoría de juegos es una disciplina que tiene como objetivo principal el estudio de
decisiones multipersonales, es decir, cuando la decisión de una persona afecta el
bienestar de otra. En ese contexto, el concepto clave es la interdependencia
estratégica.
1.2. Objetivos
Está dirigido a estudiantes que están cursando sus últimos cursos de pregrado y a
estudiantes de postgrado no iniciados en la teoría. Está dirigido también a
profesionales que deben tomar decisiones estratégicas.
3
Apuntes Docentes de Teoría de Juegos
El documento está dividido en tres capítulos. En los capítulos dos y tres se revisan
diversos juegos con las siguientes características:
4
Apuntes Docentes de Teoría de Juegos
5
Apuntes Docentes de Teoría de Juegos
Capítulo Dos
Juegos Simultáneos
2.1. Objetivos del capítulo
6
Apuntes Docentes de Teoría de Juegos
Los jugadores son racionales en el sentido que buscan maximizar sus ganancias.
1. Todos los jugadores conocen la función de ganancias; cada jugador sabe que
todos conocen las funciones de ganancias; y todos los jugadores saben que
7
Apuntes Docentes de Teoría de Juegos
todos los jugadores saben que todos los jugadores conocen las funciones de
ganancias.
2. Los jugadores son racionales; los jugadores saben que todos los jugadores son
racionales; y los jugadores saben que todos los jugadores saben que todos los
jugadores saben que son racionales.
8
Apuntes Docentes de Teoría de Juegos
1.- Si el jugador uno elige α y el jugador dos elige β, el jugador uno obtendrá una
nota A y el jugador dos obtendrá una nota C.
2.- Si ambos jugadores eligen la estrategia α, ambos obtendrán una nota B-.
3.- Si ambos jugadores eligen la estrategia β, ambos obtendrán una nota B+.
4.- Si el jugador uno elige β y el jugador dos elige α, el jugador uno obtendrá una
nota C y el jugador dos obtendrá una nota A.
2 2
1 α β 1 α β
α B- A α B- C
β C B+ β A B+
α B-,B- A,C
β C,A B+,B+
Figura 2.3
9
Apuntes Docentes de Teoría de Juegos
Ahora que se han valorizado los resultados, se tienen los tres ingredientes
necesarios (los jugadores, las estrategias y las ganancias) para representar el juego
en forma estratégica. Para eso se recurre a la matriz de ganancias:
2
1 α β
α 0,0 3,-1
β -1,3 1,1
Figura 2.5
10
Apuntes Docentes de Teoría de Juegos
4.- A cada perfil estratégico le corresponde una ganancia para cada jugador:
Pregunta 2.1
11
Apuntes Docentes de Teoría de Juegos
Una estrategia 𝑠𝑖´ está estrictamente dominada por la estrategia 𝑠𝑖" cuando la
desigualdad estricta:
𝑈𝑖 (𝑠𝑖´ , 𝑠−𝑖 ) < 𝑈𝑖 (𝑠𝑖" , 𝑠−𝑖 )
se cumple para toda combinación de estrategias 𝑠−𝑖 (las estrategias del resto de los
jugadores, es decir, de todos los jugadores menos el jugador i).
Se dice que una estrategia 𝑠𝑖´ está débilmente dominada por la estrategia 𝑠𝑖" cuando
la desigualdad débil:
𝑈𝑖 (𝑠𝑖´ , 𝑠−𝑖 ) ≤ 𝑈𝑖 (𝑠𝑖" , 𝑠−𝑖 )
Volviendo a la figura 2.5 se puede concluir que para ambos jugadores la estrategia
β es estrictamente dominada por la estrategia α. Analicemos porqué:
El jugador uno reflexionará: “si el jugador dos juega α entonces me convendrá jugar
α y no β porque la ganancia que obtengo es cero que es mayor que menos uno. Y
si el jugador dos juega β entonces me convendrá jugar α y no β porque la ganancia
que obtengo es tres que es mayor que uno”.
Analice en segundo lugar al jugador dos. Éste reflexionará: “si el jugador uno juega
α entonces me convendrá jugar α y no β porque la ganancia que obtengo es cero
que es mayor que menos uno. Y si el jugador uno juega β entonces me convendrá
jugar α y no β porque la ganancia que obtengo es tres que es mayor que uno”.
12
Apuntes Docentes de Teoría de Juegos
Ahora bien, si el jugador uno “se pone en los zapatos” del jugador dos, reflexionará
que éste, que es un jugador racional que busca maximizar sus ganancias, no jugará
nunca la estrategia β porque la ganancia que obtiene al jugar aquella estrategia es
menor que la que obtendría al jugar la estrategia α, independientemente de lo que
él juegue.
Al mismo tiempo, si el jugador dos “se pone en los zapatos” del jugador uno,
reflexionará que éste tampoco jugará la estrategia β porque la ganancia que obtiene
al jugar aquella estrategia es menor que la que obtendría al jugar la estrategia α,
independientemente de lo que él juegue.
β -1,3 1,1
Figura 2.6
13
Apuntes Docentes de Teoría de Juegos
De esta forma, al eliminar las estrategias que nunca se jugarán el juego se puede,
en primer lugar, representar de una forma mucho más sencilla y, en segundo lugar,
permite obtener una solución.
2
1 α
α 0,0
Figura 2.6.1
La solución del juego es el perfil estratégico {α, α} que lleva asociado una ganancia
de (0, 0). Cuando, luego de eliminar de manera iterada todas las estrategias
dominadas sobrevive sólo un perfil estratégico dicho perfil es un equilibrio de Nash.
Note que la solución del juego es una solución sub óptima: ambos jugadores podrían
estar mejor si el equilibrio hubiese sido {β, β}. Las ganancias asociadas a dicho
equilibrio hubiesen sido (1, 1) mayores a (0, 0).
Una característica fundamental del equilibrio {β, β}, que se puede considerar un
equilibrio cooperativo, es que es un equilibrio inestable: ambos jugadores tienen
incentivo a desviarse.
14
Apuntes Docentes de Teoría de Juegos
Pregunta 2.2.
¿Cómo se pueden lograr equilibrios cooperativos de largo plazo?3
Figura 2.7
Observe en primer lugar que las estrategias del jugador uno son {U, M, D} y las
estrategias del jugador dos son {L, M, R}. Las ganancias de cada uno dependen de
3Para estudiar en profundidad las soluciones cooperativas del dilema del prisionero, revisar Axelrod,
R. (1985).
15
Apuntes Docentes de Teoría de Juegos
Para determinar las estrategias dominadas, comience por el jugador uno de acuerdo
al siguiente razonamiento:
Continúe analizando las posibles estrategias dominadas del jugador dos utilizando
el mismo razonamiento:
16
Apuntes Docentes de Teoría de Juegos
Como se supone que el jugador dos es un jugador racional se deduce que no jugará
una estrategia dominada. Por lo tanto, se puede eliminar de su conjunto estratégico
la estrategia M. Al eliminar M, el juego queda representado de la siguiente forma:
2
1 L R
U 4,3 6,2
M 2,1 3,6
D 3,0 2,8
Figura 2.7.1
17
Apuntes Docentes de Teoría de Juegos
Como se supone que el jugador uno no jugará una estrategia dominada, el juego se
puede representar de una forma reducida:
2
1 L R
U 4,3 6,2
D 3,0 2,8
Figura 2.7.2
Continúe el proceso:
Compare U y D. Si el jugador dos juega L, U domina a D. Si el jugador dos juega
R, U domina a D. Por lo tanto, D es una estrategia dominada por U porque
independientemente de lo que juegue el jugador dos (L o R), la ganancia que
obtiene el jugador uno al jugar D es menor que la que obtiene de jugar U.
2
1 L R
U 4,3 6,2
Figura 2.7.3
Continúe:
Compare L y R. Si el jugador uno juega U, la estrategia L domina a la estrategia
R porque la ganancia de 3 es mayor que 2. Al eliminar esta última estrategia
dominada sobrevive un único perfil estratégico:
18
Apuntes Docentes de Teoría de Juegos
2
1 L
U 4,3
Figura 2.7.4
Tarea 2.1.
Compruebe en el juego original que ninguno de los dos jugadores tiene incentivo a
desviarse desde el equilibrio {U, L}.
Ejercicio 2.1: Suponga treinta jugadores que deben elegir, de manera simultánea,
es decir, con información imperfecta, un número entre el uno y el cien. El ganador
será aquel jugador que elija el número más cercano a dos tercios del promedio. Por
ejemplo, si el promedio es 30, el ganador será aquel jugador que haya elegido el
número más cercano a 20 (2/3 por 30 = 20). Por eliminación de estrategias
dominadas y “poniéndose en los pantalones del otro”, resuelva el equilibrio de Nash.
Suponga dos candidatos (jugadores) a una elección popular. Cada candidato debe
decidir entre diez posiciones (estrategias) del espectro político.
1 2 3 4 5 6 7 8 9 10
19
Apuntes Docentes de Teoría de Juegos
Ejemplos:
Las ganancias de cada candidato son el porcentaje de votos. Como ambos son
racionales, tienen como objetivo maximizar la votación.
Solución:
20
Apuntes Docentes de Teoría de Juegos
Sólo con este paso es suficiente para determinar que, antes de eliminar la posición
1, la posición 3 no domina a la posición 2. Esto porque la ganancia del candidato
uno, asumiendo que el candidato dos se ubica en la posición 1, es mayor por
ubicarse en la posición 2 que en la 3.
2 3 4 5 6 7 8 9
Hay que aclarar que lo que se eliminó fueron las estrategias 1 y 10. No se eliminan
los votantes que se sienten identificados con dichas posiciones políticas. Esto
implica que el universo electoral sigue siendo el mismo. En este caso, los votantes
de la posición 1 y 10, votarán por el candidato que se ubique más cerca de sus
preferencias.
21
Apuntes Docentes de Teoría de Juegos
Suponga que Pat y Cris son dos vendedores de helado (jugadores) que trabajan en
la misma playa. La playa está dividida en nueve sectores. Debido a que necesitan
electricidad, deben decidir de manera independiente y simultánea, donde
localizarse. El día anterior deben llamar a la administración e informar en cual sector
se ubicarán (estrategias).
1 2 3 4 5 6 7 8 9
El precio de los helados es el mismo y cada uno gana una comisión de $25 por
helado. La demanda está estimada en 500 helados por sector. Si un vendedor
atiende a un sector y vende 500 helados, sus ventas serán de $12.500. Como los
helados son iguales, los consumidores deciden comprar en el lugar más cercano al
que están ubicados. Si los consumidores son indiferentes, asuma que comprarán
250 helados a Pat y 250 helados a Cris.
Por ejemplo:
Solución:
22
Apuntes Docentes de Teoría de Juegos
2 3 4 5 6 7 8
Al igual que en la aplicación anterior se debe recalcar que los consumidores de los
sectores 1 y 9 seguirán comprando helados. Lo que se ha eliminado son dos
estrategias posibles, no porque las estrategias no sigan estando presentes, sino
porque suponemos que jugadores racionales no jugarán estrategias dominadas.
23
Apuntes Docentes de Teoría de Juegos
3 4 5 6 7
Tarea 2.2
Una compañía aérea pierde dos maletas pertenecientes a dos viajeros diferentes.
Ambas maletas resultan ser idénticas y contienen artículos idénticos. El gerente de
la línea aérea encargada de resolver las reclamaciones de los viajeros explica que
la compañía aérea es responsable por un máximo de $100.000 por maleta (él es
incapaz de averiguar directamente el precio de los artículos), y con el fin de
determinar un valor honesto de tasación de la mercancía, el gerente de
reclamaciones separa a los viajeros para que no puedan acordar nada, y les pide
que escriban un valor de la maleta mayor a $20.000 y menor de $100.000. También
les dice, si ambos escriben el mismo número, él va a tratar ese número como el
valor monetario real de las maletas y reembolsará a los viajeros dicha cantidad. Sin
embargo, si uno escribe un número más pequeño que el otro, este número más
24
Apuntes Docentes de Teoría de Juegos
pequeño se tomará como el valor verdadero, y cada uno de los viajeros recibirá esa
cantidad junto con una recompensa o un castigo de $20.000: el viajero que escribió
el valor más bajo recibirá el valor más bajo más una recompensa de $20.000 y la
persona que escribió la cantidad más alta recibirá el valor más bajo menos una
deducción de $20.000.
2
1 L C R
Figura 2.8
25
Apuntes Docentes de Teoría de Juegos
2
1 L C
T 5,-1 11,3
B 6,4 0,2
Figura 2.8.1
Una estrategia 𝑠̂𝑖 es una mejor respuesta (𝑅𝑖 ) respecto a la estrategia 𝑠𝑖´ para el
jugador i ante la estrategia 𝑠−𝑖 del resto de los jugadores si se cumple que la
ganancia de jugar 𝑠̂𝑖 es mayor que la ganancia de jugar 𝑠𝑖´ :
26
Apuntes Docentes de Teoría de Juegos
De lo anterior se puede deducir que los jugadores no jugarán una estrategia que no
sea la mejor respuesta a las creencias que tengan acerca de las estrategias del
resto de los jugadores. Además, se debe suponer que los jugadores supondrán que
el resto de los jugadores también jugarán una mejor respuesta.
Para entender mejor el método vuelva a la figura 2.8.1. En esta figura están las
estrategias que sobrevivieron a la eliminación de estrategias dominadas. El método
de la mejor respuesta consiste en:
27
Apuntes Docentes de Teoría de Juegos
2
1 L C
T 5,-1 11,3
B 6,4 0,2
Figura 2.8.2
En el juego se han encontrado dos perfiles estratégicos que cumplen con una
característica esencial: las estrategias elegidas por los jugadores constituyen las
mejores respuestas ante las mejores respuestas de los otros jugadores.
En nuestro ejemplo, hay dos equilibrios de Nash. Observe que desde ninguno de
los equilibrios los jugadores tienen incentivo a desviarse.
En un juego G, las estrategias (𝑠1∗ , … , 𝑠𝑛∗ ) son un equilibrio de Nash si, para cada
jugador i, 𝑠𝑖∗ es, al menos, la mejor respuesta a las estrategias especificadas por el
resto de los jugadores tal que:
𝑈𝑖 (𝑠𝑖∗ , 𝑠−𝑖
∗ ∗
) > 𝑈𝑖 (𝑠𝑖 , 𝑠−𝑖 )
28
Apuntes Docentes de Teoría de Juegos
∗
Max 𝑈𝑖 (𝑠𝑖 , 𝑠−𝑖 )
𝑠𝑖 ∈ 𝑆𝑖
Quinta conclusión: el equilibrio de Nash entrega una solución más fuerte que el
concepto de estrategias dominadas ya que puede haber estrategias que superen la
eliminación y no ser un equilibrio de Nash; en cambio un equilibrio de Nash implica
que las estrategias si superan la eliminación iterada de estrategias dominadas.
Ejercicio 2.2.
Considere el siguiente juego6:
2
1 L C R
Figura 2.9
29
Apuntes Docentes de Teoría de Juegos
Vuelva por un momento al ejemplo 2.1. En aquel ejemplo, los jugadores debían
elegir entre α y β. La combinación de estrategias llevaba asociada diversos
resultados para cada uno de los jugadores:
2
1 α β
α B-,B- A,C
β C,A B+,B+
Figura 2.10
Ahora supondremos que los jugadores (el profesor Polack los llama “ángeles
indignados”) tienen una legítima preocupación por sus notas, pero también tienen
una preocupación por los resultados que obtienen los compañeros.
En este caso, la ganancia del ángel se ve alterada por alguna emoción como la rabia
o la culpa. La nueva valoración de ganancias se sintetiza en la siguiente figura:
30
Apuntes Docentes de Teoría de Juegos
Tenga presente que este es una simulación. Dicho eso, con los resultados
valorizados, el juego se puede representar en forma estratégica.
2
1 α β
α 0,0 -1,-3
β -3,-1 1,1
Figura 2.12
Este juego es totalmente distinto al juego de la figura 2.5. El presente juego tiene
tres características:
31
Apuntes Docentes de Teoría de Juegos
Así como el tipo de juego analizado en la figura 2.5 se conocen como juegos de
dilema, este tipo de juegos se conocen como juegos de coordinación. La principal
característica de los juegos de coordinación es que tienen equilibrios múltiples (más
de un equilibrio de Nash). En general hay dos tipos de juegos de coordinación:
α 1,1 0,0
β 0,0 1,1
Figura 2.13
32
Apuntes Docentes de Teoría de Juegos
Ángel
Diablo α β
α 0,0 3,-3
β -1,-1 1,1
Figura 2.14
Observe que:
Tarea 2.3.
Represente y resuelva el juego en que el jugador uno sea un ángel y el jugador dos
sea un diablo.
33
Apuntes Docentes de Teoría de Juegos
2
1 Callar Confesar
Figura 2.15
Considere en primer lugar, que en este juego los jugadores tienen como función
objetivo minimizar sus años de condena. Segundo, la estrategia callar es una
estrategia dominada para ambos jugadores (observe que para ninguno es una mejor
respuesta). ambos sospechosos tienen como estrategia. Tercero, el equilibrio de
Nash está en el perfil estratégico {confesar, confesar}, Cuarto, la solución al juego
es un Pareto ineficiente, es decir, ambos, podrían obtener condenas menores a
cuatro años.
tarde del día siguiente, ambos se dan cuenta que no habían coordinado el lugar en
el que se reunirían. Por lo tanto, cada uno de manera simultánea debería decidir si
iba al fútbol o iba al cine. Ambos prefieren ir al mismo sitio porque desean estar
juntos, sin embargo, la novia prefiere el cine y el novio el fútbol. A continuación, se
representa el juego en la forma estratégica:
2
1 Cine Fútbol
Figura 2.16
Los juegos con la estructura de la batalla de los sexos son una combinación de
juegos de conflicto puro y mutua dependencia.
35
Apuntes Docentes de Teoría de Juegos
3. Matching pennies
Dos jugadores están dotados con una moneda y deben escoger de manera
simultánea entre cara y sello. Si ambos escogen lo mismo el jugador uno gana 1 y
el jugador dos pierde 1. Si ambos escogen diferente, el jugador uno pierde uno y el
jugador dos gana 1. A continuación, se representa el juego en la forma estratégica:
2
1 Cara Sello
Figura 2.17
Los jugadores son dos estudiantes que han sido contratados para una asesoría por
un pequeño empresario. La función de beneficios de la empresa se describe así:
“cuatro veces el esfuerzo del jugador uno más cuatro veces el esfuerzo del jugador
dos más cuatro veces el producto de sus esfuerzos multiplicados por un parámetro
b”. El parámetro b se puede considerar como un elemento que recoge la sinergia
que genera que ambos estudiantes trabajen de manera conjunta como un equipo.
Por simplicidad, suponga que el parámetro b puede ser mayor o igual a cero y menor
o igual a ¼ (0 ≤ b ≤ ¼)
Los esfuerzos se medirán de manera individual y cada uno decidirá cuanto esfuerzo,
medido en tiempo, le dedicará a la empresa. El número de horas (estrategias) que
le puede dedicar cada estudiante está en el rango entre cero y cuatro horas.
En síntesis:
37
Apuntes Docentes de Teoría de Juegos
Solución:
Cada jugador debe decidir el esfuerzo que le dedicarán al trabajo con el objetivo de
maximizar su función de ganancias:
𝑑𝑈1
= 2 + 2 b 𝑠2 – 2𝑠1
𝑑𝑠1
2 + 2 b 𝑠2 – 2 𝑠̂1 = 0
𝑠̂1= 𝑅1 (𝑠2 ) = (1 + b 𝑠2 )
donde 𝑠̂1 = 𝑅1 (𝑠2 ) es la función de mejor repuesta del estudiante uno. Observe que
su función depende de la estrategia del estudiante dos y que tiene pendiente (el
parámetro b) positiva.
𝑑𝑈2
= 2 + 2 b 𝑠1 – 2𝑠2
𝑑𝑠2
2 + 2 b 𝑠1 – 2 𝑠̂ 2 = 0
𝑠̂2 = 𝑅2 (𝑠1 ) = (1 + b 𝑠1 )
38
Apuntes Docentes de Teoría de Juegos
donde 𝑠̂2 = 𝑅2 (𝑠1 ) es la función de mejor repuesta del estudiante dos. Observe que
su función depende de la estrategia del estudiante uno y que su pendiente
(parámetro b) es positiva.
Los rangos de trabajo que van entre 0 y 1 y entre 2 y 4 son estrategias dominadas.
La mejor respuesta de ambos jugadores estará entre 1 y 2 horas de trabajo, es
decir, para ninguno de los dos será una mejor respuesta trabajar menos de una hora
ni tampoco será una mejor respuesta trabajar más de dos horas.
Note que por eliminación de estrategias dominadas (que nunca serán una mejor
respuesta) el equilibrio converge hasta el punto en que las funciones de mejor
respuesta son iguales. Ese punto es el equilibrio de Nash y se caracteriza porque
ninguno de los dos tiene incentivos a desviarse o de tomar una estrategia distinta
(trabajar más o menos horas en el proyecto).
𝑠̂1= 𝑅1 (𝑠2 ) = (1 + b 𝑠2 )
𝑠̂2= 𝑅2 (𝑠1 ) = (1 + b 𝑠1 )
39
Apuntes Docentes de Teoría de Juegos
1
𝑠1∗ = 𝑠2∗ = (1−𝑏)
el resultado depende del valor que tome el parámetro b (recuerde que en términos
matemáticos el parámetro b es la pendiente de las funciones de mejor respuesta).
Por ejemplo:
Pregunta 2.3.
¿Por qué cree que los estudiantes destinan tan pocas horas al proyecto?
Hay dos empresas (jugadores) que producen un bien homogéneo, es decir, los
vienen son sustitutos perfectos.
Suponga que la demanda inversa del bien que las empresas producen está
determinada por la siguiente función:
P(q) = 12 – q, donde q = 𝑞1 + 𝑞2
Las ganancias son los beneficios económicos, es decir, la diferencia entre los
ingresos (I) y los costos totales (C). Los ingresos totales es el producto de lo que
produce (suponga que vende todo lo que produce) y el precio. Por simplicidad
suponga que los costos totales son iguales a cero. Las funciones de ganancias se
expresan a continuación:
40
Apuntes Docentes de Teoría de Juegos
𝑈1 (𝑞1 , 𝑞2 ) = 𝐼1 − 𝐶1
𝑈1 (𝑞1 , 𝑞2 ) = 𝑝(𝑞) ∗ 𝑞1 − 𝐶1
𝑈1 (𝑞1 , 𝑞2 ) = (12 − 𝑞) ∗ 𝑞1 − 0
𝑈1 (𝑞1 , 𝑞2 ) = [12 − (𝑞1 + 𝑞2 )] ∗ 𝑞1
𝑈2 (𝑞1 , 𝑞2 ) = 𝐼1 − 𝐶1
𝑈2 (𝑞1 , 𝑞2 ) = 𝑝(𝑞) ∗ 𝑞2 − 𝐶2
𝑈2 (𝑞1 , 𝑞2 ) = (12 − 𝑞) ∗ 𝑞2 − 0
𝑈2 (𝑞1 , 𝑞2 ) = [12 − (𝑞1 + 𝑞2 )] ∗ 𝑞2
Solución:
𝑑𝑈1
= 12 − 2𝑞1 − 𝑞2
𝑑𝑞1
12 − 2𝑞1 − 𝑞2 = 0
𝑞2
𝑞̂1 = 𝑅1 (𝑞2 ) = 6 - 2
Donde 𝑞̂1 = 𝑅1 (𝑞2 ) es la función de mejor respuesta de la empresa uno. Note que
es función de la cantidad que decida producir la empresa dos.
41
Apuntes Docentes de Teoría de Juegos
𝑑𝑈2
= 12 − 𝑞1 − 2𝑞2
𝑑𝑞2
12 − 𝑞1 − 2𝑞2 = 0
𝑞1
𝑞̂2 = 𝑅2 (𝑞1 ) = 6 -
2
Donde 𝑞̂2 = 𝑅2 (𝑞1 ) es la función de mejor respuesta de la empresa dos. Note que
es función de la cantidad que decida producir la empresa uno.
42
Apuntes Docentes de Teoría de Juegos
Note la línea de colusión. En esta línea las empresas están produciendo entre
ambas 6 unidades, que es la cantidad de monopolio. Cuando las empresas se
ubican en colusión, es necesario que estas cooperen para mantenerlo, por lo que
se encuentran en un equilibrio inestable, puesto que existen incentivos para
desviarse de estas estrategias cooperativas, aumentando la cantidad de producción
unilateralmente, ya que esto incrementaría el beneficio individual.
𝑞1
𝑞̂2 = 𝑅2 (𝑞1 ) = 6 -
2
43
Apuntes Docentes de Teoría de Juegos
Suponga que las empresas sólo tienen tres estrategias: producir tres unidades,
producir cuatro unidades o producir seis unidades11, es decir:
S1 = {3, 4, 6}
S2 = {3, 4, 6}
Por ejemplo
𝑈1 (4, 3) = [12 – (4 + 3)] * 4 = 20
𝑈2 (4, 3) = [12 – (4 + 3)] * 3 = 15
Es decir, si la empresa uno decide producir cuatro unidades y la empresa dos decide
producir tres unidades, las ganancias que obtienen son 20 y 15 respectivamente.
Haciendo ejercicio para los nueve perfiles estratégicos Ui (3, 3), Ui (3, 4), Ui (3, 6), Ui
(4, 3), Ui (4, 4), Ui (4, 6), Ui (6, 3), Ui (6, 4), Ui (6, 6), el juego se puede representar
estratégicamente:
2
1 3 4 6
Figura 2.20
44
Apuntes Docentes de Teoría de Juegos
Tarea 2.4.12
Suponga dos empresas que producen un bien homogéneo. Ambas deben decidir
de manera simultánea que precio cobrarán. Suponga que la función de demanda
de la empresa uno (𝑞1 ) es: 𝑎 − 𝑝1 cuando 𝑝1 > 𝑝2 ; 0 cuando 𝑝1 < 𝑝2 ; y (𝑎 − 𝑝1 )⁄2,
cuando 𝑝1 = 𝑝2 . Suponga que no hay costos fijos y que ambas empresas tienen un
costo marginal de c, donde c < 𝑎. Muestre que el único equilibrio de Nash es que
ambas empresas cobran el precio c.
Emilia, Nina y Talía son tres vecinas que deben decidir simultáneamente si
contribuyen (C) o no contribuyen (NC) a la creación de un jardín en el pasaje que
viven. Dependiendo de las contribuciones, el tamaño del jardín será pequeño,
mediano o grande. Emilia es la jugadora uno, Nina la jugadora dos y Talía la
45
Apuntes Docentes de Teoría de Juegos
jugadora tres. Talía debe decidir una de las dos matrices. Si elige la matriz I decide
contribuir; si decide la matriz II, decide no contribuir al proyecto.
Nina Nina
Emilia C NC Emilia C NC
Encuentre las mejores respuestas de Emilia ante las posibles jugadas de Nina:
o En la figura 2.21, si Nina decide contribuir, la mejor respuesta de Emilia es
no contribuir porque la ganancia de 6 es mayor que 5. Si Nina decide no
contribuir, la mejor respuesta de Emilia es no contribuir porque 4 es mayor
que 3.
o En la figura 2.22, si Nina decide contribuir, la mejor respuesta de Emilia es
no contribuir porque 4 es mayor que 3. Si Nina decide no contribuir, la mejor
respuesta de Emilia es no contribuir porque 2 es mayor que 1.
Encuentre las mejores respuestas de Nina ante las posibles jugadas de Emilia:
o En la figura 22.1, si Emilia decide contribuir, la mejor respuesta de Nina es
no contribuir porque 6 es mayor que 5. Si Emilia decide no contribuir, la mejor
respuesta de Nina es no contribuir porque 4 es mayor que 3.
46
Apuntes Docentes de Teoría de Juegos
Como se puede observar, el equilibrio de Nash de este juego es {NC, NC, NC} que
lleva asociado ganancias de (2,2,2). Es un equilibrio Pareto dominado ya que las
tres jugadoras hubiesen obtenido ganancias más altas si hubiesen contribuido. Este
es un juego de dilema.
47
Apuntes Docentes de Teoría de Juegos
Nina Nina
Emilia C NC Emilia C NC
Nina Nina
Emilia NC Emilia NC
NC 4,4,1 NC 2,2,2
48
Apuntes Docentes de Teoría de Juegos
Nina
Emilia NC
NC 2,2,2
Talía no contribuye
Figura 2.27
El único perfil estratégico que sobrevivió fue {NC, NC, NC} que constituye un
equilibrio de Nash.
Las tres jugadoras tenían una estrategia dominada. Aquí se comenzó con Emilia y
finalizó con Talía, pero el orden pudiese sido diferente y el resultado el mismo.
Note que las estrategias dominadas “contribuir” no son una estrategia de mejor
respuesta y las estrategias de mejor respuesta de “no contribuir” no son estrategias
dominadas.
2
1 L R
U 5,1 0,2
M 1,3 4,1
D 4,2 2,3
Figura 2.28
49
Apuntes Docentes de Teoría de Juegos
3° Cuando el jugador uno tiene una creencia (y le asigna una probabilidad igual a
uno a dicha creencia) sobre lo que jugará el jugador dos, la estrategia D no es nunca
una mejor respuesta.
14 Una estrategia es pura cuando la probabilidad que le asigna un jugador a su creencia respecto a
lo que jugará el otro jugador es igual a uno.
15 La suma de las probabilidades debe ser siempre igual a uno. Por lo tanto, las probabilidades están
50
Apuntes Docentes de Teoría de Juegos
1° Sus estrategias
La ganancia esperada del jugador uno de jugar U con la creencia que el jugador dos
jugará L con probabilidad P2(L):
Por ejemplo, se podría hacer una especulación y suponer que el jugador dos jugará
L con una probabilidad de ½ y, por lo tanto, jugará R con una probabilidad de ½.
La ganancia esperada del jugador uno de jugar U, con la creencia que el jugador
dos jugará L con probabilidad de ½, es:
UE1 (U) vs. [(P2(L), P2(R)] = UE1 (U) vs. [1/2, 1/2) = [(1/2) * 5] + [(1/2) * 0] = 2,5
El mismo ejercicio se puede realizar para calcular las ganancias esperadas del
jugador uno de jugar M o D, dada la creencia arbitraria que el jugador dos jugará L
con una probabilidad de ½:
UE1 (M) vs. [(P2(L), P2(R)] = UE1 (M) vs. (1/2, 1/2) = [(1/2) * 1] + [(1/2) * 4] = 2,5
UE1 (D) vs. [(P2(L), P2(R)] = UE1 (D) vs. (1/2, 1/2) = [(1/2) * 4] + [(1/2) * 2] = 3
Entonces, si la creencia del jugador uno es que el jugador dos jugará L con una
probabilidad de 1/2 (y por lo tanto jugará R con una probabilidad de 1/2), la mejor
respuesta del jugador uno ante esa creencia es jugar D porque la ganancia
51
Apuntes Docentes de Teoría de Juegos
esperada es 3 mayor a 2,5 que son las ganancias esperadas que obtendría al jugar
U o M.
Un punto crucial es cómo se configuran las creencias. Suponga que la creencia del
jugador uno cambia y la probabilidad que le asigna a que el jugador dos juegue L
fuese de 2/3. En tal caso, el cálculo de las ganancias esperadas también cambia
haciendo del proceso de toma de decisiones algo muy complicado y lento.
Con el fin de simplificar y facilitar el proceso de la toma de decisiones, se presenta
un método gráfico – algebraico. Procedimiento:
1° Trace tres líneas que representen las ganancias esperadas del jugador uno para
cada una de sus estrategias (U, M o D). Las ganancias esperadas del jugador uno
son función de la probabilidad que le asigna a que el jugador dos juegue R. Por este
motivo, en el eje de las abscisas (eje X) se representa la variable P 2 (R).
UE1 [U, P2(R)] = [5 * (1 - P2(R))16 + 0 * P2(R)]
Note que:
o si el jugador uno le asigna una probabilidad de cero a que el jugador dos
juegue R, es decir: P2(R) = 0, está implícitamente asignando una probabilidad
de uno a que juegue L, es decir: P2(L) = 1. Si este fuese el caso la ganancia
esperada del jugador uno de jugar U ante esa creencia sería 5.
o si el jugador uno le asigna una probabilidad de uno a que el jugador dos
juegue R, es decir: P2(R) = 1, está implícitamente asignando una probabilidad
de cero a que juegue L, es decir, P2(L) = 0. Si este fuese el caso la ganancia
esperada del jugador uno de jugar U ante esa creencia sería 0.
UE1 [M, P2(R)] = [1 * (1 - P2(R)) + 4 * P2(R)]
Note que:
o si el jugador uno le asigna una probabilidad de cero a que el jugador dos
juegue R, la ganancia esperada del jugador uno de jugar M ante esa creencia
sería 1.
16
Recuerde que (1 - P2(R)) = P2(L)
52
Apuntes Docentes de Teoría de Juegos
Note que:
Para trazar las tres líneas (una para cada estrategia del jugador uno) una los puntos
de las ganancias esperadas cuando las probabilidades que el jugador dos juega R
sean cero y uno.
2° Las líneas se cruzan en tres puntos (sólo dos puntos son relevantes, ¿por qué?).
Dichos cruces implican que la ganancia esperada del jugador uno es la misma. Si
la ganancia esperada es la misma, el jugador uno debe ser indiferente entre las dos
53
Apuntes Docentes de Teoría de Juegos
Para determinar una política de decisión para el jugador uno proceda, sólo con los
puntos relevantes, de la siguiente manera:
a) Encontrar la probabilidad de que el jugador dos juegue R tal que el jugador uno
sea indiferente entre jugar U o D. Como se dijo, si son indiferentes, las
ganancias esperadas son iguales:
P2(R) = 1/3
Es decir, si la probabilidad que el jugador uno le asigna a que el jugador dos jugará
R es igual a 1/3, el jugador uno será indiferente entre jugar U o D porque la ganancia
esperada es igual.
b) Encontrar la probabilidad de que el jugador dos juegue R tal que el jugador uno
sea indiferente entre jugar M o D:
P2(R)) = 3/5
Es decir, si la probabilidad que el jugador uno le asigna a que el jugador dos jugará
R es igual a 3/5, el jugador uno será indiferente entre jugar M o D porque la ganancia
esperada es la misma.
54
Apuntes Docentes de Teoría de Juegos
3° Generar una política de decisión para el jugador uno en función de las creencias
sobre las estrategias del jugador dos:
Definición: una estrategia 𝑠̂𝑖 es una mejor respuesta del jugador i (𝑅𝑖 ), respecto a
la creencia p (donde p representa la distribución de probabilidades) acerca de las
elecciones del resto de los jugadores (-i), si se cumple que la ganancia esperada de
jugar 𝑠̂𝑖 es mayor que la ganancia de jugar 𝑠𝑖´ para toda combinación de
probabilidades de las estrategias 𝑆−𝑖 (las estrategias de todo el resto de los
jugadores, es decir, de todos los jugadores menos el jugador i):
55
Apuntes Docentes de Teoría de Juegos
Ejercicio 2.3
De acuerdo al siguiente juego:
2
1 C S
C 1,2 0,0
S 0,0 2,1
B -1,4 3,1
Figura 2.30
Para que el par de estrategias mixtas {𝑝1∗ , 𝑝2∗ } sea un equilibrio de Nash se deben
satisfacer dos condiciones:
Condición 1: 𝑈𝐸1 {𝑝1∗ , 𝑝2∗ } ≥ 𝑈𝐸1 {𝑝1 , 𝑝2∗ }, para cada distribución de probabilidad de
p1 sobre S1, y
56
Apuntes Docentes de Teoría de Juegos
Condición 2: 𝑈𝐸2 {𝑝1∗ , 𝑝2∗ } ≥ 𝑈𝐸2 {𝑝1∗ , 𝑝2 }, para cada distribución de probabilidad de
p2 sobre S2.
En estrategias puras, el juego tiene dos equilibrios de Nash: {Cine, Cine} y {Fútbol,
Fútbol}. En adelante, se procederá a encontrar el equilibrio de Nash en estrategias
mixtas17.
17 Aunque todos los juegos tienen equilibrio de Nash en estrategias puras y/o mixtas, hay juegos que
tienen equilibrio de Nash sólo en estrategias puras (como los juegos de dilema); hay otros que tienen
equilibrios de Nash sólo en estrategias mixtas (como los juegos de conflicto puro); hay otros juegos
que tienen equilibrios de Nash en estrategias puras y estrategias mixtas (como los juegos de
negociación).
57
Apuntes Docentes de Teoría de Juegos
2
1 C F
C 2,1 0,0 p
q 1-q
Q
Figura 2.31
El jugador uno cree que el jugador dos jugará C con una probabilidad q y que jugará
F con una probabilidad 1 – q.
El jugador dos cree que el jugador uno jugará C con una probabilidad p y que jugará
F con una probabilidad 1 – p.
Solución:
1° Encontrar la mezcla Q del jugador dos que hace al jugador uno indiferente entre
ir al cine o al fútbol.
2q = 1 – q
q = 1/3
Para el jugador uno, las estrategias cine y fútbol son indiferentes, si el jugador dos
va al cine con una probabilidad de q = 1/3 y al fútbol con una probabilidad 1 – q =
2/3.
¿Cuál es la ganancia esperada del jugador uno al jugar C contra la estrategia mixta
del jugador dos Q = (1/3, 2/3)? ¿Cuál es la ganancia esperada del jugador uno al
jugar F contra la estrategia mixta del jugador dos Q = (1/3, 2/3)?
Queda comprobado entonces que si el jugador dos jugara la mezcla Q = (1/3, 2/3),
las ganancias esperadas del jugador uno al jugar cine o fútbol son iguales.
Pregunta 2.4
¿Cuál sería la mejor respuesta del jugador uno si su creencia fuese que el jugador
dos jugará C con una probabilidad mayor a 1/3? ¿Cuál sería la mejor respuesta del
jugador uno si su creencia fuese que el jugador dos jugará C con una probabilidad
menor a 1/3?
2° Encontrar la mezcla P del jugador uno que hace al jugador dos indiferente entre
ir al cine o al fútbol.
59
Apuntes Docentes de Teoría de Juegos
p = 2/3
Para el jugador dos, las estrategias cine y fútbol son indiferentes, si el jugador uno
va al cine con una probabilidad de p = 2/3 y al fútbol con una probabilidad 1 – p =
1/3.
¿Cuál es la ganancia esperada del jugador dos al jugar C contra la estrategia mixta
del jugador uno P = (2/3, 1/3)? ¿Cuál es la ganancia esperada del jugador dos al
jugar F contra la estrategia mixta del jugador uno P = (2/3, 1/3)?
Queda comprobado entonces que si el jugador uno jugara la mezcla P = (2/3, 1/3),
las ganancias esperadas del jugador al jugar cine o fútbol dos son iguales.
Pregunta 2.5
¿Cuál sería la mejor respuesta del jugador dos si su creencia fuese que el jugador
uno jugará C con una probabilidad mayor a 2/3? ¿Cuál sería la mejor respuesta del
jugador dos si su creencia fuese que el jugador uno jugará C con una probabilidad
menor a 2/3?
60
Apuntes Docentes de Teoría de Juegos
Es decir, la ganancia esperada del jugador uno de jugar su estrategia mixta P = (2/3,
1/3) versus la estrategia mixta Q= (1/3, 2/3) del jugador dos es igual a la ganancia
esperada que tiene al jugar sus estrategias puras C o F versus la estrategia mixta
Q del jugador dos. Por lo tanto, el jugador uno no tiene incentivos a desviarse.
Es decir, la ganancia esperada del jugador dos de jugar su estrategia mixta Q = (1/3,
2/3) versus la estrategia mixta P= (2/3, 1/3) del jugador uno es igual a la ganancia
esperada que tiene al jugar sus estrategias puras C o F versus la estrategia mixta
P del jugador uno. Por lo tanto, el jugador dos no tiene incentivos a desviarse.
6° En conclusión, el juego tiene tres equilibrios de Nash {C, C}, {F, F} y {(2/3, 1/3),
(1/3, 2/3)} con sus respectivas ganancias (2, 1), (1, 2) y (2/3, 2/3).
Pregunta 2.6
¿Por qué los jugadores podrían aleatorizar sus estrategias si las ganancias que
obtienen de sus estrategias mixtas son tan pobres, incluso comparadas con la
ganancia más baja de los equilibrios en estrategias puras?
61
Apuntes Docentes de Teoría de Juegos
2
1 C S
C 1,-1 -1,1 p
q 1-q
Q
Figura 2.32
Solución:
1° Encontrar la mezcla Q = (q, 1 – q) del jugador dos que hace al jugador uno
indiferente entre jugar cara o sello.
Para el jugador uno, la decisión de jugar cara o sello es indiferente si sus ganancias
esperadas (versus la estrategia mixta Q del jugador dos) son iguales, es decir, si:
4q = 2
q = 1/2
Para el jugador uno, las estrategias cara y sello son indiferentes si el jugador dos
elige cara con una probabilidad de q = 1/2 y elige sello con una probabilidad 1 – q =
1/2.
¿Cuál es la ganancia esperada del jugador uno al jugar cara contra la estrategia
mixta del jugador dos Q = (1/2, 1/2)? ¿Cuál es la ganancia esperada del jugador
uno al jugar sello contra la estrategia mixta del jugador dos Q = (1/2, 1/2)?
Queda comprobado entonces que si el jugador dos jugara la mezcla Q = (1/2 1/2),
las ganancias esperadas del jugador uno al jugar cara o sello son iguales.
2° Encontrar la mezcla P del jugador uno que hace al jugador dos indiferente entre
jugar cara o sello.
Para el jugador dos, la decisión de jugar cara o sello es indiferente si sus ganancias
esperadas (versus la estrategia mixta P del jugador uno) son iguales, es decir, si:
63
Apuntes Docentes de Teoría de Juegos
p = 1/2
¿Cuál es la ganancia esperada del jugador dos al jugar C contra la estrategia mixta
del jugador uno P = (1/2, 1/2)? ¿Cuál es la ganancia esperada del jugador dos al
jugar S contra la estrategia mixta del jugador uno P = (1/2, 1/2)?
Queda comprobado entonces que si el jugador uno jugara la mezcla P = (1/2 1/2),
las ganancias esperadas del jugador dos de jugar cara o sello son iguales.
UE1 (P, Q) = 0
Es decir, la ganancia esperada del jugador uno de jugar su estrategia mixta P = (1/2,
1/2) versus la estrategia mixta Q = (1/2, 1/2) del jugador dos es igual a la ganancia
esperada que tiene al jugar sus estrategias puras C o S versus la estrategia mixta
Q del jugador dos. Por lo tanto, el jugador uno no tiene incentivos a desviarse.
64
Apuntes Docentes de Teoría de Juegos
UE2 (P, Q) = 0
Es decir, la ganancia esperada del jugador dos de jugar su estrategia mixta Q = (1/2,
1/2) versus la estrategia mixta P = (1/2, 1/2) del jugador uno es igual a la ganancia
esperada que tiene al jugar sus estrategias puras C o S versus la estrategia mixta
P del jugador uno. Por lo tanto, el jugador dos no tiene incentivos a desviarse.
2
1 Roca Tijera Papel
Figura 2.33
65
Apuntes Docentes de Teoría de Juegos
Capítulo Tres
Juegos Dinámicos
3.1. Objetivos del capítulo
66
Apuntes Docentes de Teoría de Juegos
Al igual que en el capítulo dos se supone que: (1) los jugadores tienen información
completa, es decir, conocen la función de ganancias de cada jugador; (2) los
jugadores son racionales en el sentido que buscan maximizar sus ganancias, y (3)
los jugadores tienen conocimiento común respecto a las funciones de ganancias
y a la racionalidad.
1° Conjunto de jugadores.
2° El orden del juego representado por un árbol; quien mueve, cuando mueve.
3° La información que poseen los jugadores al momento de mover y elegir sus
acciones.
4° El conjunto de posibles acciones que tiene cada jugador.
5° Las ganancias como función del desarrollo del juego.
67
Apuntes Docentes de Teoría de Juegos
Un árbol es una colección finita de nodos con una relación entre ellos que se
expresa en su conexión mediante ramas. Entre los nodos hay una relación de
precedencia. Para la construcción del árbol, se establecen dos supuestos:
Luego de los nodos terminales se deben especificar las ganancias de cada jugador
asociadas a las secuencias de movimientos que culminan en un nodo terminal.
Los nodos están conectados por ramas que representan acciones. De cada nodo
pueden surgir múltiples ramas. Un perfil estratégico es una secuencia de nodos
conectados por ramas que (1) comienzan en el nodo inicial, (2) finaliza en un nodo
terminal y (3) tiene la propiedad que los nodos sucesores son nodos sucesivos en
la secuencia. Cada perfil estratégico es un camino a través de las ramas del árbol.
68
Apuntes Docentes de Teoría de Juegos
Subjuegos
Note que:
1.- El juego G es siempre un subjuego de G.
2.- Se llaman subjuegos propios de G a aquellos subjuegos que no coinciden con
G, es decir, que no comienzan en el nodo inicial de G.
3.- Si G es un juego de información perfecta, cualquier parte que comience en un
nodo de decisión y contenga todos los nodos que le suceden es un subjuego.
4.- También se considera un subjuego a aquellos en que sólo intervendrá un solo
jugador.
69
Apuntes Docentes de Teoría de Juegos
Ejemplo 3.1
Resuelva el siguiente juego por inducción hacia atrás.
70
Apuntes Docentes de Teoría de Juegos
El juego comienza con el jugador uno que debe decidir si juega L o R. Si juega L le
corresponde el turno al jugador dos, que debe decidir entre a o b. Si decide la acción
a el juego termina con ganancias de 5 para el jugador uno y de 2 para el jugador
dos. Si decide la acción b el juego termina con ganancias de 3 para el jugador uno
y de 1 para el jugador dos. Si el jugador uno, decide R, le corresponde al jugador
dos que debe decidir entre c o d. Si juega c, el juego termina con ganancias de 4
para el jugador uno y de 1 para el jugador dos. Si el jugador dos, juega d, le
corresponde jugar nuevamente al jugador uno, quien debe decidir entre S o T. Si
decide la acción S el juego termina con ganancias de 1 para el jugador uno y de 2
para el jugador dos. Si decide la acción T el juego termina con ganancias de 0 para
el jugador uno y de 3 para el jugador dos.
Solución
71
Apuntes Docentes de Teoría de Juegos
2° Se va a los dos últimos subjuegos (aquel que comienza en los últimos nodos de
decisión) y se asume que el jugador dos jugará una acción óptima.
En estos nodos, si el jugador uno decide L, el jugador dos debe decidir entre a o b.
Por racionalidad elegirá a porque la ganancia de 5 es mayor que 3.
Si el jugador uno decide R, el jugador dos debe decidir entre c o d. Por racionalidad
elegirá d porque anticipa que si juega aquella opción, el jugador uno elegirá S y la
ganancia que obtendrá es 2 que es mayor que 1.
Una vez resueltos estos dos subjuegos, se representa el juego en una forma más
reducida, donde el jugador deberá decidir si juega L o R:
En consecuencia, la solución del juego por inducción hacia atrás es {(L, S), (a, d)}:
el jugador uno jugaría L en su primer nodo de decisión y S en su segundo nodo de
decisión. El jugador dos, jugaría a en su primer nodo de decisión, si el jugador uno
juega L y d en su segundo nodo de decisión, si el jugador uno juega R.
Note que, si el jugador uno juega L, el jugador dos no deberá decidir entre c y d. No
obstante, en la solución se debe registrar lo “que haría si” el juego llegará a ese
nodo.
Este modelo es una variante de Cournot. La diferencia crucial es que los jugadores
juegan de manera secuencial.
73
Apuntes Docentes de Teoría de Juegos
Hay dos empresas (jugadores) que producen un bien homogéneo, es decir, son
sustitutos perfectos. Las empresas deben decidir cuánto producir (estrategias) de
manera secuencial, es decir, la empresa líder (jugador uno) decide primero, la
empresa seguidora (empresa dos) observa la decisión de la empresa líder, y luego
decide cuánto producir
Suponga que la demanda inversa del bien que las empresas producen está
determinada por la siguiente función:
𝑃(𝑞) = 12 − 𝑞, donde 𝑞 = 𝑞1 + 𝑞2
Solución:
Como este es un juego dinámico de información completa y perfecta, se utilizará el
método de inducción hacia atrás, es decir, se comenzará por la empresa dos que
es aquella que debe decidir en los nodos previos a los nodos terminales:
1° Encontrar la función de mejor respuesta de la empresa dos. Como se supone
que la empresa es racional y que tiene como objetivo la maximización de sus
ganancias, planteamos el problema como un problema de optimización:
𝑀𝑎𝑥 𝑈2 (𝑞1 , 𝑞2 ) = 𝑀𝑎𝑥[12 − (𝑞1 + 𝑞2 )] ∗ 𝑞2
𝑞2 𝑞2
74
Apuntes Docentes de Teoría de Juegos
Donde 𝑞̂2 = 𝑅2 (𝑞1 ) es la función de mejor respuesta de la empresa dos. Note que
es función de la cantidad que decida producir la empresa uno.
2° La empresa líder conoce la función de mejor respuesta de la empresa dos. Esta
información le da la ventaja de poder anticipar las respuestas de la empresa dos
ante sus decisiones de producción. Además, como la empresa uno sabe que la
pendiente de la función de mejor respuesta de la empresa dos es negativa, anticipa
que en la medida que aumente la producción, la empresa uno disminuirá la suya.
𝑞12
𝑀𝑎𝑥 𝑈1 (𝑞1 , 𝑞̂2 ) = 𝑀𝑎𝑥 6 𝑞1 −
2
𝑞1 𝑞1
75
Apuntes Docentes de Teoría de Juegos
Por inducción hacia atrás la solución es que la empresa líder decide producir seis
unidades. Esta decisión la toma luego de anticipar que la mejor respuesta de la
empresa dos sería producir cuatro unidades si ésta produce tres; cuatro unidades
si ésta produce cuatro y tres unidades si ésta decidiese producir seis.
76
Apuntes Docentes de Teoría de Juegos
La solución del juego por inducción hacia atrás es {R, (R´, L´)}, es decir, si el juego
llega al primer nodo de decisión del jugador dos, luego de que el jugador uno jugara
L, su mejor respuesta sería jugar R´. Si el juego llega al segundo nodo de decisión
del jugador dos, luego de que el jugador uno jugara R, su mejor respuesta sería
jugar L´. El jugador uno que anticipa las mejores respuestas del jugador dos, jugaría
al comienzo del juego, la estrategia R:
77
Apuntes Docentes de Teoría de Juegos
El jugador uno tiene un nodo de decisión y tiene dos acciones (L o R). Por lo
tanto, tiene dos estrategias.
El jugador dos tiene dos nodos de decisión y tiene dos acciones en cada nodo
(L´ o R´). Por lo tanto, tiene cuatro estrategias:
o Estrategia 1: (L´, L´): si el jugador uno juega L, entonces juega L´. Si el
jugador uno juega R, entonces juega L´.
o Estrategia 2: (L´, R´): si el jugador uno juega L, entonces juega L´. Si el
jugador uno juega R, entonces juega R´.
o Estrategia 3: (R´, L´): si el jugador uno juega L, entonces juega R´. Si el
jugador uno juega R, entonces juega L´.
o Estrategia 4: (R´, R´): si el jugador uno juega L, entonces juega R´. Si el
jugador uno juega R, entonces juega R´.
Cada estrategia del jugador dos le indica una acción a seguir en caso que tuviese
que decidir.
La representación del juego en forma estratégica se ilustra a continuación:
2
1 (L´, L´) (L´, R´) (R´, L´) (R´, R´)
78
Apuntes Docentes de Teoría de Juegos
18
En la próxima sección se definirá el equilibrio de Nash perfecto en subjuegos.
79
Apuntes Docentes de Teoría de Juegos
La solución por inducción hacia atrás sugiere que al comienzo del juego el jugador
uno juega L y el juego termina con ganancias de 2 y 0 respectivamente.
2
1 L´ R´
L, L” 2,0 2,0
L, R” 2,0 2,0
R, L” 1,1 3,0
R, R” 1,1 0,2
Figura 3.5.219
19
Note que las dos primeras filas son redundantes porque expresan las mismas ganancias. El motivo
es que, si el jugador uno juega L al comienzo de juego, éste finaliza. No obstante, debido a la
definición de estrategia que se ha adoptado como un plan de acción en todas las contingencias o
nodos de decisión, es necesario escribirla pese a su no plausibilidad. El razonamiento es “que haría
si…”. A lo largo del documento se continuará representando de esta forma a pesar de que existe una
forma reducida de presentar (para detalles sobre como representar la matriz en una forma reducida
ver Osborne y Rubinstein.
80
Apuntes Docentes de Teoría de Juegos
El juego tiene dos equilibrios de Nash: {(L, L”), L´} y {(L, R”), L´}. Sólo el equilibrio
{(L, L”), L´} induce un equilibrio de Nash en cada subjuego. En efecto, este equilibrio
es consistente con la solución por inducción hacia atrás. El segundo equilibrio es no
plausible porque descansa en una amenaza no creíble: que el jugador uno jugará
R” en su segundo nodo de decisión.
Tarea 3.1
Represente el juego de Stackelberg con variables discretas en forma estratégica.
Pista: La empresa uno tiene tres estrategias y la empresa dos tiene 9 estrategias.
81
Apuntes Docentes de Teoría de Juegos
Solución:
1° Encontrar los equilibrios de Nash del subjuego 1: El subjuego 1, es aquel que
comienza en el segundo nodo de decisión del jugador uno. La representación
extensiva y estratégica del subjuego se presenta a continuación:
82
Apuntes Docentes de Teoría de Juegos
83
Apuntes Docentes de Teoría de Juegos
uno de los dos equilibrios de Nash de ese subjuego, ya que, si el jugador uno
juega d, la mejor respuesta del jugador dos es r.
Juego completo
Equilibrios de Nash [Uu, l] [Du, r] [Dd, r]
Subjuego 1 [u] cumple cumple no cumple
[u, l] cumple no cumple no cumple
Subjuego 2
[d, r] no cumple no cumple cumple
5° Resolver por inducción hacia atrás: se decía que el método de la inducción hacia
atrás elimina las respuestas que no son equilibrios de Nash. En el juego la solución
es: {(Uu), l}, es decir, el jugador uno juega U en el primer nodo de decisión y u en
su segundo nodo de decisión. El jugador dos en tanto, juega l en su nodo de
decisión.
Ejercicio 3.1
Instrucciones: J1 elige U o D, donde D termina el juego con ganancia de 3 para J1
y 2 para J2. Si J1 eligió U entonces J2 elige L o R, donde R finaliza el juego con
ganancias de 2 para J1 y 3 para J2. Si J2 elige L entonces J1 elige entre u y d, y el
84
Apuntes Docentes de Teoría de Juegos
2
1 l m r
85
Apuntes Docentes de Teoría de Juegos
En una representación extensiva, la línea discontinua que une los nodos de decisión
denota la simultaneidad del juego.
En la primera representación, esto quiere decir que el jugador dos sabe que el
jugador uno jugó, pero no sabe que jugó, es decir, no sabe en cuál de sus dos nodos
está. En la segunda representación, el jugador uno sabe que el jugador dos jugó,
es decir, sabe que el juego está en su conjunto de información, pero no sabe en
cuál de sus tres nodos de decisión está.
86
Apuntes Docentes de Teoría de Juegos
En este tipo de juegos, una estrategia es un completo plan de acción que específica
una acción para el jugador en cada conjunto de información en que pueda ser
llamado a decidir.
1° Cada conjunto de información contiene nodos de decisión para sólo uno de los
jugadores.
2° Todos los nodos en un conjunto de información deben contener el mismo número
de sucesores inmediatos.
3° Los nodos deben tener el mismo conjunto de acciones disponibles en las ramas
que llevan a los sucesores.
Ejemplo 3.2.
Resolviendo por inducción hacia atrás el argumento es que el jugador uno no elige
U o M porque su elección será observada por el jugador dos, y éste elegirá d o u y
87
Apuntes Docentes de Teoría de Juegos
la ganancia del jugador uno será 0. Jugador uno elegirá D porque anticipa que el
jugador dos elegirá u y por lo tanto tendrá una ganancia de 1 que es mayor que 0.
Ahora, si el jugador uno eligió D, el jugador dos sabe en que nodo está. Sin
embargo, si el jugador uno eligió U o M el jugador dos no sabe en que nodo está,
es decir, no sabe si el jugador uno eligió U o M y el jugador uno sabe que el jugador
dos no sabe en que nodo está. En este caso ya no es tan obvio que el jugador uno
juegue D. El jugador uno podría pensar que el jugador dos mezclará sus acciones
(estrategias mixtas), por ejemplo, jugando ½ de las veces u y ½ de las veces d y,
por lo tanto, la ganancia esperada del jugador uno producto de la estrategia mixta
del jugador dos será 2 que es mayor que 1 que es la ganancia que obtendría al
jugar D.
Ejemplo 3.3.
Resuelva el equilibrio de Nash perfecto en subjuegos del siguiente juego20:
Solución:
1° Resuelva los dos subjuegos propios:
20
Ver Pérez, Jimeno y Cerda.
89
Apuntes Docentes de Teoría de Juegos
2° Una vez que se ha determinado cómo se jugará en cada uno de los subjuegos
propios, el jugador uno se enfrenta a la decisión de jugar I, C o D, que le producirían
ganancias de 6, 5 o 2, respectivamente. Represente el juego en forma reducida y
resuelva por inducción hacia atrás:
90
Apuntes Docentes de Teoría de Juegos
Ejercicio 3.4
Observe que este juego denota el problema con el método de la inducción hacia
atrás. El último subjuego propio es un juego de suma cero, sin estrategias
dominadas ni equilibrio de Nash en estrategias puras.
Solución:
21
Ver Fundenberg y Tirole
91
Apuntes Docentes de Teoría de Juegos
2
1 C D
C 2, -2 -2, 2 p
D -2, 2 2, -2 1–p
q 1-q
Q
Figura 3.11.1
2.1 Encontrar la mezcla Q del jugador dos que hace al jugador uno indiferente
entre jugar cara o sello y calcular las ganancias esperadas:
q = 1/2
Para el jugador uno, las estrategias C y D son indiferentes, si el jugador dos elige C
con una probabilidad de q = 1/2 y elige D con una probabilidad 1 – q = 1/2.
Ganancias esperadas:
92
Apuntes Docentes de Teoría de Juegos
2.2 Encontrar la mezcla P del jugador uno que hace al jugador dos indiferente
entre jugar C o D.
p = 1/2
Ganancias esperadas:
UE1 (P, Q) = 0
UE2 (P, Q) = 0
93
Apuntes Docentes de Teoría de Juegos
4° El equilibrio de Nash perfecto en subjuegos es {[R, (1⁄2 , 1⁄2)], [L, (1⁄2 , 1⁄2)]}.
Este equilibrio indica que el jugador uno jugará R en su primer nodo de decisión y
jugará A con una probabilidad de 1⁄2 y jugará B con una probabilidad de 1⁄2 si el
juego llega a su segundo nodo de decisión. El jugador dos por su parte, jugará L en
su primer nodo de decisión y jugará C con una probabilidad de 1⁄2 y jugará D con
una probabilidad de 1⁄2 si el juego llega a su segundo nodo de decisión.
La predicción del desarrollo del juego es que el jugador uno jugará R y luego
terminará con la decisión del jugador dos jugando L. Este equilibrio trae asociadas
ganancias de 3 y 1, respectivamente.
Ejercicio 3.5
22
Ver Pérez, Jimeno y Cerda.
94
Apuntes Docentes de Teoría de Juegos
Solución:
2
1 A B
A -2, -2 4, 2
B 1, 4 -1, -1
Figura 3.12.1
Note que este subjuego tiene dos equilibrios de Nash: (A, B) y (B, A).
95
Apuntes Docentes de Teoría de Juegos
3° El juego tiene dos equilibrios de Nash perfectos: {DA, B} y {IB, A}. Si (A, B)
es el equilibrio de Nash que se supone se jugará en el subjuego, la elección óptima
del jugador uno al comienzo del juego sería jugar D. Si (B, A) es el equilibrio de
Nash que se supone se jugará en el subjuego, la elección óptima del jugador uno al
comienzo del juego sería jugar I y terminar el juego.
96