S03. Teoría de Juegos Estudiantes 7-2-23

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 19

Teoría de Juegos

¿Qué es la teoría de juegos?


La Teoría de Juegos es una teoría matemática que estudia las características
generales de las situaciones competitivas de manera formal y abstracta.
Es útil para tomar decisiones en casos donde dos o más personas que deciden se
enfrentan en un conflicto de intereses.
Así, estudia la toma de decisiones en interacción (ejemplos: el juego de ajedrez,
la negociación política, las estrategias militares).
¿Dónde se utiliza?
En estrategias de conflicto, guerras de precios, decisiones de cartel, relaciones
sindicato empresa, acuerdos y negociaciones políticas, económicas, militares, etc.

Historia de la Teoría de Juegos


La noción más antigua de un juego se encuentra en el Mabinogion, una colección
de cuentos populares galeses (siglos XI-XIII). Hay un relato en el que dos reyes
que están en guerra juegan al ajedrez, mientras que sus ejércitos batallan en las
proximidades. Cada vez que un rey se come una pieza llega un mensajero para
informar al otro que ha perdido un hombre importante o una división. Al final un
rey da jaque al otro.

Émile Borel (1871 – 1956)


En 1921 el matemático francés, EB, hizo públicos varios artículos sobre la théorie
du jeu (“Game theory and left symetric core integral equations”) Borel usó el
póquer como ejemplo, y analizó el problema del faroleo. Borel reparó en las
posibles aplicaciones económicas y militares de la teoría de juegos y planteó las
cuestiones esenciales de la teoría de juegos: ¿para qué juegos existe la mejor
estrategia, y de qué manera puede uno buscar esa estrategia?
Como matemático, era conocido por su trabajo fundación en las áreas de la teoría
de la medida y la probabilidad.

John Von Neumann (1903 – 1957)


Fue un matemático húngaro-estadounidense que realizó contribuciones
fundamentales en física cuántica, análisis funcional, teoría de conjuntos, ciencias
de la computación, economía, análisis numérico, cibernética, hidrodinámica,
estadística y muchos otros campos. Desde la década de 1920 estuvo trabajando
en la estructura matemática del póker y otros juegos, pero enseguida vio que sus
teoremas podían ser aplicados a economía, política, relaciones internacionales,
etc. No fue hasta 1944, cuando von Neumann y Morgensten publicaron su libro
Teoria de Juegos y Comportamiento Económico, que incide en el desarrollo de la
programación lineal y la teoría de la decisión estadística de Wald.
John Von Neumann demostró matemáticamente que siempre hay un curso
racional de acción para juegos de dos jugadores, con intereses completamente
opuestos (uno gana y el otro pierde). Esta prueba es conocida como el Teorema
Minimax.

Ejemplo: repartirse una tarta (queque)


Muchas personas saben cuál es la mejor forma de que dos niños caprichosos se
repartan un trozo de tarta. No importa el cuidado que el padre tenga para cortarla,
uno de los niños (¡o incluso ambos!) pensará que se le ha dejado el trozo más
pequeño. La solución consiste en que uno de ellos corte la tarta y el otro escoja el
trozo que quiere. Gracias a la glotonería, será una partición justa, el primer niño
no podrá quejarse de que la división es injusta porque la ha hecho él. El segundo
no podrá protestar, pues ha podido escoger el trozo que prefería. Esta discusión
doméstica no sólo es un juego en el sentido dado por Von Neumann, sino que es
prácticamente el ejemplo más simple posible del principio MINIMAX en el que se
fundamenta la teoría de juegos. ¿Cuál es la mejor estrategia?

Concepto de juego
Un juego es cualquier situación de decisión caracterizada por una
interdependencia estratégica, gobernada por reglas y con un resultado definido. El
resultado que obtiene una empresa depende no sólo de la estrategia que elige,
sino también de las estrategias que eligen los otros competidores guiados por sus
propios intereses.
La solución de un juego debería indicar a cada jugador qué resultado esperar y
cómo alcanzarlo. Los participantes de un juego intentan obtener el mejor
resultado para sus intereses. Por lo tanto, un juego es un problema de
maximización, uno para cada jugador. La teoría de juegos, como cualquier otra
teoría general, provee vinculaciones: muestra cómo situaciones aparentemente
diversas tienen la misma estructura lógica.
La interdependencia genera muchas veces competencia entre los participantes
del juego, pero los jugadores también pueden tener algunos intereses
compartidos. Un juego puede ser comparado con la división de una tarta cuyo
tamaño puede aumentar o reducirse como resultado de acciones de los
jugadores. Los jugadores tienen un interés común en agrandar la tarta, pero
tendrán intereses en conflicto al momento de acordar dividirla.

Un juego consiste en:


1. Al menos dos jugadores.
2. Un conjunto de estrategias para cada jugador.
3. Una relación de preferencia sobre posibles resultados.
El jugador es generalmente una entidad: Individuo, compañía, nación, animal, etc.
Las estrategias: Acciones que un jugador selecciona a seguir.
Las salidas: Determinadas por la mutua selección de estrategias.
Relación de preferencia: Modelada como la utilidad (pago) de un conjunto de
salidas.

Estrategia
En la teoría de juegos una estrategia es un concepto muy importante, con un
sentido más concreto que el que se le da habitualmente.
Es un plan muy específico.
Es la descripción completa de una forma determinada de jugar,
independientemente de lo que hacen los demás jugadores y de la duración de un
juego.
Existen estrategias puras y mixtas (definición).

Conducta racional y la información


La teoría de juegos considera que los jugadores son racionales y solo les interesa
ganar.
Se supone que los jugadores tienen un conocimiento total y una comprensión
absoluta de las reglas, además de una memoria perfecta que les permite recordar
todas las jugadas anteriores.
Racionalidad estratégica
En teoría de juegos la racionalidad significa que cada jugador hace lo mejor que
puede dada la información con que cuenta al momento de tomar la decisión. Ser
racional significa no cometer el mismo error en forma consistente.
Dada la interdependencia entre jugadores, una decisión racional debe basarse en
una predicción de la respuesta de otros jugadores. Al ponerse uno en los zapatos
del otro y predecir entonces la acción que el otro tomaría, se puede elegir el mejor
curso de acción propio.

Información perfecta e imperfecta


 Un jugador tiene información perfecta si conoce exactamente lo que ocurre
cada vez que toma una decisión.
 Un juego tiene información perfecta si cada jugador tiene información
perfecta.
 Si algún jugador no tiene información perfecta, el juego es de información
imperfecta.

Juegos con información imperfecta


La información es imperfecta si el jugador, en el momento de tomar una decisión,
no sabe dónde está en el juego.
Para poder incluir información imperfecta en un juego necesitamos un mecanismo
para representar el azar y otro que muestre los efectos del azar sobre el juego.
Un conjunto de información asignado al azar significa que es el azar el que debe
realizar su jugada. Las ramas que parten de un nodo de azar representan
probabilidades.
Cualquier conjunto de información que contiene más de un nodo refleja que el
jugador tiene información imperfecta.
Un jugador no sabe en qué nodo estará cuando le corresponda hacer su jugada.
Lo único que conoce son las probabilidades con que se llega a cada uno de esos
nodos.
Aunque la información sea imperfecta, se hace necesario tomar una decisión.
Para solucionar su problema de decisión, un jugador debe comparar la utilidad
esperada de las alternativas a su disposición.
Muchas decisiones deben tomarse sin tener conocimiento completo de sus
consecuencias.
Los tomadores de decisiones deben decidir no solamente acerca de cuáles
riesgos son aceptables sino también acerca de la manera en que las
incertidumbres que enfrentan los otros jugadores pueden afectar sus decisiones.
La dispersión de información introduce un papel para estrategias ofensivas y
defensivas: cómo aprovechar cualquier ventaja informativa propia y cómo limitar
las ventajas de información de otros.

Juegos de suma cero y no cero, o Juegos de suma cero y suma variable


 Los juegos en que los intereses de los jugadores son contrapuestos se
llaman juegos de suma cero
 Los juegos en que los intereses de los jugadores no se hallan totalmente
contrapuestos se llaman juegos de suma variable
 La resolución de juegos de suma variable es más difícil que la resolución
de juegos de suma cero

Juegos de suma cero y suma constante


En un juego de suma cero, para cada posible resultado del juego la suma de las
utilidades de los dos jugadores suma cero: lo que un jugador gana, el otro lo
pierde. u1 + u2 = 0
En un juego de suma cero no se crea valor, se redistribuye valor.
En un juego de suma constante la suma de las utilidades de los jugadores es una
constante k.

Para ilustrar las características básicas de un modelo de teoría de juegos,


considérese el juego llamado pares y nones. Éste consiste nada más en que los
dos jugadores muestran al mismo tiempo uno o dos dedos. Si el número de dedos
coincide, el jugador que apuesta a pares (por ejemplo, el jugador 1) gana la
apuesta (digamos $1) al jugador que va por nones (jugador II). Si el número no
coincide, el jugador 1 paga $1 al jugador II. Entonces, cada jugador tiene dos
estrategias: mostrar uno o dos dedos. La tabla a continuación contiene el pago en
dólares que resulta para el jugador 1 en una matriz de pagos.
Tabla de pagos del juego para el jugador I

Jugador II Impar o nones


# de dedos #1 #2
#1 $1 $-1
Jugador I Pares #2 $-1 $1
Tabla de pagos del juego para el jugador II

Jugador II Impar o nones


# de dedos #1 #2
#1 $-1 $1
Jugador I Impares #2 $1 $-1

En general, un juego de dos personas se caracteriza por


1. Las estrategias del jugador I.
2. Las estrategias del jugador II.
3. La matriz de pagos.
Antes de iniciar el juego, cada jugador conoce las estrategias de que dispone, las
que tiene su oponente y la matriz de pagos. Una jugada real en el juego consiste
en que los dos jugadores elijan al mismo tiempo una estrategia sin saber cuál es
la elección de su oponente.
Una estrategia puede constituir una acción sencilla, como mostrar un número par
o nonis de dedos en el juego de pares y nones. Por otro lado, en juegos más
complicados que llevan en sí una serie de movimientos, una estrategia es una
regla predeterminada que especifica por completo cómo se intenta responder a
cada circunstancia posible en cada etapa del juego. Por ejemplo, una estrategia
de un jugador de ajedrez indica cómo hacer el siguiente movimiento para todas
las posiciones posibles en el tablero, de manera que el número total de
estrategias posibles sería astronómico. Las aplicaciones de la teoría de juegos
involucran situaciones competitivas mucho menos complicadas que el ajedrez,
pero las estrategias que se manejan pueden llegar a ser bastante complejas.
Por lo general, la matriz de pagos muestra la ganancia (positiva o negativa) que
resultaría con cada combinación de estrategias para el jugador 1. Se da de esta
manera, ya que la matriz del jugador II es el negativo de ésta, debido a la
naturaleza de la suma cero del juego.
Los elementos de la matriz pueden tener cualquier tipo de unidades, como
dólares, siempre que representen con exactitud la utilidad del jugador 1 en el
resultado correspondiente. Debe hacerse hincapié en que la utilidad no
necesariamente es proporcional a la cantidad de dinero (o cualquier otro bien)
cuando se manejan cantidades grandes. Por ejemplo, para una persona pobre $2
millones (después de impuestos) tal vez vale mucho más que el doble de $1
millón.
En otras palabras, si a una persona se le da a elegir entre: 1) recibir, con el 50%
de posibilidades, $2 millones en lugar de nada y 2) recibir $1 millón con
seguridad, ese individuo tal vez prefiriera este último. Por otro lado, el resultado
que corresponde a un elemento 2 en una matriz de pagos debe "valer el doble"
para el jugador 1 que el resultado correspondiente a un elemento 1. Así, dada la
elección, debe serle indiferente un 50% de posibilidades de recibir el primer
resultado (en lugar de nada) y recibir en definitiva el último resultado.
Un objetivo primordial de la teoría de juegos es establecer criterios racionales
para seleccionar una estrategia, los cuales implican dos suposiciones
importantes:
1. Ambos jugadores son racionales.
2. Ambos jugadores eligen sus estrategias sólo para promover su propio bienestar
(sin compasión para el oponente).
La teoría de juegos se contrapone al análisis de decisión, en donde se hace la
suposición de que el tomador de decisiones está jugando un juego contra un
oponente pasivo, la naturaleza, que elige sus estrategias de alguna manera
aleatoria. Se desarrollará el criterio estándar de teoría de juegos para elegir las
estrategias mediante ejemplos ilustrativos. En particular, a continuación, se
presenta un ejemplo prototipo que ilustra la formulación de un juego y su solución
en algunas situaciones sencillas. Después se desarrollará una variación más
complicada de este juego para obtener un criterio más general.
El dilema del prisionero
Para entender mejor el concepto del equilibrio de Nash y en qué consiste
la teoría de los juegos, se suele utilizar como ejemplo el llamado dilema del
prisionero.
Supongamos una situación en la que somos detenidos junto con otra persona por
un delito de robo. La pena por este delito es de dos años de cárcel. La policía
sabe que también ha habido un herido por arma de fuego, pero no sabe cuál de
los dos detenidos ha sido el culpable; la pena por este otro delito es de cinco años
de prisión.
Ambos ladrones estamos totalmente incomunicados entre nosotros, y en el
interrogatorio la policía nos propone a cada uno el siguiente trato: si delatamos a
nuestro compañero como autor del disparo, estaremos solamente un año en la
cárcel, mientras que nuestro compañero estará diez.
Para poder ver más claramente la situación, lo primero que hacemos es una
matriz de decisión (también llamada normal), que tendrá el siguiente aspecto:
Prisionero 1
Decisión No delatar Delatar
No delatar (2,2) (10,1)
Prisionero 2 Delatar (1,10) (5,5)

Dado que no sabemos lo que hará nuestro compinche, la mejor situación es


delatarle independientemente de lo que haga él, ya que, si nos delata, iremos
cinco años en vez de diez, y si no nos delata, iremos uno en vez de dos.
La situación mejor para ambos, como conjunto, sería que ambos no nos
delatáramos y estuviéramos dos años cada uno, pero dado que al final lo más
probable es que el compañero piense como nosotros lo hemos hecho, al final
cada uno pasaremos cinco años en prisión. Esta situación alcanzada es el
llamado equilibrio de Nash, porque ambas partes no pueden cambiar sin
empeorar su propia situación.

TEORÍA DE JUEGOS
Dos jugadores (A y B) están negociando cómo repartir 100 euros. El juego, una
variante del denominado Nash Bargaining Game, procede del siguiente modo:
Cada uno escribe simultáneamente una cantidad entre 0 y 100 (ambas incluidas),
y si estas cantidades suman 100, entonces cada uno se lleva la cantidad que
escribió. En caso contrario, ambos se llevan 0 euros.
Suponga que a cada jugador sólo le interesa el dinero que él gane.
(a) ¿Si A piensa que B va a escribir 57, ¿qué debería escribir A? ¿Y si pensase
que B va a escribir 0? ¿Y si pensase 100?
(b) Teniendo lo anterior en cuenta, ¿cuáles son los equilibrios de Nash en
estrategias puras de este juego? Razone su respuesta.
(c) ¿Qué cantidad cree usted más probable que escriba cada jugador?

Jugadores B A Suma Pago


57 43 100 43A y 57B
Números 0 (-100) 100(100) 100 100A
escogidos 100(-100) 0 (-100) 100 100B
50 50 100 50A y 50B
100 100 200 0A y 0B

Solución:
a)
Si A espera 57 de B, debería elegir obviamente 43.
Si espera 0, debería elegir 100.
Si espera 100, cualquier número que elija le va a dar la misma utilidad (0).
En este último caso, por tanto, está indiferente entre cualquier número.
b)
Cualquier par de números (nA, nB) tal que nA + nB = 100 y nA, nB ∈ [0,
100] es un equilibrio porque ningún jugador puede mejorar su utilidad
cambiando unilateralmente su estrategia.
Asimismo, el vector (100, 100) también es equilibrio de Nash, por la misma
razón (ambos obtienen 0 de utilidad y no pueden mejorar este resultado
con una desviación unilateral). En total, por tanto, hay 102 equilibrios.
c)
El equilibrio (50, 50) parece la predicción más intuitiva en este juego; un
punto focal derivado de la igualdad de pagos.
Ejercicio
La Empresa Propia, después de seguir consejo y haber conseguido resultados
óptimos, decide consultar la estrategia a seguir para competir con la
“COMPETENCIA”. Ha desarrollado un modelo de pronósticos de ventas de cada
uno de los productos de su Empresa Propia, en función de sus decisiones y las de
la “COMPETENCIA”. Estos datos los han recogido en la matriz de pago que se
muestra. ¿Cuál es el informe que debes presentar a la Empresa Propia? Describir
su estrategia, la de “COMPETENCIA” y el valor del juego.

Empresa COMPETENCIA
Propia
B1 B2 B3 B4
A1 50 20 120 -50
A2 60 20 70 60
A3 -20 0 -40 60

Solución
Comienza Empresa Propia
Estrategias Empresa Propia A1, A2 y A3.
A1 vs A2 = (50 < 60); (20 = 20); (120 > 70); (-50 < 60) Domina A2
A1 vs A3 = (50 > -20); (20 > 0; (120 > -40); (-50 < 60) Domina A1
Eliminamos A3
Empresa COMPETENCIA
Propia
B1 B2 B3 B4
A1 50 20 120 -50
A2 60 20 70 60

Turno de Competencia
Estrategias Competencia B1, B2, B3 y B4.
B1 vs B2 = (-50 < -20); (-60 < -20); Domina B2
B1 vs B3 = (-50 > -120); (-60 > -70); Domina B1
B3 vs B4 = (-120 < 50); (-70 < -60) Domina B4
Eliminamos B3
Empresa COMPETENCIA
Propia
B1 B2 B4
A1 50 20 -50
A2 60 20 60

Turno de Empresa Propia


Estrategias Empresa Propia A1 y A2.
A1 vs A2 = (50 < 60); (20 = 20); (-50 < 60) Domina A2
Eliminamos A1

Empresa COMPETENCIA
Propia
B1 B2 B4

A2 60 20 60

Turno de Competencia
Estrategias Competencia B1, B2 y B4.
B1 vs B2 = (-60 < -20); Domina B2
B1 vs B4 = (-60 = -60) Hay igualdad entonces cualquiera de las dos,
Eliminamos B4
Y Eliminamos B1
Empresa COMPETENCIA
Propia
B2

A2 20

Se define con A2 vs B2 = Empresa Propia gana 20 y Competencia pierde 20


Empresa Propia tres estrategias: A1, A2 y A3.
Competencia: B1, B2, B3 y B4.
Eliminando A3:
A1 vs A3 (50>-20; 20>0; 120>-40, -50<60) Gana A1
A2 vs A3 (60>-20; 20>0; 70>-40, 60≥60) Gana A2
Se desecha A3
Empresa COMPETENCIA
Propia B1 B2 B3 B4
A1 50 20 120 -50
A2 60 20 70 60

Competencia:
Eliminando B3:
B1, B2 y B3 vs B4
B1 vs B2 (-50<-20; -60<-20) Gana B2
B1 vs B3 (-50>-120; -60>-70) Gana B1
B3 vs B4 (-120<50; -70<-60) Gana B4

(-50<50) (-20<50) (-120<50)


Se desecha B3

Empresa COMPETENCIA
Propia B1 B2 B4
A1 50 20 -50
A2 60 20 60

Empresa Propia dos estrategias: A1 y A2.


Competencia: B1, B2 y B4.
Eliminando A1:
A1 vs A2 (50<60; 20=20; -50<60) Gana A2
Empresa COMPETENCIA
Propia B1 B2 B4
A2 60 20 60

Empresa COMPETENCIA
Propia B2 B4
A2 20 60

Competencia:
Eliminando B1 y B4:
Línea A2 =
B1, B2 vs B4 (-60<-20) (-20>-60) (-60≥-60)
Se desecha B1 y B4
Empresa COMPETENCIA
Propia
B2
A2 20

Solución: La empresa propia va a tomar la estrategia A2 (gana 20) y la


competencia va a tomar B2 (que es con la que menos puede perder -20)
Trabajando a la “inversa”
Empresa Competencia
Propia B1 B2 B3
A1 50 60 -20
A2 20 20 0
A3 120 70 -40
A4 -50 60 60

Solución
Empresa Propia cuatro estrategias: A1, A2, A3 y A4.
Competencia: B1, B2 y B3.
Eliminando A2:
A1 vs A2 (50>20; 60>20; -20<0) Domina A1
A2 vs A3 (20<120; 20<70; 0>-40) Domina A3
A2 vs A4 (20>-50; 20<60; 0<60) Domina A4
Se desecha A2
Empresa Propia Competencia
B1 B2 B3
A1 50 60 -20
A3 120 70 -40
A4 -50 60 60

Competencia: B1, B2 y B3.


Eliminando B2:
Línea A1
B1 vs B2 (-50>-60; -120<-70; -50>-60) Domina B1
Línea A3
B2 vs B3 (-60<20; -70<40; -60=-60) Domina B3;

Se desecha B2
Empresa Competencia
Propia B1 B3
A1 50 -20
A3 120 -40
A4 -50 60

Empresa Propia tres estrategias: A1, A3 y A4.


Competencia: B1 y B3.
Eliminando A1:
A1 vs A3 (50<120; -20>-40) Domina A3
A1 vs A4 (50>-50; -20<60) Domina A4
Se desecha A1
Empresa Competencia
Propia B1 B3
A3 120 -40
A4 -50 60

Competencia: B1 y B3.
Eliminando B1:
Línea A3
B1 vs B3 (-120<40) Domina B3
Línea A4
B1 vs B3 (50>-60) Domina B1
Al estar empatados, se desecha B3 (50 es mayor que 40)

Empresa Competencia
Propia B1
A3 120
A4 -50

Empresa Propia dos estrategias: A3 y A4.


Competencia: B1.
Eliminando A4:
Empresa Competencia
Propia B1
A3 120
1. Aplicando el concepto de estrategias estrictamente dominadas al siguiente
juego, ¿qué estrategias podemos estar seguros de que nunca se jugarán? En
cada eliminación, explicite qué supuesto necesita hacer acerca del jugador
correspondiente. Nota: El pago izquierdo es siempre el del jugador “Fila” y el
derecho del jugador “Columna”.
Jugadores C1 C2 C3
F1 (-20,10) (1,1) (4,0)
F2 (0,2) (5,1) (1,0)
F3 (1,3) (0,10) (9,0)

Empezamos con jugador Fila


Estrategias de Fila: F1, F2 y F3
F1 vs F2 = (8 > 0); (1 < 5); (4 > 1) Domina F1
F2 vs F3 = (0 < 1); (5 > 0); (1 < 9) Domina F3

Eliminamos F2
Jugadores C1 C2 C3
F1 (8,2) (1,1) (4,0)

F3 (1,3) (0,10) (9,0)

Turno de Columna
Estrategias C1, C2 y C3.
C1 vs C2 = (2 > 1); (3 < 10) Domina C2
C1 vs C3 = (2 > 0); (3 > 0) Domina C1
Eliminamos C3
Jugadores C1 C2
F1 (8,2) (1,1)
F3 (1,3) (0,10)

Turno jugador Fila


Estrategias de Fila: F1 y F3
F1 vs F3 = (8 > 1); (1 > 0) Domina F1
Eliminamos F3
Jugadores C1 C2
F1 (8,2) (1,1)

Turno de Columna
Estrategias C1 y C2.
C1 vs C2 = (2 > 1) Domina C1
Elimina C2
Jugadores C1
F1 (8,2)
Al final del juego de estrategias estrictamente dominadas, las estrategias serán F1
y C1, con pagos de 8 para Fila y de 2 para Columna

También podría gustarte