s11.s1 - Teoria de Juegos

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 5

TEORIA DE JUEGOS

La teoría de juegos es un área de la matemática aplicada que utiliza modelos para estudiar
interacciones en estructuras formalizadas de incentivos (los llamados «juegos»). La teoría de
juegos se ha convertido en una herramienta sumamente importante para la ciencia económica y
ha contribuido a comprender más adecuadamente la conducta humana frente a la toma de
decisiones. Sus investigadores estudian las estrategias óptimas, así como el comportamiento
previsto y observado de individuos en juegos. Tipos de interacción aparentemente distintos
pueden presentar en realidad una estructura de incentivo similar y, por lo tanto, se puede
representar mil veces conjuntamente un mismo juego.
La teoría de juegos se ha ido extendiendo a muchos otros campos, como la biología, las ciencias de
la computación, la sociología, la politología, la psicología y la filosofía. Experimentó un crecimiento
sustancial y se formalizó por primera vez a partir de los trabajos de John von Neumann y Oskar
Morgenstern, antes y durante la Guerra Fría, debido sobre todo a su aplicación a la estrategia
militar, en particular a causa del concepto de destrucción mutua garantizada. Desde los setenta, la
teoría de juegos se ha aplicado a la conducta animal, incluyendo el desarrollo de las especies por la
selección natural. A raíz de juegos como el dilema del prisionero, en los que el egoísmo
generalizado perjudica a los jugadores, la teoría de juegos ha atraído también la atención de los
investigadores en informática, usándose en inteligencia artificial y cibernética.
Los conflictos entre seres racionales que recelan uno del otro, o la pugna entre competidores que
interactúan y se influyen mutuamente, que piensan y que, incluso, pueden ser capaces de
traicionarse uno al otro, constituyen el campo de estudio de la teoría de juegos, la cual se basa en
un análisis matemático riguroso pero que, sin embargo, surge de manera natural al observar y
analizar un conflicto desde un punto de vista racional. Desde el enfoque de esta teoría, un «juego»
es una situación conflictiva en la que priman intereses contrapuestos de individuos o instituciones,
y en ese contexto una parte, al tomar una decisión, influye sobre la decisión que tomará la otra;
así, el resultado del conflicto se determina a partir de todas las decisiones tomadas por todos los
actuantes.
La teoría de juegos plantea que debe haber una forma racional de jugar a cualquier «juego» (o de
negociar en un conflicto), especialmente en el caso de haber muchas situaciones engañosas y
segundas intenciones; así, por ejemplo, la anticipación mutua de las intenciones del contrario, que
sucede en juegos como el ajedrez o el póquer, da lugar a cadenas de razonamiento teóricamente
infinitas, las cuales pueden también trasladarse al ámbito de resolución de conflictos reales y
complejos. En síntesis, y tal como se comentó, los individuos, al interactuar en un conflicto,
obtendrán resultados que de algún modo son totalmente dependientes de tal interacción.

Representación de juegos

El dilema del prisionero


Uno de los problemas que plantea el equilibrio de Nash se halla en que no conduce
necesariamente a situaciones eficientes en el sentido de Pareto1. El análisis original de este juego
se basa en una situación en la que se interroga en habitaciones distintas a dos personas que han
cometido conjuntamente un robo armado a un banco; sin embargo, el dinero sustraído no se
encuentra en sus manos y, por ello, la policía solo puede inculparlos por tenencia ilícita de armas,
al carecer de otras pruebas. Así, al ser interrogados por separado, cada uno de ellos tendría la
posibilidad de confesarse culpable, implicar al otro prisionero o negar haber participado en el
atraco.
Sin embargo, la policía puede proponerles un trato y, a través del uso de un adecuado esquema de
incentivos, hacer que ambos confiesen la participación en el hecho, lograr que la verdad salga a la
luz y condenarlos. A continuación se verá que una adecuada propuesta efectuada por el cuerpo de
policías, puede conducir a que la racionalidad y el egoísmo individual con el que suelen ser
tomadas las decisiones puede volverse en contra del interés conjunto de estos sujetos. Para
demostrar esto, considérese por ejemplo, el juego denominado El dilema del prisionero. Este juego
permite comprender que mantener la cooperación es algo sumamente difícil. Muchas veces los
individuos no cooperan (este caso es un ejemplo paradójico, ya que demuestra los beneficios que
se obtendrían al mantener la cooperación entre cualquier grupo de individuos, pero a la vez
demuestra que ello, bajo ciertos postulados, es imposible de conseguir), y sus decisiones
individuales no necesariamente conducen al mutuo bienestar.
Forma normal de un juego
La forma normal (o forma estratégica) de un juego es una matriz de pagos, que muestra los
jugadores, las estrategias y las recompensas (ver el ejemplo a la derecha). Hay dos tipos de
jugadores; uno elige la fila y otro la columna. Cada jugador tiene dos estrategias, que están
especificadas por el número de filas y el número de columnas. Las recompensas se especifican en
el interior. El primer número es la recompensa recibida por el jugador de las filas (el Jugador 1 en
nuestro ejemplo); el segundo es la recompensa del jugador de las columnas (el Jugador 2 en
nuestro ejemplo). Si el jugador 1 elige arriba y el jugador 2 elige izquierda entonces sus
recompensas son 4 y 3, respectivamente.
Cuando un juego se presenta en forma normal, se presupone que todos los jugadores actúan
simultáneamente o, al menos, sin saber la elección que toma el otro. Si los jugadores tienen
alguna información acerca de las elecciones de otros jugadores el juego se presenta
habitualmente en la forma extensiva.
También existe una forma normal reducida. Ésta combina estrategias asociadas con el mismo
pago.

El jugador 2
El jugador 2 elige
elige izquierda derecha
El jugador 1
4, 3 -1, -1
elige arriba
El jugador 1
0, 0 3, 4
elige abajo

Forma extensiva de un juego


La representación de juegos en forma extensiva modela juegos con algún orden que se debe
considerar. Los juegos se presentan como árboles (como se muestra a la derecha).
Cada vértice o nodo representa un punto donde el jugador toma decisiones. El jugador se
específica por un número situado junto al vértice. Las líneas que parten del vértice representan
acciones posibles para el jugador. Las recompensas se especifican en las hojas del árbol.
En el juego que se muestra en el ejemplo hay dos jugadores. El jugador 1 mueve primero y
elige F o U. El jugador 2 ve el movimiento del jugador 1 y elige A o R. Si el jugador 1 elige U y
entonces el jugador 2 elige A, entonces el jugador 1 obtiene 8 y el jugador 2 obtiene 2.
Los juegos en forma extensiva pueden modelar también juegos de movimientos simultáneos. En
esos casos se dibuja una línea punteada o un círculo alrededor de dos vértices diferentes para
representarlos como parte del mismo conjunto de información (por ejemplo, cuando los jugadores
no saben en qué punto se encuentran).
La forma normal da al matemático una notación sencilla para el estudio de los problemas de
equilibrio, porque desestima la cuestión de cómo las estrategias son calculadas o, en otras
palabras, de cómo el juego es jugado en realidad. La notación conveniente para tratar estas
cuestiones, más relevantes para la teoría combinatoria de juegos, es la forma extensiva del juego.

Tipos de juegos
Juegos simétricos y asimétricos
Un juego simétrico es un juego en el que las recompensas por jugar una estrategia en particular
dependen solo de las estrategias que empleen los otros jugadores y no de quien las juegue. Si las
identidades de los jugadores pueden cambiarse sin que cambien las recompensas de las
estrategias, entonces el juego es simétrico. Muchos de los juegos 2×2 más estudiados son
simétricos. Las representaciones estándar del juego del gallina, el dilema del prisionero y la caza
del ciervo son juegos simétricos..
Los juegos asimétricos más estudiados son los juegos donde no hay conjuntos de estrategias
idénticas para ambos jugadores. Por ejemplo, el juego del ultimátum y el juego del dictador tienen
diferentes estrategias para cada jugador; no obstante, puede haber juegos asimétricos con
estrategias idénticas para cada jugador. Por ejemplo, el juego mostrado a la derecha es asimétrico
a pesar de tener conjuntos de estrategias idénticos para ambos jugadores.
Juegos de suma cero y de suma distinta de cero
En los juegos de suma cero el beneficio total para todos los jugadores del juego, en cada
combinación de estrategias, siempre suma cero (en otras palabras, un jugador se beneficia
solamente a expensas de otros). El go, el ajedrez, el póker y el juego del oso son ejemplos de
juegos de suma cero, porque se gana exactamente la cantidad que pierde el oponente. Como
curiosidad, el fútbol dejó hace unos años de ser de suma cero, pues las victorias reportaban 2
puntos y el empate 1 (considérese que ambos equipos parten inicialmente con 1 punto), mientras
que en la actualidad las victorias reportan 3 puntos y el empate 1.
La mayoría de los ejemplos reales en negocios y política, al igual que el dilema del prisionero, son
juegos de suma distinta de cero, porque algunos desenlaces tienen resultados netos mayores o
menores que cero. Es decir, la ganancia de un jugador no necesariamente se corresponde con la
pérdida de otro. Por ejemplo, un contrato de negocios involucra idealmente un desenlace de suma
positiva, donde cada oponente termina en una posición mejor que la que tendría si no se hubiera
dado la negociación.
Se puede analizar más fácilmente un juego de suma distinta de cero, y cualquier juego se puede
transformar en un juego de suma cero añadiendo un jugador "ficticio" adicional ("el tablero" o "la
banca"), cuyas pérdidas compensen las ganancias netas de los jugadores.
La matriz de pagos de un juego es una forma conveniente de representación. Por ejemplo, un
juego de suma cero de dos jugadores con la matriz que se muestra abajo.

Criterios «maximin» y «minimax»

Los criterios «maximin» y «minimax» establecen que cada jugador debe minimizar su pérdida
máxima:

 Criterio «maximin»: el jugador A, elige que su cobro mínimo posible sea el mayor.
 Criterio «minimax»: el jugador B elige que el pago máximo a A sea el menor posible.

Equilibrio de Nash
Los equilibrios de las estrategias dominantes están muy bien cuando aparecen en los juegos, pero
desafortunadamente, eso no ocurre con frecuencia.
Un par de estrategias es un equilibrio de Nash si la elección del jugador A es óptima, dada elección
de B, y la de B es óptima, dada la de A.
El equilibrio de Nash puede interpretarse como un par de expectativas sobre la elección de cada
persona tal que, cuando la otra revela su elección, ninguna de las dos quiere cambiar de conducta.
Cada jugador conoce y ha adoptado su mejor estrategia, y todos conocen las estrategias de los
otros. Consecuentemente, cada jugador individual no gana nada modificando su estrategia
mientras los otros mantengan las suyas. Así, cada jugador está ejecutando el mejor "movimiento"
que puede dados los movimientos de los demás jugadores.

LOS ELEMENTOS DE LA TEORIA DE LOS JUEGOS


Los elementos presentes en todo juego son: jugadores, acciones, información, estrategias,
recompensas y resultados.

• Jugadores: los personas que juegan y toman las decisiones tratando de obtener el mejor
resultado posible, o sea maximizar su utilidad.

• Acción: es una de las opciones que el jugador tiene disponible para alcanzar el objetivo buscado.
Un conjunto de acciones son todas las acciones disponibles. El orden del juego determina en qué
momento esas acciones están disponibles.

• Información: es el conocimiento, en un determinado momento, de los valores de las distintas


variables, los distintos valores que el jugador cree que son posibles.

• Estrategias: es un conjunto de acciones a tomar en cada momento del juego dada la información
disponible. Un conjunto de estrategias son todas las estrategias disponibles en un determinado
momento.

• Recompensa: es la utilidad que reciben los jugadores al completar el juego, la evaluación


posterior a la realización de la acción sobre si el objetivo buscado fue alcanzado. También es
importante la recompensa esperada, ya que es ésta en realidad la que motiva la acción.

• Resultado: son las conclusiones que el modelador obtiene una vez que el juego se ha jugado.

También podría gustarte