Chapitre 1 - Théorie Des Jeux

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 41

4

Chapitre 1 (Chapitre 4 dans CORE Project)

Théorie des jeux et interactions sociales

1
• Prendre des décisions pour atteindre un
objectif spécifique:
• Individu: La satisfaction d’une aspiration
(bonheur, utilité, richesse,…);
• Entreprise: Le profit, la part de marché, le
prestige du PDG,…
• Etat: Le bien-être des citoyens, la réduction des
inégalités, la sécurité du pays,…
• Souvent, le résultat obtenu dépend de la
L’art de la décision de l’agent, mais aussi de la
décision d’autres agents.
stratégie • Se pose alors la question de savoir quelle
stratégie sera suivie par les autres de
manière à déterminer sa propre stratégie
optimale.
• Ces situations sont étudiées en « Théorie
des Jeux ».
• La théorie des jeux est une discipline qui a
révolutionné la science économie depuis
les années 1950.

2
Le dilemme du prisonnier

• La police est certaine que Sophie et Andréa ont commis un crime,


mais ne dispose pas de preuve suffisante pour les condamner.
• Au tribunal, les peines seront limitées à un an de prison en l’absence
d’aveux.
• La police les interroge séparément et essaie d’obtenir des aveux de
chacun en promettant une amnistie à celui qui avouera, s’il est le seul
à avouer.
• Si les deux avouent, chacun écope de 4 ans de prison;
• Si un seul avoue, il est amnistié, mais l’autre écope de la peine max (5 ans).
• Vous êtes Sophie, et vous rentrez dans la salle d’interrogatoire.
• Quelle stratégie allez-vous suivre?

3
Dilemme du prisonnier: Matrice des gains

Sophie

Nier Avouer

-1 0
Nier
-1 -5
Andréa

-5 -4
Avouer
0 -4

4
Dilemme du prisonnier: Analyse

• Du point de vue des deux comparses, l’idéal serait que chacun nie.
• Mais si Sophie pense qu’Andréa va nier, elle a intérêt à avouer pour
bénéficier de l’amnistie.
• De même, si Sophie pense qu’Andréa va avouer, elle a intérêt à
avouer aussi.
• La tentation d’avouer est donc irrésistible.
• Quelque soit la stratégie suivie par Andréa, la meilleure réponse de Sophie
est d’avouer.
• On dit que avouer est une stratégie dominante pour Sophie.
• Le même raisonnement peut être fait pour Andréa: Avouer est une
stratégie dominante pour Andréa.
• On dit que la solution (avouer, avouer) est un équilibre en stratégie
dominante de ce jeu.

5
Dilemme du prisonnier: Propriétés de
l’équilibre
• Si ce jeu n’est joué qu’une fois, les économistes prédisent que chacun
va avouer.
• Propriétés:
1. Rationalité: La poursuite de l’intérêt individuel incite chacun à suivre sa
stratégie dominante, qui est la stratégie qui maximise son gain quelle que
soit la stratégie suivie par l’autre joueur.
2. Spontanéité: Aucune intervention extérieure (hors l’institution de la justice)
n’est nécessaire pour amener les joueurs à ce comporter de cette façon.
3. Stabilité: Aucun des deux joueurs ne désire dévier de l’équilibre.
• Mais cet équilibre est loin d’être idéal pour les joueurs puisque
globalement, il implique 8 ans de prison au total, alors que la solution
(nier, nier) n’en aurait impliqué que 2.
• On dit que l’équilibre est inefficace (du point de vue de la communauté des 2
joueurs).

6
Adaptation du jeu du dilemme du prisonnier

• La mafia s’organise en promettant d’assassiner la famille de tout


membre qui avouerait… Cela modifie en fait la matrice des gains!
Sophie

Nier Avouer

-1 -10
Nier
-1 -5
Andréa

-5 -14
Avouer
-10 -14

• Quel est le nouvel équilibre du jeu?


7
Beaucoup de contextes, mais un concept!

• Equilibre de la terreur Joueur B

• Duopole
Coopère Dévie
• Changement climatique
• Tragédie des prés communs
2 3
• Dumping fiscal Coopère

Joueur A
2 -1

-1 0
Dévie
3 0

8
Equilibre de la terreur et course à l’armement

• A = USA, B = URSS.
• Coopérer = limiter les dépenses militaires; Dévier = investir
massivement dans l’armée.
• Gain = valeur des victoires militaires moins les sacrifices de la
population pour financer l’armée (voir Corée du Nord; du beurre ou
des canons!).
• Chaque pays voudrait conclure un accord de non-course, mais chacun
est tenté de dévier de cette promesse.
• Les économistes prédisent une course à l’armement.
• Les USA ont dépensé jusqu’à 10% de leur PIB chaque année dans les années
50-60 pour leur défense. L’URSS en a fait bien plus…

9
Duopole et la faiblesse des cartels

• A et B: Deux vendeurs de glaces sur la plage.


• Coopérer = politique de prix élevé; Dévier = politique de prix faible.
• Gain = prix fois quantités vendues moins coût.
• Les deux vendeurs voudraient faire cartel en se mettant d’accord sur
un prix élevé, mais chaque vendeur serait très heureux de baisser un
peu son prix pour s’emparer de tout le marché.
• Les économistes prédisent l’instabilité des cartels.
• L’OPEP n’a pas réussi à maintenir des prix du pétrole élevé après une courte
période de cartellisation du marché mondial.

10
Changement climatique et
l’impossible accord international
pour le climat

• A = Les pays riches; B = les pays en développement.


• Coopérer = réduction des émissions de CO2; Dévier = ne
rien faire.
• Gain = dommages climatiques évités moins coûts
économiques de la transition.
• Les deux régions auraient intérêt à réduire leurs
émissions de concert, mais chaque région est tentée de
ne rien faire. Problème du « passager clandestin ».
• Les économistes prédisent le désastre écologique.
• On connait le problème de l’effet de serre depuis les
années 80. Les émissions mondiales de CO2 ont
pourtant augmenté de 55% entre 1999 et 2019.
Tragédie des prés communs

• Deux îles (A et B) se partagent une aire de pêche.


• Coopérer = gestion soutenable de la ressource halieutique; Dévier =
pêche intensive.
• Gain = consommation intertemporelle de poissons.
• Les îles voudraient s’entendre sur des quotas de pêche, mais chaque
ile est tentée à pêcher plus que son quota.
• Les économistes prédisent que les ressources « qui n’appartiennent à
personne » seront surexploitées.
• Disparition des bisons, des éléphants, des baleines, de la morue,…

12
Dumping fiscal

• Deux pays (A et B) voudraient augmenter l’impôt pour financer des


biens publics vitaux, mais s’inquiètent de l’expatriation fiscale des
riches.
• Coopérer = taux d’impôt élevé; Dévier = taux d’impôt faible.
• Gain = bénéfice des bien publics net de leur coût financé par l’impôt.
• Les pays voudraient un taux d’impôt élevé dans le monde, mais
chacun (surtout les petits) est tenté par la stratégie de taux faible
pour attirer les expatriés fiscaux.
• Les économistes prédisent l’existence de paradis fiscaux qui
empêchent les autres pays de mettre en place une fiscalité optimale.
• La plupart des pays ont supprimé leur impôt sur la fortune;
• Taxe sur l’essence, les cigarettes et l’alcool dans les zones frontalières;
• Pourquoi le transport aérien ne paie pas de taxe carbone?

13
Autres exemples du dilemme du prisonnier

• Média: Chaque média devrait contrôler ses informations, mais


privilégie la rapidité sur ses concurrents.
• Echappée au Tour de France: Chaque membre de l’échappée voudrait
que l’autre fasse l’effort avant le sprint final.
• Dopage dans le sport: Chaque sportif voudrait que personne ne se
dope, mais le dopage est tentant.
• Travail en groupe à l’université (ou ailleurs).
• Vie de couple: Chacun voudrait pouvoir faire confiance à l’autre, mais
mener une double vie est tentant.
• Publicité non-informative: Ne pas faire de publicité, c’est l’idéal au
niveau de l’industrie, mais en faire est tentant.

14
Commentaires sur le dilemme du prisonnier

• Les choses ne tournent pas rond dans notre monde.


• Le laisser-faire ne mène pas au meilleur des mondes. La « main invisible » ne
fonctionne pas toujours.
• Le libéralisme doit être régulé.
• Les économistes sont utiles!
• Il existe des mécanismes pour organiser la coopération.
• Jeux répétés et réputation: Avantage à se construire une réputation de
fiabilité dans la coopération.
• Capacité de punir la déviation.
• Tous les jeux n’ont pas cette structure « dilemme du prisonnier ».

15
La guerre des sexes
• Deux amis veulent sortir ce soir, ils
ont le choix entre aller voir un Thérèse
match de boxe ou aller au théâtre.
• Thérèse préfère aller au théâtre et Boxe Théâtre
Brutus préfère la boxe.
• Mais passer la soirée seul leur est
insupportable. 1 0
Boxe
• Pas de stratégie dominante! 4 0

Brutus
• Pas d‘équilibre en stratégie
dominante! 0 4
• Que faire? Que prédire? Théâtre
0 1

16
Nouveau concept d’équilibre: Equilibre de
Nash
• Définition : Un équilibre de Nash est une solution dans laquelle
chaque joueur joue sa meilleure réponse compte tenu de la
stratégie suivie par les autres joueurs.
• Rationalité, spontanéité, stabilité.
• Un équilibre en stratégie dominante est un équilibre de Nash,
mais l’inverse n’est pas vrai.
• Il existe deux équilibres de Nash (en stratégies pures) dans le jeu
de la guerre des sexes.
• Ah ben zut alors! Comment prédire lequel prévaudra?
• Indétermination;
• Jeux de coordination.

17
John Nash et la théorie des
jeux
• Histoire :
• Mathématicien né en 1928.
• Thèse de 28 pages à Princeton en 2 ans exposant l’ équilibre de Nash
• Carrière fulgurante de 1951 à 1958
• Interné pour schizophrénie à partir de 1960.
• Prix Nobel en 1994 pour les travaux réalisés pendant sa thèse.
• Rupture avec l’équilibre économique
• La « main invisible » du marché conduit à un équilibre EFFICACE.
• Désormais, l’équilibre de Nash est issu d’un mécanisme
d’interaction, et n’est pas toujours EFFICACE.

18
Jeu du « Concours de beauté »

• Dans un amphi, chaque étudiant doit écrire un nombre compris entre


0 et 100.
• Le gagnant est celui dont le nombre se rapproche le plus de la moitié
de la moyenne des nombres choisis dans l’amphi.
• Quel est l’équilibre de Nash de ce jeu?

19
Comment repérer un équilibre de Nash?
• Regarder la structure du jeu et faire une hypothèse.
• Par exemple, testons l’hypothèse que (boxe,boxe) est un équilibre de
Nash. Pour que ce soit le cas, il faut vérifier deux choses:
1. Compte tenu que Thérèse va à la boxe, Brutus préfère aller à la boxe.
2. Compte tenu que Brutus va à la boxe, Thérèse préfère aller à la boxe.
• Exercice: Vérifiez le statut des trois autres solutions possibles du jeu.
Thérèse

Boxe Théâtre

1 0
Boxe
Brutus

4 0
0 4
Théâtre
0 1
20
Papier-ciseaux-caillou

• Il y a des jeux sans équilibre de Nash (en stratégies pures).

Thérèse
Papier Ciseaux Caillou
1/2 1 0
Papier
1/2 0 1
Brutus

0 1/2 1
Ciseaux
1 1/2 0
1 0 1/2
Caillou
0 1 1/2

• Si B joue Papier, T joue Ciseaux, mais alors B devrait jouer Caillou…


• Si B joue Ciseaux, T joue Caillou, mais alors B devrait jouer Papier…
• Si B joue Caillou, T joue Papier, mais alors B devrait jouer Ciseaux…
21
Equilibre de Nash en stratégies mixtes

• Stratégie mixte = Stratégie qui consiste à randomiser la stratégie


utilisée.
• Exemple: T lance une pièce de monnaie pour déterminer si elle joue
Ciseaux ou Caillou.
• Une équilibre de Nash en stratégies mixtes est un équilibre de Nash
dans lequel les joueurs utilisent des stratégies mixtes.
• La randomisation utilisée par chaque joueur est une meilleure réponse à la
randomisation utilisée par l’autre joueur.
• On va voir que pour une stratégie mixte soit une meilleure réponse
d’un joueur, il faut nécessairement que ce joueur soit indifférent
entre les différentes stratégies pures qu’il randomise.
• Cette constatation offre une méthode simple pour calculer un
équilibre de Nash en stratégies mixtes.

22
Théorie des probabilités

• Si X et Y sont deux variables aléatoires indépendantes, alors

Pr  X  x et Y  y   Pr  X  x   Pr Y  y 

• Quelle est la probabilité d’obtenir une paire de 6 dans un lancé de deux dés?
Pr = 1/6 x 1/6 = 1/36.

• Si X donne xi avec probabilité pi, i=1,… ,n, alors l’espérance de X est


égale à
E  X   p1 x1  p2 x2  ...  pn xn

• Si X est la valeur obtenue à un lancé de dé,


1 1 1 1 1 1 21
E  X  x  1  2  3  4  5  6   3.5
6 6 6 6 6 6 6
23
Retour sur la guerre des sexes:
Calcul de probabilité
• Brutus va à la boxe avec probabilité pB.
• Thérèse va au théâtre avec probabilité pT.
Thérèse Thérèse
Boxe Théâtre
Boxe Théâtre
(1-pT) (pT)
Boxe 1 0
Boxe

Brutus
(pB)
Brutus

4 0
Théâtre 0 4
Théâtre
(1-pB) 0 1

• Espérance de gain de Brutus:

UB 

24
Thérèse
Retour sur la guerre des sexes: Boxe Théâtre
Nash en stratégies mixtes 1 0
Boxe

Brutus
• Brutus va à la boxe avec probabilité pB. 4 0
• Thérèse va au théâtre avec probabilité pT. Théâtre
0 4
• Quelle est l’espérance de gain de Brutus? 0 1

U B  4  pB (1  pT )  1 (1  pB ) pT  pB (4  5 pT )  pT
• Supposons par exemple que B pense que T tire à pile ou face pour
déterminer si elle va à la boxe ou au théâtre (pT = ½ ). Alors:

U B  1.5 pB  0.5 est croissant en pB !


• Donc, la meilleure réponse de Brutus à pT= ½ est pB=1: Il va à la boxe!
• Ce n’est pas un équilibre de Nash, puisque la meilleure réponse de T
à pB=1 est pT=0!
• Le même argument s’applique tant que pT est compris entre 0 et 4/5.
• Il y a quand même l’équilibre en stratégies pures pB=1 et pT=0.
25
Thérèse
Retour sur la guerre des sexes: Boxe Théâtre
Nash en stratégies mixtes 1 0
Boxe

Brutus
4 0
U B  pB (4  5 pT )  pT 0 4
Théâtre
0 1

• De même, quand pT est plus grand que 4/5, la meilleure réponse de


Brutus est pB=0: Brutus préfère alors aller au théâtre!
• Mais ce n’est pas un équilibre de Nash, car la meilleure réponse de
Thérèse à pB=0 est pT=1!
• Pour résumer, pour que (pB,pT) soit un équilibre de Nash en SM, on
ne peut avoir ni pT plus petit que 4/5, ni pT plus grand que 4/5.
• Se pourrait-il qu’il existe un équilibre de Nash en SM avec pT=4/5 ?
• Le cas pT=4/5 correspond à la propriété que Brutus est indifférent
entre aller à la boxe ou au théâtre.
• Symétriquement, Thérèse doit être elle aussi indifférente, ce qui
exige que pB=4/5. Vérifiez en effet que U T  pT (4  5 pB )  pB .
26
Thérèse
Guerre des sexes: Un équilibre Boxe Théâtre
de Nash en stratégies mixtes 1 0
Boxe

Brutus
4 0
0 4
Théâtre
0 1

• La solution pB=pT=4/5 est un équilibre de Nash en stratégies mixtes.


• A l’équilibre, chaque joueur est indifférent entre aller à la boxe ou au
théâtre. Les joueurs n’ont donc pas de problème à randomiser entre
deux stratégies qui leur donne la même espérance de gain.
• Mais le choix spécifique d’une probabilité 4/5 d’un joueur est tel que
l’autre joueur est indifférent entre boxe et théâtre.
• S’il choisissait une autre probabilité, l’autre joueur aurait forcément une
préférence stricte pour la boxe ou pour le théâtre, ce qui tuerait la possibilité
d’un équilibre de Nash.

27
Papier-ciseaux-caillou

• Il existe un équilibre de Nash en stratégies mixtes dans laquelle joue


Papier, Ciseaux et Caillou avec probabilité 1/3.
• Vérifiez que chaque joueur est indifférent entre Papier, Ciseaux et
Caillou à l’équilibre, avec un gain espéré de ½ pour chacun d’eux.

Thérèse
Papier Ciseaux Caillou
1/2 1 0
Papier
1/2 0 1
Brutus

0 1/2 1
Ciseaux
1 1/2 0
1 0 1/2
Caillou
0 1 1/2
28
Gardien
Y’a penalty!
Plonge à Plonge à
• Le buteur est droitier. Ses tirs sont Droite Gauche
plus précis et plus puissants à
gauche qu’à droite. Mais le gardien
est au courant… 0.8 0.1
Tire à
• Le gain pour le buteur est mesuré
par la probabilité de marquer. Droite
0.2 0.9

Buteur
• Pas d’équilibre de Nash en
stratégies pures!
0.2 0.5
• Soit pB la probabilité que le buteur Tire à
tire à gauche, et pG la probabilité Gauche
que le gardien plonge à gauche. 0.8 0.5

Buteur indifférent: 0.2(1  pG )  0.9 pG  0.8(1  pG )  0.5 pG


 pG  0.6
Gardien indifférent: 0.8(1  pB )  0.2 pB  0.1(1  pB )  0.5 pB
 pB  0.7
Equilibre: le Buteur tire à gauche avec prob pB=0.7.
Le gardien plonge à gauche avec probabilité pG=0.6.
Probabilité de but = 62%. 29
Altruisme

• Dans les études de laboratoire, on constate souvent que les joueurs


ne jouent pas l’équilibre de Nash, même en l’absence de punition ou
de rétorsion contre la défection.
• C’est parfois parce que l’équilibre de Nash donne des gains très
inégalitaires.
• Les gens se sentent concernés par les inégalités.
• Plus généralement, certains se préoccupent du bien-être des autres
en plus que de le leur propre: Altruisme.
• On va le voir dans le jeu de l’ultimatum.
• Question: Cela pourrait-il sauver le monde?
• Faire appel à l’altruisme des gens pour combattre le changement climatique?

30
Interactions sociales: Jeu de l’ultimatum
• Jeu séquentiel (pas de représentation matricielle) avec deux joueurs:
l’offreur et son répondant.
• L’offreur reçoit 100, et doit faire une proposition de partage à son
répondant. Par exemple (80,20).
• Le répondant peut accepter ou refuser.
• S’il accepte, il reçoit 20 et l’offreur reçoit 80.
• S’il refuse, chacun reçoit 0.
• Quelle prédiction faites-vous sur les stratégies suivies par les deux joueurs?
• Jeux séquentiels: Réfléchir par « induction à rebours »:
• Pour chaque offre possible de l’offreur, quelle stratégie est optimale/rationnelle
pour le répondant?
• Compte tenu de cette meilleure réponse du répondant, quelle est la meilleure
stratégie de l’offreur?

31
Jeu de l’ultimatum (section 4.10 de CORE)

32
Données… (voir CORE Project)

33
Données… (voir CORE Project)

34
Fourniture d’un bien public et interaction
sociale (section 4.6 dans CORE)

• Bien public : la production du bien par un individu profite à tous


les individus.
• Financement du bien public par des contributions individuelles
volontaires.
• Chaque individu choisit le montant qu’il verse pour financer le
bien public.
• Les joueurs n’observent pas les contributions individuelles, juste
le montant total.
• Cas d’un système d’irrigation, d’un système d’éducation, d’un
système de protection…

35
Bien public :
• Système d’irrigation pour 4 agriculteurs : contribution de 10 euros pour un bénéfice
de 8 euros PAR contributeur
• Pour un contributeur (dont le joueur) bénéfice net de 8-10 = -2
• Pour 2 contributeurs (dont le joueur) bénéfice net de 8x2-10 = 6...
• Kim doit-elle contribuer ?

36
Fourniture d’un bien public et interaction
sociale :

• Ne pas contribuer est stratégie dominante puisque les gains sont


toujours plus grand lorsque Kim ne contribue pas que lorsque Kim
contribue… Stratégie du « passager clandestin ».
• C’est le cas pour l’ensemble des participants !
• Pas de bien public...
• MAIS la réalité est un peu plus complexe...
• Expérimentations menées par des économistes sur ces questions
:

37
Un jeu à 4 joueurs
• Chacun des 4 joueurs reçoit 20€.
• Il peut contribuer tout ou partie de cette somme dans un pot
commun, sans que sa contribution soit publique.
• Pour chaque euro dans le pot, chacun des joueurs reçoit 0.4€ en
plus de ce qu’il a conservé des 20€ initiaux.
• Quel est l’équilibre du jeu?

38
Les personnes contribuent au bien public mais de moins en moins dans le
temps…
39
Fourniture d’un bien public et interaction
sociale :

• Effet des normes sociales : disposition à contribuer au bien public


dépend des normes sociales de chaque pays.
• Réduction dans le temps : si les autres participent alors je
participe ! Répétition du jeu dans le temps…
• Acceptabilité de l’impôt ?
• Normes sociales vs normes morales ?

40
Ce que vous devez retenir en priorité…
• Concepts d’équilibre (Nash et équilibre en stratégies
dominantes)
• Propriétés de l’équilibre: Rationalité, stabilité.
• Problème d’existence et/ou d’unicité de l’équilibre.
• L’équilibre n’est pas nécessairement efficace.
• Au passage, concepts associés:
• Passager clandestin
• Altruisme et aversion aux inégalités
• Randomisation des stratégies
• Normes sociales
• Capacité prédictive et diagnostic du raisonnement
économique.

41

Vous aimerez peut-être aussi