partie i : jeux et equilibre de nashncarayol.u-bordeaux4.fr/part_1_jeux_m1.pdf · la th eorie des...
TRANSCRIPT
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Partie I : Jeux et equilibre de Nash
Nicolas Carayol
M1 MIMSE
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Introduction
• La theorie des jeux peut se concevoir comme une theorie descomportement d’agents rationnels en situation d’interaction.
• Les joueurs sont rationnels : ils poursuivent des objectifsexogenes et independants (ici jeux non-cooperatifs vs jeuxcooperatifs) ;
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Jeu en forme normale
DefinitionUn jeu en forme normale
⟨I , (Si )i∈I , (ui (·))i∈I
⟩est donne par :
• Un ensemble I de n ≥ 1 joueurs, indexes par i = 1, 2, . . . n ;
• Un ensemble de strategies Si pour chaque joueur i qui peutchoisit une strategie (pure) si . Le vecteur s ≡ (s1, s2, . . . , sn)est le resultat (ou profil de strategies) avec s ∈ S,l’ensembe des profils de strategies.
• Une fonction de gain pour chaque joueur i , ui : S → R
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Le dilemme du prisonnier
• Un jeu non–cooperatif avec n = 2 joueurs, I = {1, 2}• L’ensemble de strategies de chaque joueur : S1 = S2 = {C ,D}
Definition
• 4 resultats possibles du jeu :
S = {(C ,C ) , (C ,D) , (D,D) , (D,C )} .
• Gains symetriques :
• u1 (C ,C ) = u2 (C ,C ) = −1,• u1 (C ,D) = −10, u2 (C ,D) = 0,• u1 (D,C ) = 0, u2 (D,C ) = −10,• u1 (D,D) = u2 (D,D) = −8.
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
DP - Matrice du jeu II
2C D
1 C (−1,−1) (−10, 0)D (0,−10) (−8,−8)
Table: Dilemme du prisonnier
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
NotationLe profil de strategies s = (si , s−i ) (∀i ∈ I ) avec
s−i = (s1, s2, . . . , si−1, si+1, . . . , sn) , s−i ∈ Xj 6=i
Sj .
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
DefinitionLa strategie si du joueur i est strictement dominee par lastrategie s ′i si et seulement si, quel que soit le comportementdes autres joueurs, le joueur i obtient avec si une utilitestrictement inferieure a celle obtenue avec s ′i
∀s−i ∈ S−i , ui (si , s−i ) < ui
(s ′i , s−i
)DefinitionLa strategie si est faiblement dominee par s ′i si l’inegalite estfaible pour toutes les strategies des autres joueurs et qu’il existe aumoins un profil de strategies des autres joueurs pour lequel l’utiliteavec pi est strictement inferieure a celle avec s ′i :
∀s−i ∈ S−i , ui (si , s−i ) ≤ ui
(s ′i , s−i
)et ∃s−i ∈ S−i | ui (si , s−i ) < ui
(s ′i , s−i
)
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Dilemme du prisonier
2N D
1 N (−1,−1) (−10, 0)D (0,−10) (−8,−8)
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Strategies dominantes
DefinitionUne strategies s ′i est une strategies strictement dominante si
∀si ∈ Si ,∀s−i ∈ S−i , ui (si , s−i ) < ui
(s ′i , s−i
)
DefinitionUne strategies s ′i est une strategies faiblement dominante si :
∀si ∈ Si :
∀s−i ∈ S−i , ui (si , s−i ) ≤ ui
(s ′i , s−i
)et ∃s−i ∈ S−i | ui (si , s−i ) < ui
(s ′i , s−i
)
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Equilibre en strategies dominantes
DefinitionUn profil de strategies s ′ est un equilibre en strategies dominantesstrict si
∀i ∈ I ,∀si ∈ Si ,∀s−i ∈ S−i , ui (si , s−i ) < ui
(s ′i , s−i
)
DefinitionUn profil de strategies s ′ est un equilibre en strategies (faiblement)dominantes si :
∀i ∈ I : ∀si ∈ Si ,
∀s−i ∈ S−i , ui (si , s−i ) ≤ ui
(s ′i , s−i
)et ∃s−i ∈ S−i | ui (si , s−i ) < ui
(s ′i , s−i
)
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Equilibre de Nash
DefinitionUn profil s∗ = (s∗1 , . . . , s
∗n) (s∗i ∈ Si , i = 1...n) est un equilibre de
Nash si aucun joueur n’a interet a devier unilateralement de sastrategie p∗i (quand les autres joueurs continuent a jouer le profilp∗−i ) :
ui
(s∗i , s
∗−i)≥ ui
(si , s
∗−i), ∀si ∈ Si , ∀i = 1 . . . n.
Definitionp∗ est un equilibre de Nash strict siui
(s∗i , s
∗−i)> ui
(si , s
∗−i), ∀si ∈ Si\ {s∗i } , ∀i = 1 . . . n.
• Si l’equilibre de Nash est strict, en devier doit avoir un coutpour les joueurs.
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
2C D
1 C (−1,−1) (−10, 0)D (0,−10) (−8,−8)
Table: Dilemme du prisonnier
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
La Bataille des sexes
2B b
1 B (2, 1) (0, 0)b (0, 0) (1, 2)
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
DefinitionUne strategie mixte du joueur i est une mesure de probabilites pi
definie sur l’ensemble des strategies pures du joueur i(∑
sipi ,si = 1). On note Pi l’ensemble des strategies mixtes du
joueur i . pi ,si est la probabilite que i joue le strategie pure si .pi ∈ Pi correspond donc a une strategie mixte du joueur i .
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Strategies mixtes
Strategies mixtes : p1 = (q, 1− q) et p2 = (t, 1− t) avecq, t ∈ [0, 1].→ q est la frequence du choix de la strategie N par 1→ t est la frequence du choix de N par 2.
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Equilibre de Nash
DefinitionUn profil p∗ = (p∗1 , . . . , p
∗n) (p∗i ∈ Pi , i = 1...n) est un equilibre
de Nash en strategies mixtes si
ui
(p∗i , p
∗−i)≥ ui
(pi , p
∗−i), ∀pi ∈ Pi , ∀i = 1 . . . n. (1)
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Fonctions de meilleures reponses
Determiner les strategies du joueur i qui correspondent a la plusgrande satisfaction pour lui face a tout profil s−i .
DefinitionDans un jeu a n joueurs, la fonction de meilleure reponse dujoueur i , Ri (p−i ) associe, a chaque combinaison de strategies desautres joueurs p−i , la (les) strategie(s) du joueur i quimaximise(nt) son gain :
ui (Ri (p−i ) , p−i ) ≥ ui (pi , p−i ) , ∀pi ∈ Pi , p−i ∈ P−i .
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Illustration en strategies pures avec la Dilemme duprisonnier
2C D
1 C (−1,−1) (−10, 0)D (0,−10) (−8,−8)
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Illustration en strategies pures avec la Bataille des sexes
2B b
1 B (2, 1) (0, 0)b (0, 0) (1, 2)
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
De maniere plus generale :
Proposition
p∗ est un equilibre de Nash si et seulmement sip∗i ∈ Ri
(p∗−i), ∀i = 1...n.
Preuve : Par definition, Ri
(p∗−i)
maximise ui
(pi , p
∗−i), pour tout
joueur i → Aucun joueur n’a interet a devier unilateralement de sastrategie p∗i .
• Recherche des equilibres de Nash est operee en pratique par larecherche des points d’intersection entre les fonctions demeilleures reponses de tous les joueurs (comme dansl’oligopole de Cournot).
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Meilleures reponses en strategies mixtesStrategies mixtes des deux joueurs : p1 = (q, 1− q) etp2 = (t, 1− t) avec q, t ∈ [0, 1] .
2t 1− tB b
1 q B (2, 1) (0, 0)1− q b (0, 0) (1, 2)
Table: Bataille des sexes et strategies mixtes
Comparons alors l’esperance d’utilite de 1 pour ses deux strategies :
si B : UB1 (p1, p2) = U1 ((1, 0) , (t, 1− t)) = 2t + 0 (1− t) = 2t
si b : Ub1 (p1, p2) = U1 ((0, 1) , (t, 1− t)) = 0t + 1 (1− t) = 1− t
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Meilleures reponses en strategies mixtes
Face a la strategie mixte p2 de 2, 1 choisira B si :
2t > 1− t ⇒ t >1
3.
→ La fonction de meilleure reponse de 1 :
R1 (t) = q∗ (t) =
1 Si t > 1/3[0, 1] Si t = 1/30 Si t < 1/3.
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Et pour 2 :
B : UB2 (p1, p2) = U2 ((q, 1− q) , (1, 0)) = 1q + 0(1− q) = q
b : Ub2 (p1, p2) = U2 ((q, 1− q) , (0, 1)) = 0q + 2 (1− q) = 2− 2q
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Meilleures reponses en strategies mixtes
Face a la strategie mixte p1 de 1, 2 choisira B (t = 1) si :
UB2 (p1, p2) > Ub
2 (p1, p2)
C’est a dire si :
q > 2− 2q ↔ q >2
3.
La fonction de meilleure reponse de 2 est :
R2 (q) = t∗ (q) =
1 Si q > 2/3[0, 1] Si q = 2/30 Si q < 2/3.
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Representation graphique
Tp : representation graphique des fonctions de meilleures reponse.
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Meilleures reponses en strategies mixtes : autre exemple
Autre exemple
2a b
1 a (2, 2) (1, 3)b (3, 1) (0, 0)
Table: Strategies mixtes
Ensemble des EN en strategies mixtes ?
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Meilleures reponses en strategies mixtes : autre exemple
Autre exemple
2a b
1 a (3, 3) (0, 2)b (0, 1) (1, 1)
Table:
Exercice : Calculer le(s) equilibre(s) de Nash en strategies mixtesde ce jeu (s’il en existe).
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Jeu en forme extensive
DefinitionUn jeu en forme extensive⟨I ,A, ψ (·) ,Λ, (λi )i∈I , (Si )i∈I , ρ, (ui (·))i∈I
⟩est donne par
• Un ensemble I de n ≥ 1 joueurs, indexes par i = 1, 2, . . . n.
• Un ensemble de noeuds A, comprenant la racine a0. Le sousensemble Aw ⊂ A rassemble les noeuds terminaux. Les autresnoeuds Ad sont les noeuds de decision.
• Une fonction donnant le predecesseur (unique) pour toutnoeud different de la racine ψ : A\ {a0} → Ad .
• Une partition de l’ensemble des noeuds de decision Ad surl’ensemble des joueurs indiquant, pour chaque noeud dedecision, le joueur qui joue : Λ = (Λ1, ...,Λn). Λ1 = ensembledes noeuds de decision du joueur 1.
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Jeu en forme extensive
Definition
• Pour chaque joueur i , une partition λi (λi1, ..., λini ) de son Λi
en ni ensembles d’information hj (hj ∈ Hi l’ensemble desensembles d’information du joueur i) avec la condition quetous les noeuds d’un meme ensemble d’information aient lememe nombre de branches.
• Des probabilites sur d’eventuels mouvements aleatoires (jouespar la Nature) : ρ.
• La specification des gains de chaque joueur a chaque noeudterminal : Une fonction de gain pour chaque joueuri , ui : Aw → R
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Information imparfaite
• Si un joueur ne connaıt pas les choix effectues par les joueursqui ont joue avant lui, il ne connaıt pas parfaitement le noeudsur lequel il se situe.
• Si, a un moment donne, il ne peut distinguer deux noeuds, cesdeux noeuds appartiennent au meme ensembled’information.
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
DefinitionUn jeu en forme extensive est
1. un jeu avec information imparfaite si au moins un ensembled’information contient plus d’un noeud ;
2. un jeu avec information parfaite si chaque ensembled’information est reduit a un seul noeud.
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Strategies pures
• Une strategie pure : specification d’une action pour unjoueur chaque fois qu’il est susceptible de jouer.
• Dans un jeu en forme normale : une strategie d’un joueur iconsiste en la determination d’un si .
• Dans un jeu en forme extensive : une strategie d’un joueur iest une application si qui attribue a chaque ensembled’information hj (∈ Hi ) du joueur i une action qu’il estsusceptible de choisir dans cet ensemble d’information.
• Un profil de strategies (resultat) → specification d’underoulement complet du jeu en precisant une strategie parjoueur.
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Strategies pures dans un jeu sequentiel : Exemple
CHAPITRE 2. JEUX, STRATEGIES ET INFORMATION 14
Definition 2.6 Un jeu est a information incomplete si au moins un des joueurs ne connaıt pasparfaitement la structure du jeu. Dans le cas contraire, il est a information complete.
Nous allons revenir dans la seconde partie de cet ouvrage sur les problemes lies a l’informationincomplete de certains joueurs.
Remarque 2.4 L’exemple du dilemme du prisonnier nous montre que plusieurs representations enforme extensive peuvent correspondre au meme jeu en forme normale.
Nous devons maintenant definir plus precisement un des concepts cle de la theorie des jeux : lastrategie.
2.3 Definition des strategies
Jusqu’a maintenant, nous avons deliberement confondu les strategies des agents avec leurs actionspropres : denoncer, combattre l’entree... Cela est souvent vrai pour les jeux tres simples mais la theoriedes jeux est basee sur une representation plus fine des strategies des joueurs en fonction de la situationd’interaction et de la representation retenue du jeu.
De maniere generale, une strategie d’un joueur doit specifier une action pour ce joueur chaque foisqu’il est susceptible de jouer (s’il joue, par exemple, a plusieurs tours du jeu, nous devons specifier uneaction pour chacun des tours). Un profil de strategies (appele parfois resultat) specifie un deroulementcomplet du jeu en precisant une strategie par joueur.
Quelle que soit la complexite du jeu, les strategies des joueurs doivent nous permettre de deroulercompletement le jeu quand on les combine (on considere donc un profil de strategies). Par consequent,le concept de strategie de la theorie des jeux est plus complet que celui du langage courant. Conside-rons une version plus detaillee du jeu de l’entree afin de developper la definition des differents typesde strategies.
Exemple 3 : Le Jeu de l’entree IIPrenons le jeu represente dans la Figure 2.3.
(0, 100)
Non
E0
I
Augmenter capacite
Non
Produire
Non
Produire
Non(−10, 100)
(50, 60)
(−10, 120)
(−50, 40)
capaciteInstaller
E1
(uE,uI)
Fig. 2.3: Le jeu de l’entree II
Il s’agit d’une analyse plus fine des interactions concernant le probleme d’entree sur un marche. Lejeu commence par la decision de l’entrant potentiel (E) : il doit choisir s’il met en place les capacitesde production necessaires a son entree sur ce nouveau marche. Ayant observe cette decision, la firmeinstallee (I) doit choisir si elle augmente ses propres capacites de production ou non. L’entrant doitalors prendre sa decision de proceder effectivement a la production du bien ou non et cela, sanspouvoir observer la decision de la firme installee. Si E choisit des le debut de ne pas installer decapacites de production, le probleme de l’entree ne se pose plus et I garde son monopole.
Figure: Le jeu de l’entree II
Tire de Yildizoglu (2011)
Donnez la representation sours forme normale de ce jeu ?
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Strategies dans un jeu en forme extensive - II
DefinitionUne strategie locale du joueur i est similaire a une strategiemixte, sauf qu’elle est definie au niveau d’un ensembled’information (au lieu du jeu global). Pour un joueur i , elleefinit dpar consequent, pour un ensemble d’information hj , une mesure deprobabilites sur l’ensemble des actions disponibles en cet ensembled’information. On la note par πihj (la strategie locale du joueur i ason ensemble d’information hj) et Πihj est l’ensemble des strategieslocales de i pour l’ensemble d’information hj .
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Strategies dans un jeu en forme extensive - III
DefinitionUne strategie comportementale du joueur i est un vecteur destrategies locales de ce joueur, contenant une strategie locale pourchaque ensemble d’information de ce joueur. On la note par πi etΠi est l’ensemble des strategies comportementales du joueur i .
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Concepts de strategies :
• strategies pures (pour jeux en forme strategique et extensive) ;
• strategies mixtes (pour jeux en forme strategique etextensive) ;
• strategies locales (pour jeux en forme extensive) ;
• strategies comportementales (pour jeux en forme extensive).
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Non-existence de l’equilibre de Nash en strategies pures
• Il n’existe pas necessairement un equilibre de Nash enstrategies pures.
• Exemple
2B b
1 B (2, 0) (0, 2)b (0, 1) (1, 0)
Table: Bataille des sexes II
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Conditions d’existence
TheoremeTout jeu sous forme normale
⟨I , (Si )i∈I , (ui )i∈I
⟩a au moins un
equilibre de Nash en strategies pures s’il verifie les conditionssuivantes
• L’ensemble des strategies est un sous espace Euclidien(Si ⊆ RK ,K ∈ N) non vide, compact et convexe
• Les fonctions d’utilite ui (·) : S → R sont continues
• Les fonctions d’utilite ui (·, s−i ) : Si → R sont quasi-concaves∀s−i ∈ S−i .
Demonstration.Le theoreme du point fixe (Kakutani, 1941) s’applique a lacorrespondance des meilleures reponses R : S → S
• → Intersection des fonctions de meilleure reponse assuree.
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Theoreme(Nash) Tout jeu sous forme normale fini possede au moins unequilibre de Nash si les strategies mixtes sont autorisees.
Demonstration.Strategies mixtes dans un jeu fini → elles sont definies dansl’intervalle fermee [0, 1], et sur un support fini (Si ) → compacite etconvexite → Theoreme de Nash.
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Bien-etre social
• Un concept d’equilibre implique un mecanisme particulier decoordination des strategies individuelles. Dans l’equilibre deNash, chaque joueur cherche a ameliorer sa situationindividuelle unilateralement.
• L’equilibre de Nash est-il un mecanisme de coordinationefficace au sens de Pareto ?
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Optimum de Pareto
DefinitionEfficacite au sens de Pareto.
1. Le resultat s Pareto-domine le resultat s si :
ui (s) ≥ ui (s) , ∀i et
∃ j , uj (s) > uj (s) .
2. Un resultat s∗ est un optimum de Pareto s’il n’existe pas unautre resultat qui le Pareto-domine.
3. Les resultats s et s ne sont pas Pareto-comparable si
∃i , ui (s) > ui (s) et ∃ j 6= i , uj (s) < uj (s) .
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Exemple
2C D
1 C (−1,−1) (−10, 0)D (0,−10) (−8,−8)
Optimum de Pareto ?
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Exemple
2C D
1 C (−1,−1) (−10, 0)D (0,−10) (−8,−8)
Dilemme du prisonnier : (D,D) est un equilibre de Nash mais(N,N) Pareto-domine cet equilibre.
Proposition
Un equilibre de Nash n’est pas necessairement un optimum dePareto.
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Application : Jeu de pollution
• Jeu de pollution simultane avec strategies (si )i∈N continues∈ R+ et la fonction de paiement :
ui (s1, ..., sn)) = v(si )−∑j
sj ,
avec v ′ > 0, v ′′ < 0 et v ′(0) > 1.
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Application : Jeu de pollution
• Solution : chaque agent max son paiement individuellement :
maxsi
v(si )−∑j
sj
→ v ′(si ) = 1.
• Chaque agent a une (unique) action dominante.
• Le profil de strategies caracterise par v ′(si ) = 1, ∀i ∈ N estdonc son unique EN.
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Application : Jeu de pollution
• Si l’objectif est de maximiser le bien etre social :
maxsi,∀i∈N
∑i
v(si )−∑j
sj
→ v ′(si ) = n
• Les EN ne maximisent pas le bien-etre social
• Les EN ne sont pas des optimas de pareto.
• Quel mecanisme pour implementer la solution optimale al’EN ?
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Application : Jeu de pollution
• Si l’on introduit un taux θ de taxe (dite pigouvienne) lineaireen si →
ui (s1, ..., sn)) = v(si )−∑j
sj − θsi +θ
n
∑j
sj
• A l’equilibre de Nash :
v ′(si ) = 1 + θ
(n − 1
n
)• Or maximiser le bien etre social implique : v ′(si ) = n
• Le mecanisme : fixer la taxe telle que
n = 1 + θ
(n − 1
n
).
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Application : competition spatiale
Application : competition spatiale
• N = 2
• S1 = S2 = [0; 1]
• u1(x1, x2) =
(x1 + x2)/2 si x1 < x2
[1− (x1 + x2)] /2 si x1 > x2
1/2 si x1 = x2
• u2(x1, x2) symetrique
• EN ?
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Information incomplete et jeux Bayesiens
• L’hypothese de base des jeux a information complete est quetous les joueurs sont parfaitement informes des regles du jeu.
• Or, les joueurs ont souvent une connaissance imparfaite descaracteristiques des autres joueurs ou meme de certainesconditions du jeu.
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
L’idee de baseExemple : mais qui est votre partenaire ?
2.aB b
1 B (2, 3) (0, 0)b (1, 2) (3, 1)
2.bB b
1 B (2, 1) (0, 2)b (1, 2) (3, 3)
Table: Bataille des sexes en info incomplete
• Le joueur 1 ignore l’identite du joueur 2.
• Le joueur 2 connaıt ses preferences et a une strategiedominante.
• Le joueur 1 attribue la probabilite p a l’eventualite que lejoueur 2 soit de type 2.a et 1− p qu’il soit de type 2.b.
• si : 2p + 0(1− p) > 1p + 3(1− p)→ 1 joue B.
• C’est le principe du Bayesian Nash Equilibrium.
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
L’idee de base
• Tout jeu en information incomplete peut etre representecomme un jeu a infomation imparfaite dans lequel la naturejoue en premier un coup qu’un agent au moins ne peut pasobserver.
• Exemple : information asymetrique prive d’un joueur =situation dans laquelle la nature a attribue un type a unjoueur que l’autre ne peut observer.
• Exemple : transformer le jeu de la bataille des sexes ainformation incomplete !
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Remarque
• Harsanyi (1973) montre que tout equilibre de Nash(notamment en strategies mixtes) d’un jeu sous formenormale peut “presque toujours” etre obtenu comme la limited’un equilibre de Nash en strategies pures d’un jeu perturbe ainformation incomplete (ou les joueurs sont incertains sur lespaiements des autres) quand les perturbations (incertitudes apriori, types) tendent vers 0.
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Jeux bayesiens
• Lorsque l’incertitude porte sur une caracteristique d’un joueur,les differents etats de la nature portent sur les types desjoueurs.
• Quand l’incertitude porte sur une autre caracteristique du jeu,il est quand meme le plus souvent possible d’ecrire les gainsdu jeu comme dependant de types des joueurs.
• Les types de i , ti , et des autres joueurs t−i
• La distribution de probabilites sur les types des autres sachantson propre type et ses croyances pi (t−i |ti )
• Si les attributions des types sont independants :pi (t−i |ti ) = pi (t−i )
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Jeux bayesiens
DefinitionUn jeu bayesien statique en forme normale est decrit par : · Unensemble de n joueurs : I = {1, 2, . . . , n} . · Pour chaque joueur i ,i ∈ I , un ensemble d’actions Ai et un ensemble de types possiblesTi . A = X
i∈IAi et T = X
i∈ITi . · Pour chaque joueur i , une fonction
de gain, ui → les preferences (VNM) du joueur i :
ui : S = A× T → Rs ≡ (a1, a2, . . . , an, t1, t2, . . . , tn) 7→ ui (a, t) .
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Jeux bayesiens
Definition(suite) · Une distribution de probabilite a priori pi pour tout i ∈ Iqui donne les croyances des agents quant aux types des autresagents :
pi : T → [0, 1](t1, t2, . . . , tn) 7→ pi (t−i |ti ) .
qui resulte de la regle de bayes lorsque celle-ci peut etre appliquee(memo : Pr(a|b) = Pr(a) Pr(b|a)
Pr(b) )
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Jeux bayesiens
DefinitionUne strategie (pure) si du joueur i precise une action pour chaquetype :
si : Ti → Ai
ti 7→ si (ti ) = ai .
Le profil de strategies (pures) est donne par s = (s1, s2, . . . , sn).
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Jeux bayesiens
• Une strategie pour i est
• separatrice si si (ti ) 6= si (t ′i ) ,∀ti 6= t ′i ∈ Ti ,• melangeante (pooling) si si (ti ) = si (t ′i ) ,∀ti 6= t ′i ∈ Ti
• Les deductions que l’on peut inferer quant a leurs types au vude leurs choix sont tres differentes.
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Equilibre de Nash bayesien
DefinitionL’equilibre de Nash en strategies pures d’un jeu bayesien est unprofil de strategies s∗ = (s∗1 , s
∗2 , . . . , s
∗n) tel que, ∀i ∈ I ,∀ti ∈ Ti :
s∗i (ti ) = arg maxsi∈Si∑
t−i∈T−iui
(s∗−i (t−i ), si ; t
)× pi (t−i |ti ) ,
avec :s−i (t−i ) = (s1(t1), s2(t2), . . . si−1(ti−1), si+1(ti+1), ..., sn(tn)) .
• Notion que l’on peut etendre aux strategies mixtes σ∗i (ti ) .
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Bataille des sexes avec information incomplete
Equilibre :
• s∗2 (t2.a) = B; s∗2 (t2.b) = b (strategie separatrice)
• s∗1 (t1) =
B si p > 3/4(x , 1− x), ∀x ∈ [0, 1] si p = 3/4b si p < 3/4
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Duopole de Cournot en information incomplete
• Q = A− p,
• πi (q1, q2) = (p − ci ) qi = (A− q1 − q2 − ci ) qi .
• I = {1, 2} .• T1 = {t1} ,T2 = {t2.a, t2.b}• Pr(t2.a) = P (c2 = c) = α = 1− Pr(t2.b) = 1− P (c2 = c)
avec c < c1 < c .
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Duopole de Cournot en information incomplete
• La fonction de reaction de la firme 2 :
• maxq2 (A− q1 − q2 − c) q2, si t2 = t2.a ou• maxq2 (A− q1 − q2 − c) q2, t2 = t2.b
• → q∗2 (q1, c) = A−q1−c2
• → q∗2 (q1, c) = A−q1−c2
• Strategie separatrice
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Duopole de Cournot en information incomplete
• La fonction de reaction de la firme 1 incorpore une incertitudesur la fonction de reaction de 1 :maxq1 α (A− q1 − q∗2 (q1, c)− c1) q1
+ (1− α) (A− q1 − q∗2 (q1, c)− c1) q1
ou maxq1 (A− q1 − E1 (q∗2)− c1) q1
avec E1 (q∗2) = αA−q1−c2 + (1− α) A−q1−c
2 = A−q1−E1(c2)2
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Duopole de Cournot en information incomplete
L’equilibre
• q∗1 (q2) = A−E1(q2)−c1
2
• E1 (q∗2) = A−q1−E1(c2)2
• Donne q1 = A+q1+E1(c2)−2c1
4 → q∗1 = A+E1(c2)−2c1
3
• La quantite proposee par 1 tient compte de ses croyances sur 2
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Duopole de Cournot en information incomplete
L’equilibre
• q∗2 (c) =A−A+E1(c2)−2c1
3−c
2 = 2A−E1(c2)+2c1−3c6
• q∗2 (c) =A−A+E1(c2)−2c1
3−c
2 = 2A−E1(c2)+2c1−3c6
• q∗2 (c) < q∗2 (c)
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Duopole de Cournot en information incomplete
L’equilibre
• q∗2 (c) > q∗∗2 (c) en information complete
• q∗2 (c) < q∗∗2 (c) en information complete
Forme normale et equilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplete
Duopole de Cournot en information incomplete
• Dans l’EN avec information incomplete, la firme 2 :
• si elle a des couts eleves, elle produit plus que ses quantites decournot en information complete,
• si elle a des couts faibles, elle produit moins que ses quantitesde cournot en information complete