Θεωρία Παιγνίων και Εφαρμογές
DESCRIPTION
Θεωρία Παιγνίων και Εφαρμογές. Θ. Κεχαγιάς Γενικό Τμήμα Πολυτεχνική Σχολή, ΑΠΘ. Πράσινος. C. D. Μπλε. ΔΦ Live. C. D. ΔΦ: Ανάλυση. Πράσινος. C. D. Μπλε. C. D. Για τον Μπλέ: 3TRANSCRIPT
![Page 1: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/1.jpg)
Θεωρία Παιγνίων και Εφαρμογές
Θ. Κεχαγιάς
Γενικό Τμήμα
Πολυτεχνική Σχολή, ΑΠΘ
![Page 2: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/2.jpg)
ΔΦ Live
(3,3) (0,5)
(5,0) (1,1)
ΜπλεΠράσινος
C
D
C D
![Page 3: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/3.jpg)
ΔΦ: Ανάλυση
(3,3) (0,5)
(5,0) (1,1)
ΜπλεΠράσινος
C
D
C D
Για τον Μπλέ: 3<5 και 0<1 άρα C<DΓια τον Πρασ.: 3<5 και 0<1 άρα C<D
Άρα όλοι παίζουν D. Αλλά …
![Page 4: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/4.jpg)
Το Αρχικό ΔΦ
(2,2) (5,0)
(0,5) (4,4)
ΜπλεΠράσινος
C
D
C D
Δύο ύποπτοι για ληστεία ανακρίνονται από την αστυνομία …
•Αν ομολογήσει μόνο ο ένας τον αφήνουν ελεύθερο ο άλλος τιμωρείται με 5 χρόνια φυλακή.•Αν δεν ομολογήσει κανείς δεν μπορούν να αποδείξουν ότι έκαναν την ληστεία αλλά θα τους καταδικάσουν για παράνομη οπλοφορία, 2 χρόνια τον καθένα.•Αν ομολογήσουν και οι δύο καταδικάζονται και οι δύο, σε 4 χρόνια φυλακή.
Το Δίλημμα του Φυλακισμένου
![Page 5: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/5.jpg)
Ένα Παίγνιο Διαφήμισης
(3,3) (0,5)
(5,0) (2,2)
ΜπλεΠράσινος
C
D
C D
Δύο εταιρείες πουλούν το ίδιο προϊόν, στην ίδια τιμή. Οι συνολικές πωλήσεις είναι 104 τεμάχια και αποφέρουν κέρδος 6· 104 Euro. •Αν καμμία εταιρεία δεν κάνει διαφημιστική καμπάνια, οι αγοραστές μοιράζονται εξίσου μεταξύ των δύο.•Αν μόνο η Πράσινη εταιρεία κάνει διαφημιστική καμπάνια όλοι οι αγοραστές θα προτιμήσουν το προϊόν της … αλλά η καμπάνια στοιχίζει 104 Euro. •Αν και η Πράσινη και η Μπλε εταιρεία κάνει διαφημιστική καμπάνια, οι αγοραστές δεν θα αλλάξουν προμηθευτή.
![Page 6: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/6.jpg)
Ένα Παίγνιο Τηλεπικοινωνιών
(0,0) (0,0.9)
(0.9,0) (-0.1,-0.1)
ΜπλεΠράσινος
C
D
C D
Τηλεπικοινωνίες(Channel Access)
Δύο χρήστες θέλουν να στείλουν ο καθένας το δικό τους μήνυμα. Υπάρχει μόνο ένα διαθέσιμο κανάλι.•Το κόστος αποστολής είναι 0.1 Euro.•Αν μόνο ο Πράσινος στείλει το μήνυμα του, θα έχει κέρδος 1 Euro.•Αν και ο Πράσινος και ο Μπλε στείλουν μήνυμα, το κανάλι θα μπλοκάρει και κανένα μήνυμα δεν θα περάσει.
![Page 7: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/7.jpg)
Και Άλλα Παίγνια
(1,1) (1,5)
(5,1) (0,0)
ΜπλεΠράσινος
C
D
C D
(-1,-1) (-1,5)
(5,-1) (-100,-100)
ΜπλεΠράσινος
C
D
C D
Η Μάχη των Φύλων
Chicken
![Page 8: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/8.jpg)
Παίγνια Μηδενικού Αθροίσματος
(-2,2) (1,-1)
(2,-2) (3,-3)
ΜπλεΠράσινος
C
D
C D
-2 1
2 3
ΜπλεΠράσινος
C
D
C D
![Page 9: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/9.jpg)
Παίγνια Μηδενικού Αθροίσματος
5 1
3 4
Μπλε
Πράσινος
C
D
C D
-1 1
1 -1
Μπλε
Πράσινος
C
D
C D
![Page 10: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/10.jpg)
Τ ο π α ρ α π ά ν ω π α ί γ ν ι ο π α ί ζ ε τ α ι κ α ι σ τ ι ς α π ε ρ γ ί ε ς . C : x i = 1 ( Α π ε ρ γ ώ ) D : x i = 1 ( Δ ε ν α π ε ρ γ ώ )
3 αν0
3 αν5
21
21
xx
xxy i
Α ρ . Α λ λ ω ν C 0 1 2 3 4
Ο π α ί κ τ η ς π α ί ζ ε ι C
- 1 - 1 4 4 4
Ο π α ί κ τ η ς π α ί ζ ε ι D
0 0 0 5 5
Παίγνιο με Ν παίκτες
![Page 11: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/11.jpg)
Το γενικό 2Χ2 Συμμετρικό Παίγνιο
C D C R,R S,T D T,S P,P
Εχουμε 4*3*2*1=24 22 συμμετρικά παίγνια. Prisoner’s Dilemma: T > R > P > S Chicken: T > R > S > P Battle of the Sexes: T > R > S > P
![Page 12: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/12.jpg)
Το γενικό MΧN Συμμετρικό Παίγνιο
11 11 12 12 1 1
21 21 22 22 2 2
1 1 2 2
( , ) ( , ) ... ( , )
( , ) ( , ) ... ( , )
... ... ... ...
( , ) ( , ) ... ( , )
N N
N N
M M M M MN MN
a b a b a b
a b a b a bA
a b a b a b
![Page 13: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/13.jpg)
Επαναλαμβανόμενο ΔΦ
CC CD DC DD CC 6,6 3,8 3,8 0,10 CD 8,3 4,4 5,5 1,6 DC 8,3 5,5 4,4 1,6 DD 10,0 6,1 6,1 2,2
(3,3) (0,5)
(5,0) (1,1)
ΜπλεΠράσινος
C
D
C D
Εδώ είναι ο πίνακας για το παίγνιο που αποτελείται από δύο γύρους ΔΦ.
![Page 14: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/14.jpg)
Θεωρία Παιγνίων
Θεωρία Παιγνίων: Η μαθηματική θεωρία της σύγκρουσης και της συνεργασίας
Ότι είναι η Θεωρία Πιθανοτήτων για τα παίγνια τύχης, είναι η Θεωρία Παιγνίων για τα στρατηγικά παίγνια
![Page 15: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/15.jpg)
Θεωρία Παιγνίων
Κεντρική Βελτιστοποίηση: Ενας «παίκτης» επιλέγει x1, x2
για να μεγιστοποιήσει την f(x1, x2)
Κατανεμημένη Βελτιστοποίηση: Ο «παίκτης» 1 επιλέγει την x1, για να μεγιστοποιήσει την f (x1, x2) και ο «παίκτης» 2
επιλέγει την x2, για να μεγιστοποιήσει την f (x1, x2).
Εγωιστική Βελτιστοποίηση: Ο «παίκτης» 1 επιλέγει την x1, για να μεγιστοποιήσει την f1(x1, x2) και ο «παίκτης» 2
επιλέγει την x2, για να μεγιστοποιήσει την f2(x1, x2).
![Page 16: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/16.jpg)
Εφαρμογές της Θεωρίας Παιγνίων
•Οικονομία (καρτέλ, ολιγοπώλια, διαφημιστικές εκστρατείες)•Κούρσα εξοπλισμών (π.χ. Ελλάδα-Τουρκία)•Χρήση προηγμένων τεχνολογιών πληροφορικής (ΔΦ με Ν παίκτες, μεγάλο Ν).
•Linux vs. Windows•C vs. Fortran
•Peer-To-Peer (να ανοίξω τον HD μου ή όχι?).•Χρηματοδότηση έρευνας.•Εκπαιδευτικές Εφαρμογές
•Κλέψιμο στις εξετάσεις.•Πληθωρισμός βαθμών
Κάθε περίπτωση στην οποία περισσότεροι του ενός παίκτες προσπαθούν να βελτιστοποιήσουν ο καθένας την δική του συνάρτηση κέρδους.
![Page 17: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/17.jpg)
Διάφορα Παίγνια
•Φτηνές υπεραστικές κλήσεις μετά τις 23:00 και συμφόρηση γραμμών. Πότε να πάρω τηλέφωνο, πριν ή μετά τις 23:00?•Pennypot: Δύο παίκτες εναλάσσονται, σε κάθε γύρο ο ένας εκ των δύο ή προσθέτει ένα ευρώ στην μπάνκα ή παίρνει όλα τα ευρώ.•ΔΦ με ανταλλαγές αγαθών (Hofstadter 716) •Γιατί στα στρατόπεδα συγκέντρωσης οι έγκλειστοι δεν επιτέθηκαν στου φρουρούς?•Κανείς δεν θέλει να είναι στην πρώτη γραμμή σε μια διαδήλωση, αν όμως δεν σχηματιστεί πρώτη γραμμή δεν θα υπάρχει διαδήλωση.•Κυκλοφοριακά: τήρηση/παραβίαση του κόκκινου, οδήγηση σε μια πλευρά του δρόμου.•Γενικότερα: εγκαθίδρυση προτύπων, κανονισμών, (άγραφων) νόμων, ηθικής.•Ειδικότερα: σταθεροποίηση γλώσσας.•Παιχνίδια με μάθηση.•Παιχνίδια με χωρική δομή.
![Page 18: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/18.jpg)
Παίγνια Μηδενικού Αθροίσματος
Μέγιστοελάχιστοκέρδος του Α
Ελάχιστημέγιστηζημία του Β
Σαγματικό σημείο (saddle point)
![Page 19: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/19.jpg)
Λύση Minimax με Καθαρές Στρατηγικές
Παράδειγμα 1 (έχει Minimax λύση)
Παράδειγμα 2 (ΔΕΝ έχει Minimax λύση)
![Page 20: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/20.jpg)
Λύση Minimax με Μικτές Στρατηγικές
Οι μικτές στρατηγικές είναι κατανομές πιθανοτήτων
Το προσδοκώμενο κέρδος του Α είναι:
Θεώρημα Minimax: Για κάθε παίγνιο μηδενικού αθροίσματος υπάρχουν p*,q* τ.ω.
Η αξία του παιγνίου για τον Α ισούται με
και επιτυγχάνεται όταν
![Page 21: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/21.jpg)
Παράδειγμα με Μικτές Στρατηγικές
Η αξία του παιγνίου για τον Α ισούται με
=1/5 =3/5
=17/5
![Page 22: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/22.jpg)
Παίγνια Μη Μηδενικού Αθροίσματος: Ισορροπία Nash
* * *( , ) ( , ),i i i i i i i iu s s u s s s S
iu Ui is S
όπου: Κέρδος του παίκτη i
στρατηγική του παίκτη i
arg max ( , )i i
i i i is S
s u s s
Η βέλτιστη απόκριση του παίκτη i στις στρατηγικές s-i είναι η στρατηγική si η οποία ικανοποιεί:
Σημείο ισορροπίας Nash : Ένα σύνολο αμοιβαία βέλτιστων αποκρίσεων
Ένα παίγνιο μπορεί να έχει περισσότερα από ένα σημεία ισορροπίας Nash
Μια στρατηγική είναι σημείο ισορροπίας Nash ανν για κάθε παίκτη i * * * *
1 2( , ,..., )Ns s s s
![Page 23: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/23.jpg)
Θεώρημα: Κάθε πεπερασμένο παίγνιο Ν παικτών έχει τουλάχιστον ένα σημείο ισορροπίας Nash (στον χώρο των μικτών στρατηγικών).
Προσοχή: Ένα παίγνιο μπορεί να έχει περισσότερα από ένα σημεία ισορροπίας Nash
![Page 24: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/24.jpg)
Παίγνια Μη Μηδενικού Αθροίσματος:
Βελτιστότητα Pareto
(1) (2)( ) ( ), 1,2,...,i iu s u s i N
Μια στρατηγική s* είναι Pareto βέλτιστη ανν δεν υπάρχει στρατηγική s η οποία υπερέχει της s* κατά Pareto.
Δηλ. ένα σημείο είναι Pareto βέλτιστο ανν κανείς παίκτης δεν μπορεί να βελτιώσει το κέρδος του χωρίς να ελαττώσει το κέρδος κάποιου άλλου παίκτη
Μια στρατηγική s(1) υπερέχει κατά Pareto της s(2) ανν για κάθε παίκτη i
![Page 25: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/25.jpg)
Εφαρμογή στο ΔΦ
(3,3) (5,0)
(0,5) (1,1)
ΜπλεΠράσινος
C
D
C D
Nash
![Page 26: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/26.jpg)
Live: To Παίγνιο της Βαθμολόγησης
![Page 27: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/27.jpg)
Βελτιστότητα στο Παίγνιο της Βαθμολόγησης
(0, 0) (0, 1)(1, 0) (0, 0)
BlueGreen
Δεν Θέλω
Θέλω
Δεν θέλω Θέλω
Nash
![Page 28: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/28.jpg)
Παίγνια σε Δίκτυα Ασύρματης Επικοινωνίας
S1
S2
D1D2
![Page 29: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/29.jpg)
Το Δίλημμα της Προώθησης
??
Blue Πράσινος
(1-c, 1-c) (-c, 1)
(1, -c) (0, 0)
Μπλέ
Πράσινος
Forward
Drop
Forward Drop
Το κόστος αποστολής είναι c, το κέρδος από επιτυχή μετάδοση είναι 1.
![Page 30: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/30.jpg)
Το Δίλημμα της Προώθησης
(1-c, 1-c) (-c, 1)
(1, -c) (0, 0)
Μπλέ
Πράσινος
Forward
Drop
Forward Drop
Το αποτέλεσμα είναι η τραγωδία των βοσκοτόπων (Hardin, 1968)
Η στρατηγική Drop επικρατεί της Forward, αν και η αμοιβαία Forward θα έδινα καλύτερο αποτέλεσμα.
![Page 31: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/31.jpg)
Το Δίλημμα της Συνδυασμένης Προώθησης
?Μπλέ Πράσινος
Πηγή Προορισμός
?
• Το κέρδος επιτυχούς μετάδοσης είναι 1• Το κόστος προώθησης είναι c (0 < c << 1)
(1-c, 1-c) (-c, 0)
(0, 0) (0, 0)
Μπλέ
Πράσινος
Forward
Drop
Forward Drop
Δεν υπάρχει επικρατούσα στρατηγική ….
![Page 32: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/32.jpg)
Ισορροπία Nash
(1-c, 1-c)
(-c, 1)
(1, -c) (0, 0)
Μπλέ
Πράσινος
Forward
Drop
Forward DropΤο δίλημμα της προώθησης
Το δίλημμα της συνδυασμένης προώθησης
(1-c, 1-c)
(-c, 0)
(0, 0) (0, 0)
Μπλέ
Πράσινος
Forward
Drop
Forward Drop
![Page 33: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/33.jpg)
«Αποδοτικότητα» της Ισορροπίας Nash
(1-c, 1-c)
(-c, 0)
(0, 0) (0, 0)
Μπλέ
Πράσινος
Forward
Drop
Forward Drop
Δύο σημεία Nash, το ένα είναι Pareto βέλτιστο …
![Page 34: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/34.jpg)
Το Παιχνίδι Πολλαπλής Πρόσβασης
(0, 0) (0, 1-c)(1-c, 0) (-c, -c)
Μπλέ
Πράσινος
Quiet
Transmit
Quiet Transmit
Time-division channel
![Page 35: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/35.jpg)
Το Παιχνίδι Πολλαπλής Πρόσβασης
(1 )(1 ) (1 )blueu p q c pqc p c q (1 )greenu q c p
1 , 1p c q c
p: Πιθανότητα να εκπέμψει ο Μπλε
q: Πιθανότητα να εκπέμψει ο Πράσινος
Σημείο Nash
![Page 36: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/36.jpg)
Το Παιχνίδι Παρεμβολής
Δεν υπάρχει σημείο Nash στις καθαρές στρατηγικές, αλλά το p=1/2, q=1/2 είναι σημείο Nash στις μικτές στρατηγικές
Δύο κανάλια, C1 και C2
(-1, 1) (1, -1)(1, -1) (-1, 1)
Μπλέ
Πράσινος
C1
C2
C1 C2
Πομπός
Παρεμβολέας
![Page 37: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/37.jpg)
•Επανειλημμένη αλληλεπίδραση μεταξύ των παικτών
•Στρατηγική: προσδιορίζει την επόμενη κίνηση ως συνάρτηση των προηγούμενων
•Παίγνια πεπερασμένου ή άπειρου ορίζοντα
Επαναλαμβανόμενα Παίγνια
![Page 38: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/38.jpg)
Συνάρτηση Κέρδους σε Επαν. Παίγνια
1i iu u t
0
T
i it
u u t
0
i it
u u t
Μυωπική:
Μακρόπνοη, πεπερασμένη:
0
ti i
t
u u t
0 1 Ο συντελεστής απόσβεσης
Μακρόπνοη, άπειρη:
Μακρόπνοη, άπειρη,με απόσβεση:
![Page 39: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/39.jpg)
Στρατηγικές σε Επαν. Παίγνια
• Συνήθως οι στρατηγικές εξαρτώνται από το προηγούμενο βήμα μόνο:
– Την κίνηση του συμπαίκτη:
– Την κίνηση του ίδιου του παίκτη:
– Το κέρδος:
1i i im t s m t 1 ,i i i im t s m t m t 1i i im t s u t
Π.χ. στο Παίγνιο Προώθησης:
Μπλε (t) Αρχική κίνηση
F D Στρατηγική
Πράσινος (t+1)
F F F AllC
F F D Tit-For-Tat (TFT)
D D D AllD
F D F Anti-TFT
![Page 40: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/40.jpg)
Το Επαν. Παιχνίδι της Προώθησης
(1-c, 1-c)
(-c, 1)
(1, -c) (0, 0)
Μπλέ
Πράσινος
Forward
Drop
Forward Drop
?
?
Μπλέ Πράσινος
Κέρδος κάθε γύρου
![Page 41: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/41.jpg)
Το Επαν. Παιχνίδι της Προώθησης
Μπλε
Στρατηγική
Πρασινη Στρατηγική
AllD AllD
AllD TFT
AllD AllC
AllC AllC
AllC TFT
TFT TFT
Άπειρο παίγνιο με απόσβεση: 0
ti i
t
u u t
Μπλε
Κέρδος
Πράσινο
Κέρδος
0 0
1 -c
1/(1-ω) -c/(1-ω)
(1-c)/(1-ω) (1-c)/(1-ω)
(1-c)/(1-ω) (1-c)/(1-ω)
(1-c)/(1-ω) (1-c)/(1-ω)
![Page 42: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/42.jpg)
Ανάλυση
Το AllC έχει καλό κέρδος όταν παίζει με AllC και με TFT, αλλά
το AllD εκμεταλλεύεται το AllC.
Το AllD έχει μικρό κέρδος όταν παίζει με AllD.
Το TFT πάει καλά με το AllC και με το AllD και
εκδικείται το AllD
Το TFT είναι η καλύτερη στρατηγική όταν το ω είναι κοντά στο 1!
Μπλε
Στρατηγική
Πρασινη Στρατηγική
AllD AllD
AllD TFT
AllD AllC
AllC AllC
AllC TFT
TFT TFT
Μπλε
Κέρδος
Πράσινο
Κέρδος
0 0
1 -c
1/(1-ω) -c/(1-ω)
(1-c)/(1-ω) (1-c)/(1-ω)
(1-c)/(1-ω) (1-c)/(1-ω)
(1-c)/(1-ω) (1-c)/(1-ω)
![Page 43: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/43.jpg)
Ανάλυση
Θεώρημα: Στο επαναλ. Παίγνιο προώθησης, το (AllD, AllD) είναι σημείο Nash.
Θεώρημα: Στο επαναλ. Παίγνιο προώθησης, το (TFT , TFT) είναι σημείο Nash το οποίο είναι και Pareto βέλτιστο.
Μπλε
Στρατηγική
Πρασινη Στρατηγική
Μπλε
Κέρδος
Πράσινο
Κέρδος
AllD AllD 0 0
TFT TFT (1-c)/(1-ω) (1-c)/(1-ω)
![Page 44: Θεωρία Παιγνίων και Εφαρμογές](https://reader035.vdocuments.mx/reader035/viewer/2022081421/56814f87550346895dbd4075/html5/thumbnails/44.jpg)
Βιβλιογραφία1. http://en.wikipedia.org/wiki/Game_theory2. http://users.auth.gr/~kehagiat/GameTheory/index.html3. J.D. Williams, The Compleat Strategyst, 1954.4. Γ. Βαρουφάκης , Θεωρία παιγνίων, 2007.5. R. Axelrod, The Evolution of Cooperation.6. JW Weibull , Evolutionary game theory. 1997.7. Μ. Felegyhazi + J.P. Hubaux, “Game Theory in Wireless Networks: a
Tutorial”, IEEE, 2005.8. M Felegyhazi, M Cagalj, SS Bidokhti , “Noncooperative multi-radio channel
allocation in wireless networks”, Proceedings of the IEEE, 2007.9. AB MacKenzie, SB Wicker . «Game theory and the design of self-
configuring, adaptive wireless networks». IEEE Communications Magazine, 2001.
10. Srivastava et al., “Using Game Theory to Analyze Wireless Ad Hoc Networks”, 2006.
11. H.Tembine, E Altman, R El-Azouzi . “Multiple access game in ad-hoc network”, 2007.
12. G Thamilarasu, R Sridhar , “Game Theoretic Modeling of Jamming Attacks in Ad hoc Networks”, 2009.
13. Y Xiao, X Shan, Y Ren . «Game theory models for IEEE 802.11 DCF in wireless ad hoc networks», IEEE Communications Magazine, 2005.