game theory - staff.informatics.buu.ac.thbencha/886204_58/ch6gametheory.pdf ·...
TRANSCRIPT
ทฤษฎเกม
• เกม(game) หมายถงการแขงขนกนระหวางผตดสนใจหลายๆคน เปนสถานการณทมการแขงขน หรอการขดแยงระหวางผเลนสองฝายขนไป โดยทตางฝายตางตองการไดชยชนะดวยการคดกลยทธตางๆ เพอแยงชงสวนแบงทางการตลาดทมอยอยางจ ากดจากอกฝายหนงมาใหมากทสด ผลของเกมธรกจนคอ ฝายหนงได(ชนะ) และอกฝายหนงเสย(แพ)
• เกมมผแขงขนสองฝาย ขนไปประจนหนาซงกนและกนเพอแสวงหาวตถประสงคทขดกน (Competitive)
2
ผชนะ Positive Payoff (+)
ผแพ Negative Payoff (-)
องคประกอบของทฤษฎเกม
ทฤษฎเกม จะตองประกอบดวย 3 องคประกอบ คอ 1. ผเลน (Players): มมากกวา 1 ฝาย 2. กลยทธของผเลน (Player’s Strategies): แผนทใชในการลงแขงขนของแตละผเลน 3. ตารางผลตอบแทน (Payoff Table): ตารางแสดงผลลพธในการลงแขงขนโดยใชแตละ
กลยทธของผเลนแตละฝาย การแกปญหาของทฤษฎเกมจะเกดขนภายใตสมมตฐานดงตอไปน คอ • คแขงขนมจ านวนจ ากดนบจ านวนได • คแขงขนแตละฝาย ตางกมจ านวนกลยทธทนบได • คแขงขนแตละฝายจะไมทราบกลยทธของคแขงขน • ผเลนทกฝายแขงขนโดยใชหลกการเหตผล • ผเลนทกฝายแขงขนกนเพอหาวธทางทน าไปสผลทดทสดของแตละฝาย • ผลตอบแทนทผแขงขนแตละคนไดรบขนกบการกระท าหรอการตดสนใจของคแขงขนทกฝาย • มก าไร/ขาดทนทแนนอน และคาของเกมสามารถค านวณได คอเปน + , -, 0
รปแบบพนฐานของเกม
• ในการศกษาทฤษฎเกม ( Game Theory )ในบทน จะเปนการศกษาถงการเลอกใชกลยทธทดทสดเขามาตอสกบคแขงขน โดยจ ากดจ านวนผเขาแขงขนเพยง 2 ฝายเทานน และผลรวมของเกมเปนศนย (Two-person, Zero-sum Game)
• รปแบบของเกมทมผเลนเพยง 2 ฝาย ซงเปนการแขงขนทผแขงขนฝายหนงชนะจ านวนเทาใด ฝายทแพกจะเสยจ านวนเทานน เชน การแขงขนแยงชงสวนแบงของตลาดระหวางองคกร ประกอบไปดวยผเลน 2 ฝาย ซงในการแขงขน จะมฝายหนงแพ (-)คอไดสวนแบงตลาดลดลง และฝายหนงชนะ (+) คอไดสวนแบงตลาดเพมขน ซงเมอเราค านวณหาคาของเกม ผลรวมของเกมในรปแบบน สดทายจะมคาเปนศนย(ผลรวมของผลไดผลเสยของคแขงขนเปนศนย)
• ในการเลนเกมรปแบบน จะประกอบดวย กลยทธของผเลนท 1, กลยทธของผเลนท 2 และตารางผลตอบแทนของผเลน
4
ตารางผลตอบแทนในการเลนเกม
5
กลยทธของ A
กลยทธของ B
1 2 … n
1 a11 a12 … a1n
2 a21 a22 … a2n
m am1 am2 … amn
ตารางผลตอบแทนของผเลน A Payoff Matrix of A
กลยทธของ A
กลยทธของ B
1 2 … n
1 -a11 -a12 … -a1n
2 -a21 -a22 … -a2n
m -am1 -am2 … -amn
ตารางผลตอบแทนของผเลน B Payoff Matrix of B
ตวอยาง
• นาย ก. และนาย ข. พนนกนวา ถาทงสองหยบไพไดสเดยวกน นาย ก.จะเปนผชนะ ผชนะจะไดรบเงน 500 บาท ผแพตองเสยเงน 500 บาท จงสรางตารางผลตอบแทนของเกมน
6
นาย ก. นาย ข.
สด า สแดง สด า สแดง
แสดงผลตอบแทนของนาย ก.
นาย ก. นาย ข.
สด า สแดง สด า สแดง
แสดงผลตอบแทนของนาย ข.
500 -500 -500
-500 -500
500
500 500
กลยทธในการแขงขน (STRATEGY)
กลยทธในการแขงขน (Strategy) เปนวธการหรอแผนการทผเลนใชในการแขงขน ซงแบงกลยทธออกไดเปน 2 ประเภท คอ
1.กลยทธเดยว หรอ กลยทธแท (Pure Strategy) เปนกลยทธทผเลนแตละฝายจะเลอกใชวธใดวธหนงเปนประจ ากลยทธเดยวตลอดเวลา โดยไมค านงวาคแขงขนจะเลอกใชกลยทธใด ไมมการเลนหลายวธผสม
2.กลยทธผสม (Mixed Strategy) เปนกลยทธทผเลน ไมไดเลอกใชกลยทธใดกลยทธหนงเพยงวธเดยว แตจะเลนหลายวธผสมกน โดยจะมการก าหนดสดสวนวาจะใชกลยทธใดเปนสดสวนเทาไร
7
กลยทธเดยว หรอ กลยทธแท (PURE STRATEGY)
• สมมตวามบรษทอย 2 บรษท คอ บรษท A และ บรษท B ซงเปนคแขงกน บรษททงสองตองการโฆษณาผลตภณฑของตนเองโดยแตละบรษทมกลยทธดงน
• บรษท A ม • กลยทธ A1 คอลงโฆษณาทางวทย • กลยทธ A2 คอโฆษณาทางโทรทศน • กลยทธ A3 คอโฆษณาทางหนงสอพมพ
• บรษท B ม • กลยทธ B1 คอลงโฆษณาทางวทย • กลยทธ B2 คอโฆษณาทางโทรทศน • กลยทธ B3 คอโฆษณาทางหนงสอพมพ
• กลยทธ B4 คอโฆษณาทางสออนเทอรเนต 8
สรปรอยละผลตอบแทนของบรษท A
B1 B2 B3 B4
A1 8 -2 9 -3
A2 6 5 6 8
A3 -2 4 -9 5
B1 B2 B3 B4
A1 -8 2 -9 3
A2 -6 -5 -6 -8
A3 2 -4 9 -5
เนองจากเปน Zero-Sum Game ดงนน รอยละผลตอบแทนของบรษท B คอ
9
การหาค าตอบ
• ค าตอบของเกมจะอยภายใตสมมตฐานวาแตละฝายเปนผทมความระมดระวงในการแขงขน ผเลนแตละคน จงใชหลกการ “the Best of the Worst” กลาวคอ
• ผเลนท 1 ใชกลยทธ Maximin คอ การเลอกผลไดทมากทสด จากผลไดทนอยทสดทไดรบจากการใชแตละกลยทธ โดยหาคาต าทสดของแถวนอนแตละแถว ดวาคาใดเปนคาสงทสด ใหเลอกคานน
• ผเลนท 2 ใชกลยทธ Minimax คอ การเลอกทางเลอกทจะเกดผลเสยทนอยทสด จากผลเสยทมากทสดทไดรบจากการใชแตละกลยทธ โดยหาคาสงทสดของคอลมนแตละคอลมน ดวาคาใดเปนคาต าทสด ใหเลอกคานน
• หลงจากพจารณาคา Maximin และ Minimax แลว ถาทง 2 คานเปนคาเดยวกน เกมประเภทนจะเปนเกมกลยทธเดยว และค าตอบทดทสดของเกมกคอจดทมคาทงสองเทากน ซงจะเรยกจดดงกลาววา “จดอานมา” (Saddle Point)
10
B1 B2 B3 B4
A1 8 -2 9 -3
A2 6 5 6 8
A3 -2 4 -9 5
สรปรอยละผลได/ผลเสยของบรษท A
• ถาบรษท A เลอกกลยทธท A1 แลวบรษท A จะไดนอยทสด คอเสย 3% • ถาบรษท B เลอกกลยทธท B1 แลวบรษท B จะเสยทมากทสด คอ 8% • จากตารางขางตนจะเหนไดวาเกมการแขงขนนเปนเกมแบบกลยทธเดยว เนองจากมจด saddle
point คอจดทบรษท A เลอกใชกลยทธ A2 และบรษท B เลอกใชกลยทธ B2 ซงใหคา Maximin และ Minimax เปน 5% เทากน และการใชกลยทธ A2 และ B2 นเปนผลลพธทดทสดของเกม ซงจะใหคาของเกมปน 5% (บรษท A จะไดผลตอบแทนเพมขน 5% บรษท B จะไดผลตอบแทนลดลง 5%)
Row Min
Column Max
-3
5
-9
8 5 9 8
(Maximum)
(Minimum)
11
12
ตวอยาง
• หางสรรพสนคา A และ B ใชกลยทธสงเสรมการขายเพอดงดดลกคาใหมาซอสนคายงหางของตน
• หางสรรพสนคา A พบวา “ยอดขายของหางขนกบกลยทธการสงเสรมการขายของตนและคแขง”
• หาง A
(1) ลดราคา
(2) แจกของแถม
(3) ชงโชคชงรางวล
• หาง B
(1) ลดราคา
(2) แจกของแถม
(3) คปอง
(4) แสตมปการคา
กลยทธ
13
9 12 18 8
15 -4 1 9
11 12 13 10 A
(1) (2) (3)
(1) (2) (3) (4) B คาต าสด
ของแถวนอน
คาสงสด ของแถวตง
8 -4 10
15 12 18 10
Maximin
Minimax Maximin=Minimax
หนวย : ลานบาท
• คาของเกม = 10 ลานบาท
• หาง A ใชกลยทธ 3 (ชงโชคชงรางวล) มยอดขายเฉลย 10 ลานบาท
• หาง B ใชกลยทธ 4 (แสตมปการคา) สญเสยเฉลย 10 ลานบาท
14
ตารางแสดงผลตอบแทนของ ตน
กลยทธของ ตน
กลยทธของเจยบ
1 2 3 4
1 5 6 4 8
2 8 9 7 10
3 5 3 2 9
4 11 5 3 4
Maximin
Minimax 11 9 7 10
4
7
2
3
ตวอยาง
• ตน ควรเลอกใชกลยทธใด กลยทธท 2 เจยบ ควรเลอกใชกลยทธใด กลยทธท 3
• คาของการเกมคอ 7
ตวอยางการแขงขนสองฝายและมผลรวมเปนศนย
15
• คแขงขน คอ ตอดกบนน (ตอดม 3 กลยทธ นนม 2 กลยทธ)
กลยทธทดทสดของตอด คอ กลยทธท 3 กลยทธทดทสดของนน คอ กลยทธท 1 ตอดจะเปนฝายไดเปรยบในการเลนเกมโดยมคาของเกมเทากบ 5
•
MINIMAX
กลยทธตอด กลยทธนน 1 2 MAXIMIN
1 2 3
2 -3 1 -2 5 6
-3 -2 5
5 6
ตารางแสดงผลตอบแทนของตอด
16
ตวอยาง
5 8 3 4
5 3
Maximin
5 8 Minimax
16 17 9 12 13 18 9 10 15 16
9 12 9
17 18 Minimax
Maximin
คาของเกม = 5
Maximin ≠ Minimax
เกมกลยทธผสม (MIXED STRATEGY GAMES)
• หากพจารณาตารางผลตอบแทนแลวพบวาเกมนนมคา Maximin และ Minimax ไมเทากน กลยทธเดยวจะไมสามารถใชได ตองใชหลายกลยทธผสมกน ซงเกมทใชกลยทธผสมจะไมมจดอานมา
• วธการหาสดสวนทเหมาะสมในการใชกลยทธแบบผสม ม 2 วธคอ • วธใชความนาจะเปน • วธเลขคณต
• เมอไดคาสดสวนทเหมาะสมแลว จงค านวณคาของเกมโดยเฉลย หรอคาคาดหวงของเกม B1 B2 Row Min
A1 1 -1 -1
A2 -1 1 -1
Col Max 1 1
17 Maximin ≠ Minimax -1 ≠ 1
18
1. ก าหนดใหผเลนฝายแรกใชกลยทธท 1 ดวยความนาจะเปน P ดงนนความนาจะเปนในการใชกลยทธท 2 ยอมเทากบ 1 – P และก าหนดใหผเลนฝายทสองใชกลยทธท 1 ดวยความนาจะเปน Q ดงนนความนาจะเปนในการใชกลยทธท 2 ยอมเทากบ 1 – Q
2. หาคา P โดยใชหลกการวา ไมวาผเลนฝายทสองจะใชกลยทธท 1 หรอ 2 ผเลนฝายแรกจะตองได คดเปนคาคาดหวงเทากนจงจะยอม
3. หาคา Q โดยใชหลกการวา ไมวาผเลนฝายแรกจะใชกลยทธท 1 หรอ 2 ผเลนฝายทสองจะตองได คดเปนคาคาดหวงเทากนจงจะยอม
วธการหาสดสวนทเหมาะสมดวยวธใชคาความนาจะเปน
19
โอ
ใหม
Maximin
10 20
Minimax 40 60
ตวอยาง เรมดวยการทดสอบวาใชกลยทธแบบผสมหรอไม
Maximin ≠ Minimax
1 2
1 10 60
2 40 20
ตารางแสดงผลตอบแทนของ ใหม
ดงนนใชกลยทธแบบผสม
20
โอ
ใหม P 1-P
ความนาจะเปน Q 1-Q
ขนท 1 ก าหนดคาความนาจะเปน
1 2
1 10 60
2 40 20
ความนาจะเปน
ตารางแสดงผลตอบแทนของ ใหม
21
โอ
ใหม P 1-P
ความนาจะเปน Q 1-Q
ขนท 2 หาคา P
1 2
1 10 60
2 40 20
ความนาจะเปน
ตารางแสดงผลตอบแทนของ ใหม
10P+40(1-P) = 60P+20(1-P) 10P+40-40P = 60P+20-20P
-30P+40 =40P+20 70P=20 ดงนน P = 2/7 จะได 1-P = 5/7
22
โอ
ใหม 2/7 5/7
ความนาจะเปน Q 1-Q
ขนท 3 หาคา Q
1 2
1 10 60
2 40 20
ความนาจะเปน
ตารางแสดงผลตอบแทนของ ใหม
10Q+60(1-Q) = 40Q+20(1-Q) 10Q+60-60Q = 40Q+20-20Q
-50Q+60 = 20Q+20 70Q = 40 ดงนน Q = 4/7 จะได 1-Q = 3/7
23
โอ
ใหม 2/7 5/7
ความนาจะเปน 4/7 3/7
ขนท 4 สรปคาความนาจะเปน
1 2
1 10 60
2 40 20
ความนาจะเปน
ตารางแสดงผลตอบแทนของ ใหม
24
ขนท 5 ค านวณคาของเกมโดยเฉลย
7
5*20
7
2*60
7
3
7
5*40
7
2*10
7
4
7
100
7
120
7
3
7
200
7
20
7
4
7
220
7
3
7
220
7
443.31
7
220
7
3
7
4
7
220
• คาคาดหวงของเกมหรอคาของเกมโดยเฉลยส าหรบใหมคอ 31.43 นนคอ ใหมจะเปนฝายไดผลตอบแทนโดยเฉลยแลว 31.43
• โอจะมคาของเกมเทากบ -31.43 (เพราะเปนตารางผลตอบแทนของ ใหม)
คาคาดหวงของเกมส าหรบผเลนฝายแรก =Q[a11P+a21(1-P)]+(1-Q)[a12P+a22(1-P)]
25
1. ค านวณหาผลตางทงแถวนอนและแถวตง
2. สลบทคาผลตางทค านวณได
3. หาอตราสวนของกลยทธทใช
วธการหาสดสวนทเหมาะสมดวยวธเลขคณต
โอ
ใหม
ตวอยาง ตารางแสดงผลตอบแทนของ ใหม
1 2
1 10 60
2 40 20
26
โอ
ใหม
Maximin
10 20
Minimax 40 60
ทดสอบวาใชกลยทธแบบผสมหรอไม
Maximin ≠ Minimax
1 2
1 10 60
2 40 20
29
โอ
ใหม 50/70 20/70
30/70 40/70
3. หาอตราสวนของกลยทธทใช
1 2
1 10 60
2 40 20
• ใหมใชกลยทธท 1 ดวยอตราสวน ใชกลยทธท 2 ดวยอตราสวน
• โอใชกลยทธท 1 ดวยอตราสวน ใชกลยทธท 2 ดวยอตราสวน
7
2
7
5
7
4
7
3
30
4. ค านวณคาของเกมโดยเฉลย
7
3*
7
2*60
7
4*
7
2*10
7
3*
7
5*20
7
4*
7
5*40
7
5*20
7
2*60
7
3
7
5*40
7
2*10
7
4
7
100
7
120
7
3
7
200
7
20
7
4
7
220
7
3
7
220
7
443.31
7
220
7
3
7
4
7
220
• คาคาดหวงของเกมส าหรบใหมคอ 31.43 นนคอ ใหมจะเปนฝายไดผลตอบแทนโดยเฉลยแลว 31.43
• โอจะมคาของเกมโดยเฉลยเทากบ -31.43 (เพราะเปนตารางผลตอบแทนของ ใหม)
เกมกลยทธผสม (MIXED STRATEGY GAMES)
วธการในการหาค าตอบส าหรบเกมกลยทธผสม
• Graphical Solution of Games ใชไดกบการแขงขนทคแขงขนฝายใดฝายหนงม 2 กลยทธ แตอกฝายมไดไมจ ากด
• Linear Programming of Games ใชไดกบการแขงขนทคแขงขนมกกลยทธกไดไมจ ากด
31
GRAPHICAL SOLUTION OF GAMES
• เกมแบบ 2n เปนเกมทตารางผลตอบแทนของฝาย A มกลยทธอย 2 กลยทธ และฝาย B ม n กลยทธ ลกษณะของตารางผลตอบแทน( payoff matrix) แสดงดงน
ความนาจะเปน y1 y2 … yn
ความนาจะเปน B1 B2 … Bn
x: A1 a11 a12 … a1n
1-x: A2 a21 a22 … a2n
x และ yj คอ ความนาจะเปน
วธการหาค าตอบของเกมแบบ 2n จะเรมตนจากการหาคาคาดหวงของ A เมอฝาย B ใชกลยทธตางๆ โดยคาคาดหวงของ A เมอ B ใชกลยทธ Bj ค านวณไดจาก a1jx+a2j(1-x) หรอ (a1j – a2j)x + a2j
32
ตวอยาง ก ำหนดตำรำงผลตอบแทนของฝำย A ของเกมขนำด 24 จงหำค ำตอบทดทสดของเกม
B1 B2 B3 B4
A1 2 2 3 -1
A2 4 3 2 6
กลยทธของ B ผลตอบแทนทคาดหวงของ A
B1 2x + 4(1-x) -2x + 4
B2 2x + 3(1-x) -x + 3
B3 3x + 2(1-x) x + 2
B4 -1x+6(1-x) -7x + 6
ค านวณหาผลตอบแทนทคาดวาผเลน A จะไดรบ(Expected Payoff ของผเลน A)
33
1 - x
x
ความ นาจะเปน
ตวอยาง
• น ำสมกำรคำคำดหวงของ A มำวำดลงบนกรำฟ
ทเสนแกน x=0 (แสดงวำ A ใชกลยทธท 2
วธเดยว) และ x=1 (แสดงวำ A ใชกลยทธท
1 วธเดยว) เพอหำจด Maximin ซงเปนจดตดทอยบนเสนขอบดำนลำง และเปนจดตด
แรกสดเมอมองจำกดำนลำงขนไป
B ใชกลยทธท 1
B ใชกลยทธท 2
B ใชกลยทธท 3
B ใชกลยทธท 4
6
5
4
3
2
1
0
-1
-2
6
5
4
3
2
1
0
-1
-2
A ใชกลยทธท 2 (x=0)
A ใชกลยทธท 1 (x=1)
-7x+6
x+2
-2x+4
-x+3
Maximin
34
THE BEST OF THE WORST
• หาจดตดของสมการคาคาดหวงทท าใหเกดจดตด ในทนเกดจากสมการกลยทธท 3 และ 4 ของฝาย B (หรอจะมองวาเกดจากสมการท 2 และ 3 ตดกน หรอ 2 และ 4 ตดกนกได) จะไดวา x + 2 = -7x + 6
x = 1/2 = 0.5
• ผแขงขนฝาย A จะใชกลยทธท 1 ในอตราสวน 1/2 และใชกลยทธท 2 ในอตราสวน 1 – 0.5 = 0.5 เชนกน
• จากนนหาคาของเกมโดยการแทน x = 0.5 ลงในสมการ x + 2 หรอ -7x + 6
จะไดคาของเกม = 0.5 + 2 = 2.5
35
ค านวณคา EXPECTED PAYOFF ของผเลน B
• จากภาพ พจารณากลยทธทดทสดของ B จากเสนสมการทกอใหเกดจด Maximinซงในทนคอสมการท 3 และ 4 ดงนนกลยทธทเหมาะสมของ B คอกลยทธ B3 และ B4 นนเอง และเนองจากเกมการแขงขนนเปนเกมกลยทธผสม ดงนนเราจะหาวาฝาย B ควรใชกลยทธ B3 และ B4 เปนสดสวนเทาใดจงจะเหมาะสมทสด ซงมวธการหาค าตอบ คอ
• ก าหนดคาความนาจะเปนในการใชกลยทธ B3 และ B4 เปน y และ 1 y ตามล าดบ จากนนค านวณหาผลตอบแทนทคาดหวงของ B
36
ค านวณคา EXPECTED PAYOFF ของผเลน B
ความนาจะเปน ผเลน B
B3(y) B4(1 - y)
ผเลน A A1 3 -1
A2 2 6
กลยทธของ A ผลตอบแทนทคาดหวงของ B
A1 3y + (-1)(1 y) 4y 1
A2 2y + 6(1 y) -4y + 6
37
ค านวณคา EXPECTED PAYOFF ของผเลน B
• ค านวณจดตดของเสนตรงทงสองเสน
4y 1 = -4y + 6 y = 7/8 • นนคอฝาย B จะใชกลยทธ B3 โดยมอตราสวนเปน 7/8 และใชกลยทธ B4 เปนสดสวนเทากบ 1/8
• จากนนแทนคา y = 7/8 ในสมการกลยทธท 1 จะได 4*(7/8)-1 = 3.5-1 = 2.5 • หรอแทนคา y = 7/8 ในสมการกลยทธท 2 จะได -4*(7/8)+6 = -3.5+6 = 2.5 เชนกน • จะท าใหไดคาเหมาะสมสดของเกมคอ 2.5 นนคอถามการแขงขนลกษณะนหลายๆครงโดยทฝาย A ใชกลยทธผสมระหวางกลยทธท 1 และ 2 ในอตราสวน 1/2 และ 1/2 ในขณะทฝาย B ใชกลยทธผสมระหวางกลยทธท 3 และ 4 ในอตราสวน 7/8 และ 1/8 ฝาย A จะไดผลตอบแทนโดยเฉลย 2.5
38
เกณฑเดน (DOMINANCE CRITERIA)
• คอ หลกเกณฑทใชในการจ ากดขนาดของปญหาใหเลกลง โดยตดกลยทธทคดวา คแขงขนจะไมเลอกอยางแนนอนออกไป และพจารณาเฉพาะกลยทธทนาสนใจเทานน เพอสามารถแกปญหาไดงายขน เชน จากตารางผลตอบแทนของ A ดงน
39
B1 B2 B3 B4
A1 2 2 3 -1
A2 4 3 2 6
เกณฑเดน(DOMINANCE CRITERIA)
• จะเหนวาบรษท B จะไมใชกลยทธท 1 เลย เพราะจะเปนวธทมแตทางเสย(มากกวากลยทธท 2 และ 3) จงสามารถตดกลยทธท 1 ของบรษท B ออกจากตารางผลตอบแทนของบรษท A ได ปญหาจะลดขนาดจาก 24 เปนขนาด 23 ตารางทไดสามารถใชในการค านวณไดงายยงขน ดงน
• ซงสามารถน าตารางผลตอบแทนทไดนไปหาค าตอบดวยวธกราฟตอไป
40
B2 B3 B4
A1 2 3 -1
A2 3 2 6