第八 章 混合策略納許均衡
DESCRIPTION
第八 章 混合策略納許均衡. 本章大綱. 8.1 棒球賽中的投手與打者之戰 8.2 純策略與混合策略的納許均衡 8.3 特價活動 8.4 混合策略與純策略均衡並存 8.5 以圖形分析混合策略. 本章觀念預讀. 純策略:純策略是指於標準式中表述之各列與各行伴隨報酬的策略。 混合或隨機策略:混合策略就是賦予標準式中的純策略一機率分配。 混合策略均衡:若一納許均衡中,有一參賽者的策略是混合策略,則此均衡即稱之為混合策略均衡。. 棒球賽中的投手與打者之戰. 理性的假設下,投手與打者將選擇不可測的策略 - PowerPoint PPT PresentationTRANSCRIPT
智勝文化事業有限公司製作
賽局理論 Roger A. McCain 原著‧陳建良 翻譯
ISBN 957-729-568-1
第八章 混合策略納許均衡
智勝文化事業有限公司製作
賽局理論 Roger A. McCain 原著‧陳建良 翻譯
ISBN 957-729-568-1 本章大綱 8.1 棒球賽中的投手與打者之戰 8.2 純策略與混合策略的納許均衡 8.3 特價活動 8.4 混合策略與純策略均衡並存 8.5 以圖形分析混合策略
智勝文化事業有限公司製作
賽局理論 Roger A. McCain 原著‧陳建良 翻譯
ISBN 957-729-568-1 本章觀念預讀 純策略:純策略是指於標準式中表述之各列與各行伴
隨報酬的策略。 混合或隨機策略:混合策略就是賦予標準式中的純策
略一機率分配。 混合策略均衡:若一納許均衡中,有一參賽者的策略
是混合策略,則此均衡即稱之為混合策略均衡。
智勝文化事業有限公司製作
賽局理論 Roger A. McCain 原著‧陳建良 翻譯
ISBN 957-729-568-1 棒球賽中的投手與打者之戰 理性的假設下,投手與打者將選擇不可測的策略
不可測的策略:參賽者選擇的是一純策略的機率分配,又稱為混和策略。
純策略就是表述在標準式中的策略,混合策略就是賦予標準式中的純策略一機率分配。
混合策略納許均衡兩階段思考打者先決定是否採取隨機策略選擇特定的機率
智勝文化事業有限公司製作
賽局理論 Roger A. McCain 原著‧陳建良 翻譯
ISBN 957-729-568-1表 8.1 棒球投手與打者之報
酬表
智勝文化事業有限公司製作
賽局理論 Roger A. McCain 原著‧陳建良 翻譯
ISBN 957-729-568-1表 8.2 打者不同策略下的期
望值報酬
智勝文化事業有限公司製作
賽局理論 Roger A. McCain 原著‧陳建良 翻譯
ISBN 957-729-568-1表 8.3 投手不同策略下的期
望值報酬
智勝文化事業有限公司製作
賽局理論 Roger A. McCain 原著‧陳建良 翻譯
ISBN 957-729-568-1表 8.4 各種機率選擇下的期
望值報酬
智勝文化事業有限公司製作
賽局理論 Roger A. McCain 原著‧陳建良 翻譯
ISBN 957-729-568-1 重要觀念顯微鏡 當對手採取的隨機策略使你無論採取哪一個策略都得
到相同的報酬時,你選擇哪一個策略都一樣。 理性的共有知識:不僅兩個參賽者是理性的,而且彼
此都知道對手是理性的。 貝氏學習法則:根據更新的資訊來修正經驗
參賽者認為對手並非全然理性時,無法推論對手的策略為何,僅能根據經驗估測對手採取某純策略的機率
智勝文化事業有限公司製作
賽局理論 Roger A. McCain 原著‧陳建良 翻譯
ISBN 957-729-568-1純策略與混合策略的納許
均衡 純策略是指表述於標準式中各列與各行伴隨報酬的策
略,而混合策略是指賦予多個純策略以一特定的機率分配。
馮紐曼與摩根斯坦證明兩人零和賽局的均衡必定存在 納許證明所有兩人賽局必存在納許均衡
智勝文化事業有限公司製作
賽局理論 Roger A. McCain 原著‧陳建良 翻譯
ISBN 957-729-568-1 特價活動 零售商的策略
今日特價明日特價
消費者的策略今日購物明日購物
納許均衡可能是混合策略的組合
智勝文化事業有限公司製作
賽局理論 Roger A. McCain 原著‧陳建良 翻譯
ISBN 957-729-568-1 表 8.5 特價活動賽局的報酬
智勝文化事業有限公司製作
賽局理論 Roger A. McCain 原著‧陳建良 翻譯
ISBN 957-729-568-1表 8.6 零售商不同策略下的
期望值報酬
智勝文化事業有限公司製作
賽局理論 Roger A. McCain 原著‧陳建良 翻譯
ISBN 957-729-568-1表 8.7 消費者不同策略下的
期望值報酬
智勝文化事業有限公司製作
賽局理論 Roger A. McCain 原著‧陳建良 翻譯
ISBN 957-729-568-1 混合策略與純策略均衡並存 阿羅與喬治互讓的賽局
等候前進三個均衡,包括兩個純策略均衡以及一個混合策略均衡
利特頓鎮與哈姆雷特鎮的鑿井策略鑿淺井鑿深井
智勝文化事業有限公司製作
賽局理論 Roger A. McCain 原著‧陳建良 翻譯
ISBN 957-729-568-1 表 8.8 阿羅與喬治的報酬
智勝文化事業有限公司製作
賽局理論 Roger A. McCain 原著‧陳建良 翻譯
ISBN 957-729-568-1表 8.9 阿羅採取不同策略下
的期望值報酬
智勝文化事業有限公司製作
賽局理論 Roger A. McCain 原著‧陳建良 翻譯
ISBN 957-729-568-1表 8.10 在混合策略均衡下,阿羅採取不同策略的期望值報酬
智勝文化事業有限公司製作
賽局理論 Roger A. McCain 原著‧陳建良 翻譯
ISBN 957-729-568-1表 8.11 利特頓鎮與哈姆雷
特鎮的報酬
智勝文化事業有限公司製作
賽局理論 Roger A. McCain 原著‧陳建良 翻譯
ISBN 957-729-568-1表 8.12 利特頓鎮的期望值
報酬
智勝文化事業有限公司製作
賽局理論 Roger A. McCain 原著‧陳建良 翻譯
ISBN 957-729-568-1 以圖形分析混合策略 以棒球賽投手與打者的賽局為例
只有當投手與打者都採取混合策略時,才會是納許均衡。
以阿羅與喬治的互讓賽局為例混合策略是不穩定的一般情形下,一賽菊若有兩個純策略均衡與混合一個策略均衡,此混合策略均衡也經常是不穩定的
以廣告賽局為例當我們擴大參賽者的可選擇策略集合至混合策略時,社會困境均衡仍可能是一優勢策略均衡。
智勝文化事業有限公司製作
賽局理論 Roger A. McCain 原著‧陳建良 翻譯
ISBN 957-729-568-1圖 8.1 棒球中打者的期望值
報酬
智勝文化事業有限公司製作
賽局理論 Roger A. McCain 原著‧陳建良 翻譯
ISBN 957-729-568-1圖 8.2 阿羅與喬治的期望值
報酬
智勝文化事業有限公司製作
賽局理論 Roger A. McCain 原著‧陳建良 翻譯
ISBN 957-729-568-1表 8.13 廣告賽局(複製自
表 1.3 )
智勝文化事業有限公司製作
賽局理論 Roger A. McCain 原著‧陳建良 翻譯
ISBN 957-729-568-1圖 8.3 廣告賽局的期望值
報酬
智勝文化事業有限公司製作
賽局理論 Roger A. McCain 原著‧陳建良 翻譯
ISBN 957-729-568-1 本章摘要 不確定性可能來自於「自然」,也可能是人類的選擇。
在賽局標準式中,兩側的策略稱為純策略。而當參賽者使用純策略時,很容易會被看穿,進而陷入脆弱的地位。因此,參賽者為使策略不可測,可賦予純策略某一機率分配,即為混合策略。
因為策略是不確定的,只能以期望值報酬來加以評量報酬,因此,參賽者的最適反應就是選擇一個可以極大化期望值報酬的機率分配。按此,所有兩人賽局皆有納許均衡,縱使賽局沒有純策略均衡,也一定會有混合策略均衡。在某些賽局(如協調賽局)中,會同時存在純策略與混合策略均衡,但是,混合策略均衡在這些賽局裡是不穩定的。