3.2.1. 協力性の進化
Post on 19-Mar-2016
48 Views
Preview:
DESCRIPTION
TRANSCRIPT
3.2.1. 協力性の進化
社会心理学特殊講義(高木)2000.07.06
囚人のジレンマ(D)協力(C)と非協力
CC=相互サポート一種の(限定)交換
均衡解→静的ゲーム DD
Meta Game, Super Game への→ CC DD 拡張 が とともに均衡
解に含まれる。
━ ━ ━ ━ ━ ━ ━ ━ ━ Self Other─ ─ ─ ─ ─ ─ ─ ─ ─
give 0 2not give 1 0
━ ━ ━ ━ ━ ━ ━ ━ ━Player 2
2
1
give not give
give
not give
Player 12
10
0
3
3
Axelrod(1984) の分析
一種の進化ゲーム状況 戦略間のトーナメント
• tit-for-tat 戦略 (TFT) の優越 解析
• TFT を取り合う(→ CC )ことが Nash 均衡解になる。
• Collective Stable Starategy ESS)≒ TFT の頑健性 限界
• どの戦略が勝つかは戦略分布による。• ノイズを考えない。• 多数の戦略が競い合う状況ではない。
Axelrod(1984) 以後の展開 (1): ノイズのある状況
ノイズがある状況では TFT より「寛容な」戦略が有利である可能性 右図の p : C 返礼確率 右図の q : D に C を
返す確率 厳密な TFT :協力の優
越への触媒作用
Axelrod(1984) 以後の展開(2)
パブロフ戦略 (Win-stay Lose-change): TFT より成績が良い、という結果( Nowak, M. & Sigmund, K., 1993 )
非寛容な Gradual が強いという説( Beaufils, Delahaye & Mathieu, 1996 ) : 相手が裏切った全回数を、相手が裏切るたびに裏切り返す。
Open end な進化 (Lindgren, 1991)• ノイズの存在+遺伝子操作によって戦略の次元が増加できる• 何らかのESSに到達 - 9割• open end な進化 - 1割TFT
Pavlov ESS の1種
セルオートマトンの適用例(Hegselmann, 1996a,b)
エージェントをセルで表現• エージェントはリスクを抱える。• サポート関係の成立のシミュ
レーション結果
• サポートのネットワークが出現• 近隣間でサポート関係が生じる。• リスク水準が似通ったエージェ
ント間でサポート関係が生じやすい。
参考文献 Axelrod, R., 1984, The Evolution of Cooperation. NY: Basic Books. アクセルロッド 松田裕之
( 訳 ) 『つきあい方の科学』、 1987 、HBJ出版局 . Beaufils, B., Delahaye, J-P., Mathieu, P. (1996) Our meeting with Gradual. Artificial-Life-V, MIT
Press, Pp.202-209. Hegselmann, R., 1996a, Understanding social dynamics. See Troitzsch et al. (1996), Pp.282-306. Hegselmann, R., 1996b, Cellular automata in the social sciences. In R. Hegselmann, U. Mueller &
K.G. Troitzsch (Eds.), Modelling and Simulation in the Social Sciences from the Philosophy of Science Point of View. Dordrecht: Kluwer Academic Publishers, Pp.209-233.
Lindgren, K. (1991) Evolutionary phenomena in simple dynamics. Artificial Life-II. Addison-Wesley, Pp.295-312.
Nowak, M. & May, R.M., 1992, Evolutionary games and spatial chaos. Nature, 359, 29, 826-9. Nowak, M., May, R.M. & Sigmund, K., 1995, The arithmetics of mutual help. Scientific American,
June, 50-55. Nowak, M. & Sigmund, K., 1992, Tit for tat in heterogeneous populations. Nature, 355, 16, 250-3. Nowak, M. & Sigmund, K., 1993, A strategy of win-stay, lose-shift that outperforms tit-for-tat in the
Prisoner's Dilemma game. Nature, 364, 1, 568-3. Suleiman, R., 1996, Simulating cooperation and competition: Present state and future objectives.
See Troitzsch et al. (1996), Pp.264-281.
余談:社会的交換ゲーム
ゲーム(シミュレーション)のルール 100人のプレイヤー ゲームの1ラウンド = 試行の繰返し プレイヤーは各試行で資源を保有する。 資源を自由に分割し、他者ないし自分に与える。 各試行でのプレイヤーの利得=その試行で受け取った資源量の和 他者から得た資源は自分の資源より価値がある。
• 囚人のジレンマ ラウンドでのプレイヤーの利得は試行ごとの利得和。ただし後の試行の利得
は割引かれる。 ラウンドごとに、利得の下位者の戦略は上位者の戦略と入代わる(進化)。
囚人のジレンマのシミュレーションとの違い 予算制約:協力の範囲を無制限に拡張することはできない。 与える量を自由に調節できる。
限定交換戦略• NonCoop :孤立主義者
– 決して他者に与えない。• Saint :聖人
– すべてを無条件に他者に与える。• Recp :お返し戦略 ~ 返報規範
– 最初のうちは自発的に他者に資源を与える。– 自分と相手との差し引き勘定を計算、負債の2倍返しをする。 → 交換の永続
• TFT :仲間作り戦略 ~ tit for tat– 最初のうちは自発的に他者に資源を与える。– 資源をくれる相手を「仲間」と認定する。仲間には常に与える。– 2度裏切った(資源をくれない)相手は2度と仲間とは認めない。 →同類
を識別• 情報構造 - 自分の交換履歴の情報だけを利用
A
B
A
B
-1
-1
-1
-1
-1
-1
-1
+1
+1
+1
+1
+1
+1
+1
1 2 2 2 2 2 2
1 1 1 1 1 1 1
1 1 1 1 1 1
返報戦略 (Recp)
仲間作り戦略 (TFT)
2 2
2 2
1 1
分析:4戦略の比較 相手が NonCoop だけなら、 Recp 、 TFT は勝利できる。
• Recp 8 vs NonCoop 92 → Recp 100
• TFT 7 vs NonCoop 93 → TFT 100
TFT が4戦略中最強。 Recp は Saint に弱い。
• 同類識別能力の欠如SaintNonCoopRecp TFT
戦略
0
100
200
300
400
500
平均
利得 TFT
RecpNonCoopSaint
Recp, NonCoop, Saint 図2: の循環 -1 TFT 図2 : が参加した場合
分析:改良返報戦略 Recp2 :改良型返報戦略
同類を識別できる 。 得点能力は TFT にせまる ( 図3 ) 。
保有資源の不確実性 TFT は不確実なほど得点が低下 Recp2 は不確実性の影響を受けない(図3-
1)。 シミュレーション
条件• 確実:毎試行資源 10• 低不確実: 15/5• 高不確実: 20/0
確実条件 → TFT が勝利 低/高不確実条件 → Recp2 が勝利
Saint NonCoop Recp2 TFT戦略
0
100
200
300
400
500
平均
利得 TFT
Recp2NonCoopSaint
図3:戦略の平均利得
確実 低不確実 高不確実0
100200300400500
TFTRecp2
-1図3 :戦略の平均利得
0
20
40
60
80
100
確実条件
TFTRecp2
NonCoop
0
20
40
60
80
100TFT
Recp2
NonCoop
低不確実条件0
20
40
60
80
100 TFT
Recp2
NonCoop
高不確実条件
top related