cienka linia między współpracą a zdradą w modelu ...th.if.uj.edu.pl/~gulakov/uwr.pdf · niech...

Cienka linia między współpracą a zdradą w modelu kolektywnych

zachowań społecznych

UWr, Wrocław, 10.06.2011Andrzej JarynowskiZakład Teorii Układów Złożonych, Instytut Fizyki, Uniwersytet JagiellońskiP. Gawroński, K. KułakowskiKatedra Informatyki Stosowanej i Fizyki Komputerowej, AGH

Plan Prezentacji• Motywacja

•Wprowadzenie do modelu

• Grupa przypadków dla stałego altruizmu

• Grupa przypadków dla zmiennego altruizmu

• Podsumowanie i próba socjologicznej interpretacji wyników

Motywacja

•Współpracować, czy zdradzać: Wedle klasycznej teorii gier wzajemna współpraca nigdy nie jest optymalna z indywidualnego punktu widzenia, ale zawsze opłacalna dla społeczeństwa

•Opozycja archetypów graczy: Homo Economicus – istota racjonalna kierująca się własną korzyścią Homo Sociologicus – istota postępująca według norm społecznych

•Dylemat więźnia rozumiany nie jak zwykle według teorii racjonalnego wyboru (ekonomicznie), lecz normatywnie (socjologicznie)

MotywacjaMówimy że R jest w populacji P normą społeczną, jeśli istnieje wystarczająco duża część populacji P

cf należąca do P taka, że dla każdej

jednostki „i” należącej do Pcf zachodzi:

•okoliczność (contingency): „i” wie, że reguła R istnieje i stosuje się do sytuacji typu S•preferencja warunkowa (conditional preference): „i” woli przestrzegać R w sytuacji S pod warunkiem że(a): spodziewanie empiryczne (empirical expectations): „i” wierzy że

wystarczająco duży podzbiór P stosuje R w sytuacji typu S (b): spodziewanie normatywne (normative expectations): „i” wierzy że

wystarczająco duży podzbiór P spodziewa się, że „i” zastosuje się do R w sytuacji typu S (b’): spodziewanie normatywne z sankcją (normative expectations with

sanctions): „i” wierzy że wystarczająco duży podzbiór P spodziewa się, że „i” zastosuje siędo R w sytuacji typu S, woli aby „i” się zastosował, i może wywrzeć sankcję.[C. Bicchieri, The Grammar of Society, Cambridge UP 2006 (tłum. K. Kułakowski]

•Zmiana społeczna w wyniku zmiany normy

•Zainteresowanie dynamiką procesu a nie jedynie stanem końcowym

•Zerowy model, minimalne założenia - zmienne charakterystyki graczy: reputacja i altruizm

Motywacja

Model

Rozważmy grę, gdzie agenci grają w parach i za każdym razem mają 2 możliwości: współpracować (C), bądź oszukiwać (D). Prawdopodobieństwo współpracy zależy liniowo od altruizmu gracza (i) oraz reputacji współgracza (j).

P(i,j) = Wj(i)+ εi

Jeżeli P(i,j)>1 to przyjmujemy 1, a kiedy P(i,j)<0 to 0.Reputacja W- jest w przedziale [0,1]Altruizm ε- jest w przedziale [-1/2,1/2]

Ogólna zasada: • reputacja gracza rośnie (spada) jeśli on współpracował (oszukiwał); • altruizm gracza rośnie (spada), jeżeli jego współgracz współpracował (oszukiwał).Szybkość zmian jest definiowana przez xW/xε jako procentowa zmiana reputacji / altruizmu.

(C) ε := (0.5-ε)xε + ε (D) ε := ε + (-0.5-ε)xε (C) W := (1-W)xW + W (D) W := W - WxW

Model

W grze zakładam, że bierze udział 100 graczy (czasami 1000) z pewnym początkowym rozkładem W i ε.

Będą to rozkłady jednorodne z ustaloną szerokością połówkową d. Przedział określony jest przez:

[<W>-d; <W>+d][<ε>-d; <ε>+d]

Przykładowo:• jak d=0 mamy jednakowa wartość W (ε) dokładnie w środku dozwolonego przedziału• jak d=0,5 mamy rozkład jednorodny na całym dozwolonym przedziale z wartością średnią dokładnie w środku

ModelModel

Model

Możliwe strategie graczy:

R- obaj współpracują

S- współgracz oszukiwał, kiedy gracz współpracował

T- gracz oszukiwał, kiedy współgracz współpracował

P- obaj oszukują

ε=const

Ewolucja upraszcza się do poniższego układu:

(C) W := (1-W)xW + W (D) W := W – WxW

Wykresy częstości występowania strategii dla 105 kroków MC

ε=const

Spłaszczenie krzywej od signoidalnej (kółka, xw=1%) do

prostej (trójkąty, xw=99%)

ε=const

85% vs 15% u góry

95% vs 5% na dole

ε=const, xw=z*W'

xw=z*W' gdzie W' jest reputacją współgracza, a z wewnętrznym parametrem szybkości zmiany

Oscylacje średniej wartości reputacji w czasie dla z=0,5 (po lewej) oraz z=1(po prawej)

ε=const, xw=z*W'

Dla z=1 obserwujemy efekt jak w modelu Isinga 3D (spontaniczne przeskoki pomiędzy stanami).

ε=const, xw=z*W'

P. Gawroński, K. Kułakowski

Xε != 0, xW = 0Najprostszy przypadek: xW = 0

xε != 0

Kiedy xw i xε są niezerowe to zanikają różnorodne strategie. Zaczynając od przypadku, kiedy po każdej kolejce następuje zmiana reputacji i altruizmu o ½ otrzymamy:

1 0,7 0,5 0,3 0

0 0,25 0,5 0,75 1W

-0,5

-0,25

0

0,25

0,5

ε

xε != 0Granica faz opisywana dystrybuantą rozkładu Gaussa

-0,12 -0,10 -0,08 -0,06 -0,04 -0,02 0,00 0,02 0,04 0,06 0,08 0,10 0,12δ ε

0,0

0,2

0,4

0,6

0,8

1,0

Pep

s

-0,12 -0,10 -0,08 -0,06 -0,04 -0,02 0,00 0,02 0,04 0,06 0,08 0,10 0,12

δ W

0,0

0,2

0,4

0,6

0,8

1,0

PW

xε != 0Warunek na obszar stochastyczny: of 1/2-3σ<(W + ε)<1/2+3σ, gdzie σ jest odchyleniem standarowym dopasowanej dystrybuanty.

y=W + ε-1/2

xε != 0Zależność od wielkości układu

y=W + ε-1/2

xε != 0Zbieżność do stanu końcowego

ε W0 200 400 600 800 1000 1200 1400 1600 1800 2000

MC steps

-0,4

-0,2

0,0

0,2

0,4

xε != 0Zbieżność do stanu końcowego

xε != 0Początkowa dynamika zmian

P. Gawroński, K. Kułakowski

xε != 0Czas relaksacji układu

Xε != 0, pamięćWprowadźmy pamięć indywidualną do układu.Reputacja gracza i składa się z N wizerunków reputacji

Pamiec indyw idualna

010000

2000030000

4000050000

6000070000

8000090000

1E51,1E5

1,2E5

trelax

0

50

100

150

200

250

300

350

400

Licz

ba o

bs.

Xε != 0, pamięć

pozytyw nie

ODCH.STD_eps och_stand_W

0 10000 20000 30000 40000 50000

MC step

-0,05

0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

negatyw ne


0 10000 20000 30000 40000 50000

MC step

-0,05

0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

neutralne


500010000

1500020000

2500030000

3500040000

4500050000

MC step

-0,05

0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

Xε != 0, sieć kwadratowa

siec kwadratowa, eps

0,4 0,2 0 -0,2 -0,4 1 41 81 121 161 201 241 281 321 361 401 441 481

Zmn1

Zmn8

Zmn15

Zmn22

Zmn29

Zmn36

Zmn43

Zmn50

Zmn57

Zmn64

Zmn71

Zmn78

Zmn85

Zmn92

Zmn99

siec kwadratowa, W

0,9 0,7 0,5 0,3 0,1 1 41 81 121 161 201 241 281 321 361 401 441 481

Zmn1

Zmn8

Zmn15

Zmn22

Zmn29

Zmn36

Zmn43

Zmn50

Zmn57

Zmn64

Zmn71

Zmn78

Zmn85

Zmn92

Zmn99

Xε != 0, sieć kwadratowa

Xε != 0, sieć kwadratowaGra na sieci, a domeny...

Xε != 0, sieć E-R

Gra na sieci, gdzie każda krawędź jest równie prawdopodobna, a średnia krotność wierzchołków wynosi 4 (porównywalnie do sieci kwadratowej)

Xε != 0Niech altruizm zmienia się nie po każdej kolejce a tylko w wyznaczonych sytuacjach:• Rośnie kiedy obaj gracze współpracują• Maleje kiedy gracz współpracował a jednak został oszukanyW tej sytuacji również nie otrzymamy różnych strategii po ustaleniu się stanu końcowego z tym, że:

xε != 0

0,4 0,5 0,6 0,7 0,8 0,9 1,0

xε

-0,48

-0,46

-0,44

-0,42

-0,40

-0,38

-0,36

-0,34

-0,32

-0,30

-0,28

-0,26<ε

>

Zależność stanu negatywnego od xε

Jakkolwiek prawdopodobieństwo stanu pozytywnego: 0,65

Wnioski

• „Uzmiennienie” altruizmu przyczyną rozdzielenie się faz współpracujących i oszukujących• Dynamika w obszarze o niedeterministycznym stanie końcowym odzwierciedleniem procesów społecznych


• Socjotechniczne zabiegi, a regulacja układu

Wnioski



• Jeżeli któryś ze stanów jest premiowany, to jest nim współpraca (jako norma społeczna)

Wnioski



• Jeżeli któryś ze stanów jest premiowany, to jest nim współpraca (jako norma społeczna)

Dziękuję za uwagę

Wnioski

Zaproszenie

cienka linia między współpracą a zdradą w modelu ...th.if.uj.edu.pl/~gulakov/uwr.pdf · niech...

Documents