teorija igara

75
TEORIJA IGARA Ciljevi ovog poglavlja su slijedeći: Razumjeti sadržinu konfliktne situacije Shvatiti suštinu strateške interakcije između strana u konfliktu Upoznati osnove teorije igara i njene mogućnosti za analizu strateške interakcije Razumjeti karakteristike i vrste igara Upoznati specifičnosti igara dva igrača sa nula sumom Naučiti postupak rješavanja igara sa sedlastom tačkom Temeljito razraditi postupke za rješavanje igara bez sedlaste tačke Opisati postupak rješavanja igara pomoću linearnog programiranja Za različite oblike matrice plaćanja opisati postupke rješavanja na konkretnim primjerima 1. Uvod 9

Upload: belma-torlic

Post on 13-Apr-2015

343 views

Category:

Documents


11 download

DESCRIPTION

zzgttzgtukjhk

TRANSCRIPT

Page 1: TEORIJA IGARA

TEORIJA IGARA

Ciljevi ovog poglavlja su slijedeći:

Razumjeti sadržinu konfliktne situacije Shvatiti suštinu strateške interakcije između strana u konfliktu Upoznati osnove teorije igara i njene mogućnosti za analizu strateške

interakcije Razumjeti karakteristike i vrste igara Upoznati specifičnosti igara dva igrača sa nula sumom Naučiti postupak rješavanja igara sa sedlastom tačkom Temeljito razraditi postupke za rješavanje igara bez sedlaste tačke Opisati postupak rješavanja igara pomoću linearnog programiranja Za različite oblike matrice plaćanja opisati postupke rješavanja na

konkretnim primjerima

1. Uvod

U procesu odlučivanja, kako u svakodnevnom tako i u poslovnom životu, okruženje se najčešće ne identificira kao potpuno amorfna masa o kojoj ništa ne znamo i na koju nemamo nikakav utjecaj, već se uglavnom poznaju učesnici, pojedinci ili grupe čije su aktivnosti relevantne za naše odlučivanje. Istovremno naše aktivnosti imaju povratni utjecaj na odluke istih učesnika, tako da u konačnici rezultati koji postižu pojedinačno svi učesnici proizvod su brojnih odluka i njihovih interakcija. Ovi utjecaji su ponekad zasnovani na saglasnim interesima, dobroj volji i želji da da se pomogne jedni drugima, a češće na konfliktnim interesima, animozitetu, pa i neprijateljstvu.

„Situacije djelimičnog ili potpunog konflikta između različitih donosilaca odluke nazivamo igrama“ [Pavličić (2004), str. 207] koje se izučavaju u okviru teorije igara kao posebne naučne discipline ili okviru disciplina operaciona istraživanja, teorija odlučivanja i sl.

U situaciji kada postoji konflikt različitih interesa teorija igara se pojavljuje kao metoda odlučivanja. Subjekt odlučivanja pored svojih ciljeva mora respektovati i

9

Page 2: TEORIJA IGARA

ciljeve protivnika. Ciljevi igrača, odnosno učesnika u igri su najčešće suprotni što je i razumljivo pošto igra odražava konfliktnu situaciju. Igrači ili učesnici igre su lica i organizacije koje jedinstveno i samostalno donose odluke. Sama igra između učesnika rezultira zavisnim odnosima koji predstavljaju konfliktnu situaciju. Prema tome pod pojmom igra možemo smatrati model konfliktne situacije ili skup pravila i dogovora kojih se moraju pridržavati učesnici igre. Da bi realizovao svoje ciljeve igrač se mora prodržavati pravila ponašanja koja su rezultat raspoloživosti informacija o ciljevima i ponašanju protivnika.

2. Osnovni pojmovi teorije igara

2.1. Konfliktna situacija i strateška interakcija

Konfliktna situacija je takva situacija u kojoj se djelimično ili potpuno sukobljavaju ili suprostavljaju interesi dva ili više učesnika (akteri, strane, igrači i sl.) u kojoj svaki učesnik želi za sebe da ostvari što povoljniji rezultat. Prilikom odlučivanja u uslovima konflikta, pored poznatih uslova konflikta, učesnik postavlja cilj izbora akcije uzimajući u obzir i akceptirajući i ciljeve suprotnih strana. Prema tome, između dvije ili više strana u konfliktu postoji strateška interakcija, pod kojom možemo podrazumijevati situaciju međusobne povezanosti i uzajamne uzrokovanosti (međudejstvo) u kojem strategija svakog učesnika zavisi od strategija njegovih protivnika, ali takođe i ima utjecaj na strategije protivnika. Ako se radi o poslovnim strategijama, onda ona tjera nosioce odlučivanja da respektuju reakcije konkurenata na njihovu strategiju. Situacija određivanja cijena je tipična situacija strateške interakcije učesnika u odlučivanju. Ako neko preduzeće odluči da smanji cijenu nekom proizvodu onda ono mora voditi računa o reakciji konkurenata i hoće li i oni smanjti svoju cijenu, odnosno ako želi da poveća cijenu onda treba znati hoće li ga konkurenti pratiti ili će u suprotnom gubiti kupce. Prema tome, prilikom odlučivanja o smanjenju ili povećanju cijena donosilac odluke mora uvažiti potencijalne reakcije konkurenata koji, takođe, žele da ostvare što veće efekte poslovanja.

2.2. Sadržina teorije igara

Iako su se nekim aspektima teorije igara još u 19. vijeku bavili Cournot i Bertrand, ipak na teorijski konzistentan način teoriju igara su predstavili John von Neumann i Oskar Morgenstern koji su 1944. godine publikovali knjigu "Teorija igara i ekonomsko ponašanje" (Theory of Games and Economic Behaviour) u kojoj je težište usmjereno na primjenu u ekonomiji.

Teorija igara se bavi matematičkim modeliranjem konfliktnih situacija u kojima učesnici imaju suprostavljene interese, pa se kaže da je teorija igara matematička teorija konfliktnih situacija. Kao i kod drugih kvantitativnih modela, tako i u teoriji igara model igre predstavlja apstrakciju i idealizaciju realne konfliktne situacije.

Teorija igara predstavlja matematičku teoriju i metodologiju analize i rješavanja konfliktnih situacija u kojima učesnici imaju suprostavljene interese, odnosno

Page 3: TEORIJA IGARA

koji se nalaze u strateškoj interakciji. Teorija igara obuhvata samo one interakcije u kojima se igrači ponašaju racionalno i strateški. Neki igrač se ponaša racionalno ako može da:

identificira sve svoje alternative (moguće akcije), formira očekivanja od svojih alternativa i alternativa protivnika, jasno izrazi svoje preferencije i izbor akcije izvrši pažljivo nakon nekog procesa optimizacije [Osborne

(1994), str. 4].

Strateško ponašanje nekog igrača podrazumijeva da on uzima u obzir i znanje ili očekivano ponašanje drugih igrača.

Teorija igara ima sličnu terminologiju kao i neke sportske i društvene igre (različiti sportovi, poker, šah, monomol i sl.) i koristi se za modeliranje konfliktnih situacija u ekonomiji (konkurentska preduzeća), politici (suprostavljene političke stranke), vojnoj strategiji (zaraćene države) i sl. Zajednička osobina svih ovih igara je ta da su pojedinačni potezi ili odluke svakog učesnika manje ili više determinisane potezima ili odlukama drugih učesnika u konfliktu, a konačan rezultat svakog učesnikla određen je svim pojedinačnim potezima ili odlukama.

2.3.Definicija igre, poteza, partije, strategije

Suština odnosa učesnika u konfliktu može se formalizirati precizno definisanim pravilima igre, tako da se pod pojmom igra može podrazumijevati uprošteni model konfliktne situacije koji obuhvata skup pravila ponašanja učesnika u igri koja opredjeljuju njihove moguće akcije (odluke, poteze) i potencijalne rezultate njihovog izbora.

Igrači ili učesnici u igri mogu biti preduzeća, pojedinci, grupe pojedinaca, vojne formacije i sl.

Pod potezom se podrazumijeva etapa igre u kojoj igrači donose odluku, dok pojam partije podrazumijeva konkretnu realizaciju igre. Skup većeg broja poteza obrazuje partiju.

Pošto je igra skup pravila i dogovora po kojima se ponašaju učesnici u igri, pravila utvrđuju:

alternative akcije između kojih igrači moraju birati u svakoj etapi partije,

informacije dostupne svakom igraču kad vrši takav izbor i isplate na kraju svake etape igre [Martić (1971), str. 243].

Potencijalne rezultate učesnika najčešće se prestavljaju tzv. funkcijom plaćanja (korisnosti) koja predstavlja numerički izraz dobitaka/gubitaka učesnika neke igre. Svaka igra ima svoje konačno stanje, odnosno rezultat (vrijednost igre).

Page 4: TEORIJA IGARA

Cilj svakog učesnika u igri je da postigne takvo rješenje koje mu obezbjeđuje ostvarenje najpovoljnijeg mogućeg rezultata.

Vrijednost rezultata koji će ostvariti učesnici u igri ne zavisi samo od njihovog izbora pravila ponašanja u igri, nego i od izbora ostalih učesnika. Svaki učesnik unaprijed poznaje moguće alternative svog ponašanja koje mu stoje na raspolaganju i nazivaju se strategijama. Pod strategijom igrača podrazumijeva se skup uputnih pravila na osnovu kojih se donosi odluka o akciji ili strategije predstavljaju ukupnost pravila ponašanja igrača i potencijalne izbore pojedinih alternativa u svakoj konkretnoj situaciji. Strategija sadrži sve poteze u toku jedne partije. Znači, strategija u okviru teorije igara ima centralnu ulogu jer se njome definišu moguće alternative izbora od strane učesnika u igri za koje se oni mogu opredijeliti u svim mogućim varijantama igre.

Svaka igra se realizuje putem pojedinačnih poteza igrača, gdje je potez izbor moguće alternative od strane igrača. Nakon izbora strategije od strane svakog igrača dobiva se stanje igre. Prilikom izbora strategija svaki igrač se rukovodi kriterijem obezbjeđenja ekstremene vrijednosti sopstvene korisnosti uzimajući u obzir svoje i strategije drugih igrača. Igre bi trebale da vode nekom ravnotežnom stanju koje je prihvatljivo za sve igrače, tako da se može reći da je optimalna strategija ona koja dovodi igru do stanja ravnoteže.

Strategija je čista ako svaki igrač kod ponavljanja igre stavlja izbor na jednu strategiju, a mješovita ako mora igrati dvije ili više strategija sa odgovarajućom vjerovatnoćom.

Ako rezultat igre zavisi samo od slučaja onda je to hazardna ili slučajna igra. Naš interes su igre čije konačno stanje zavisi od ponašanja i izabrane strategije igrača, koje se jednim imenom nazivaju strategijske igre.

3.Tipologija igara

Postoje različiti kriteriji za klasifikovanje igara. Najčešći kriteriji su: broj igrača, međusobna povezanost igrača, broj poteza, redoslijed u kojem igrači donose odluke, informacije o igri sa kojim igrači raspolažu, broj strategija i karakter funkcije plaćanja.

3.1. Kriterij: Broj igrača

U zavisnosti od broja igrača učesnika u igri razlikuju se:- igra sa dva igrača- igre sa tri igrača,- ...- igre sa n igrača.

Page 5: TEORIJA IGARA

3.2. Kriterij: međusobni odnos igrača

U situaciji kada postoje tri ili više učesnika u igri onda postoji mogućnost međusobnog kooperiranja ili stvaranja koalicija između igrača u okviru kojih se međusobno usklađuje ponašanje i izbor pojedinačnih strategija koje im obezbjeđuju maksimalnu korisnost. Ovakve igre se nazivaju kooperativne igre.

Kod nekooperativnih ili anatagonističkih igara između igrača ne postoji saradnja u izboru poteza, odnosno svaki igrač samostalno vrši izbor poteza bez koordinacije sa drugim igračima.

3.3. Kriterij: informisanost igrača

Igre sa potpunom informacijom podrazumijevaju da svaki igrač raspolaže sa informacijama o tome:

- ko su igrači u igri,- koje strategije stoje na raspolaganju svakom igraču i- koja je funkcija plaćanja za sve igrače.

U suprotnom slučaju slučaju radi se o igrama sa nepotpunim informacijama.

3.4.Kriterij: broj strategija

S obzirom na broj raspoloživih strategija igrača razlikuju se konačne i beskonačne igre. Ako je igraču raspoloživ konačan broj strategija, onda se radi o konačnim igram, dok u slučaju da bar za jedanog igrača broj strategija nije konačan, igra predstavlja berskonačnu igru.

3.5.Kriterij: karakter funkcije plaćanja

Ako dobitak jednog igrača znači gubitak drugog, onda možemo govoriti o nula-suma i nenula-suma igri. Kod nula-suma igre dobitak jednog igrača jednak je gubitku drugog, za razliku od nenula-suma igre, gdje zbir dobitaka i gubitaka nije jednak nuli. Primjer nula-suma igre je zatvoreno tržište koga kontroliraju dva preduzeća. Najpoznatiji i u literaturi najviše korišteni tip igara je nula-suma igra sa dva igrača čiji su interesi potpuno suprotni (tzv. antagonističke igre). Igrači unaprijed poznaju sve mogućnosti izbora protivnika. Svaki igrač u svakom potezu donosi samo jednu odluku i mora izvršiti svoj izbor ne znajući koji je izbor protivnika. Dobitak odnosno gubitak u igri dat je funkcijom plaćanja (korisnost, cijena igre) za sve moguće izbore u igri.

3.6. Kriterij: predstavljanje igre

Načini na koji se predstavljaju igre važne su u postupku modeliranja i rješavanja igara tako da se najčešće razlikuju:

- igre u normalnoj formi i - igre ekstenzivne (opšte) forme.

Igre sa potpunom informacijom mogu se predstaviti kao u igre u normalnoj formi kod kojih su unaprijed poznata plaćanja za sve kombinacije strategija igrača. Kod konačne igre dva igrača sa nula sumom plaćanja se predstavljaju

Page 6: TEORIJA IGARA

matricom plaćanja, tako da se ove igre nazivaju i matričnim igrama. U matrici plaćanja dva igrača elementi matrice predstavljaju plaćanje za svaku kombinaciju strategija koje igrači mogu izabrati. Naravno dobitak jednog igrača istovremeno predstavlja i gubitak za drugog igrača.

Igare kod kojih ne postoji potpuna informisanost igrača o strategijama drugih igrača, odnosno u situaciji kada igrači nisu potpuno informisani o potencijalnim odgovorima protivnika na njihov izbor pojedinih strategija i gdje se plaćanje obračunava tek na kraju igre, odnosno kada se realizuje partija nazivaju se igre ekstenzivne ili opšte forme Igre ekstenzivne forme se najčešće prestavljaju tzv. stablom igre. Primjer ovakve igre je igra pokera.

4. Igre dva igrača sa nula sumom

Pretpostavimo da postoje dva igrača I1 i I2, pri čemu igraču I1 stoji na raspolaganju skup strategija X

I1 = X (x1, ..., xm),

a igraču I2 skup strategija Y

I2 = Y (y1, ..., yn),

pri čemu je

A1(xi, yj), = -A2(xi, yj),

gdje su A1 i A2 korisnost (cijena ili plaćanje) igre za igrače I1 i I2, ako prvi igrač igra i-tu, a drugi j-tu strategiju, respektivno. To istovremno to znači da je dobitak za prvog igrača istovremno i gubitak za drugog igrača. Nekoopreativne (antagonističke) igre su definisane:

skupom strategija X igrača I1, skupom strategija Y igrača I2, funkcijom plaćanja (cijena, korisnost).

Na bazi svih kombinacija strategija prvog i drugog igrača može se utvrditi matrica plaćanja (korisnosti) A:

gdje je aij=A(xi,yj) i označava korisnost ili dobitak/gubitak igrača I1 kod njegovog izbora i-te strategije i izbora j-te strategije igrača I2. Pozitivna vrijednost elementa aij u matrici plaćanja znači dobitak za prvog igrača, a gubitak za drugog i obrnuto. Razvijeni oblik matrice plaćanja je:

Page 7: TEORIJA IGARA

Takođe, matrica plaćanja se može predstaviti i u obliku tabele:

Strategije igrača 2 Minimalni dobici1 … s … n

Stra

tegi

je

igra

ča 1

1 a11 … a1s … a1n min {a1j}… … … … … … …r ar1 … ars … arn min {arj}… … … … … … …m am1 … ams … amn min {amj}

Maksimalni gubici

max {ai1} … max{ais} … max {ain}

Tabela 1. Matrica plaćanja

Prema tome, redovi matrice ili tabele plaćanja predstavljaju strategije igrača 1, dok se kolone odnose na strategije igrača 2, dok elementi matrice (tabele) plaćanja predstavljaju dobitak za prvog igrača ili gubitak za drugog igrača u slučaju izbora bilo koje od mogućih kombinacija raspoloživih strategija.

5. Rješavanje matričnih igara sa nula sumom

Prilikom rješavanja matričnih igara polazi se od toga da su igrači racionalni i da svaki igrač treba da odabere takvu strategiju koja će mu omogućiti ostvarenje najpovoljnijeg mogućeg rezultata u situaciji kada ne zna koju će strategiju izabrati protivnik. Stoga je cilj prvog igrača ostvarenje maksimalno mogućeg dobitka, a drugog igrača minimalno mogućeg gubitka. Strategije koje im to obezbjeđuju predstavljaju njihove optimalne strategije.

Da bi utvrdili najpovoljniji rezultat u igri, igrači vrše prethodnu analizu mogućih dobitaka i gubitaka. Igračima stoje na raspolaganju čiste strategije i to, prvom igraču m čistih strategija, a drugom n čistih strategija ili mješovita strategija, kao kombinacija različitih strategija sa odgovarajućim vjerovatnoćama. U situaciji ako svaki igrač u igra svoju optimalnu strategiju kao čistu, govori se o čistoj (prostoj) matričnoj igri ili igri sa sedlastom tačkom. Ako igrači u nizu poteza ne

Page 8: TEORIJA IGARA

odabiru samo jednu strategiju, već više raspoloživih strategija sa odgovarajućim vjerovatnoćama, onda se radi o matričnim igrama sa mješovitim strategijama.

Analizu mogućih dobitaka i gubitaka treba provesti za svakog igrača pojedinačno. Ako prvi igrač igra prvu čistu strategiju, drugi igrač će odgovoriti sa onom strategijom koja mu obezbjeđuje najmanji gubitak, koji je istovremeno i najmanji dobitak za prvog igrača. Na sličan način će odgovoriti drugi igrač i ako prvi igrač igra strategiju 2, 3,..., m. U suštini, za svaki red matrice (tabele) plaćanja potrebno je odrediti najmanji dobitak koji će ostvariti prvi igrač, bez obzira na izbor strategije drugog igrača. Pošto prvi igrač želi da obezbijedi maksimalno mogući dobitak, on će od minimalnih dobitaka za svaku od čistih m strategija, izdabrati onu strategiju koja mu obezbjeđuje maksimalan od minimalno mogućih dobitaka. Zato prvi igrač vrše izbor strategije prema Von Neumann-ovom maximin kriteriju za dobit u obliku

.

Vrijednost α se označava kao maksimin vrijednost i predstavlja donju granicu vrijednosti igre, koja označava garantovani dobitak koji će ostvariti prvi igrač. Optimalna strategija prvog igrača određena je na osnovu donje granice vrijednosti igre, čijim izborom prvi igrač ne može umanjiti svoj dobitak od α novčanih jedinica bez obzira na izbor strategije drugog igrača.

Slična analiza se može provesti i za drugog igrača. Ako drugi igrač igra svoju prvu čistu strategiju, onda će prvi igrač odgovoriti sa izborom one strategije koja će mu omogućiti maksimalnu dobit, koja je istovremeno i maksimalan gubitak za drugog igrača. Na sličan način će odgovoriti prvi igrač i ako drugi igrač igra strategiju 2, 3,..., n. U suštini, u svakoj koloni matrice (tabele) plaćanja potrebno je odrediti najveći gubitak koji će ostvariti drugi igrač, bez obzira na izbor strategije prvog igrača. Pošto drugi igrač želi da obezbijedi minimalno mogući gubitak, on će od maksimalnih gubtaka za svaku od čistih n strategija, izdabrati onu strategiju koja mu obezbjeđuje minimalan od maksmalno mogućih gubitaka. Stoga drugi igrač vrše izbor strategije prema Von Neumann-ovom minimax kriteriju za gubitak u obliku

.

Vrijednost β se označava kao minimaks vrijednost i predstavlja gornju granicu vrijednosti igre. Optimalna strategija drugog igrača određena je na osnovu gornje granice vrijednosti igre, čijim izborom drugi igrač ne može povećati svoj gubitak od β novčanih jedinica bez obzira na izbor strategije prvog igrača.

Donja granica vrijednosti igre u matričnim igrama uvijek je manja ili jednaka gornjoj granici vrijednosti igre.

Ako je gornja granica vrijednosti igre β jednaka donjoj granici vrijednosti igre α (α = β), tj. ako je

Page 9: TEORIJA IGARA

,

gdje je v vrijednost igre, onda se takva matrična igra naziva čistom (prostom) matričnom igrom ili igrom sa sedlastom tačkom ili sedlom.

U slučaju da igra nema sedlastu tačku, odnosno da je donja granica vrijednosti igre manja od gornje granice vrijednosti igre (α < β), izbor optimalne strategije prvog igrača treba da mu obezbijedi dobitak ne manji od α, dok izbor optimalne strategije drugog igrača treba da mu obezbijedi gubitak ne veći od β. U takvoj situaciji igrači, ne znajući izbor strategije protivnika, biraju u nizu poteza više strategija nastojeći uvećati svoj dobitak, odnosno umanjiti gubitak.U ovom slučaju se radi o igrama sa mješovitim strategijama.

5.1. Čiste matrične igre

Ako je u matričnoj igri, kako je već istaknuto, gornja granica vrijednosti igre jednaka donjoj granici vrijednosti igre, onda se radi o čistoj matričnoj igri. Čista matrična igra ima sedlastu tačku koja se nalazi na presjeku optimalnih strategija prvog i drugog igrača. Vrijednost igre definiše elemenat u matrici plaćanja koji odgovara sedlastoj tački. Igra u kojoj je max/min strategija jednaka min/max strategiji naziva se čistom igrom, a strategija čistom strategijom. Kod čistih strategija korisnost koja se dobija kad svaki igrač igra čistu strategiju, odnosno vrijednost igre se naziva sedlastom tačkom ili tačkom sedla.

Postupak utvrđivanja optimalne strategije prvog i drugog igrača, sedlaste tačke i vrijednosti igre može se opisati slijedećim postupkom, gdje koraci 1. i 2. opisuju maksimin kriterij, a koraci 3. i 4. minimaks kriterij (vidjeti Tabelu 2):

1. U matrici plaćanja u svakom redu, koji odgovaraju strategijama prvog igrača, i= , odrediti minimalan elemenat (dobitak), tj.

2. Između minimalnih dobitaka za svaku strategiju (red) izabrati maksimalan dobitak. Pretpostavimo da je to dobitak od izbora r-te strategije prvog igrača, odnosno

.

Ova vrijednost predstavlja donju granicu vrijednosti igre.

3. U svakoj koloni matrice plaćanja odrediti maksimalan elemenat (maksimalni gubitak drugog igrača), tj.

Page 10: TEORIJA IGARA

4. Između maksimalnih gubitaka za svaku strategiju (kolonu) drugog igrača izabrati onu koja minimizira njegov gubitak. Neka je to s-ta strategija drugog igrača, tj.

koja predstavlja gornju granicu vrijednosti igre.5. Ako je , onda se radi o čistoj matričnoj igri. Strategije

igrača koje vode do sedlaste tačke (r,s) predstavljaju optimalne strategije igrača, a njima korespondirajući elemenat matrice plaćanja ars

predstavlja vrijednost igre i označavamo ga sa v.

Strategije igrača 2 Minimalni dobici1 … S … N

Stra

tegi

je

igra

ča 1

1 a11 … A1s … a1n min {a1j}… … … … … … …r ar1 … ars … arn min {arj}… … … … … … …m am1 … ams … amn min {amj}

Maksimalni gubici

max {ai1} … Max{ais} … max {ain}

Tabela 2. Matrica plaćanja za igru sa sedlom

Prema tome, rješenje čiste matrične igre definisano je optimalnom čistom strategijom za prvog igrača, optimalnom čistom strategijom za drugog igrača i optimalnom vrijednošću igre, koja je izvjesna i jednaka je vrijednosti sedlaste tačke. Stoga, rješavanje igara sa sedlastom tačkom podrazumijeva pronalaženje uređene trojke (r,s,v) odnosno utvrđivanje optimalnih strategija igrača i vrijednosti igre.

Primjer 1. Pretpostavimo da imamo dva igrača I1 i I2. Igrač I1 ima strategije x1 i x2. Na poteze igrača I1 igrač I2 parira svojom strategijom y1 i y2. Nadalje neka je utvrđena funkcija plaćanja kombinacija strategija igrača I1 i I2 u obliku tabele:

Igrač I1

Igrač I2

Strategija y1 Strategija y2

Strategija x1 Igrač I1 dobiva 4NJ Igrač I1 dobiva 7NJStrategija x2 Igrač I1 dobiva 2NJ Igrač I2 dobiva 3NJ

Na osnovu prethodne tabele matrica A ima oblik:

Page 11: TEORIJA IGARA

,

čije elemente možemo tumačiti npr. a11=4 znači da će igrač I1 imati korisnost od 4NJ ako on igra strategiju x1, a igrač I2 odgovori strategijom y1 ili a22 znači da će igrač I1 imati gubitak od 3NJ ako on igra strategiju x2, a igrač I2 strategiju y2, ... Posmatrajmo matricu plaćanja A. Ako igrač I1 odabere strategiju x1 onda igrač I2

može da odabere jednu od strategija y1 ili y2. Pošto se radi o racionalnom igraču on odabira strategiju koja mu obezbjeđuje najveću korist, odnosno odabira strategiju y1 jer kod nje ima najmanji gubitak (4NJ). Ako pak igrač I1 odabere strategiju x2, onda će igrač I2 odabrati strategiju y2 jer mu ona donosi najveću korisnost, odnosno dobitak od 3NJ. Na osnovu prethodnog jasno je da ako igrač I1 igra prvi za njega je najpovoljnija strategija x1, jer bez obzira kakvom strategijom odgovori igrač I2 on ostvaruje najmanje 4NJ korisnosti, dok strategija x2 daje mogućnost i gubitka. U slučaju da je igrač I2 prvi na potezu onda na njegov izbor strategije y1 igrač I1 će odgovoriti strategijom x1 jer mu ona obezbjeđuje maksimalnu korist od 4NJ (za razliku od 2NJ i strategiju x2). Kod izbora strategije y2 igrača I2, igrač I1 će odgovoriti strategijom x1 jer mu ona obezbjeđuje korist od 7NJ (za razliku od strategije x2 koja mu donosi gubitak od 3NJ). Iz prethodne analize proizilazi da je najpovoljnija alternativa igrača I2

strategija y1, jer mu osigurava najmanji gubitak od 4NJ. U prethodnoj igri jasno je da će igrač I1 uvijek igrati strategiju x1, a igrač I2 strategiju y1, odnosno ako sa α obilježimo vrijednost igre igrača I1:

a vrijednost igre igrača I2:

Kombinacija strategija igrača koja obezbjeđuje da je:

naziva se optimalnom.

Kao primjer čiste igre sa sedlastom tačkom iskoristićemo prethodni primjer:

I2

I1 y1 y2 ai=minaij

x1 4 7 4 a=maxai=4

Page 12: TEORIJA IGARA

x2 2 -3 -3bj=maxaij 4 7

b=minbj = 4

Odgovor je identičan sa prethodnom analizom: Igrač I1 igra prvu strategiju, I2

takođe prvu i vrijednost igre je 4.

Primjer 2. Dva igrača I1 i I2 dijele tržište istorodnih proizvoda pri čemu su u konkurentskim odnosima. Prvi igrač raspolaže sa dvije strategije, a drugi igrač sa tri strategije. Poslovni rezultati zavise od izabranih strategija svakog od igrača. Mogući poslovni efekti zadati su matricom igre datoj u slijedećoj tabeli:

Strategije igrača I1Strategije igrača I2

Strategija y1 Strategija y2 Strategija y3

Strategija x1 50 80 20Strategija x2 60 70 40

Odredite vrijednost igre i optimalne strategije igrača!

Rješenje:

Da bismo ovaj zadatak riješili, neophodno je primjeniti max/min kriterij za prvog igrača i min/max kriterij za drugog igrača.

Tako, prvi igrač, neovisno od toga koju će strategiju izabrati njegov proitvnik, pomoću max/min kriterija osigurava siguran rezultat igre koji predstavlja donju granicu vrijednost igre, odnosno:

Drugi igrač pomoću min/max kriterija takođe obezbjeđuje sebi povoljan rezultat igre, neovisno od toga koju će strategiju odabrati prvi igrač, koji predstavlja gornju granicu vrijednosti igre, odnosno:

Da bi izabrane strategije igrača bile i optimalne, neophodno je da donja granica vrijednosti igre bude jednaka gornjoj, odnosno:

..

U našem primjeru analizirat ćemo prvo ponašanje prvog igrača. Tako, igrač I1 ne znajući koju će strategiju primjeniti njegov protivnik polazi od slijedećeg:

Page 13: TEORIJA IGARA

- ako primjeni prvu čistu x1 strategiju mogući efekti igre (čitamo iz prvog reda matrice) su 50, 80 i 20. Da bi ostvario siguran efekat igre, ovaj igrač bira minimalnu vrijednost tj. 20 NJ;

- ako se pak odluči za drugu čistu x2 strategiju tada mogući efekti igre (čitamo iz drugog reda matrice) iznose 60, 70 i 40. Logično, igrač će izabrati minimalnu vrijednost igre tj. siguran efekat, a to je 40 NJ;

- na bazi prethodno odabranih minimalnih ali i sigurnih efekata igre, igrač I1 bira onu strategiju koja mu osigurava maksimalno minimalni tj. maksimalno sigurni efekat igre, odnosno:

.

Dakle, primjenom max/min kriterija racionalna strategija igrača I1 je druga čista x2 strategija kojom se osigurava siguran dobitak od 40 NJ i to neovisno od toga koju strategiju da odabere igrač I2. Iznos od 40 NJ predstavlja donju granicu vrijednosti igre.

Što se tiče igrača I2 on, ne znajući koju će strategiju izabrati njegov protivnik, polazi od slijedećeg:

- ako izabere prvu čistu y1 strategiju onda mogući efekti igre (čitamo iz prve kolone) su 50 i 60. Ovi efekti za igrača I2 predstavljaju gubitke te on bira najveći nepovoljni rezultat igre, odnosno maksimalno mogući gubitak koji u ovom slučaju iznosi 60 NJ;

- ako izabere drugu čistu y2 strategiju onda mogući efekti igre (čitamo iz druge kolone) su 80 i 70. Ovi efekti za igrača I2 predstavljaju gubitke te on bira najveći nepovoljni rezultat igre, odnosno maksimalno mogući gubitak koji u ovom slučaju iznosi 80 NJ;

- ako izabere treću čistu y3 strategiju onda mogući efekti igre (čitamo iz treće kolone) su 20 i 40. Ovi efekti za igrača I2 predstavljaju gubitke te on bira najveći nepovoljni rezultat igre, odnosno maksimalno mogući gubitak koji u ovom slučaju iznosi 40 NJ;

- na bazi prethodno odabranih maksimalnih gubitka, igrač I2 bira onu čistu strategiju čijom bi primjenom ostvario minimalan gubitak, odnosno:

.

Dakle, primjenom min/max kriterija racionalna strategija igrača I2 je treća čista y3 strategija kojom ostvaruje jer se njome ostvaruje minimalan gubitak od 40 NJ neovisno od toga koju strategiju da odabere igrač I1. Iznos od 40 NJ predstavlja gornju granicu vrijednosti igre.

Kako je donja granica jednaka gornjoj granici vrijednosti igre može se reći da zadata matrična igra ima ravnotežni ishod, odnosno sedlastu tačku.

Dobijena rješenja najlakše se mogu uočiti pomoću slijedeće tabele:

Page 14: TEORIJA IGARA

Strategije igrača I1Strategije igrača I2 ai=minaij

a = maxai = 40y1 y2 y3

x1 50 80 20 20x2 60 70 40 40

bj=maxaij 60 80 40b = minbj = 40

Primjer 3: Na posmatranom tržištu dva ponuđača (P1 i P2) nude određeni proizvod kupcima koji su raspoređeni na tri lokacije na slijedeći način:

- na lokaciji L1 nalazi se 30% kupaca,- na lokaciji L2 nalazi se 35% kupaca i- na lokaciji L3 nalazi se 35% kupaca.

Udaljenosti između pojedinih lokacija su slijedeće:- između L1 i L2 15 km,- između L1 i L3 je 20 km i - između L2 i L3 je 10 km.

Ponuđači treba da grade po jedan prodajni objekat za posmatrano tržište pri čemu moraju voditi računa o tome da obim prodaje koji će ostvariti pojedini ponuđač zavisi od lokacije prodajnog objekta, odnosno od njegove udaljenosti od kupaca. Tako je istraživanjem tržišta utvrđeno da će ponuđač P1 imati 75% kupaca sa lokacija koje su bliže njegovom prodajnom objektu, 55% kupaca koji se jednako udaljeni od oba prodajna objekta i 25% kupaca sa lokacija koje su bliže prodajnom objektu ponuđača P2. Potrebno je odrediti optimalne lokacije za prodajne objekte oba ponuđača, pri čemu je gradnja objekata moguća samo unutar navedene tri lokacije (ne između njih).

Rješenje:

Određivanje lokacija prodajnih objekata ponuđača možemo posmatrati kao stratešku interakciji (igru) u kojoj ponuđač P1 predstavlja prvog, a P2 drugog igrača. Igrači imaju na raspolaganju po tri strategije:

- strategija 1: gradnja prodajnog objekta na lokaciji L1,- strategija 2: gradnja prodajnog objekta na lokaciji L2 i- strategija 3: gradnja prodajnog objekta na lokaciji L3.

Pri tome oni nastoje da izaberu onu lokaciju za gradnju prodajnog objekta koja će im obezbijediti najveće tržišno učešće pa pri tome moraju voditi računa o tome koju strategiju će izabrati protivnik. Time su ispunjene osnovne pretpostavke za primjenu teorije igara, odnosno igrači su racionalni i ponašaju se strateški.

Za formiranje matrice igre potrebno je utvrditi plaćanja (aij) koja predstavljaju tržišno učešće igrača P1 u slučaju da se on opredijeli za lokaciju Li, a igrač P2 za lokaciju Lj. Njih utvrđujemo posebno za svaku moguću kombinaciju strategija

Page 15: TEORIJA IGARA

uzimajuči u obzir pretpostavljenu lokaciju objekata, raspoređenost kupaca i njihovu udaljenost od objekata. Plaćanja izračunavamo na slijedeći način:

a11 = 0,55a12 = 0,75 · 0,30 + 0,25 (0,35 + 0,35) = 0,40 a13 = 0,75 · 0,30 + 0,25 (0,35 + 0,35) = 0,40

a21 = 0,75 (0,35 + 035) + 0,25 · 0,35 = 0,6125a22 = 0,55a23 = 0,75 (0,30 + 0,35) + 0,25 · 0,35 = 0,575

a31 = 0,75 (0,35 + 0,35) + 0,25 · 0,30 = 0,60a32 = 0,75 · 0,35 + 0,25 (0,30 + 0,35) = 0,425a33 = 0,55.

Dobivena plaćanja istovremeno predstavljaju i gubitke igrača P2, što znači da se radi o igrama dva igrača sa nula sumom. Elemente matrice plaćanja aij ćemo prikazati u slijedećoj tabeli:

Primjenom maximin kriterija utvrđujemo donju granicu vrijednosti igre, tj.

.

Gornju granicu vrijednosti igre utvrđujemo pomoću minimax kriterija, pa je

.

Kako je v1 = v2, u pitanju je igra sa sedlastom tačkom pa strategije igrača koje vode do sedlaste tačke (L2,L2) predstavljaju optimalne strategije igrača. Elemenat matrice plaćanja a22 određuje vrijednost igre (v=0,5500).

Prema tome, optimalna lokacija prodajnih objekata za oba ponuđača je L2, pri čemu će tržišno učešće ponuđača P1 biti 55%, a ponuđač P2 će imati 45% kupaca.

5.2.Rješavanje mješovitih matričnih igara

Za razliku od čistih igara kod kojih učesnici igraju samo po jednu strategiju, kod mješovitih igara učesnici mogu igrati dvije ili više strategija. Rješenje igre koje

Page 16: TEORIJA IGARA

obezbjeđuje maksimalan dobitak igrača I1 i minimalan gubitak igrača I2 dobiva se kombinacijom raspoloživih strategija. To znači da će igrači I1 i I2 igrati po nekoliko puta svaku od raspoloživih strategija da bi maksimizirali svoj dobitak, odnosno minimizirali gubitak. Svaki igrač će pomoću nekog slučajnog mehanizma vršiti izbor alternativa, odnosno svaki igrač će primijeniti neku strategiju sa izvjesnim vjerovatnoćama.

Kod igara bez sedlaste tačke prvi igrač naizmjeničnim izborom različitih strategija može ostvariti dobitak koji je veći od vrijednosti maksimin elementa, dok drugi igrač uzastopnim igranjem različitih strategija u uzastopnim potezima može umanjiti svoj gubitak u odnosu na njegovu minimaks vrijednost (Backović, Vuleta, 2000., str.387-8). Ako sa označe vjerovatnoća sa kojima igrač I1 upotrebljava strategiju i, onda je mješovita strategija igrača I1 data vektorom:

x = (x1, x2, ..., xm)

koji udovoljava uslovima:

.

Na sličan način mješovita strategija igrača I2 , gdje je sa označena vjerovatnoća sa kojima igrač I2 upotrebljava strategiju j, definisana je vektorom:

y = (y1, y2, ..., yn)

koji udovoljava uslovima:

.

U slučaju da se igrači opredijele za izbor bilo koje od strategija kao čiste strategije, onda bi vjerovatnoća izbora ove strategije bila jednaka jedinici, dok bi za sve preostale strategije vjerovatnoća njihovog izbora bila jednaka nuli. Na taj način se čiste matrične igre mogu tretirati kao specijalni slučaj mješovitih matričnih igara. Za mješovite matrične igre važne su one strategije igrača za koje su vjerovatnoće izbora strogo veće od nule, te se nazivaju aktivne strategije.

Ako igrač I1 bira mješovitu strategiju x, a igrač I2 mješovitu strategiju y, onda će funkcije plaćanja aij biti pomnožene sa vjerovatnoćom xiyj tako da očekivana funkcija plaćanja će imati oblik

Page 17: TEORIJA IGARA

.

U situaciji višestrukih uzastopnih izbora definisanih mješovitim strategijama, potencijalni dobitak prvog igrača, odnosno gubitak drugog igrača, predstavljaju slučajnu veličinu koja zavisi od vektora x i y i matrice plaćanja. Stoga vrijednost igre u uslovima mješovitih strategija igrača predstavlja očekivano plaćanje koje pokazuje iznos kojim će težiti prosječno plaćanje u slučaju višestrukog igranja igre.

Kod rješavanja mješovitih matričnih igara, igrači biraju mješovitu strategiju kojom će maksimizirati svoje minimalne očekivane dobiti, odnosno minimizirati svoje maksimalne očekivane gubitke. Stoga je za prvog igrača optimalna ona mješovita strategija koja mu garantuje najveću moguću očekivanu dobit, bez obzira koju će mješovitu strategiju upotrijebiti drugi igrač. Vrijednost ovog maximin očekivanog plaćanja predstavlja donju granicu vrijednosti igre (α). Drugi igrač izabire onu optimalnu mješovitu strategiju koja mu obezbjeđuje najmanji mogući očekivani gubitak, bez obzira na izbor prvog igrača. Iznos minimax očekivanog gubitka drugog igrača predstavlja gornju granicu vrijednosti igre (β).

U mješovitim matričnim igrama uvijek postoji optimalna očekivana vrijednost igre za koju je v = α = β. Tako, ako oba igrača izaberu svoje mješovite strategije koje su optimalne u skladu sa maximin, odnosno minimax kriterijem, očekivano plaćanje će biti jednako v i nijedan igrač ne može ostvariti bolji rezultat ako jednostrano promijeni svoju strategiju.

Ako postoji mješovita strategija x* za igrača I1 i y* za igrača I2, tako da važi da je:

za sve moguće strategije x i y igrača I1 i I2, respektivno, onda vektori x* i y*

označavaju optimalnu mješovitu strategiju igrača I1 i I2, respektivno. Po analogiji sa čistim igrama optimalna mješovita strategija x* i y* igrača I1 i I2 udovoljava jednačini:

. (10)

Veličina E(x*,y*) naziva se očekivana vrijednost igre i označava se sa v, tj.

v = E(x*,y*),

Page 18: TEORIJA IGARA

koja predstavlja ravnotežu igre i označava prosječan dobitak za prvog igrača, odnosno prosječan gubitak za drugog igrača ako svaki izvrši izbor svoje optimalne strategije.Prema tome, rješenje igre određeno je veličinama optimalnom mješovitom strategijom prvog igrača x*, optimalnom mješovitom strategijom druog igrača y*

i očekivanom vrijednošću igre v.

Za rješavanje igara bez sedlaste tačke, odnosno matričnih igara sa mejšovitim strategijama mogu se koristiti različite metode. Izbor metode koja će se koristiti za rješavanje igre zavisi od broja strategija koje igrači imaju na raspolaganju, odnosno od veličine matrice plaćanja. Matrice plaćanja igre mogu biti reda 2 × 2, 2 × n, m × 2 i m × n (m>2, n>2).

Najčešće se mješovite matrične igre rješavaju:

- analitičkom metodom,

- grafičkom metodom i

- svođenjem na model linearnog programiranja.

Analitička i grafička metoda u rješavanju mješovitih matričnih igara koristi se u situaciji kada jedan od igrača raspolaže sa sa dvije strategije, a njegov protivnik sa konačnim brojem strategija (igre reda 2xn ili mx2) ili ako se igra većeg reda (m>2 i n>2) može uprostiti i svesti na igru reda 2xn ili mx2. Inače bez obzira na red, sve mješovite matrične igre mogu se rješavati korištenjem modela linearnog programiranja. U objašnjenu postupka rješavanja mješovitih matričnih igara prvo će se objasniti igra reda 2x2, a potom i igre sa matricom plaćanja višeg reda.

Napomenimo, da svaku matričnu igru prvo treba rješavati po potupku za rješavanje čistih matričnih igara, pa tek nakon utvrđivanja da ne postoji sedlasta tačaka, treba preći na postupak za rješavanje mješovite matrične igare.

5.2.1.Igre sa matricom plaćanja reda 2 × 2

Matrica plaćanja za igre dva igrača sa nula sumom od kojih svaki igrač ima raspoložive dvije strategije data je u slijedećem obliku:

.

Ako sa x = (x1 x2 ) označimo mješovitu strategiju prvog igrača, onda jednačine koje moraju biti zadovoljene za njegovu optimalnu mješovitu strategiju su slijedeće:

a11 x1 + a21 x2 = v

Page 19: TEORIJA IGARA

a12 x1 + a22 x2 = vx1 + x2 = 1

gdje prva jednačina predstavlja očekivani dobitak prvog igrača koji će on ostvariti u slučaju izbora prve strategije drugog igrača. Na sličan način tumači se I druga jednačina koja predstavlja očekivani dobitak prvog igrača u slučaju izbora druge strategije od strane drugog igrača. Treća jednačina odnosi se na uslov da je zbir vjerovatnoća izbora prvog igrača za prvu i drugu strategiju jednak jedinici.

Rješavanjem prethodno dobivenog sistema od tri jednačina sa tri nepoznate može se dobiti optimalna mješovita strategija prvog igrača x1 i x2 i očekivan a vrijednost igre v. Ovo je analitički način rješavanja mješovite matrične igre.

Na sličan način mogu se formulisati i jednačine za utvrđivanje optimalne mješovite strategije drugog igrača, tj.

a11 y1 + a12 y2 = va21 y1 + a22 y2 = vy1 + y2 = 1

čijim rješavanjem određujemo optimalnu mješovitu strategiju igrača 2.

Primjer 4. Kao primjer matrične igre sa mješovitim strategijama analizirat ćemo strategiju dva trgovinska preduzeća na tržištu artikala A1 i A2. Pretpostavimo da je poznata matrica plaćanja:

y1 y2 ai=minaij

x1 6 3 3 a=maxai=3x2 2 4 2bj=maxaij 6 4 b=minbj =4

Pošto a nije jednako b ne postoje čiste strategije koje bi igrači mogli koristiti, te se moraju koristiti mješovite strategije. Pretpostavimo da igrač I1 primjenjuje mješovitu strategiju, a igrač I2 čistu, odnosno ako igrač I2 koristi strategiju y1

onda je očekivana vrijednost korisnosti igrača I1 jednaka:v = 6x1 + 2x2,

a u slučaju da koristi strategiju y2 očekivana vrijednost korisnosti je:

v = 3x1 + 4x2,jer je

.

Pošto važi da je

Page 20: TEORIJA IGARA

x1 + x2 = 1,

rješavanjem sistema od tri jednačine sa tri nepoznate dobiva se da je:

Na sličan način određuje se i optimalna mješovita strategija igrača I2, pri čemu se pretpostavlja da igrač I1 igra čistu strategiju. Očekivana vrijednost korisnosti igrača I2 ako igrač I1 koristi strategiju x1 jednaka je:

v = 6y1 + 3y2,a ako koristi strategiju x2

v = 2y1 + 4y2,jer je:

.

Pošto i ovdje važi da je

y1 + y2 = 1

rješavanjem sistema jednačina dobiva se da je:

Primjer 5. Dva igrača I1 i I2 dijele tržište jednog proizvoda te s nalaze u konfliktnoj situaciji. Svako preduzeće raspolaže sa po dvije strategije čijom primjenom želi ostvariti što veće poslovne efekte. Neka su x1 i x2 čiste strategije igrača I1 , y1 i y2 a čiste strategije igrača I2. Mogući poslovni efekti zadati su matricom igre u slijedećoj tabeli:

Strategije igrača I1Strategije igrača I2

Strategija y1 Strategija y2

Strategija x1 10 2Strategija x2 5 7

Odrediti vrijednost igre i optimalne strategije igrača.

Rješenje:

Zadatak ćemo prvo riješiti analitičkom metodom a zatim i grafičkom.

Page 21: TEORIJA IGARA

Rješavanje zadatka analitičkom metodom

Da bismo riješili ovaj zadatak, prvo moramo da ispitamo da li zadata matrična igra ima ravnotežni ishod, odnosno sedlastu tačku. Stoga ćemo prvo konstruisati slijedeću pomoćnu tabelu:

Strategije igrača I1Strategije igrača I2 ai=minaij

a = maxai = 5y1 y2

x1 10 2 2x2 5 7 5

bj=maxaij 10 7b = minbj = 7

Prema tome, iz dobijenih vrijednosti igre za igrača I1 i igrača I2 primjenom max/min i min/max kriterija vidi se da donja vrijednost igre nije jednaka gornjoj vrijednosti igre, odnosno:

,

što ukazuje na činjenicu da ne postoji sedlasta tačka a samim tim ne postoje ni optimalne čiste strategije.

Optimalnu mješovitu strategiju za igrača I1 određujemo postavkom sistema jednačina na slijedeći način:

- ako igrač I2 primijeni čistu strategiju y1, tada je:

;

- ako igrač I2 primijeni čistu strategiju y2, tada je:

;

- pri čemu mora biti ispunjen slijedeći uslov:

Prema tome, sistem jednačina za određivanje optimalne mješovite strategije igrača I1 glasi:

Rješenje ovog sistema glasi:

Page 22: TEORIJA IGARA

Prema tome, mješovita strategija igrača I1 je što znači da, u relativnom smislu, ovaj igrač treba 0,2 puta da igra prvu čistu strategiju i 0,8 puta drugu čistu strategiju da bi pri tome ostvario dobit od 6 NJ. Ova vrijednost od 9 NJ ustvari predstavlja očekivanu vrijednost igre, odnosno očekivanu donju granicu igre za igrača I1.

Optimalnu mješovitu strategiju za igrača I2 određujemo postavkom sistema jednačina na slijedeći način:

- ako igrač I1 primijeni čistu strategiju x1, tada je:

;

- ako igrač I1 primijeni čistu strategiju x2, tada je:

;

- pri čemu mora biti ispunjen slijedeći uslov:

Prema tome, sistem jednačina za određivanje optimalne mješovite strategije igrača I2 glasi:

Rješenje ovog sistema glasi:

Prema tome, mješovita strategija igrača I2 je što znači da, u relativnom smislu, ovaj igrač treba 0,5 puta da igra prvu čistu strategiju I 0,5 puta drugu čistu strategiju da bi pri tome gubitak bude 6 NJ. Ova vrijednost od 6 NJ ustvari predstavlja očekivanu gornju granicu vrijednosti igre.

Rješavanje zadatka grafičkom metodom

Prilikom određivanja optimalne mješovite strategije igrača I1 služit ćemo se slijedećom metodologijom:

Page 23: TEORIJA IGARA

- ako igrač I2 igra čistu strategiju y1, tada igrač I1 može da odgovori sa strategijom x1 ili x2. Ako odgovori sa strategijom x1 tada može očekivati efekat od 10 NJ koji nanosimo na prvu ordinatu (tačka A) dok ako odgovori sa strategijom x2 može očekivati efekat od 5 NJ koji nanosimo na drugu ordinatu (tačka B). Spajanjem ovih tačaka dobijamo duž AB. Tačke na ovoj duži predstavljaju moguće efekte igre za igrača I1 po uslovom da igrač I2 igra čistu strategiju y1.

- ako igrač I2 igra čistu strategiju y2, tada igrač I1 ako odgovori sa strategijom x1 tada može očekivati efekat od 2 NJ koji nanosimo na prvu ordinatu (tačka C) dok ako odgovori sa strategijom x2 može očekivati efekat od 7 NJ koji nanosimo na drugu ordinatu (tačka D). Spajanjem ovih tačaka dobijamo duž CD. Tačke na ovoj duži predstavljaju moguće efekte igre za igrača I1 po uslovom da igrač I2 igra čistu strategiju y2;

- tačka presjeka, Z, duži AB i CD, određuje donju granicu vrijednosti igre. Projekcija tačke Z na apscisu daje tačku Z¢ koja određuje proporciju (relativni odnos) čistih strategija . Tačka Z¢ dijeli apscisu (0,1) u

odnosu .

Na slijedećoj slici prikazano je određivanje optimalne mješovite strategije za igrača I1 pomoću grafičke metode.

10987654321

-1-2-3-4-5

A 1098765 4321

-1-2-3-4-5

D Z

B

ZONA DOBITKA ZA IGRAČA I1

C

Prilikom određivanja optimalne mješovite strategije igrača I2 služit ćemo se slijedećom metodologijom:

- ako igrač I1 igra čistu strategiju x1, tada igrač I2 može da odgovori sa strategijom y1 ili y2. Ako odgovori sa strategijom y1 tada može očekivati efekat od 10 NJ koji nanosimo na prvu ordinatu (tačka E) dok ako odgovori sa strategijom y2 može očekivati efekat od 2 NJ koji nanosimo na drugu ordinatu (tačka F). Spajanjem ovih tačaka dobijamo duž EF.

Page 24: TEORIJA IGARA

Tačke na ovoj duži predstavljaju moguće efekte igre za igrača I2 po uslovom da igrač I1 igra čistu strategiju x1.

- ako igrač I1 igra čistu strategiju x2, tada igrač I2 ako odgovori sa strategijom y1 tada može očekivati efekat od 5 NJ koji nanosimo na prvu ordinatu (tačka G) dok ako odgovori sa strategijom y2 može očekivati efekat od 7 NJ koji nanosimo na drugu ordinatu (tačka H). Spajanjem ovih tačaka dobijamo duž GH. Tačke na ovoj duži predstavljaju moguće efekte igre za igrača I2 po uslovom da igrač I1 igra čistu strategiju x2;

- tačka presjeka, Z1, duži EF i GH, određuje gornju granicu vrijednosti igre. Projekcija tačke Z1 na apscisu daje tačku Z¢1 koja određuje proporciju (relativni odnos) čistih strategija . Tačka Z¢ dijeli

apscisu (0,1) u odnosu .

Na slijedećoj slici prikazano je određivanje optimalne mješovite strategije za igrača I2 pomoću grafičke metode.

10987654321

-1-2-3-4-5

E 1098765 4321

-1-2-3-4-5

ZONA GUBITKA ZA IGRAČA I2

H Z1

G

F

Z¢1

5.2.2.Igre sa matricom plaćanja reda 2 × n i m × 2

Rješavanje ovih igara je slično prethodnom rješavanju igara reda 2x2. Rješavanje ovakvih igara realizuje se tako što se grafičkim predstavljanjem mogućih rezultata igre za igrača koji ima dvije strategije opredjeljuju aktivne strategije njegovog protivnika, na osnovu kojih se izračunava vrijednost igre i optimalne strategije. Za igre bez sedlaste tačke u kojima barem jedan igrač ima na raspolaganju samo dvije strategije može se primijeniti postupak grafičkog rješavanja. Igru bez sedlaste tačke sa matricom plaćanja reda 2 × n možemo predstaviti kao u tabeli 2.

Page 25: TEORIJA IGARA

Tabela 2. Igra bez sedlaste tačke sa matricom plaćanja reda 2 × n

U tabeli 2. sa x1 i x2 obilježene su vjerovatnoće da će igrač 1 igrati svoju prvu i drugu strategiju, respektivno, dok su sa yj, j = , obilježene vjerovatnoće da će igrač 2 igrati svoju prvu, drugu,…, n-tu strategiju, respektivno. Ako igru posmatramo iz aspekta igrača 1, njegova očekivana plaćanja koja odgovaraju izboru čiste strategije igrača 2 linearno zavise od x1 što se može vidjeti u tabeli 3.

Tabela 3. Zavisnost očekivanih plaćanja igrača 1 od čiste strategije igrača 2

U razmatranje postupka rješavanja ove igre posmatraćemo igru kod koje je n=3 za koju se očekivana plaćanja igrača 1, pri različitim čistim strategijama igrača 2, mogu prikazati kao prave koje predstavljaju funkcije od x1, kao npr. na slici 3.

Slika 3. Grafičko rješavanje igre sa matricom plaćanja reda 2 × 3U skladu sa maximin kriterijem za mješovitu strategiju igrač 1 treba da izabere vrijednost x1 koja maksimizira njegova minimalna očekivana plaćanja. Na slici 3. vidimo da se maximin ostvaruje na presjeku prave 1 i prave 3. Tako vrijednost

Page 26: TEORIJA IGARA

x1 možemo utvrditi grafički ili analitički izjednačavanjem jednačina pravih 1 i 3. Očekivanu vrijednost igre v možemo utvrditi grafički, na osnovu vrijednosti na vertikalnim osama koja korespondira maximin tački, ili analitički unošenjem dobivene vrijednosti x1 u jednačinu bilo koje prave koja prolazi kroz maximin tačku.

Da bismo odredili optimalnu mješovitu strategiju igrača 2, potrebno je na slici 3. identifikovati prave koje prolaze kroz maximin tačku. Kao što vidimo, u pitanju su prave 1 i 3. To znači da će optimalna mješovita strategija igrača 2 obuhvatati strategije 1 i 3, a y2 = 0. Preostaje nam još da odredimo vjerovatnoće y1 i y3, gdje je y3 = 1 - y1. Očekivana plaćanja igrača 2, u zavisnosti od izabrane čiste strategije igrača 1, linearno zavise od y1 što je prikazano u tabeli 4.

Tabela 4. Očekivana plaćanja igrača 2 u zavisnosti od čiste strategije igrača 1

Vrijednost y1, za koju igrač 2 minimizira svoje maksimalne gubitke (minimax kriterij), možemo utvrditi jednostavnim izjednačavanjem očekivanih plaćanja za slučaj kada igrač 1 izabere strategiju 1 i 2, tj. rješavanjem jednačine sa jednom nepoznatom

(a11 - a13)y1 + a13 = (a21 - a23)y1 + a23.

Dalje je y3 = 1 - y1 i tako smo utvrdili optimalnu mješovitu strategiju igrača 2 (y1, y2, y3). Očekivanu vrijednost igre v možemo utvrditi i tako što ćemo uvrstiti vrijednost y1 u bilo koji od izraza kojim su data očekivana plaćanja igrača 2 u tabeli 4.

Ako više pravih prolazi kroz maximin tačku onda imamo i više optimalnih mješovitih strategija za igrača 2. Alternativne optimalne mješovite strategije utvrđujemo tako što posebno posmatramo svaki par pravih koje imaju suprotan nagib. Nakon što utvrdimo optimalne mješovite strategije za svaku kombinaciju (par) ovih pravih, pomoću konveksne kombinacije y = α yI + (1 - α) yII za bilo koju vrijednost α iz intervala od 0 do 1, dobivena rješenja možemo kombinovati i na taj način utvrditi optimalne mješovite strategije koje uključuju više od dvije čiste strategije igrača 2 [Taha (1982), str. 443].

Na sličan načim rješavamo i igre sa matricom plaćanja reda m × 2. Radi ilustracije poslužićemo se igrom bez sedlaste tačke za koju igrač 1 ima na raspolaganju m = 3 čistih strategija. Pošto u ovoj igri igrač 2 ima na raspolaganju dvije strategije njegova očekivana plaćanja, u zavisnosti od izbora čiste strategije igrača 1, linearno su zavisna od y1, pri čemu je y2 = 1 - y1. Ovu zavisnost ćemo prikazati u tabeli 5.

Page 27: TEORIJA IGARA

Tabela 5. Zavisnost očekivanih plaćanja igrača 2 od čiste strategije igrača 1

Ova očekivana plaćanja možemo prikazati kao funkciju od y1 kao npr. na slici 5. Na slici vidimo da igrač 2 minimizira svoja maksimalna očekivana plaćanja u tački koja se nalazi na presjeku pravih 1 i 2 na osnovu čega možemo odrediti y1. Koristeći isti postupak kao kod igara reda 2 × n možemo odrediti optimalnu mješovitu strategiju igrača 2 (y1, y2) kao i očekivanu vrijednost igre v.

Slika 4. Grafičko rješavanje igre sa matricom plaćanja reda 3 × 2Optimalnu mješovitu strategiju igrača 1 ćemo utvrditi koristeći se istim grafičkim prikazom. Pošto prava 3 ne prolazi kroz minimax tačku, igrač 1 neće nikada izabrati čistu strategiju 3 pa je x3 = 0. Tako je x1 = 1 - x2, a očekivana plaćanja igrača 1 u zavisnosti od izabrane čiste strategije igrača 2 prikazana su u tabeli 6.

Tabela 6. Očekivana plaćanja igrača 1 u zavisnosti od čiste strategije igrača 2

Page 28: TEORIJA IGARA

Izjednačavanjem očekivanih plaćanja igrača 1 dobivamo x1, pa analogno kao kod igara reda 2 × n utvrđujemo optimalnu mješovitu strategiju igrača 1 (x1, x2, x3) kao i očekivanu vrijednost igre v.

Ako kod igara sa matricom plaćanja reda m × 2, kroz minimax tačku prolazi više od dvije prave onda postoji više optimalnih mješovitih strategija igrača 1. Za određivanje alternativnih optimalnih mješovitih strategija igrača 1 primjenjuje se isti postupak utvrđivanja parova pravih koje prolaze kroz minimax tačku i imaju suprotne nagibe kao kod igara sa matricom plaćanja reda 2 × n.

Primjer 6. Mogući poslovni efekti zadati su matricom igre u slijedećoj tabeli:

Strategije igrača I1Strategije igrača I2

Strategija y1 Strategija y2 Strategija y3

Strategija x1 4 6 -4Strategija x2 2 -4 10

Odrediti vrijednost igre i optimalne strategije igrača grafičkom i analitičkom metodom!

Rješenje:

Za zadatu matrice igre, igrač I1 ima na raspolaganju dvije strategije (x1 i x2) dok igrač I2 raspolaže sa tri strategije (y1, y2 i y3). Da bismo mogli odrediti optimalnu vrijednost igre i optimalne strategije, neophodno je da prvo za igrača I2 odredimo aktivne čiste strategije.

U nastavku je prikazano određivanje aktivnih čistih strategija igrača I2 pomoću grafičkog metoda i max/min kriterija.

10987654321

-1-2-3

F 1098765 4321

-1-2-3

C

A

B

E D DONJA GRANICA VRIJEDNOSTI IGRE

Page 29: TEORIJA IGARA

-4-5

-4-5

Očigledno je sa se uslov ravnoteže (gornja granica jednaka donjoj granici vrijednosti igre) postiže u presjeku duži CD i EF. Tako, aktivne strategije igrača I2 sa prvom i drugom strategijom igrača I1 formiraju matricu plaćanja u slijedećem obliku:

,

čijim se rješavanjem na prethodno opisan analitički način dobijaju mješovite strategija igrača u slijedećem obliku:

- optimalna mješovita strategija igrača I1 glasi:

- optimalna mješovita strategija igrača I2 glasi:

- vrijednost igre:

Primjer 7. U slijedećoj tabeli prikazana je matrica plaćanja za igru dva igrača sa nula sumom.

Odrediti optimalne strategije igrača.

Rješenje:

Pošto je u pitanju igra sa matricom plaćanja reda 2 × 3, koja se postupkom redukcije ne može svesti na matricu reda 2 × 2, za rješavanje ćemo primijeniti grafički postupak. Očekivana plaćanja igrača 1, koja odgovaraju izboru čiste strategije igrača 2, linearno zavise od x1 što se može vidjeti u slijedećoj tabeli.

Očekivana plaćanja igrača 1, za različite čiste strategije igrača 2, mogu biti prikazane kao prave koje predstavljaju funkcije od x1 kao na slijedećoj slici.

Page 30: TEORIJA IGARA

Igrač 1 ostvaruje maximin na presjeku pravih 2 i 3 pa ćemo nakon izjednačavanja -5x1 + 3 = 3x1 + 1 dobiti da je x1 = 1/4. Pošto je x2 = 1 - x1 = 3/4. Stoga je optimalna mješovita strategija igrača 1 (x1,x2) = (1/4,3/4). Očekivanu vrijednost igre možemo utvrditi grafički, na osnovu vrijednosti na vertikalnim osama koja korespondira maximin tački, ili analitički tako što ćemo unijeti vrijednosti x1 = 1/4 u jednačinu bilo koje prave koja prolazi kroz maximin tačku. Tako je v = 5(1/4) + 3 = 7/4 ili v = 3(1/4) + 1 = 7/4.

Pošto kroz maximin tačku prolaze prave 2 i 3, optimalna mješovita strategija igrača 2 će obuhvatati strategije 2 i 3, pa je potrebno odrediti vjerovatnoće y2 i y3, gdje je y2 = 1 - y3, jer je y1 = 0. Zavisnost očekivanih plaćanja igrača 2 od izabrane čiste strategije igrača 1 prikazana je u slijedećoj tabeli.

Izjednačavanjem očekivanih plaćanja za slučaj kada igrač 1 izabere strategiju 1 i 2, tj. -6y2 + 4 = 2y2 + 1, možemo utvrditi vrijednost y2, za koju igrač 2. Rješavanjem jednačine dobivamo da je y2 = 3/8. Odavde je y3 = 1 - 3/8 = 5/8 pa je optimalna mješovita strategija igrača 2 (y1,y2,y3) = (0,3/8,5/8). Očekivanu vrijednost igre možemo utvrditi i tako što ćemo uvrstiti vrijednost y2 = 5/8 u bilo

Page 31: TEORIJA IGARA

koji od izraza kojim su data očekivana plaćanja igrača 2, tj. v = -6(3/8) + 4 = 7/4 ili v = 2(3/8) + 1 = 7/4.

Primjer 8. Matrica plaćanja reda m × 2 za igru dva igrača sa nula sumom, prikazana je u slijedećoj tabeli.

Potrebno je odrediti optimalne strategije igrača.

Rješenje:

Pošto je u pitanju igra sa matricom reda 3 × 2, za rješavanje ćemo koristiti grafički postupak. Očekivana plaćanja igrača 2, u zavisnosti od izbora čiste strategije igrača 1, linearno su zavisna od y1, pri čemu je y2 = 1 - y1. Slijedeća tabela pokazuje ove zavisnosti.

Na slijedećoj slici, kao funkcija od y1, prikazana su očekivana plaćanja igrača 2.

Page 32: TEORIJA IGARA

Vidimo da se minimax tačka nalazi na presjeku pravih 1 i 2 pa ćemo nakon izjednačavanja y1 + 2 = -5y1 + 3 dobiti da je y1 = 1/6. Pošto je y2 = 1 - y1 = 5/6, optimalna mješovita strategija igrača 2 je (y1,y2) = (1/6,5/6). Vrijednost igre možemo izračunati na osnovu izraza za očekivano plaćanje igrača 2 i čistoj strategiji 1 igrača 1, odnosno v = y1 + 2 = 13/6.

Optimalnu mješovitu strategiju igrača 1 ćemo utvrditi koristeći se istim grafičkim prikazom. Pošto prava 3 ne prolazi kroz minimax tačku, igrač 1 neće nikada izabrati čistu strategiju 3 pa je x3 = 0. Očekivana plaćanja igrača 1, u zavisnosti od izabrane čiste strategije igrača 2, prikazana su u slijedećoj tabeli.

Izjednačavanjem očekivanih plaćanja igrača 1 dobivamo da je x1 = 5/6. Pošto je x2 = 1 - x1 = 1/6, optimalna mješovita strategija igrača 1 je (x1,x2,x3) = (5/6,1/6,0). Vrijednost igre je v = 5x1 - 2 = 13/6.

5.2.3. Redukcija matrice plaćanja

Page 33: TEORIJA IGARA

Nakon što utvrdimo da igra nema sedlaste tačke potrebno je izvršiti redukciju matrice plaćanja kako bismo utvrdili na koji red se ona može svesti. Matrice plaćanja veće od 2 × 2 mogu biti reducirane u veličini ako je, za jednog od igrača, jedna strategija inferiorna u odnosu na drugu bez obzira na izbor drugog igrača. Tada za drugu strategiju kažemo da je dominantna, a za prvu da je dominirana. Ako posmatramo redove u matrici plaćanja onda za k-ti red kažemo da je pogodniji od l-tog reda ako je akj ≥ alj za svako j= . Isto tako, za r-tu strategiju (kolonu u matrici plaćanja) kažemo da je dominantna, a za s-tu da je dominirana ako je air ≤ ais za svako i= . Reduciranje matrice podrazumijeva uzastopno eliminisanje dominiranih strategija prvog i drugog igrača, odnosno redova i kolona u matrici plaćanja. Cilj je da se veličina matrice što više smanji i lakše utvrde optimalne mješovite strategije oba igrača.

Primjer 9. Matrica plaćanja za igru dva igrača sa nula sumom prikazana je u slijedećoj tabeli.

Potrebno je odrediti optimalne strategije igrača.

Rješenje:

Pošto su igrači racionalni i ponašaju se strateški, primjenom maximin kriterija uočava se da će igrač 1 izabrati strategiju 1 jer ne želi da izgubi više od 2 NJ. S druge strane, primjenom minimax kriterija vidi se da će igrač 2 izabrati strategiju 3 jer ni on ne želi da izgubi više od 2 NJ. Ovi rezultati prikazani su u slijedećoj tabeli.

Pošto je donja granica vrijednosti igre manja od gornje granice (v1 = -2 < v2 = 2), u pitanju je igra bez sedlaste tačke. Tako izabrane strategije ne predstavljaju ravnotežnu tačku jer igrač 2 (ako igrač 1 zadrži svoju strategiju 1) ima interesa da promijeni strategiju, odnosno da izabere strategiju 2 i tako, umjesto da izgubi,

Page 34: TEORIJA IGARA

zaradiće 2 NJ. Međutim, igrač 1 je svjestan protivnikove mogućnosti i zaključuje da može povećati svoju dobit sa -2 NJ (u slučaju da igrač 2 izabere strategiju 2) na 4 NJ tako što će i on izabrati strategiju 2. To tjera igrača 2 da izabere strategiju 3 i zaradi 3 NJ umjestu da izgubi 4 NJ. Iz tog razloga igrač 1 ponovo ima potrebu da izabere strategiju 1. Nakon toga bi ciklus ponovo započeo. Na ovaj način spoznajemo da se polazno rješenje može poboljšati tako što će igrači birati alternativne strategije na slučajnoj osnovi tako da nijedan igrač unaprijed ne zna koju će od svojih vlastitih strategija uzeti, kao ni koju strategiju će izabrati njegov protivnik. Stoga se za rješavanje igara bez sedlaste tačke koristi drugi pristup.

Kod igara bez sedlaste tačke svaki igrač treba da odredi distribuciju vjerovatnoća na svom skupu strategija. Tako će igrač 1 odrediti svoj plan za igranje igre određivanjem vrijednosti x1, x2,…,xm. Pošto su ove vrijednosti vjerovatnoće, one ne mogu biti negativne i njihov zbir treba da bude 1. Isto tako, igrač 2 određuje vrijednosti y1, y2,…,yn. Planovi (x1, x2,…,xm) i (y1, y2,…,yn) predstavljaju mješovite strategije igrača i na osnovu njih će igrači vršiti izbor čistih strategija.

Ako posmatramo naš primjer i pretpostavimo da igrači 1 i 2 izaberu mješovite strategije (x1, x2, x3) = (1/2, 1/2, 0) i (y1, y2, y3) = (0, 1/2, 1/2), respektivno, to znači da igrač 1 daje istu vjerovatnoću izboru čiste strategije 1, odnosno 2, a odbacuje strategiju 3. Isti tako igrač 2 bira čiste strategije 2 i 3. Tako igrači mogu bacanjem novčića odrediti koje strategije će stvarno izabrati. Za izabrane mješovite strategije može se izračunati očekivano plaćanje korištenjem izraza

.

Za igrača 1 optimalna je ona mješovita strategija koja mu garantuje najveću moguću očekivanu dobit (donja granica vrijednosti igre - v1), bez obzira koju će mješovitu strategiju upotrijebiti igrač 2. Za igrača 2 optimalna je ona mješovita strategija koja mu garantuje najmanji mogući očekivani gubitak (gornju granicu vrijednosti igre - v2), bez obzira na izbor igrača 1. Optimalne mješovite strategije igrača obezbjeđuju optimalnu očekivana vrijednost igre za koju je v = v1 = v2.

Redukcija matrice plaćanja

Prije nego što pristupimo rješavanju igre, odnosno određivanju optimalnih mješovitih strategija igrača, potrebno je izvršiti redukciju matrice plaćanja jer se igre sa matricama plaćanja nižeg reda lakše rješavaju. Ako posmatramo matricu plaćanja igre vidimo da je strategija 2 za igrača 1 dominantna u odnosu na strategiju 3 jer je a2j ≥ a3j za svako j= , odnosno igrač 1 će izborom strategije 2 dobiti više nego izborom strategije 3 bez obzira na izbor igrača 2. Stoga ćemo

Page 35: TEORIJA IGARA

iz matrice plaćanja eliminisati strategiju 3 za igrača 1. Tako dobivamo slijedeću matricu plaćanja reda 2 × 3.

Ako sada posmatramo strategije igrača 2 vidimo da je ai2 ≤ ai1 za svako i=1,2, što znači da on nikada neće izabrati strategiju 1 jer je ona za njega uvijek lošija od strategije 2 i donosi mu veće gubitke. Tako iz matrice plaćanja možemo eliminisati prvu kolonu i kao rezultat dobivamo matricu plaćanja reda 2 × 2.

Na ovaj način matricu reda 3 × 3 sveli smo na matricu reda 2 × 2 koja se više ne može reducirati. Sada nam preostaje da utvrdimo optimalne mješovite strategije za matricu 2 × 2 jer znamo da su vjerovatnoće da će igrač 1 izabrati strategiju 3, odnosno da će igrač 2 izabrati strategiju 1 jednake nuli (x3 = 0 i y1 = 0). Tako se postupak rješavanja svodi na utvrđivanje vjerovatnoća x1 i x2 za igrača 1 odnosno y2 i y3 za igrača 2.

Postoji mnogo načina da se utvrde optimalne mješovite strategije u igri sa matricom plaćanja reda 2 × 2. Na našem primjeru objasnićemo jedan od najjednostavnijih postupaka. Naime, kao što se u posljednjoj matrici plaćanja može vidjeti, najveći elemenat matrice i prvi za njim leže na dijagonali. Tako, kod određivanja mješovite strategije igrača 1, prvo utvrđujemo razlike između elemenata u prvom (a12 -a11), odnosno u drugom redu matrice (a21 - a22) koje su uvijek ili obje pozitivne ili obje negativne što se najbolje može vidjeti u slijedećoj tabeli.

Page 36: TEORIJA IGARA

Stoga, da bi se odredila optimalna mješovita strategija igrača 1, potrebno je utvrditi razlike u redovima. Njihovim biranjem u suprotnom odnosu određujemo optimalnu mješovitu strategiju igrača 1, odnosno (x1,x2,x3) = (7/11,4/11,0). Na isti način utvrđujemo optimalnu mješovitu strategiju igrača 2 tako što pronalazimo razlike kolona i biramo ih u suprotnom odnosu, tj. (y1,y2,y3) = (0,5/11,6/11). Očekivana vrijednost igre je jednaka očekivanom plaćanju za datu kombinaciju mješovitih strategija igrača 1 i igrača 2 koje na osnovu izraza 3.6 iznosi

Ovaj uprošteni postupak rješavanja igre zasnovan je na maximin, odnosno minimaks kriteriju po kojem se za optimalne mješovite strategije ostvaruje jednakost donje i gornje granice vrijednosti igre. Do istog rješenja ćemo doći ako, prilikom utvrđivanja optimalne mješovite strategije igrača 1, riješimo slijedeći sistem jednačina:

–2x1 + 4x2 = v2x1 – 3x2 = vx1 + x2 = 1.

Isto tako, optimalne mješovite strategije igrača 2 utvrđujemo rješavanjem slijedećeg sistema jednačina:

–2y2 + 2y3 = v4y2 – 3y3 = vy2 + y3 = 1.

5.2.4. Rješavanje matričnih igara korištenjem linearnog programiranja

Sve matrične igre, a naročito one koje su definisane matricom plaćanja velikih dimenzija, mogu se transformisati u model linearnog programiranja i rješavati simpleks metodom.

Postupak rješavanja igre pomoću linearnog programiranja je zasnovan na primjeni maximin i minimax kriterija za formulisanje modela linearnog programiranja [Hillier (1980), str. 312]. Kako igrač 1 nastoji da maksimizira svoja očekivana plaćanja, za njegovu optimalnu mješovitu strategiju (x1, x2, …, x3) vrijedi da očekivano plaćanje ne može biti manje od vrijednosti igre, tj.

(3.9)

Page 37: TEORIJA IGARA

za sve strategije njegovog protivnika (y1, y2, …, y3). Tako za svaku čistu strategiju igrača 2 moraju biti zadovoljene slijedeće nejednačine:

Polazeći od prethodnih relacija mješovita optimalna strategija za igrača I1 dobiva se rješavanjem sistema jednačina/nejednačina:

max z = va11x1 + a21x2 + … + am1xm ≥ va12x1 + a22x2 + … + am2xm ≥ v… … … …a1nx1 + a2nx2 + … + amnxm ≥ v x1 + x2 + … + xm = 1 xi ≥ 0, i =

U prethodnom modelu sva ograničenja možemo podijeliti sa v, pod uslovom da je vrijednost igre v > 0, jer ako je v < 0 model ne možemo rješavati simpleks metodom, a za v = 0 ne možemo izvršiti dijeljenje. Ovaj uslov možemo zadovoljiti tako što ćemo sve elemente matrice plaćanja povećati za vrijednost neke konstante koja je dovoljno velika da obezbijedi da svi elementi matrice plaćanja budu pozitivni. Vrijednost ove konstante je potrebno, kada dođemo do rješenja modela, oduzeti od modifikovane vrijednosti igre da bismo dobili pravu vrijednost igre.

Ako se svaka jednačina sistema podijeli v i ako se uvede oznaka

onda se prethodni sistem jednačina/nejednačina transformiše u slijedeći model linearnog programiranja:

Funkcija cilja modela dobiva se transformacijom posljednje jednačine iz polaznog sistema, a cilj - njena minimizacija proizilazi iz želje igrača I1 da dobiva takav skup vrijednosti , koja će udovoljiti definisanim ograničenjima, a da vrijednost očekivane korisnosti v bude što veća.

Page 38: TEORIJA IGARA

Analognim postupkom mješovita optimalna strategija za igrača I2 dobiva se rješavanjem sistema jednačina/nejednačina:

a11y1 + a12y2 + ... + a1nyn £ va21y1 + a22y2 + ... + a2nyn £ v...am1y1 + am2y2 + ... + amnyn £ vy1 + y2 + ... + yn= 1.

Nakon uvođenja smjene:

i uvažavajući želju igrača I2 da odabere takav skup vrijednosti , koji će udovoljiti definisanim ograničenjima, a da

vrijednost očekivane vrijednosti igre bude minimalna dobivamo model linearnog programiranja:

koji je ustvari dual modela linearnog programiranja za utvrđivanje optimalne strategije igrača I1.

Koristeći primal-dual vezu iz linearnog programiranja možemo rješavanjem jednog modela utvrditi optimalne strategije za oba igrača.

Primjer 10.

Page 39: TEORIJA IGARA
Page 40: TEORIJA IGARA

Primjer 11. Matrica plaćanja igre prikazana je u slijedećoj tabeli.

Strategije igrača I1Strategije igrača I2

Strategija y1 Strategija y2 Strategija y3

Strategija x1 4 1 4Strategija x2 5 4 2Strategija x3 2 -1 4

Primjenom linearnog programiranja, potrebno je odrediti optimalne strategije igrača.

Rješenje:

Da bi se ovaj zadatak mogao riješiti pomoću linearnog programiranja neophodno je da svi elementi matrice budu strogo pozitivni. Kako to u ovom zadatku nije slučaj neophodno je izvršiti transformaciju matrice tako što će se svakom njenom elementu dodati broj koji je za 1 veći od apsolutne vrijednosti minimalnog negativnog elementa matrice C. Tako dolazimo da matrice C¢ prikazane u nastavku.

Nakon određenih transformacija i uvođenja smjene ,

primarni problem (za igrača I2) glasi:

Početna simpleks tabelaC 1 1 1 0 0 0

Baza y¢0 y¢1 y¢2 y¢3 y¢4 y¢5 y¢6

0 y¢4 1 6 3 6 1 0 00 y¢5 1 7 6 4 0 1 0

Page 41: TEORIJA IGARA

0 y¢6 1 4 1 6 0 0 1z – c 0 -1 -1 -1 0 0 0

III iteracijaC 1 1 1 0 0 0

Baza y¢0 y¢1 y¢2 y¢3 y¢4 y¢5 y¢6

1 y¢3 0,125 0,625 0 1 0,25 -0,125 01 y¢2 0,083 0,75 1 0 -0,1667 0,25 00 y¢6 0 -0,5 0 0 -1,333 0,5 1

z – c 0,2083 0,375 0 0 0,0833 0,125 0

Kako je slijedi da je . Tako, optimalno

rješenje glasi:

Takođe, nakon određenih transformacija i uvođenja smjene

, dualni problem (za igrača I1) glasi:

Rješavanjem modela simpleks metodom dobijeno je slijedeće optimalno rješenje:

Prema tome, optimalne mješovite strategije igrača su:

Page 42: TEORIJA IGARA

Konačna vrijednost igre je .

6. IGRE PROTIV PRIRODE

Odlučivanje u uslovima neizvjesnosti možemo posmatrati kao poseban slučaj strateške interakcije koji se javlja u situaciji kada imamo jednog igrača koji treba da izabere neku akciju, a rezultati izabrane akcije zavise od stanja okruženja. Tada se kao protivnik, odnosno kao drugi igrač, javlja priroda sa svojim različitim stanjima. Priroda je kao igrač naivna odnosno ne nastupa u interakciji sa ciljem da maksimizira vlastita plaćanja ili da minimizira plaćanja protivnika. Prema tome, u ovakvim situacijama nije ispunjena temeljna pretpostavka teorije igara, tj. drugi igrač nije racionalan. S obzirom na to da njegov protivnik nije racionalan, igrač vrši izbor akcije u uslovima neizvjesnosti. Neizvjesnost je prouzrokovana dejstvom različitih faktora okruženja koje je jako kompleksno. Pri tome su moguće i različite situacije u zavisnosti od toga da li je igrač upoznat sa svim mogućim stanjima prirode, odnosno da li su mu poznate vjerovatnoće nastupanja određenih stanja prirode. Ovakve situacije se u literaturi često nazivaju igrama protiv prirode, a njihova analiza će nam pomoći da bolje razumijemo različite kriterije na osnovu kojih donosioci odluke (igrači) donose svoje odluke u uslovima neizvjesnosti.

4.3.1. Pretpostavke

U razmatranju različitih kriterija odlučivanja mi ćemo pretpostaviti da je igrač upoznat sa svim mogućim stanjima prirode, odnosno da poznaje sve moguće odgovore protivnika. Pri tome ćemo posebno razmatrati situacije u kojima su igrači prije donošenja odluka upoznati sa distribucijom vjerovatnoća za različita stanja prirode (odlučivanje sa apriori vjerovatnoćama), a posebno situacije u kojima igrači ne poznaju ovu distribuciju vjerovatnoća (odlučivanje bez apriori verovatnoća). Distribucija vjerovatnoća za različita stanja prirode nam kvantificira uticaj različitih faktora koji djeluju u okruženju.

Pretpostavimo da igrač ima na raspolaganju m strategija, a da priroda može da odgovori sa n različitih stanja. Distribucija vjerovatnoća za različita stanja prirode, ukoliko je poznata, data je vektorom y=(y1,y2,…,yn). Igrač želi da u interakciji, iz skupa mogućih strategija s=(s1,s2,…,sm), izabere optimalnu strategiju sr.

Page 43: TEORIJA IGARA

Za različite kombinacije strategija igrača i stanja prirode rezultati se predstavljaju u formi matrice plaćanja reda m × n čiji aij-ti elemenat predstavlja plaćanje igrača u slučaju da on, pri j-tom stanju prirode, izabere strategiju si. Plaćanja igrača mogu biti dobit ili neke druge pozitivne kategorije koje igrač nastoji maksimizirati, odnosno troškovi, žaljenje (izgubljene dobiti) ili neke druge negativne kategorije koje igrač u interakciji želi da minimizira.

4.3.2. Kriteriji odlučivanja

Izbor optimalne strategije igrač vrši na osnovu plaćanja za različite kombinacije strategija i stanja prirode. U zavisnosti od njegovog viđenja budućeg razvoja situacije, odnosno stanja prirode, igrač može prilikom izbora strategije da primijeni neki od slijedećih šest kriterija koji su u teoriji odlučivanja poznati kao kriteriji odlučivanja u uslovima neizvjesnosti [Eiselt (1977), str. 265]:

- WALD-ov kriterij pesimizma;- HURWICZ-ov kriterij optimizma;- SAVAGE-ov kriterij minimalnog žaljenja;- BAYES-ov kriterij očekivane vrijednosti plaćanja;- LAPLACE-ov kriterij maksimalnog prosječnog plaćanja i- HODGES-LEHMANN-ov kriterij.

U nastavku ćemo objasniti postupak primjene navedenih kriterija. Primjenom različitih kriterija dobivaju i različite optimalne strategije.

4.3.2.1. WALD-ov kriterij pesimizma

Ovaj kriterij je karakterističan za igrače koji su neskloni riziku. Prema ovom kriteriju igrač je pesimista i on za svaku alternativu najprije utvrđuje najlošije rezultate, a onda među tim najlošijim rezultatima bira najbolje rješenje. Ovaj kriterij se označava kao maximin.

Postupak utvrđivanja optimalne strategije po maximin kriteriju može se opisati kroz slijedeće dvije iteracije:

1.U matrici plaćanja za svaku strategiju igrača si, i= , odrediti najmanja plaćanja, tj.

2.Među najmanjim plaćanjima izabrati ono najveće, odnosno

Strategija sr koja donosi maksimum od minimuma plaćanja (maximin strategija), prema WALD-ovom kriteriju predstavlja optimalnu strategiju.

Page 44: TEORIJA IGARA

Primjer 1. Donosilac odluke ima na raspolaganju tri strategije, a moguća su četiri stanja prirode. Rezultati za različite kombinacije strategija i stanja prirode prikazani su u slijedećoj matrici plaćanja

Ako je igrač pesimista, odrediti njegovu optimalnu strategiju.

Rješenje:

Koristeći WALD-ov kriterij pesimizma, utvrđujemo najniža plaćanja za svaku strategiju igrača i dobivamo da je

Prema max/min kriteriju optimalna strategija igrača je s2, a očekivano plaćanje za ovu strategiju je 2.

4.3.2.2. HURWICZ-ov kriterij optimizma

Nasuprot WALD-ovom pesimističkom kriteriju, prema HURWICZ-ovom kriteriju igrač je u određenoj mjeri optimista i smatra da će priroda odgovoriti na za njega najbolji način. Stepen njegovog optimizma izražava se parametrom optimizma λ koji uzima vrijednost iz intervala [0;1]. Veličina ovog parametra zavisi od igračeve ubijeđenosti da će se situacija odvijati najpovoljnije za njega.

U slučaju da je λ=1, igrač je totalni optimista i izbor strategije vrši tako što najprije za svaku strategiju pronađe najveće plaćanje, a onda bira strategiju sa apsolutno najvećim plaćanjem. Zato se, za λ=1, ovaj kriterij naziva još i maximax kriterij. U slučaju da je λ=0, igrač je totalni pesimista i izbor strategije će vršiti prema WALD-ovom maximin kriteriju.

Postupak utvrđivanja optimalne strategije prema HURWICZ-ovom kriteriju za ostale vrijednosti λ možemo opisati kroz slijedeće tri iteracije:

1. U matrici plaćanja za svaku strategiju igrača si, i= , odrediti najmanja i najveća plaćanja, tj.

Page 45: TEORIJA IGARA

2. Koristeći parametar optimizma λ, na osnovu najvećeg i najmanjeg plaćanja za svaku strategiju utvrditi očekivana plaćanja pomoću izraza

3. Među očekivanim plaćanjima odrediti maksimalno, tj.

Strategija sr koja donosi maksimalno plaćanje , prema HURWICZ-ovom kriteriju predstavlja optimalnu strategiju.

Primjer 2. Za matricu plaćanja iz prethodnog primjera odrediti optimalnu strategiju ako je igrač optimista sa parametrom optimizma λ=0,4.

Rješenje:

Prema HURWICZ-ovom kriteriju dobivamo optimalna strategija igrača je strtegija s3, a očekivano plaćanje je 6,4.

4.3.2.3. SAVAGE - ov kriterij minimalnog žaljenja

Da bismo primijenili ovaj kriterij za utvrđivanje optimalne strategije igrača, neophodno je formirati matricu žaljenja. Žaljenje predstavlja “izgubljenu dobit”, odnosno propuštenu priliku igrača da svojim izborom obezbijedi najbolji razultat. Žaljenje izražavamo kao razliku između rezultata koji se mogao ostvariti izborom najbolje strategije i rezultata ostvarenog na osnovu strategije koju je on izabrao prije nego što je znao koje stanje prirode će se desiti.

Page 46: TEORIJA IGARA

Ovaj kriterij ustvari podrazumijeva primjenu WALD-ovog kriterija pesimizma na matricu žaljenja koja se može formirati na osnovu matrice dobiti. To znači da se u matrici žaljenja za svaku strategiju pronalazi najlošiji rezultat, odnosno maksimalno žaljenje. Nakon toga se među najlošijim rezultatima bira najbolji, odnosno minimalno žaljenje. Zato se SAVAGE-ov kriterij minimalnog žaljenja naziva još i minimax kriterij.

Prema minimax kriteriju, optimalna strategija igrača utvrđuje se po postupku koji se sprovodi kroz tri iteracije:

1. Formirati matricu žaljenja tako što za svako stanje prirode, j= , pronađemo najveće plaćanje, tj.

nakon čega se utvrđuju elementi matrice žaljenja Z reda m×n pomoću izraza

gdje zij predstavlja žaljenje ako igrač izabere strategiju si pri j-tom stanju prirode.

2. Za svaku strategiju igrača si, i= , utvrdimo najveće žaljenje, odnosno

3. Među najvećim žaljenjima biramo najmanje, tj.

Strategija sr koja donosi minimax žaljenja zr, prema SAVAGE-ovom kriteriju predstavlja optimalnu strategiju.

Primjer 3. Neka je data slijedeća matrica plaćanja:

.

Potrebno je formirati matricu žaljenja i u njoj pomoću min/max kriterija odrediti optimalnu strategiju.

Rješenje:

Page 47: TEORIJA IGARA

Optimalna je strategija s2.

4.3.2.4. BAYES-ov kriterij očekivane vrijednosti plaćanja

BAYES-ov kriterij očekivane vrijednosti plaćanja koristi se u slučaju da nam je poznata distribucija vjerovatnoća za različita stanja prirode y=(y1,y2,…,yn), gdje

je = 1. Možemo ga primijeniti na matricu plaćanja kao i na matricu

žaljenja tako što izbor optimalne strategije vršimo na osnovu maksimalne, odnosno minimalne očekivane vrijednosti. Na osnovu distribucije vjerovatnoća i plaćanja (žaljenja), za svaku strategiju očekivanu vrijednost plaćanja (žaljenja) utvrđujemo na osnovu ponderisane aritmetičke sredine.

Kada je data matrica plaćanja, utvrđivanje optimalne strategije igrača prema ovom kriteriju vrši se u dvije iteracije:

1. Za svaku strategiju utvrđujemo očekivano plaćanje na osnovu izraza

(4.10)

2. Među očekivanim plaćanjima biramo maksimalno, tj.

(4.11)

Tako strategija sr predstavlja optimalnu strategiju, a ar je očekivano plaćanje.

Primjer 4. Ako je za matricu plaćanja

Page 48: TEORIJA IGARA

.

distribucija vjerovatnoća za različita stanja prirode y=(0,2; 0,3; 0,4; 0,1), odrediti optimalnu strategiju igrača pomoću BAYES-ovog kriterija očekivane vrijednosti plaćanja.

Rješenje:

Optimalna strategija igrača je s2 i očekivano plaćanje 15.

4.3.2.5. LAPLACE-ov kriterij maksimalnog prosječnog plaćanja

Prema LAPLACE-ovom kriteriju, polazi se od pretpostavke da je vjerovatnoća nastupanja svakog stanja prirode jednaka, tj. yj=1/n, j= . Tako se postupak utvrđivanja optimalne strategije svodi na utvrđivanje prosječnog plaćanja za svaku strategiju, tj.

Nakon toga se bira strategija sr sa najvećim prosječnim plaćanjem

Tako ovaj kriterij predstavlja poseban slučaj BAYES-ovog kriterija očekivane vrijednosti plaćanja kada je yi=yj za svako i≠ j.

Primjer 5. Na matricu plaćanja iz primjera 4. za određivanje optimalne strategije igrača primijeniti LAPLACE-ov kriterij maksimalnog prosječnog plaćanja.

Rješenje:

Prema LAPLACE-ovom kriteriju maksimalnog prosječnog plaćanja polazi se od pretpostavke da je vjerovatnoća nastupanja svakog stanja prirode jednaka, tj. y=(0,25; 0,25; 0,25; 0,25). Za svaku strategiju utvrđujemo prosječno plaćanje, pa je:

Page 49: TEORIJA IGARA

Optimalne strategije je s4 sa očekivanim plaćanjem 37.

4.3.2.6. HODGES-LEHMANN-ov kriterij

Prema HODGES-LEHMANN-ovom kriteriju, izbor optimalne strategije igrača vrši se na osnovu njegovog parametra optimizma λ [0,1] i distribucije

vjerovatnoća za različita stanja prirode y=(y1,y2,…,yn), gdje je = 1.

Postupak ćemo opisati kroz tri iteracije:1. Za svaku strategiju si, i= , utvrđujemo najmanje plaćanje i

očekivano plaćanje, tj.

2. Pomoću parametra optimizma utvrđujemo

3. Pronalazimo najveću vrijednost

Prema tome, optimalna je strategija sr.

HODGES-LEHMANN-ov kriterij se za parametar optimizma λ=0 izjednačava sa WALD-ovim kriterijem pesimizma, a za λ=1 izjednačava se sa BAYES-ovim kriterijem očekivane vrijednosti.

Primjer 6. Ako je za matricu plaćanja iz primjera 4. poznata distribucija vjerovatnoća za različita stanja prirode y=(0,2; 0,3; 0,4; 0,1) i ako je parametar optimizma igrača λ=0,4 odrediti optimalnu strategiju igrača prema HODGES-LEHMANN-ovom kriteriju.

Rješenje:

Page 50: TEORIJA IGARA

Prema HODGES-LEHMANN-ovom kriteriju za svaku strategiju igrača utvrđujemo najmanje plaćanje, tj.

i očekivano plaćanje, odnosno:

Nakon toga, pomoću parametra optimizma utvrđujemo:

Optimalna strategija igrača je s2, a očekivano plaćanje je 7,8.

ZADACI ZA VJEŽBU

Date su slijedeće matrice plaćanja za igre dva igrača sa nula sumom:

1)

2)

3)

Page 51: TEORIJA IGARA

4)

5)

6)

7)

8)

Page 52: TEORIJA IGARA

9)

Za ove igre potrebno je utvrditi optimalne (mješovite) strategije igrača i vrijednosti igre. Prilikom rješavanja igara koristiti postupak opisan slikom 3.4.

2.Date su slijedeće matrice čiji elementi aij, i= , j= predstavljaju plaćanja donosioca odluke (igrača) za strategiju si i j-to stanje prirode:

Za ove matrice potrebno je odrediti optimalne strategije igrača korištenjem slijedećih kriterija:

- WALD-ov kriterij pesimizma,- HURWITZ-ov kriterij optimizma pri čemu je koeficijent optimizma

λ=0,6,- SAVAGE-ov kriterij minimalnog žaljenja,- BAYES-ov kriterij očekivane vrijednosti plaćanja pri čemu su poznate

slijedeće distribucije vjerovatnoća za različita stanja prirode u matricama:a) y=(0,2; 0,3; 0,5), b) y=(0,5; 0,2; 0,2; 0,1), c) y=(0,4; 0,4; 0,2) id) y=(0,3; 0,3; 0,2; 0,2).

- LAPLACE-ov kriterij maksimalnog prosječnog plaćanja i- HODGES-LEHMANN-ov kriterij pri čemu su distribucije vjerovatnoća

za različita stanja prirode u matricama kao kod BAYES-ovog kriterija, a parametar optimizma je λ=0,3.