Теорија на игри

Post on 15-Jan-2016

87 Views

Category:

Documents

1 Downloads

Preview:

Click to see full reader

DESCRIPTION

teorii za igri

TRANSCRIPT

Теорија на игри е проучување на интеракцијата на носителите на одлуките;

Теоријата на игри има за цел да го промовира рационално донесување на одлука, бидејќи тоа е најсоодветен модел на економско однесување;

Теоријата на игри е неопходна аналитичка алатка за секој економист.

• Начин на опис на игра: стратешки (скратен) и екстензивен (проширен);

• Стратешки облик, содржи множества:1.Играчи2.Стратегии3. плаќањаПретпоставка: описот на играта –

плаќањата и стратегиите достапни на играчите се ОПШТО ПОЗНАТИ. Секој играч е целосно рационален.

Теоријата на игра е воопштување на стандардната теорија на одлука на едно лице.

Како би се однесувало едно лице во ситуација во која неговите приходи зависат од изборот на друго лице?

Пример: фрлање паричка (петка-глава) Двајца играчи (ред и колона), секој има

паричка и секој има две стратегии (петка или глава). Приходите можат да бидат:

- Ако двајцата покажат исто петка или глава добива пари Редица (прв играч)

- Ако покажат различни, добива пари Колоната

1, -1 -1,1 -1,1 1,-1 Стратешките интеракции се прикажани

во матрица на игри Исплатата на еден од играчите е

негација на исплатата на другиот; Ова е игра со нулта сума

• Двајца играчи, но сега нивните интереси се само делумно во конфликт

• Две стратегии: да се соработува или да не се соработува

• Оригинална приказна е за двајца кои заедно учествувале во кривично дело (можат да соработуваат да не дадат исказ или еден да соработува и да го обвини другиот, за да се спаси)

• Опис на Ауман, игра во кој секој од играчите може да му каже на судијата:

- Дај ми 1000 долари или- Дај му на другиот играч 3000 долари- Кооперативна стратегија е секое лице да добие

подарок од 3000 долари, додека стратегијата на несоработка е да се земе 1000 долари и да се избега

Соработка несоработка Соработка 3,3 0,4 Несоработка 4,0 1,1, Секоја страна има поттик за несоработка, а тоа е

дека јас верувам дека другата страна ке соработува и ке ми даде подарок од 3000 долари, а јас ако во тој момент не соработувам ке добијам уште 1000 долари (вкупно 4000 долари).

Од друга страна, ако верувам дека другиот нема да соработува и тој ке земе 1000 долари, тогаш подобро е и јас да ги земам тие 1000 долари за себе.

• Двајца играчи на пазарот (производители на ист производ)

• Стратегија на секој играч да ја огласи цената• Ако двајцата соработуваат, можат да

остварат монополска цена и секој да добие половина од монополскиот профит;

• Но за играчот секогаш постои искушение да ја намали својата цена и да го придобие целиот пазар за себе;

• Ако и двајцата играчи ја намалат цената – губат.

• Пример на картел – ОПЕК – преку одредување на производствените квоти на секој член се контролира цената.

• Стратегијата се моделира преку производствените нивоа , а не преку цени;

• Уметност е да се одредат репрезентативни стратешки избори на играта.

• Играчот сака да избере стратегија која другиот не може однапред да ја предвиди;

• Ниеден од играчите не сака другиот играч точно да го предвиди неговиот избор;

Кај играта со паричките – се избира случајна стратегија (да се игра глава – со веројатност Ph и петка со веројатност Pt). Tаквата стратегија се нарекува МЕШАНА, а стратегии во кои изборот е со веројатност = 1 се нарекуваат ЧИСТИ СТРАТЕГИИ.

• Секој играч сака да ја максимизира својата корисност според своите верувања.

• Според верувањата за тоа што може да направи другиот играч, јас ја бирам стратегијата што ја максимизира мојата очекувана корисност.

• Во овој модел, сите верувања за стратешки избори се егзогени варијабли.

• Меѓутоа, клучното прашање е КОИ ВЕРУВАЊА СЕ РАЗУМНИ ВО ВРСКА СО ОДНЕСУВАЊЕТО НА ДРУГОТО ЛИЦЕ?

• Секој играч знае дека другиот сака да ја максимизира корисноста и секој треба да ја искористи таа информација при одредување кои разумни верувања да ги има за однесување на другиот играч.

• Во теоријата на игри знаеме дека секој играч сака да ги максимизира приходите и секој играч знае дека тоа е целта на останатите. Затоа, за да се одредат кои се нашите разумни верувања за тоа како би постапиле другите играчи, мора да се постави прашањето: што веруваат другите како ќе постапам јас?

• Природно, верувањето на секој играч за изборите на другиот играч се поклопуваат со актуелните избори што другиот играч има намера да ги направи. Очекувањата кои се конзистентни со актуелните фреквенции се нарекуваат рационални очекувања.

• Нешовата рамнотежа е одреден вид на рамнотежа на рационалните очекувања

• Нешовата рамнотежа се состои од верувања на веројатноста r c за стратегиите (r и c) и веројатноста за избирање на стратегии (pr pc), така што:

1. Верувањата се точни pr = r pc=c

2. Секој играч избира (pr) и (pc) за да ја максимизира својата очекувана корисност според своите очекувања.Нешовата рамнотежа е рамнотежа на АКЦИИ и ВЕРУВАЊА. Во рамнотежата секој играч точно предвидува колку е веројатно другиот играч да направи различни избори, и верувањата на двајцата играчи се взаемно конзистентни.

• Нешова рамнотежа при чисти стратегии – е Нешова рамнотежа во која веројатноста за играње на одредена стратегија е 1 за секој играч.

• Нешовата рамнотежа е барање на минимална конзистентност за да се избере пар стратегии- ако редицата верува дека колоната ќе игра c , тогаш најдобар одговор на редот е r, и слично. Не е во интерес на ниту еден играч еднострано да одстапува од стратегијата на Нешовата рамнотежа.

• Ако множество од стратегии не е Нешова рамнотежа, тогаш најмалку еден играч не размислува конзистентно за однесувањето на другиот играч. Играчот очекува дека другиот играч нема да дејствува само во својот интерес – спротивставувајќи се на оригиналната хипотеза.

За концептот на рамнотежа се мисли како на последна точка на некој процес на приспособување –

Процес на актуелно приспособување, во кој секој играч експериментира со различни стратегии во обид да ги разбере изборите на другите играчи

• Борба помеѓу половите• Ронда и Калвин (дилема: дали да земат

макро или микроекономија во овој семестар?);

• Ако и двајцата земата микро Ронда добива 2, а Калвин 1; плаќањата се спротивни ако земат макро; ако земат различни предмети – обајцата добиваат корисност 0.

• Пресметка на Нешовата рамнотежа на оваа игра:

Калвин Калвин

Лево Микро Десно Макро

Ронда Врв (микро) 2,1 0,0

Ронда Дно (макро) 0,0 1,2

Очекуваниот приход за секој играч е 2/3, а на секој му одговара мешана стратегија- другиот да добие 1/3.

Секој играч би сакал рамнотежа на чиста стратегија наместо на мешана стратегија, затоа што плаќањата се повисоки за секој играч.

Пондерирана средина на можниот принос и веројатност за негово настанување

Веројатност Можен принос

PxM

0,4 5 2

0,5 10 5

0,1 30 3

1,00 10

За секоја рамнотежа на мешана стратегија, секогаш важи следното:- ако едната страна верува дека другиот играч ќе ја игра мешаната стратегија на рамнотежа, тогаш тој е индиферентен на тоа дали ќе ја игра неговата мешана стратегија на рамнотежа или пак некоја чиста стратегија што е дел од неговата мешана рамнотежа.

Логика: ако некоја чиста стратегија што е дел од мешана стратегија на рамнотежа има повисок очекуван принос од некоја друга компонента на мешаната стратегија на рамнотежа, тогаш играчот ќе плати да ја зголеми веројатноста со која некој ја играл стратегијата за повисок очекуван принос.

Ова е така, затоа што функцијата на очекуван принос е линеарна со веројатноста од нивно настанување.

Поголема група на луѓе, првично секој игра Нешова рамнотежа на мешани стратегии од (1/2, ½). По извесно време некои од играчите се заморуваат од играње на мешана стратегија и одлучуваат цело време да одат на петка или глава. Ако бројот на луѓето што ова го прават е ист (колку само на петка, толку само на глава), не се менува ништо, секој учесник рационално ќе верува дека неговиот противник има шанса 50:50

На овој начин, секој член на населението игра чиста стратегија, но во одредена игра играчите немаат шанса да знаат која чиста стратегија ја игра нивниот противник.

Секој играч може во одреден момент да го одреди својот избор како функција на целата историја на играта до тој момент.

Бидејќи мојот противник може да го смени своето однесување врз основа на моите поранешни избори, кога правам сопствен избор јас морам да го земам предвид ова влијание.

Долгорочен интерес за двајцата е кооперативност, кооперативност.

Краткорочен интерес на другиот играч е некооперативност – но тој знае, дека ако не соработува и првиот играч ќе изгуби трпение и од тој момент ќе почне да игра некооперативност. Така, вториот играч може долгорочно да изгуби, ако игра краткорочна оптимална стратегија.

“Потегот што сега ќе го направам, може во иднина да има последици- идните избори на другиот играч можат да зависат од моите тековни избори“;

Дали стратегијата кооперативност, кооперативност може да биде Нешова рамнотежа на повторената Дилема на затвореникот?

Прво разгледуваме случај каде што секој играч знае дека играта ќе се повтори фиксен број пати. Резонирањето на играчите го разгледуваме пред последната етапа од играта. Секој резонира и планира игра со еден погодок. Бидејќи нема иднина – со последниот потег се применува стандардна логика на Нешовата рамнотежа и обете страни играат некооперативност.

Сега го разгледуваме претпоследниот потег. Овде изгледа дека може да им се исплатува на

сите играчи да соработуваат со цел да сигнализираат дека се “добри момци“.

Но, кога доаѓа до последниот потег секој играч сака да несоработува. Затоа нема предност во кооперирањето од наредниот до последниот потег, се додека двајцата играчи веруваат дека другиот нема да соработува при последниот потег.

Ова се нарекува индукција наназад – успева два потега при крај. Во повторената Дилема на затвореникот со познат број на повторувања, Нешовата рамнотежа е да не се соработува во секоја етапа.

Ситуацијата е прилично различна во повторена игра со бесконечен број на повторувања. Во овој случај, во секоја фаза е познато дека играта ќе се повтори најмалку уште еднаш и затоа ќе има потенцијални соработки.

Стратегиите во оваа повторена игра се низа функции кои покажуваат дали секој играч ќе биде кооперативен или не во одредено ниво – како функција на минатото на играта до тоа ниво.

Биди кооперативен при моменталниот потег , а ако другиот играч не соработувал при последниот потег, тогаш не соработувај засекогаш – казнена стратегија.

Пар казнени стратегии прават Нешова рамнотежа, односно ако еден игра казнена стратегија и другиот мора тоа да го прави.

Да претпоставиме дека играчите се кооперативни до потегот Т, и еден играч дезертира при тој потег. Тој ке добие 4, но исто така, ќе се осуди на бесконечен низ на плаќања 1.

Дисконтирана вредност на ваков низ на плаќања е 1/r, вкупен очекуван принос по дезертирањето е: 4+1/r

Очекуван принос ако продолжи ако продолжи да соработува е: 3+3/r

Ке соработува се додека: 3+3/r > 4+1/r Ова се сведува на барањето: r<2

Се додека овој услов е задоволен казнената стратегија формира Нешова рамнотежа: ако едната страна ја игра казнената стратегија и другата ќе сака да ја игра, така што ниту една страна не може да добие ако еднострано отстапи од овој избор.

Концептот на Нешова рамнотежа изгледа како разумна дефиниција на рамнотежа на игра.

Прашања:1. Дали постои?2. Дали Нешовата рамнотежа ќе биде единствена?

Неш покажал дека со конечен број на економски субјекти и конечен број на чисти стратегии, секогаш ќе постои рамнотежа. Тоа може да биде рамнотежа која вклучува и мешани стратегии.Меѓутоа, не мора да биде единствена. Може да има неколку Нешови рамнотежи за една игра.

Сите досегашни опишани игри имаа едноставна динамичка структура – или се игри со еден погодок или повторена низа на игри со еден погодок

Дрво на веројатноста Рамнотежа и на секоја од подигрите

Двајца играчи А и Б имаат 1 долар да поделат меѓу себе.

Имаат најмногу 3 дена да преговараат за поделбата. Првиот ден А ке направи понуда, Б или ќе ја прифати или следниот ден се враќа со контра-понуда, а третиот ден А ја прави последната понуда. Ако за три дена не можат да постигнат согласност, обајцата добиваат 0.

А и Б се разликуваат по степенот на нетрпение: А ги дисконтира идните приноси со стапка дневно, а Б по стапка дневно.

Нашата анализа ја започнуваме на крајот од оваа игра, токму пред крајот на последниот ден. Во овој момент А на Б може да му направи понуда земи или остави. За А е оптимално да му понуди најмал можен износ што тој ке го прифати (под претпоставка нула). Така, ако играта трае три дена А ќе добие 1, а Б ќе добие нула (мал износ).

Се враќаме кога Б предлага поделба (втор ден). Во тој момент Б треба да сфати дека А може да си гарантира 1 во следниот потег, одбивајќи ја понуда на Б. Еден долар во следниот период вреди за А во овој период, така што секоја понуда помала од ке се одбие.

Б сака 1-, така треба да му предложи рационална , за А да го прифати.

Да се вратиме на првиот ден. Во овој момент А прави понуда и сфака дека Б може да добие 1- ако чека до вториот ден. Затоа А мора да понуди плаќање кое е еднакво на сегашната вредност на приносот на Б, со цел да се одбегне одложувањето.

Така, тој на Б му нуди (1-). За Б е ова прифатливо и играта

завршува. Конечниот исход е дека играта завршува

при првиот потег со тоа што А добива 1-(1-), а Б добива (1-).

Идеата за перфектна подигра ги елеминира Нешовите рамнотежи што вклучуваат играчи што се закануваат со некредибилни дејства- т.е. не е во интерес на играчите да ги спроведат.

Казнената стратегија не е рамнотежа на перфектна подигра. Ако едниот играч не соработува, тогаш на другиот не му е во интерес засекогаш да не соработува.

Разумно е да се казни играчот за некооперативност до извесен степен, но казнувањето засекогаш е премногу.

Помалку сурова стратегија: мило за драго. Играчот се казнува но само еднаш, така што ова е стратегија на простување.

Секој играч се согласува да го казни другиот за некооперативност и исто така да ги казни другите што не го казниле играчот што несоработувал.

Фактот дека ке бидеш казнет ако не го казниш оној што не соработува е она што ја прави подиграта совршена

До сега претпоставувавме дека секој играч ги знае приносите на другиот играч и секој играч знае дека другиот тоа го знае.

Ако еден играч не ги знае приносите, Нешовата рамнотежа нема смисла.

Решение за ова нашол Harsanyi (1967). Тип на субјектот

Множество стратегии за секој тип на играч што ја максимизира очекуваната вредност на секој тип на играч, ако се дадени стратегиите кон кои се стремат другите играчи.

Во основа истата дефиниција како Нешовата рамнотежа, освен додатната несигурност за типот на другиот играч.

Со цел да имаме комплетен распоред на рамнотежа, мораме да имаме листа на стратегии за сите типови на играчи, не само за актуелните типови во одредена ситуација.

Нешова рамнотежа- дозволени се само оние верувања што се компатибилни со однесувањата за максимум.

Штом дозволиме да постојат повеќе типови на играчи со различни функции на корисност, оваа идеа губи на својата сила. Секоја мостра на однесување може да биде конзистентна на мостра на верувања.

top related