л 2 6

28
ИУС Рассмотрим теперь вопросы, связанные с общими характеристиками решений при наличии игровой ситуации выбора

Upload: kirill-bystrov

Post on 16-Jun-2015

393 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: л 2 6

ИУС

Рассмотрим теперь вопросы, связанные с общими характеристиками решений при наличии игровой ситуации выбора

Page 2: л 2 6

ИУС

Рассмотрим следующую игру 2-х лиц:

( , ) max ,

( , ) max .x X

z Z

J x z

I x z

С позиций «внешнего» наблюдателя эта задачаможет трактоваться как многокритериальная,определенная на множестве L X Z

с аргументом ( , )x z

Page 3: л 2 6

ИУС

Имеем теперь:

( ) max ;

( ) max .

L

L

J

I

При анализе эффективности решения этой задачи можно снова воспользоваться

принципом Парето !

Page 4: л 2 6

ИУС

Именно, будем полагать, что первое решение лучше второго

1 2 , если

1 2

1 2

( ) ( ) ,

( ) ( )

J J

I I

и по крайней мере одно из неравенств –строгое

Page 5: л 2 6

ИУС

Обсуждение• С глобальной точки зрения должны

заслуживать внимания только Парето-оптимальные решения – иначе ситуация может быть улучшена без ущемления чьих-либо интересов

• Если решение Парето-оптимально, то улучшение ситуации для одного из игроков может быть реализовано только за счет ухудшения положения кого-то из остальных участников игры

Page 6: л 2 6

ИУС

Продолжаем обсуждение

• Отличие данной ситуации от обычной многокритериальной задачи состоит в том, что здесь не одно ЛПР, а несколько и все думают только о своих интересах

• В результате имеем «неустойчивость» ситуации, связанную с попытками игроков улучшить свои целевые функции за счет других

• Важное значение приобретают т.н. «устойчивые» решения или «ситуации равновесия»

Page 7: л 2 6

ИУС

Определение: решение игры называется устойчивым (или оптимальным по Нэшу), если игрок, нарушающий договоренность, получает ухудшение своей целевой функции

Page 8: л 2 6

ИУС

Обсуждение

• Можно показать (достаточно привести соответствующий пример), что точка, оптимальная по Нэшу может не быть оптимальной по Парето (и поэтому может быть улучшена для всех участников игры)

• Точно так же оптимальность по Парето не гарантирует устойчивости – оптимальности по Нэшу

• Идеальным был бы случай, когда одновременно реализуются оба вида оптимальности, но это, к сожалению, возможно не всегда

Page 9: л 2 6

ИУС

Пример: дилемма заключенного

(7,7)(0,10)П

(10,0)(1,1)Н

ПН2

1

Покажите, что оптимальными по Парето являются решения (Н, Н), (Н, П), (П, Н). Решение (П, П) являетсяоптимальным по Нэшу, но неоптимальным по Парето

Page 10: л 2 6

ИУС

Многостадийные процессы принятия

решений

Page 11: л 2 6

ИУС

Схема целенаправленной деятельности

Многоэтапный процесс принятия решений (выбора вариантов)

Шаг 1

Шаг 2

Шаг 3

Page 12: л 2 6

ИУС

До сих пор мы, по существу, рассматривали один шаг этого многоэтапного процесса выбора. Рассмотрим теперь многоэтапный процесс в целом

Page 13: л 2 6

ИУС

Модель многостадийности• Будем для простоты предполагать, что решаемая

проблема является одноцелевой (нет многокритериальности)

• Рассматриваемая модель будет иметь вид графа, описывающего возможные пути попадания из заданных начальных вершин в заданное множество «целевых» вершин

• Задача сводится к выбору пути, обеспечивающего минимум или максимум принятого критерия оптимальности

• Будем предполагать, что задача является «аддитивной», т.е. суммарные доход или затраты складываются из элементарных доходов или затрат на отдельных участках пути. В результате имеем стандартную задачу выбора «минимального пути» на графе

Page 14: л 2 6

ИУС

Детерминистский случай(задача о наборе высоты и скорости самолетом)

si

sl

sk

sj

Все стрелки имеют веса и надо получитьминимальный (максимальный) путь на графе

Page 15: л 2 6

ИУС

Многостадийный процесс в условиях неопределенности

si

sl

sk

sj

q

Так же как и раньше можем иметь вероятностнуюнеопределенность или полную неопределенность

Page 16: л 2 6

ИУС

Здесь важно понимать, что в пределах одного графа («дерева решений») мы можем иметь и детерминистские переходы и вероятностные переходы и переходы в условиях полной неопределенности

Page 17: л 2 6

ИУС

Пример.• Необходимо принять решение об организации крупного

либо небольшого предприятия (например, фирмы по разработке программного обеспечения по заказам)

• Впоследствии (через 4 месяца) при достаточно высоком спросе на продукцию небольшое предприятие можно расширить

• Для крупного предприятия существует опасность убытков из-за простаивания персонала, оборудования и арендованных помещений при невысоком спросе на продукцию

• Бюро системного анализа на основе изучения ситуации должно дать рекомендации о целесообразном поведении на год вперед с целью максимизации годовой прибыли

Page 18: л 2 6

ИУС

Этап 1. Сбор исходной информации о проблеме (в том числе маркетинг – исследование рынка)

А) Информация о доходах. Для простоты будем предполагать, что спрос может быть либо высоким (z1), либо низким (z2)

z1 z2

X1

(малое)50 40

X2

(крупное)200 60

X3

(расшир.)180 40

В таблице даны доходы в усл. ед. в месяц.Все эти числа полученызаранее системным ана-литиком

Это не матрица

решений !!!

Page 19: л 2 6

ИУС

В) Информация о затратах:1000 у.е. - организация крупной фирмы200 у.е. - организация малой фирмы840 у.е. - затраты на расширение фирмы (через 4 месяца)

С) Исследование рынка:0,75 - вероятность высокого спроса на продукцию0,25 - вероятность низкого спроса

Будем предполагать также, что спрос в течение первых 4-х месяцев меняться не будет, оставаясь либо высоким, либо низким. Если он был высоким, то через 4 месяца он может стать низким. В последующие 8 месяцев спрос не изменится (это предполагается)

Page 20: л 2 6

ИУС

Этап 2. Упорядочение и систематизация исходной информации в виде дерева решений

t0 4 мес 12 мес

1

2

3

4

5

6

200

60

18040

50

40

40

Ежемесячныйдоход в течениевсего года

В течениепоследних 8месяцев

В течениевсего года

x1

x2

z1

z2

z1

z2

z1

z2

z1

z2

y1

y2

Page 21: л 2 6

ИУС

Этап 3. Решение задачи методом динамического программирования

1. Решаем задачу построения оптимальногопути на графе, двигаясь справа налево порешающим вершинам. Затем восстанавливаемоптимальную траекторию, двигаясь слеванаправо

2. При движении справа налево раскрываем неопределенности одним из изученных методов: Гурвица, максимина, Байеса-Лапласаи т.д. Для каждой «круглой» вершины можетприменяться свой критерий

Page 22: л 2 6

ИУС

Вернемся к нашему примеру, представленному в виде дерева решений.

Переменные y1, y2 означают, соответственно, решение о расширении фирмы через 4 месяца и отказ от расширения

Page 23: л 2 6

ИУС

Вначале обрабатывается решающая вершина 4. Для раскрытия неопределенности используем критерий математического ожидания и будем максимизировать ожидаемую годовую прибыль

4

y1

y2

М(чистая прибыль)=(180*0.75+40*0.25)*8(мес.) – – 840 =320

М( )=(50*0.75+40*0.25)*8(мес.) = 380

380 > 320

Page 24: л 2 6

ИУС

Таким образом, имеем:

4

y1

y2

320

380

(380)

Page 25: л 2 6

ИУС

Переходим теперь согласно методу динамического программирования к вершине 1:

1

x2

x1

М( )=(200*0.75+60*0.25)*12(мес.) - 1000 = 980

М( )=40*0.25*12(мес) +50*0.75*4(мес.)++380*0.75 - 200 = 475

980 > 475

Page 26: л 2 6

ИУС

Таким образом, имеем:

1

x2

x1

980

475

(980)

Page 27: л 2 6

ИУС

Окончательный результат:

С позиций критерия математического ожидания выгоднее сразу организовывать крупное предприятие с ожидаемой прибылью в 980 у.е. в год

Page 28: л 2 6

ИУС

Решите ту же задачу на основе принципа гарантированного результата и покажите, что оптимальной окажется стратегия x1 c гарантированным годовым доходом в 280 у.е.

Упражнение