Теория игр · 2011. 3. 19. · Классификация игр по разным...

59
Теория игр А.В. Цыганов, 2010

Upload: others

Post on 12-Sep-2020

16 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Теория игр

А.В. Цыганов, 2010

Page 2: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

«Невыносим холод невежества»

Николай Рерих

Page 3: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Разумная человеческая деятельность в большинстве случаев состоит в том,

что человеку для достижения тех или иных целей приходится принимать

решения.

При этом представляется вполне естественным стремление принимать

оптимальные решения, которые реализуют поставленные цели в

наибольшей степени.

Научные постановки вопроса о выборе оптимальных решений встречались

и встречаются в различных дисциплинах. По мере развития и математизации

этих дисциплин соответствующие процессы принятия решений

формализуются и приобретают характер математических моделей.

Теория математических моделей принятия оптимальных решений

составляет ныне обширную отрасль науки, называемую исследованием

операций.

Page 4: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Будем говорить о принятии решений опираясь на интуитивное

понятие решения, как способа устранения проблемной ситуации.

Проблемная ситуация предполагает наличие:

• цели;

• ресурсов;

• альтернатив (способов действий);

• свойств окружающей среды.

Проблемная ситуация предполагает неудовлетворенность лица,

принимающего решения («целеустремленное состояние»), и

необходимость действий для устранения проблемы

Page 5: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Пример: Проблемная ситуация: мальчик показывает пальчиком на Луну и говорит «Мама, дай!». 1. Снятие ситуации мамочка популярно объясняет: «Луна — это бяка, возьми-ка лучше яблочко!». Целеустремленное состояние переведено в другое русло и проблемная ситуация снята. 2. Разрешение ситуации Взмах волшебной палочки и Луна срывается с орбиты и прилетает в руки мальчика (изменение физических законов и свойств окружающей среды). Вряд ли это хорошо кончится для мальчика, да и для всего населения Земли (см. в качестве иллюстрации рассказ Г. Дж. Уэллса «Человек, который творил чудеса»). 3. Решение ситуации Этот мальчик — Нил Армстронг. Он вырастает, поступает в отряд астронавтов НАСА и в августе 1969 г. первым в истории человечества оказывается на лунной поверхности. Целеустремленный индивид не изменяет своей цели, а достигает ее в рамках имеющихся ресурсов, альтернатив и физических законов.

Page 6: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Особое место среди условий, в которых приходится принимать

решения, занимают условия конфликта.

Конфликт – это ситуация (положение, стечение обстоятельств), в

которой сталкиваются интересы сторон, происходит борьба интересов.

Теория игр — это математическая теория конфликтов.

Игра, по сути дела, - это реализация стратегий оптимального выбора из

некоторого определяемого условиями (правилами игры) множества

возможностей.

Это достаточно сложная теория, так как условиях конфликта принимающему

решения субъекту приходится учитывать свои собственные цели,

неизвестные ему решения противника и различные неизвестные (случайные)

обстоятельства.

Page 7: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

В чем отличие проблемной ситуации от конфликта?

В целевой функции G(x)=G(m,u)

где х — переменные, влияющие на G, причем х = {m, u}, где, в свою

очередь, m — управляемые переменные (management); u —

неуправляемые (т. е. действия внешней среды).

В конфликте эта функция зависит от интересов разных игроков (в

предыдущем примере от мнения луны ничего не зависит)

Мы считаем поведение игроков рациональным в следующем смысле:

когда игра закончена, у игроков возникают некоторые выигрыши.

Единственной целью каждого игрока мы будем считать

максимизацию его выигрыша.

Page 8: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Для теории игр безразлично кто или что скрывается за игроками:

одушевленные или неодушевленные объекты, природа, элемент

социального или биологического бытия.

Для нее основное то, имеется конфликт и игроки или даже один игрок,

которым она предлагает математически точно рассчитанные действия в

условиях разной степени неопределенности.

Силой, движущей игроков, является надежда на выигрыш.

Привлекательность игр состоит в значительной степени в неопределенности

результата.

Как только какая-то игра математически обрабатывается, и создается

безошибочный алгоритм действия игрока, так сразу же она перестает быть

игрой, превращаясь в строго определенную последовательность действий,

ведущих или к победе, или к ничье или к проигрышу.

Page 9: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Итак - как только имеет место взаимодействие различных самостоятельных

и рациональных (или частично рациональных) субъектов и возникает

конфликт - появляется игра.

Главный вопрос теории игр заключается в предсказании поведения

участников игры: какие ходы сделают шахматисты, чем завершатся войны и

переговоры, какие цены сформируются на рынке и т.д.

Теория игр есть теория математических моделей принятия решений, она не

занимается этими решениями как психологическими, волевыми актами; не

занимается она и вопросами их фактической реализации. Можно привести десятки, сотни наименований игр, исследователи которых вообще не выделяют хотя бы даже в качестве просто признака признак конфликтности. Многие игры просто играются, как нечто само собой разумеющееся, как само собой данное естественным ходом эволюции. К примеру, детские игры с куклой, со сверстниками, любовные игры молодоженов, брачные игры млекопитающих и птиц. Они играются и играющие не ставят целью разрешения конфликта, который в этих случаях явно не проявляется.

Page 10: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Далеко не каждый встречающийся на практике конфликт протекает по

правилам.

Чтобы сделать возможным математический анализ конфликта, нужно

представить конфликт в игровой форме, т. е. указать стратегии (образы

действий), возможные для участников, и уточнить, к какому результату

приведет игра, если каждый из игроков выберет определенную стратегию.

Таким образом, игра есть конфликт с четко определенными условиями

или правилами получения результата (выигрыша), остальные условия

могут быть определены не четко.

Стратегией игрока называется система правил, однозначно

определяющих поведение игрока на каждом ходе в зависимости от

ситуации, сложившейся в процессе игры.

Page 11: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Исторически первым способом учета неопределенности было изобретение

вероятностей.

Т.е. в оценке частот тех или иных исходов выпадения игральных костей,

комбинаций карт, чтобы, реализуя серию из достаточного числа игр,

придерживаться определенных фиксированных игровых стратегий ради

достижения некоторого (пусть даже небольшого) выигрыша.

В отличии от теории вероятности (веса, минимаксные стратегии и т.д.) в н.в.

используют нечеткие множества как инструмент построения теории

возможностей - (игра в дурака)

Первоначальным замыслом этой теории (fuzzy sets) было построить

функциональное соответствие между нечеткими описаниями (типа "высокий",

"теплый" и т.д.) и специальными функциями, выражающими степень

принадлежности значений измеряемых параметров (длины, температуры,

веса и т.д.) упомянутым нечетким описаниям.

Page 12: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Основным достижением теории нечетких множеств является введение в

обиход т.н. нечетких чисел как нечетких подмножеств специализированного

вида, соответствующих высказываниям типа

"значение переменной примерно равно а"

С введением нечетких чисел оказалось возможным прогнозировать будущие

значения параметров, которые ожидаемо меняются в установленном

расчетном диапазоне.

Главное то, что набор операций над нечеткими числами, сводится к

операциям с обычными числами при задании определенного интервала

достоверности (уровня принадлежности).

Рутковская Д., Пилиньский М., Рутковский Л. Нейронные сети, генетические

алгоритмы и нечеткие системы, Телеком, 2004. — 452 с.

Page 13: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Пример - ним математическая игра, в которой два игрока по очереди

берут предметы, разложенные на несколько кучек.

За один ход может быть взято любое количество предметов (большее нуля) из одной кучки.

Выигрывает игрок, взявший последний предмет. В классическом китайском варианте игры число кучек равняется трём.

Ним — конечная игра с полной информацией.

Игра Ним попала в Европу в XVI веке из Китая. Имя «ним» было дано игре американским математиком Чарльзом Бутоном (Chalres Bouton), описавшим в 1901 году выигрышную стратегию игры. Существует несколько вариантов происхождения названия игры: от немецкого глагола Nimm имеющего значение «брать»; от английского глагола WIN («побеждать»), переворачиванием слова;

Page 14: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Граф игры — это множество точек, соединённых стрелочками

(направленными рёбрами).

Точки (вершины графа) – это множество всех игровых ситуаций, которые

могут возникнуть в данной игре.

Каждая точка (вершина графа) соответствует одной из возможных игровых

ситуаций.

То, что из точки A ведёт стрелочка в точку B, означает, что из позиции A

можно сходить в позицию B.

Page 15: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Выигрышная стратегия состоит в том, чтобы оставлять после своего хода позицию с ним-суммой, равной нулю.

Ним-сумма позиции — результат сложения размеров всех кучек в двоичной системе счисления без учёта переноса разрядов, то есть сложение двоичных разрядов чисел в поле вычетов по модулю 2.

Ним-сумма или нимбер является примером функции Шпрага-Гранди.

Рассмотрим пример – три кучки в которых 3, 5 и 7 камней 3 = 2 + 1 5 = 4 + 1 7 = 4 + 2 + 1 Представим эти числа в виде суммы степеней 2 и остатка. Совпадающие пары чисел 4,2,1 выкинем – остаток и будет ним-суммой – в нашем случае 1.

Page 16: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Теория игр и информационные

технологии

или зачем это все надо?

Page 17: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Интерес к теории игр в IT обусловлен несколькими причинами.

Во-первых, исключительной близостью теории игр и теории информации,

поскольку игра в любом случае предполагает передачу информации (между

самими игроками или между игроками и арбитром).

Во-вторых, многие процессы могут быть легко рассмотрены в терминах

теории игр – выбор оптимальной стратегии поиска информации,

раскрутка сайтов, коды коррекции ошибок, искусственный интеллект,

компьютерные вирусы, боты, поисковые роботы, базы данных и т.д.

В третьих, в четвертых ………………………………………………..

Например, в криптологии перехват и расшифровка сообщения может

рассматриваться как игра между отправителем и перехватчиком.

Page 18: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Internet Connectivity

Page 19: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Corporate Partnerships

Page 20: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

International Trade

A mixture of scales; detailed structure

Page 21: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Определения и примеры

Page 22: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Математическая теория игр не способна стопроцентно предопределить исход

некоторых конфликтов.

Во-первых - неопределенность вызвана значительным числом вариантов,

сложностью их ранжирования по признаку истинности. Человеческий ум в

ограниченный отрезок времени просто не в состоянии равным образом исследовать

абсолютно все варианты (к примеру, японская игра ГО, русские и международные

шашки, британские реверси).

Во-вторых, непрогнозируемое игроками случайное влияние факторов на игру. Эти

факторы оказывают решающее воздействие на исход игры и лишь в малой степени

могут быть или вообще не могут быть контролируемыми и определяемыми играющими

Игры, исход которых оказывается неопределенным в силу случайных причин,

называются азартными (фр. hasard – случай).

В-третьих, неопределенность вызвана отсутствием информации о том, какой именно

стратегии придерживается играющий против противник. Неведение игроков о

поведении соперника носит принципиальный характер и определяется самим

правилами игры. Такие игры именуются стратегическими.

Page 23: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Классификация игр по разным признакам:

число участников –одиночные, парные, с тремя участниками и т.д.;

число стратегий – конечные (каждый игрок располагает конечным множеством ходов) и

бесконечные (по крайней мере один игрок располагает бесконечным множеством ходов,

к примеру игра биологического вида с природой);

характер отношений игроков – бескоалиционные игры, игроки в которых играют каждый

за себя и кооперативные игры, игроки объединяются в коалиции с одинаковыми на

время игры интересами;

характер выигрыша – игры с нулевой суммой ( сумма общего выигрыша не меняется, а

лишь перераспределяется или сумма выигрышей всех игроков во всех партиях данной

игры нулевая) и игры с ненулевой суммой , к примеру лотерея, в которой организатор

всегда выигрывает, а другие игроки (покупатели билетов) всегда получают суммарный

выигрыш значительно меньший стоимости билетов;

число ходов – одноходовые и многоходовые, последние из которых разделяются на

стохастические, дифференциальные;

количество информации – игры с полной информацией (игроки получают всю игровую

информацию после очередного хода соперника) и игры с неполной, или с скрытой

информацией - шахматы и “дурак”.

Page 24: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Пример: Враг собирается напасть на вашу армию, защищающую замок.

В замок есть 2 входа и вам необходимо решить, как распределить 2 ваших отряда

на защиту этих входов используя правила:

1. Если враг направит оба своих отряда на левый (правый) вход и там же

встретит 2 ваших отряда, то он потерпит поражение.

2. Если враг направит по отряду на каждый вход и у одного

из входов не будет вашего отряда, то замок падет.

3. Если враг отправит оба отряда на один вход, а вы

решите защищать второй или на защите будет лишь

один отряд – замок падет.

Данная игра – парная, конечная, безкоалиционная, с нулевой суммой,

одноходовая, с полной информацией.

Page 25: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Теория игр всегда начинается с построения математической модели конфликта -

наиболее важные формы моделей:

1. развернутая (расширенная, экстенсивная, позиционная)

2. стратегическая (нормальная)

3. байесовская форма

Игра в нормальной форме состоит из трех элементов:

множество игроков N (неупорядоченное)

множество стратегий каждого игрока Sm

множество платежных функций (выигрышей) каждого игрока.

Таким образом игру в нормальной форме можно представить в виде n-мерной

матрицы (таблицы) элементы которой это n-мерные платежные вектора

(выигрыши).

Page 26: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Случай двух игроков имеющих по две стратегии.

Стратегии первого игрока: U и D. Стратегии второго игрока: L и R.

Если первый игрок выбирает U, а второй игрок выбирает L то соответствующие платежи равны 4 и 3

Сыгранная комбинация стратегий называется исходом игры. В данном

примере исход игры (U, L).

Полученные выигрыши называются ценой игры – это всегда числа –

например в футболе выиграл +3, проиграл 0, ничья – 1.

Page 27: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Для игры в нормальной форме каждой стратегии можно приписать

вероятность ее использования – тогда:

Смешанной стратегией для игрока m называется распределение вероятностей на

его множестве стратегий Sm.

Элементы множества Sm называются чистыми стратегиями и отождествляются с

распределениями вероятностей, при которых они имеют вероятность 1.

Подразумевается, что каждый игрок выбирает свой ход случайно и независимо от

других с распределением вероятностей, заданным его смешанной стратегией.

Выигрышем игрока при данном наборе смешанных стратегий называется

математическое ожидание его выигрыша при случайных независимых ходах всех

игроков, распределённых в соответствии с заданными смешанными стратегиями.

Page 28: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Пример:

Две фирмы производят один и тот же продукт - дуполия Карно

Правила:

Стоимость производства единицы продукта равна c1 и c2 соответственно

Фирма 1 производит q1 продукта, а фирма 2 – q2

Спрос на продукт зависит от его количества на рынке обратная функция спроса

(зависимость цены от количества) есть

p(Q) = a-Q = a- (q1+q2)

В этой игре

1. игроки: фирмы 1 и 2

2. стратегии: выпуск q1 и q2, соответственно

3. платежи: прибыль фирмы k равна π(k)=qk * P(Q)-ck*qk

(Смешанные стратегии - всё то же самое, но издержки фирмы k будут с’k с

вероятностью θk и с’’k с вероятностью 1-θk)

Page 29: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Игры в экстенсивной форме представляются в виде ориентированного дерева

(графа), где каждая вершина соответствует ситуации выбора игроком своей

стратегии. Каждому игроку сопоставлен целый уровень вершин. Платежи

записываются внизу дерева, под каждой листовой вершиной.

Игрок 1 ходит первым и выбирает стратегию F или U. Игрок 2 анализирует позицию и

решает — выбрать стратегию A или R.

Скорее всего первый игрок выберет U, а второй — A (для каждого из них это

оптимальные стратегии); тогда они получат соответственно 8 и 2 очка.

Page 30: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Традиционным подходом в теории игр является рассмотрение равновесий —

устойчивых в каком-то смысле наборов стратегий игроков.

Равновесием по Нэшу называется такой набор стратегий, что никакому игроку

невыгодно отклоняться от своей стратегии в этом наборе.

Т.е. ни один участник не может увеличить выигрыш, изменив своё решение в

одностороннем порядке, когда другие участники не меняют решения.

1. “Я делаю все, что могу, при том, что ты делаешь”

2. “Ты делаешь все, что можешь, при том, что я делаю.”

Равновесия Нэша — одно из основных понятий теории игр.

Они отражают устойчивые исходы при неспособности игроков договориться.

Page 31: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Оптимальность по Парето

такое состояние системы, при котором значение каждого частного критерия,

описывающего состояние системы, не может быть улучшено без ухудшения

положения других элементов.

Принцип Парето «Всякое изменение, которое не приносит убытков, а которое

некоторым людям приносит пользу (по их собственной оценке), является

улучшением».

Таким образом признаётся право на все изменения, которые не приносят никому

дополнительного вреда.

Ситуация, когда достигнута эффективность по Парето — это ситуация, когда все

выгоды от обмена исчерпаны.

Page 32: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Доминирование — ситуация, при которой одна из стратегий некоторого игрока

дает больший выигрыш, нежели другая, при любых действиях его оппонентов.

Доминирующие стратегии

1. “Я делаю все что могу, все равно что ты делаешь.”

2. “Ты делаешь все, что ты можешь, все равно что я делаю.”

Если для одного из игроков существует строго доминирующая стратегия, он

будет ее использовать в любом из равновесий Нэша в игре.

Если все игроки имеют строго доминирующие стратегии, игра имеет единственное

равновесие Нэша.

Это равновесие может не быть эффективным по Парето, т.е. неравновесные

исходы могут обеспечить всем игрокам больший выигрыш.

Page 33: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Платежная матрица для рекламной

игры

Фирма A

Рекламировать Не рекламировать

Рекламировать

Не рекламировать

Фирма B

10, 5 15, 0

10, 2 6, 8

• Наблюдения

A: независимо от B, рекламировать лучше всего

B: независимо от A, рекламировать лучше всего

Page 34: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Платежная матрица для рекламной

игры

Фирма A

Рекламировать Не рекламировать

Рекламировать

Не рекламировать

Фирма B

10, 5 15, 0

10, 2 6, 8

доминирующая стратегия для A и B – рекламировать

Не беспокоиться о другом игроке

Равновесие в доминирующей стратегии

Page 35: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Дилемма заключѐнного "Prisoners' Dilemma"

Двое преступников, попались примерно в одно и то же время на сходных

преступлениях.

Есть основания полагать, что они действовали по сговору, и полиция, изолировав их

друг от друга, предлагает им одну и ту же сделку:

если один свидетельствует против другого, а тот хранит молчание, то первый

освобождается за помощь следствию, а второй получает максимальный срок

лишения свободы (10 лет).

если оба молчат, их деяние квалифицируется как неоказание помощи следствию,

и они приговариваются к 6 месяцам.

если оба свидетельствуют против друг друга, они получают минимальный срок

(по 2 года).

Каждый заключённый выбирает, молчать или свидетельствовать против другого.

Однако ни один из них не знает точно, что сделает другой.

Page 36: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Дилемма (конфликт) появляется, если предположить, что оба

заботятся только о минимизации собственного срока заключения.

Неш

Парето

Page 37: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Рассуждения одного из заключённых:

Если партнёр молчит, то лучше его предать и выйти на свободу (иначе —

полгода тюрьмы).

Если партнёр свидетельствует, то лучше тоже свидетель-ствовать против него,

чтобы получить 2 года (иначе — 10 лет).

Стратегия «свидетельствовать» строго доминирует над стратегией «молчать».

Аналогично другой заключённый приходит к тому же выводу – равновесие Неша по 2

года каждому.

С точки зрения группы (этих двух заключённых) лучше всего сотрудничать друг с

другом, хранить молчание и получить по полгода, так как это уменьшит суммарный

срок заключения.

Любое другое решение будет менее выгодным. Это очень наглядно демонстрирует,

что в игре с ненулевой суммой Парето-оптимум может быть противоположным

равновесию Нэша.

Page 38: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Поиграть можно на сайте

http://www.gametheory.net/ - основная ссылка

http://ccl.northwestern.edu/netlogo/models/PDN-PersonIterated

http://banach.lse.ac.uk/form.html

и многих других.

Там же на http://www.gametheory.net/ можно найти инструменты для

представления игр в нормальной и экстенсивной форме, для нахождения

равновесия по Нешу, нахождения доминирующих стратегий и т.д.

Page 39: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Пример:

Враг собирается напасть на вашу армию, защищающую замок. В замок есть 2 входа и вам необходимо решить, как распределить 2 ваших отряда на защиту этих входов используя правила: 1. Если враг направит оба своих отряда на левый (правый) вход и там же

встретит 2 ваших отряда, то он потерпит поражение.

2. Если враг направит по отряду на каждый вход и у одного из входов не будет вашего отряда, то замок падет. 3. Если враг отправит оба отряда на один вход, а вы решите защищать второй или на защите будет лишь один отряд – замок падет. Заполните матрицу на http://www.gametheory.net/Mike/applets/NormalForm/NormalForm.html и нажмите “solve”

Page 40: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Поиск наиболее оптимального решения

Page 41: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Для поиска наиболее оптимального решения поставленной задачи часто используют

методы на основе анализа производных. Однако применение анализа производных часто оказывается попросту неэффективным в случае решения задач оптимизации для негладких, прерывистых, или стохастических функцией. Для таких целевых функций используют такие методы, как генетический алгоритм, алгоритм поиска по шаблону и т.д.

Page 42: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Генетический алгоритм — это алгоритм, который позволяет найти

удовлетворительное решение к аналитически неразрешимым проблемам через

последовательный подбор и комбинирование искомых параметров с

использованием механизмов, напоминающих биологическую эволюцию.

Отличительной особенностью генетического алгоритма является акцент на

использование оператора «кроссовера», который производит операцию, роль

которой аналогична роли скрещивания в живой природе.

Генетический оператор кроссовера состоит в следующем – состояния (особи)

"разрезаются", а затем их части меняются местами.

В двухточечном кроссовере "рассечение" особей происходит двумя сечениями и т.д.

Page 43: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Схема работы любого ГА

Шаг алгоритма состоит из трех стадий:

1. генерация промежуточной популяции (intermediate generation) путем отбора (selection) текущего поколения

2. скрещивание (recombination) особей промежуточной популяции путем кроссовера (crossover), что приводит к формированию нового поколения

3. мутация нового поколения

Page 44: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Состояния задачи с восемью ферзями, соответствующие первым двум родительским состояниям, и первому потомку. Затененные столбцы на этапе скрещивания теряются, а незатененные сохраняются

Работа генетического алгоритма начинается с множества сформированных

случайным образом состояний, называемых популяцией. Затем происходит селекция

- выбираются особи для "производства потомства", затем скрещивание, мутация,

генетическая модификация и определение приспособленности получившихся

особей/особи

Page 45: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

• Популяция – совокупностью всех «особей», представляющих собой строки,

кодирующие одно из решений задачи.

• С помощью функции приспособленности:

– наиболее приспособленные (более подходящие решения) получают

возможность скрещиваться и давать потомство

– наихудшие (плохие решения) удаляются из популяции и не дают

потомства

• Таким образом, приспособленность нового поколения в среднем выше

предыдущего.

• В классическом ГА:

– начальная популяция формируется случайным образом

– размер популяции (количество особей N) фиксируется и не изменяется в

течение работы всего алгоритма

– каждая особь генерируется как случайная L-битная строка, где L — длина

кодировки особи

– длина кодировки для всех особей одинакова

Page 46: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Стратегия “TIT FOR TAT” для повторяющейся дилемы заключенного

Суть стратегии заключается в следующем:

Первым ходом стратегия предлагает сотрудничество;

Повторяет ход, который сделал противник в предыдущем ходе.

Если C – сотрудничество и D – защита, то стратегия первого игрока имеет вид

CDCD

сотрудничать, если противник сотрудничал, защищаться – если противник

защищался (зуб за зуб — он тебя и ты его).

Поначалу стратегии сотрудничества набирали гораздо меньше очков (были менее

приспособлены), чем стратегии, поощрявшие защиту. Но после 10-20 поколений

этот тренд менялся в обратную сторону и стратегии, поощрявшие сотрудничество и

наказывавшие защиту, выживали и в итоге представляли основную популяцию.

Page 47: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Принцип минимакса

Page 48: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

каждый способ действия оценивается по наихудшему для него исходу и

оптимальным является способ, приводящий к наилучшему из наихудших

результатов.

или веди себя так, чтобы получить наибольшую выгоду при наихудших для

тебя действиях противника.

Проще понять на примере

Игра «Три пальца» - два игрока А и В одновременно и не сговариваясь

показывают друг другу один, два или три пальца

если сумма четное число - выигрывает А: он получает столько очков, сколько

всего было пальцев.

если сумма нечетное — выигрывает В, на тех же условиях.

Page 49: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Предположим, что мы выбрали стратегию А1. Противник разумен - выберет

стратегию В2; наш результат будет равен —3, т. е. мы потеряем 3 очка.

Стратегия А2 - на нее разумный противник ответит В3 и мы потеряем 5 очков.

Третья стратегия — А3 также даст нам “выигрыш” (—5).

Page 50: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Нашли минимум каждой строки и из этих минимумов взяли максимальный (-3).

Эта величина называется максимином или нижней ценой игры.

Подумаем теперь за противника - он должен в каждом столбце выписать не

минимальное, а максимальное число и из этих максимумов он должен найти

минимальный, так называемый минимакс или верхняя цена игры (4).

Page 51: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Равновесие - если в матрице имеется седловая точка – т.е. элемент, который

является минимальным в своей строке и одновременно максимальным в своем

столбце.

В играх с нулевой суммой седловая точка является равновесием Нэша.

Например, матрица

имеет одну седловую точку — 4, а матрица содержит 4 седловых точки — "2" в первом и втором ряду, первом и четвертом столбце.

Page 52: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Пример – доминирующая стратегия

Фирма1

Не инвестировать Инвестировать Фирма2

0, 0 -10, 10

20, 10 -100, 0

Не инвестировать

Инвестировать

• Наблюдения – Доминирующая

стратегия Фирма 2: инвестировать

– Равновесие по Нэшу

• Фирма1: инвестирует

• Фирма2: инвестирует

Page 53: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Пример - максиминная стратегия

Фирма1

Не инвестировать Инвестировать Фирма2

0, 0 -10, 10

20, 10 -100, 0

Не инвестировать

Инвестировать

• Наблюдения – Если Фирма2 не

инвестирует, –

Фирма1 испытывает значительные потери

– Фирма1 должна играть в не инвестицию • Минимизировать

потери до 10 --максиминная стратегия

Page 54: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

• В случае если обе рациональны и информированы

– обе фирмы инвестируют

– равновесие Нэша

• Если Игрок 2 не рационален или недостаточно информирован

• Максиминная стратегия Фирмы 1 - не инвестировать

• Максиминная стратегия Фирма 2 - не инвестировать.

• Однако, если 1 знает, что 2 использует максиминную стратегию, 1

будет инвестировать

Равновесие Нэша

Максиминная стратегия

Page 55: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Подбрасывание монетки

Игрок A

Орел Решка

Орел

Решка

Игрок B

1, -1 -1, 1

1, -1 -1, 1

– Чистая стратегия: нет

равновесия Нэша

– Смешанная стратегия:

Случайный выбор, при

равновесии Нэша

– Будет ли Фирма

устанавливать цену,

основываясь на

случайном выборе

допущений?

Page 56: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

В классическом случае, как известно, шансы игроков на выигрыш при достаточно

большом числе подбрасываний монеты равные

50:50

Предположим, что в качестве монеты предложено использовать атомное ядро,

ориентация спина которого вверх соответствовала бы "решке", а вниз - "орлу”.

Если один из игроков играет с ядром как с обычной монетой, то второй игрок

используя квантовую суперпозицию гарантирует себе постоянный выигрыш.

Использование квантовых стратегий полностью снимает классическую "Дилемму

арестантов«, так как квантовые выборы арестантов оказываются еще и

взаимосвязанными ("спутанными", entangled).

А это означает, что выбор одного из "спутанных" арестантов будет воздействовать на

выбор другого и наоборот, даже если они ничего не будут знать о выборах друг

друга.

Page 57: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Битва полов (или перекресток или чикен)

Он

Футбол Опера

Футбол

Опера

Она

2,1 0,0

1,2 0,0

Page 58: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

Битва полов

Он

Футбол Опера

Футбол

Опера

Она

2,1 0,0

1,2 0,0

• Чистая стратегия – оба смотрят

футбол – оба смотрят

оперу

• Смешанная стратегия

– он выбирает футбол

– она выбирает футбол

Page 59: Теория игр · 2011. 3. 19. · Классификация игр по разным признакам: число участников –одиночные, парные,

• Дж. фон Нейман, О. Моргенштерн. Теория игр и экономическое поведение • Дж. Д. Вильямс Совершенный стратег или букварь по теории стратегических игр • Оуэн, Г. Теория игр , 1971. • Раскин М. А. Введение в теорию игр // Летняя школа «Современная математика». — Дубна: 2008.

• В.И. Данилов, Лекции по теории игр , 2002.

• Вентцель Е. С. Элементы теории игр. Изд. 2. М., Физматгиз, 1961.

• Game Theory and Computer Science. Spring 2008

• http://www.gametheory.net/