Помощь в учёбе, очень быстро...
Работаем вместе до победы

Постулаты и принципы

РефератПомощь в написанииУзнать стоимостьмоей работы

Принцип Парето в некотором смысле противоположен равновесию в доминирующих стратегиях. В то время как равновесие в доминирующих стратегиях отражает «эгоистическое» поведение игроков, оптимум Парето отражает «кооперативное» поведение, т. е. их сотрудничество. Действительно, если есть ситуация, которая приносит всем игрокам не меньший выигрыш, чем существующая, почему бы им не реализовать более… Читать ещё >

Постулаты и принципы (реферат, курсовая, диплом, контрольная)

Как и любой процесс моделирования, применение аппарата теории игр связано с постулатом рациональности, рассмотренном в гл. 1. В теории игр постулат рациональности предполагает, что игроки осуществляют свои действия не случайным образом, а исходя из неких разумных оснований (хотя, как покажем далее, в ряде игр обращение к механизмам случайности вполне оправдано и рационально). Другими словами, анализ ситуации каждым из игроков основан не на неких произвольных представлениях относительно поведения других игроков, а исходит из определенных разумных предположений относительно их рассуждений при принятии решений. При этом каждый из участников предполагает, что действия другого участника основаны на тех же самых принципах, и каждый участник ориентируется на одни и те же критерии при принятии решений. Так, в ситуации «Борьба за рынки» аутсайдер предполагает, что монополист, как и аутсайдер, руководствуется критерием прибыли, а не, например, критерием справедливости («разделить рынок по справедливости») или какими-либо эмоциональными критериями («не пускать чужака на собственный рынок»).

Еще один основополагающий теоретико-игровой постулат — это предположение об общем знании (постулат общего знания). Он подразумевает, что игра со всеми правилами известна всем игрокам и каждый из них знает, что все игроки осведомлены о том, что известно остальным партнерам по игре, и такое предположение выполняется на протяжении всей игры.

Постулаты рациональности и общего знания тесно связаны. Можно сказать, что один из игроков поступает рационально, так как он знает о том, что другие игроки рациональны, и при этом они знают, что этот игрок рационален. Таким образом, некий факт А является общим знанием, если: 1) все знают А; 2) все знают, что все знают А; 3) все знают, что все знают, что все знают Л, и т. д.

Постулаты рациональности и общего знания были введены в теорию игр как некоторые основания для принятия решений в условиях неопределенности, связанной с взаимозависимостью действий игроков, из-за которой выигрыш игрока зависит не только от его действий, но и от действий других игроков. Принимая решение, игрок не знает о решениях других игроков, но на основе общего знания он может делать предположения о возможных решениях.

В классической теории игр предполагается, что никакого иного обмена информацией между участниками, кроме общего знания, не существует: никаких доигровых переговоров, угроз, соглашений и т. п., но в сравнительно новых направлениях теории игр разрабатываются также модели с учетом коммуникации игроков.

Постулаты о рациональности и общем знании — отнюдь не очевидные и не бесспорные утверждения, из которых следует ряд интересных парадоксов.

Пример 3.1. Две автозаправочные станции, А и Б, расположенные рядом друг с другом, торгуют одинаковым видом топлива. Допустим, что покупатели приобретают топливо на той заправке, где цена на него ниже (подобная модель называется дуопольной игрой Бертрана). Менеджер каждой станции должен принять решение о цене на топливо при отсутствии информации о решении конкурента. Попробуем предположить логику рассуждений, например, менеджера А, исходя из того что максимальная цена на топливо ограничена величиной, например, 35 руб. за литр: «Менеджеру Б известно, что максимальная цена 35 руб., и он, зная, что мне это известно и я могу установить эту цену, установит цену в 34 руб. на своей станции, чтобы привлечь всех клиентов к себе. Поэтому мне лучше установить цену в 33 руб. Но если Б думает, что я думаю, что он остановится на 34 руб., и поэтому я установлю 33 руб., то он установит 32 руб., поэтому мне следует установить 31 руб. Но если он думает, что я думаю, что он думает, что… и т. д.». Следуя такой логике, менеджер придет к выводу, что топливо нужно предлагать даром (или по себестоимости), что является абсурдным решением (парадокс Бертрана).

Решение, представленное в примере 3.1, получено из-за чрезмерного упрощения моделируемой ситуации и отказа от учета многих важных факторов (рекламы, качества топлива, места продаж и др.). В теории игр разработаны различные модели и подходы, позволяющие при предположении рациональности игроков принимать оптимальные и эффективные решения.

Постулат общего знания также предполагает «всеобщее знание» игры, в частности знание (или возможность оценки) результатов (или исходов) взаимодействия участников игровой ситуации. Кроме того, эти исходы (или полезности) должны быть выражены в некоторых показателях (например, доход, прибыль, затраты и т. п.). Однако реально у сторон могут быть разные представления об игровой ситуации, в которой они участвуют. Предполагается, что каждый из игроков знает не только свой выигрыш, но также и выигрыши других игроков, т. е. он способен вычислить все выигрыши абсолютно точно. Даже если предположить, что возможно вычисление не только собственного выигрыша, но и что игрок может вычислить результаты (исходы) для всех других игроков, то как он может определить полезность этих исходов для игроков? Здесь мы вновь сталкиваемся с проблемой постулата рациональности, который обсуждался в гл. 1.

Ключевым принципом принятия решений в теории игр является принцип аллоцентризма. Аллоцентризм (англ, allocentrism — направленность на всех), в отличие от эгоцентризма (англ, egocentrism — направленность на себя) характеризует стремление человека (ЛИР) понять в первую очередь мотивы, интересы и возможные действия других людей (ЛПР) с целью принятия наиболее эффективных собственных решений.

Все применяемые в теории игр принципы оптимальности и подходы к поиску оптимальных решений при всем их внешнем разнообразии отражают прямо или косвенно идею устойчивости ситуаций или множеств ситуаций, составляющих решения. В бескоалиционных играх основным принципом оптимальности считается принцип равновесия. Понятие равновесия характеризует ситуацию в игре, которая удовлетворяет (по крайней мере теоретически) всех игроков. Ситуации равновесия обладают тем свойством, что любой игрок, который отклонится от этой ситуации (при условии что остальные игроки не изменят своих стратегий), не увеличит этим свой платеж.

Однако равновесные ситуации могут быть разными в играх разных видов и, в свою очередь, определяться различными критериями. Например, пессимистический критерий обеспечивает оптимальное решение, если игрок ориентируется на самый плохой для себя исход и его цель — обеспечить наилучший гарантированный результат при любых действиях других игроков. В этом случае соответствующая стратегия игрока называется осторожной. Если все игроки придерживаются своей осторожной стратегии, то говорят о равновесии в осторожных стратегиях, или решении игры в осторожных стратегиях. Такой критерий оптимальности используется при решении антагонистических игр, которые подробно будут рассмотрены в следующей главе.

Одна из возможных ситуаций равновесия в игре связана с понятием доминантных стратегий. Стратегия s* называется доминантной (доминирующей), если она обеспечивает лучшие платежи игроку г, чем какая-либо другая стратегия sp независимо от действий других игроков. Соответственно, стратегия .s, называется доминируемой. В этом случае также говорят, что стратегия si доминируется стратегией s* или что стратегия s* доминирует стратегию .v(. Так, например, в игре «Борьба за рынки» (см. параграф 1.4) стратегия монополиста «война» является доминируемой.

Более строго в математической форме определение доминирующей стратегии выглядит следующим образом. Стратегия s* игрока i сильно доминирует стратегию sp если Ut(s*, s ,) > Ufa, s ,) для любой s, е ?,. Если Ufa, s ,) > Uj (sp s ,), то стратегия s* слабо доминирует стратегию st (здесь s, означает профиль стратегий всех игроков, кроме г).

Использование доминирующих стратегий обеспечивает рациональное и очень простое решение игры, поскольку если имеются доминируемые стратегии, то рациональный игрок не будет их использовать, так как они заведомо не выгодны для него по сравнению с доминирующими, как бы ни поступали другие игроки. Такой подход называется принципом исключения доминируемых стратегий.

Применение этого принципа можно начать с любой пары стратегий любого из игроков. При исключении сильно доминируемых стратегий результаты его использования не зависят от порядка исключения. При исключении слабо доминируемых стратегий некоторые возможные решения игры могут быть потеряны.

Если у игрока есть стратегия, доминирующая все остальные его стратегии, ему не нужно строить никаких догадок («что, если???») и вообще знать о платежах остальных игроков. Если хотя бы у одного из игроков имеется такая стратегия, его поведение можно считать известным, что позволяет исключить его из числа игроков и тем самым упростить игру. В этом случае говорят, что игра имеет решение в доминирующих (доминатных) стратегиях, или, что-то же самое, в игре существует равновесие в доминирующих (доминатных) стратегиях.

Если в результате последовательного исключения доминируемых стратегий можно получить решение игры, такая игра называется разрешимой по доминированию. Игра «Борьба за рынки» (см. параграф 1.4) нс имеет равновесия в доминирующих стратегиях, но решается в чистых стратегиях с использованием принципа исключения доминируемых стратегий (является разрешимой по доминированию).

Пример 3.2. В небольшом курортном городке работают всего два магазина, торгующих прохладительными напитками, и они могут устанавливать цену на свой товар в размере 20,40 или 50 руб. В городке проживают 4000 коренных жителей, употребляющих данный продукт. Они посещают магазин с наименьшей ценой, а при равенстве цен равномерно «распределяются» между магазинами. 6000 туристов, приезжающих в городок и приобретающих данный товар, выбирают магазин случайным образом (равновероятно). Таким образом, если оба магазина установят цену 20 руб., каждый получит по 5000 клиентов. Если первый магазин установит цену 40 руб., а второй 50 долл., то первый будет иметь 3000 + 4000 = 7000 клиентов, тогда как второй — только 3000. Эта игра представлена в следующем виде (платежи указаны в тысячах рублей):

Магазин 2.

20 руб.

40 руб.

50 руб.

Магазин 1.

20 руб.

100; 100.

140; 120.

140; 150.

40 руб.

120; 140.

200; 200.

280; 150.

50 руб.

150; 140.

150; 280.

250; 250.

Очевидно, что стратегия «20 руб.» для каждого игрока является доминируемой (она доминируется любой другой стратегией), поэтому может быть исключена из дальнейшего анализа, что сокращает игровое пространство (стратегический спектр решений игроков):

Магазин 2.

40 руб.

50 руб.

Магазин 1.

40 руб.

200; 200.

280; 150.

50 руб.

150; 280.

250; 250.

Сравнение платежей игроков при стратегиях «40 руб.» и «50 руб.» показывает, что у каждого игрока стратегия «50 руб.» является доминируемой и может быть исключена:

40 руб.

40 руб.

200; 200.

Таким образом, получено решение игры: оптимальной стратегией каждого игрока является стратегия «40 руб.», которая обеспечивает каждому игроку платеж в 200 тыс. руб. Обратите внимание, что результат нс зависит от порядка нахождения и исключения доминируемых стратегий, т. е. неважно, у какого игрока и какую доминируемую стратегию исключать вначале. Исключенная стратегия при дальнейшем анализе не учитывается.

Из принципа исключения доминируемых стратегий следует, что ни одна сильно доминируемая чистая стратегия игрока не содержится в его смешанной стратегии, т. е. вероятность ее применения нулевая. Подчеркнем, что данный принцип и следствия из него полностью построены на постулате о рациональности игроков и принципе общего знания.

Пример 3.3. Этот реальный пример, подтверждающий обоснованность применения принципа исключения доминируемых стратегий, получил впоследствии название «Море Бисмарка». В 1943 г. японский адмирал Имамура получил приказ провести конвой по морю Бисмарка к Новой Гвинее. Американский адмирал Кенни должен был этому воспрепятствовать. Имамура должен был выбрать, каким маршрутом направлять конвой (северным или южным), а Кении куда направить самолеты для бомбардировки этого конвоя. Северный маршрут занимает 2 дня, а южный — 3 дня. В течение одного дня самолеты могли бомбить лишь на одном из двух направлений. Ситуация может быть смоделирована следующей игрой, в которой платежи соответствуют числу дней, когда возможна бомбежка конвоя:

Адмирал Имамура.

Север

Юг.

Адмирал Кенни.

Север

(2; -2).

(2: -2).

Юг.

(1;-1).

(3; -3).

В этой игре Имамура имеет слабо доминирующую стратегию (Север), и тогда Кенни также имеет доминирующую стратегию (Север). В действительности так и случилось: ВВС США разбомбили в марте 1943 г. корабли Японии, выбравшие северный путь (из 7000 членов экипажа до Новой Гвинеи добрались 1000) [17].

Рациональность решения, основанного на принципе исключения доминируемых стратегий, кажется вполне обоснованной, однако возможны ситуации, когда такое решение не столь очевидно [4]. Рассмотрим следующую игру:

(100; 100).

(0; 100).

(100; 0).

(0; 0).

В этой игре у каждого из игроков есть слабо доминируемая стратегия, точнее — оба игрока имеют равноценные стратегии, поэтому с точки зрения принципа исключения доминируемых стратегий им все равно, какую из них выбирать. Однако каждый из игроков в зависимости от выбора другого может получить платеж либо 0, либо 100. Поэтому в данной игре, если рассматривать ее как статическую, дополнительным критерием принятия решения будет предположение о том, что каждый игрок, стремясь к лучшему платежу для себя, вынужденно должен будет обеспечить лучший платеж другому, и поэтому каждый будет исключать свою вторую стратегию. Эта игра представляет собой случай вынужденного кооперирования.

Игра.

(1001;0).

(i;i).

(1000;1000).

(0; 0).

представляет собой пример игры с сильным доминированием, но дающим относительно небольшой выигрыш в платежах. Мы видим, что вторая стратегия первого игрока сильно доминируема и может быть исключена. В результате оптимальное решение дает каждому из игроков платеж, равный единице. Но даже в условиях статической игры, если игроки, сочтя выигрыш в одну единицу незначительным, прибегнут к своим неоптимальным стратегиям, то они получат по 1000.

В игре.

(20; 10).

(15; 20).

(-1000; 20).

(40; 30).

первая стратегия второго игрока доминируется его второй стратегией. Но проигрыш первого игрока при выборе им второй стратегии и выборе первой стратегии вторым игроком слишком велик, поэтому можно допустить, что первый игрок не выберет свою вторую стратегию, предполагая случайную ошибку второго игрока.

Принцип исключения доминируемых стратегий, безусловно, является полезным аналитическим инструментом. Но даже при наличии доминирования (что встречается в играх нечасто) он не может рассматриваться как универсальный принцип принятия оптимальных решений, и к анализу должны привлекаться дополнительные факторы и возможности. Этот вывод показывает, что даже такой простой принцип теории игр, как исключение доминируемых стратегий, не только предлагает вариант оптимального решения в определенной ситуации, но и некоторым образом подсказывает пути поиска лучшего (более оптимального) решения.

Равновесия в доминирующих стратегиях являются устойчивыми. Это означает, что «разыгрывание» игры (ее многократное повторение) начиная с любой ситуации приведет к данной ситуации равновесия, отклонение от которой невыгодно. Например, ситуацию устойчивого равновесия мы обнаруживаем в игре «Ценовая война», уже упомянутой нами в гл. 1 (см. пример 1.5):

Постулаты и принципы.

В игровом взаимодействии может также существовать оптимум по Парето, или оптимум Парето (назван в честь В. Парето (1848—1923) — итальянского экономиста и социолога, предложившего математическое обоснование концепции взаимозависимости экономических факторов).

Эта ситуация определяется следующим образом. Стратегическая ситуация s* доминирует по Парето ситуацию s, если: 1) для любого игрока из множества N его выигрыш в ситуации 5 не больше, чем в ситуации .у*, и 2) есть хотя бы один игрок, для которого его выигрыш в ситуации s* строго больше, чем в ситуации s, т. е.

Постулаты и принципы.

Ситуация s* называется оптимальной (эффективной) по Парето, если она не доминируема никакой другой ситуацией [25]. Таким образом, оптимум по Парето существует при условии, что нельзя улучшить результат всех игроков одновременно (точнее — хотя бы для одного игрока улучшить, а для всех остальных по крайней мере не ухудшить), отклонившись от этой ситуации.

Другими словами, принцип Парето утверждает, что если для ситуации s существует такая ситуация 5*, что выигрыш каждого из игроков при реализации s* не меньше, чем при реализации ситуации s, и по крайней мере один игрок получает выигрыш строго больший, то игроки предпочтут ситуацию s* ситуации s. Еще в одной формулировке, ситуация s* называется оптимальной по Парето, если для любой ситуации s ^ s* найдется игрок г, для котоporo t/(.v) < Ut(s*). Стратегии (решения), выводящие игроков в оптимум Парето, также называют эффективными по Парето.

Принцип Парето в некотором смысле противоположен равновесию в доминирующих стратегиях. В то время как равновесие в доминирующих стратегиях отражает «эгоистическое» поведение игроков, оптимум Парето отражает «кооперативное» поведение, т. е. их сотрудничество. Действительно, если есть ситуация, которая приносит всем игрокам не меньший выигрыш, чем существующая, почему бы им не реализовать более выигрышную для всех ситуацию? Но для этого необходимы объединенные усилия всех игроков, что не всегда достижимо мри заданных условиях. Например, кооперативная ситуация «высокие цены — высокие цены» в игре «Ценовая война» является оптимальной (эффективной) по Парето, но игроки не могут ее достигнуть при данных правилах игры. Этот пример показывает, что стремление к «общему благу» может вступать в противоречие с индивидуальными интересами (см. далее игру «Трагедия общин»). Неустойчивость оптимальной по Парето ситуации приводит к вопросу о возможности расширения рассматриваемой игровой модели, например о том, можно ли включить в модель возможность заключения договора, который бы в том числе предусматривал определенные санкции за его невыполнение.

Если существует временной лаг в принятии решений игроками и один из них принимает решение, уже зная, как поступил другой (вариант динамической игры), оптимальное решение отыскивается исходя из принципа равновесия Штакельберга, которое соответствует максимальному выигрышу игроков исходя из условий, сложившихся после уже сделанного выбора одним или нескольким игроками (подробнее это равновесие рассматривается в параграфе 5.3).

Более общим критерием оптимального решения игры является равновесие Нэша (Nash equilibrium), названное в честь Дж. Нэша, который разработал соответствующие принципы и методы его нахождения. Равновесие Нэша предполагает такую ситуацию в игре (такой профиль стратегий), при которой ни одному из игроков не выгодно сепаратно (в одностороннем порядке, когда другие участники не меняют решения) отходить от выбранной стратегии. Это ситуация, в которой ни один из игроков не может увеличить свой платеж за счет только собственных действий. Равновесие Нэша и его модификации признаются наиболее подходящими концепциями решения некооперативных игр, хотя этот критерий применим (но крайней мере частично) и в теории кооперативных игр (определение кооперативных и некооперативных игр см. в параграфе 3.4).

Равновесие Нэша — это профиль стратегий (один и тот же для всех игроков), при котором стратегия каждого игрока обеспечивает ему наилучший отклик (best, response) на стратегии других игроков, т. е. обеспечивает максимальный платеж при стратегиях всех остальных игроков. Таким образом, в равновесии Нэша ни у одного из игроков нет стимула в одностороннем порядке изменять свою стратегию. Эта концепция основана на предположении максимизации выигрыша, к которой стремится каждый игрок, и на рациональном ожидании (представлении) каждого игрока относительно поведения других игроков.

Логические основания этой концепции решения игры можно объяснить следующим образом. В силу гипотезы рационального поведения каждый игрок стремится выбрать наилучшие для него действия при заданной обстановке, а обстановку эту определяют в том числе и другие игроки, рассуждающие подобным образом. Очевидно, что для реализации такого равновесия требуется информированность каждого игрока не только о допустимых стратегиях и платежных функциях всех игроков, но и информированность всех игроков о взаимной информированности (т.е. для того чтобы предположения о рациональном поведении оправдывались, необходимо выполнение постулата общего знания).

Постулат рационального нахождения решения игры означает, что каждый игрок i формирует предположение о действиях остальных игроков s*i и выбирает в качестве своей стратегии s* наилучший ответ на эти предполагаемые действия. Постулаты рациональности и общего знания делают возможным (по крайней мере гипотетически) совпадение .v*; с действительным выбором другими игроками своих стратегий. Таким образом, игрок i выбирает s*, потому что это наилучший отклик на стратегии s*t других игроков, которые являются наилучшим откликом на стратегию s*.

Математически равновесие Нэша можно определить следующим образом. Ситуация .v* в игре называется равновесием Нэша, если для любого игрока i и любой его стратегии е Si выполняется неравенство U:(s*) > s*-), т. е. Uj (s*, s*j) > i/.(s.,, v*(). Стратегия s* является наилучшим откликом на s*( для игрока i. В такой ситуации у игроков нет причин сепаратно отклоняться от своих оптимальных стратегий.

Проиллюстрируем концепцию равновесия Нэша на рассмотренном ранее примере игры «Ценовая война». Стратегия «низкой цены» является доминантной для любой фирмы: вне зависимости от того, какую цену выбирает конкурент, ей самой всегда предпочтительнее устанавливать низкую цену. Стратегическая комбинация «низкие цены — низкие цены» с соответствующими платежами представляет собой равновесие Нэша, при котором ни одному из игроков не выгодно сепаратно отходить от выбранной стратегии. Подобная концепция равновесия является принципиальной при разрешении стратегических ситуаций, но при определенных обстоятельствах она все же требует усовершенствования. Очевидно, что равновесие в доминирующих стратегиях и равновесие в осторожных стратегиях являются частными случаями равновесия Нэша.

Критерий оптимальности, называемый сейчас равновесием Нэша, был известен и ранее. Так, А. Курно использовал подобный принцип равновесия в своей модели дуополистического рынка. Поэтому некоторые авторы называют этот принцип равновесием Нэша — Курно. Дж. фон Нейман и О. Моргенштерн доказали существование равновесной ситуации для игр двух лиц с нулевой суммой. Соответственно, при анализе таких ситуаций говорят о равновесии Нэша — фон Неймана. Однако Нэш первым показал, что такие равновесия должны существовать для всех конечных бескоалиционных игр с любым числом игроков.

Строго говоря, равновесие Нэша является основным принципом оптимальности стратегий для некооперативною взаимодействия п игроков, принимающих решения одновременно, однократно и независимо, не имея возможности договариваться о выбираемых действиях и перераспределять получаемые платежи. К настоящему времени разработана целая группа принципов, основанных на равновесии Нэша и называемых очищениями равновесия Нэша (Nash equilibrium refinements). Так, для некооперативных игр в развернутой форме используются принципы оптимальности, основанные на равновесии Нэша, но учитывающие специфику динамического взаимодействия игроков. К основным из них относятся равновесие, совершенное по подыграм; секвенциальное равновесие; сильное секвенциальное равновесие. В играх с неполной информацией отыскивается равновесие Байеса — Нэша.

Использование такого принципа оптимальности, как равновесие Нэша, во многих случаях дает эффективные и рациональные решения. Но в игре может быть несколько равновесий. Возникает вопрос, как выбирать среди оптимальных решений «самое оптимальное», особенно если решения не равноценны для игроков. Если среди нескольких равновесий одно характеризуется свойствами оптимальности (эффективности) по Парето, игроки с большой вероятностью выберут его. Такие равновесия можно назвать «сильными равновесиями». Другим вариантом сильного равновесия является равновесие в доминирующих стратегиях.

Однако в некооперативных играх игроки должны независимо друг от друга выбрать стратегии, выводящие их в одну из ситуаций равновесия. Даже в довольно простых ситуациях, когда одно из решений дает лучший результат для обоих игроков (эффективно по Парето), нет полной гарантии того, что игроки в условиях, исключающих переговоры, смогут выйти на соответствующее равновесие. Например, в игре.

Постулаты и принципы.

первое равновесие (когда оба получают платеж, равный 3), более предпочтительно для обоих игроков, чем другое равновесие (при котором они получают 2). Однако игроки могут рассуждать так: «Если я выберу первую стратегию в расчете на сообразительность второго, а тот выберет вторую стратегию, то я получу только 0. Поэтому я выберу вторую стратегию, чтобы гарантированно получить 1» [4].

Но даже в случае, если равновесие единственно, необязательно, что реальные игроки его выберут. Например, в игре.

Постулаты и принципы.

есть единственная ситуация равновесия в чистых стратегиях (выделена полужирным шрифтом). Но чтобы выбрать свою третью стратегию, второй игрок должен быть уверен в рациональности первого игрока, который должен использовать свою вторую стратегию, иначе риск слишком велик, тем более что для первого игрока в этой ситуации действительно все равно, какую стратегию выбрать. Поэтому для второго игрока более надежной является вторая стратегия.

На примере игры «Ценовая война» мы уже видели, что иногда равновесие обеспечивает нелучший результат, т. е. рациональное поведение может привести к плохому (по не самому худшему) исходу для всех. Однако не следует считать, что равновесие Нэша всегда обеспечивает малоэффективные решения. Мы привели примеры неэффективности, которые всего лишь свидетельствуют об ограничениях метода, но не о его неспособности в нахождении решений. Использование принципа равновесия Нэша требует понимания того, когда предположения, на которых он основан, оправданны, а когда нет. Существуют возможности уходить от подобных неудачных равновесных решений, например за счет введения динамики ситуации, возможностей обучения игроков и т. д., что позволяет находить равновесные решения, являющиеся одновременно и наиболее эффективными.

Итак, мы рассмотрели четыре основных принципа, определяющих оптимальное и эффективные решения: равновесие в доминирующих стратегиях, оптимум Парето, равновесие Нэша и равновесие Штакельберга. Далеко не в каждой игре могут присутствовать и быть обнаружены все эти равновесия или хотя бы одно из них. Покажем на простом примере прототинной игры «Борьба за рынки» возможность существования равновесий разных видов.

Пример 3.4. Пусть фирма, А стремится нарушить монополию фирмы Б на выпуск определенного продукта и решает, стоит ли ей выходить на рынок, а фирма Б решает, стоит ли ей уменьшать объем производства продукта в том случае, если, А решает входить (подобная ситуация также называется игрой Штакельберга). В случае неизменного объема производства фирмой Б обе фирмы оказываются в проигрыше, а в случае снижения фирма Б делит рынок с А. Таким образом, имеем следующую игру с условными платежами:[1]

Б.

Прежний объем.

Снижение объема.

А.

Входить на рынок.

(-3; -2).

(4; 4).

Не входить.

(0; 10).

(0; 10).

  • [1] фирмы, А нет доминирующей стратегии, а у фирмы Б есть (стратегия «снижение объема» слабо доминирует стратегию «прежний объем»), следовательно, равновесие в доминирующих стратегиях отсутствует. Но стратегия «прежнийобъем» является «неправдоподобной угрозой», поэтому для фирмы, А оптимальным решением является «входить на рынок». В данной игре два равновесия Нэша в чистых стратегиях: «не входить на рынок — прежний объем» и «входить на рынок — снижение объема». Ни один изигроков не заинтересован в отклонении от своей стратегии в этих ситуациях. Оптимум по Парето определяется перебором всех четырех исходов и проверкой, обеспечивает ли переход к любой другой ситуации увеличение платежей одновременно обоих игроков (или хотя бы увеличение платежа одного изигроков без уменьшения платежа другого). Множество Парето-оптимальиыхрешений в данной игре определяется тремя стратегическими ситуациями, среди которых две — ранее найденные равновесия, а третья определяется стратегиями «не входить на рынок — снижение объема», но она не является равновесной. Предположим, что фирма, А делает первый ход и входит на рынок, в этомслучае компания Б выбирает стратегию «снижение объема» и, А получает 4, а если не входит, то в любом случае получает 0. Поскольку 4 > 0, равновесие Штакельберга находится в ситуации «входить на рынок — снижение объема». Еслипервый ход делает Б, то равновесие Штакельберга находится в ситуации «нсвходить на рынок — прежний объем».
Показать весь текст
Заполнить форму текущей работой