Динамические игры с полной и неполной информацией

РефератПомощь в написанииУзнать стоимостьмоей работы

Метод обратной индукции, продемонстрированный на примере рис. 8.3, является общим методом решения конечных динамических игр с совершенной информацией, имеющих развернутую форму, который позволяет получить хотя бы одно решение такой игры. Если дополнительно предположить, что выигрыши игроков во всех конечных вершинах различны, то такое решение (полученное методом обратной индукции) будет… Читать ещё >

Динамические игры с полной и неполной информацией (реферат, курсовая, диплом, контрольная)

До сих пор мы рассматривали стратегические ситуации, в которых игроки должны были выбирать свои стратегии одновременно. Теперь добавим в анализ динамику, рассматривая стратегические ситуации, в которых игроки должны делать свой выбор последовательно. Если каждый игрок, делая ход, знает, какие ходы были сделаны до него, то такая динамическая игра называется игрой с полной (совершенной) информацией, в противном случае — игрой с неполной (несовершенной) информацией.

В качестве примера динамической игры с совершенной информацией рассмотрим хорошо известную игру, называемую «Вхождение фирмы на рынок»^[1].

В отрасли функционирует фирма-монополист (F2) и в эту отрасль пытается войти другая фирма (F1) и потеснить на рынке отрасли фирму-монополиста Fr.

Фирма F1 (игрок P1) имеет два варианта принятия решения о своих действиях: вступить (B) в отрасль или не вступать (HB) в отрасль. Фирма F2 (игрок P2) имеет два своих возможных хода: сохранить © объем выпускаемой продукции или сократить (CKP) объем выпускаемой продукции. Ходы фирмы делают поочередно: сначала ход делает фирма Fv потом ход делает фирма F2, и на этом игра заканчивается.

Если фирма F1 приняла решение вступить в отрасль, а фирма F2 приняла решение сохранить объем выпускаемой продукции, то, естественно, объем предложения в отрасли вырастет и цена на продукцию упадет. В этой ситуации весьма вероятно, что фирма-новичок F1 получит вообще отрицательную прибыль, а прибыль фирмы F2 останется положительной, но меньше максимальной (равной 14)^[2]. Итак, в этом случае расклад прибылей фирм F1 и F2 будет, например, таким (-3, 6).

Если фирма F1 приняла решение вступить в отрасль, а фирма F2 приняла решение сократить объем выпускаемой продукции, т. е. уступила часть (возможно половину) рынка фирме F1, то расклад прибылей фирм F1 и F2 будет (7, 7).

Если фирма F1 приняла решение не вступать в отрасль, а фирма F2 приняла решение сохранить объем выпускаемой продукции, то, естественно, фирма F1 в отрасли прибыли не получит, а у фирмы F2 будет максимальная монопольная прибыль, равная 14. Таким образом, описанная последовательность ходов HB-C приводит к следующему набору выигрышей игроков P1 и P2 соответственно (к набору прибылей фирм F1 и F2): (0,14).

Если фирма F1 приняла решение не вступать в отрасль, а фирма F2 приняла решение сократить объем выпускаемой продукции, то эта последовательность ходов HB-CKP приводит к следующему набору прибылей фирм F1 и F2: (0, 8). Отметим, что причин и поводов сокращения объема выпускаемой фирмой F2 продукции может быть достаточно много.

Изобразим динамическую игру в виде «дерева» игры (рис. 8.3).

В каждой вершине «дерева» (т.е. в овалах) на рис. 8.3 указан игрок, делающий ход из этой вершины (принимающий решение о своих действиях). В квадратах находятся номера вершин. Дуга изображает сам ход. Последовательность ходов (действий), которые выбирают игроки P1 и P2 в каждой из своих вершин, называется траекторией ходов (действий), т. е. траектория ходов начинается в начальной вершине и заканчивается в одной из конечных вершин. Траектория ходов, предпочитаемая остальным траекториям, называется решением динамической игры с совершенной информацией в предположении, что игроки ведут себя рационально.

Рис. 8.3. «Дерево» динамической игры «Вхождение фирмы на рынок» .

Решение игры в развернутой форме можно найти методом обратной индукции, суть которого в том, что игра анализируется с ее конца, т. е. с конечных вершин.

Если фирма F1 сделала ход (B), т. е. вступила в отрасль, то фирма F2 сделает ход (СДР), т. е. сократит объем выпускаемой продукции, ибо прибыль, равная 7, больше прибыли, равной 6. Здесь формально сравниваются вторые координаты векторов (-3; 6) и (7; 7), ибо анализируется фирма F2. Подчеркнем вектор (7; 7) на рис. 8.3.

Если фирма F1 сделала ход (FIB), т. е. решила не вступать в отрасль, то фирма F2 сделает ход ©, т. е. сохранит объем выпускаемой продукции, ибо 14 > 8. Здесь формально сравниваются вторые координаты векторов (0; 14) и (0; 8), ибо анализируется фирма F2. Подчеркнем вектор (0; 14) на рис. 8.3.

Переходим к определению первого хода фирмы Fv Для этого следует сравнить уже первые координаты двух подчеркнутых векторов (7; 7) и (0; 14). В связи с тем, что фирма F1 ведет себя рационально, она сделает ход (В), ибо 7 > 0.

Таким образом, в предположении, что оба игрока ведут себя рационально, метод обратной индукции состоит из двух этапов. Сначала сопоставляются прибыли фирмы F2 путем сравнения вторых координат двух пар векторов прибылей: пары (-3; 6) и (7; 7) и пары (0; 14) и (0; 8). В результате мы получаем из двух пар векторов одну пару (7; 7) и (0; 14), в которой сравниваем уже первые координаты 7 и 0. Решением рассматриваемой пары является траектория, состоящая из двух ходов: хода (В), который делает фирма F1 из вершины [1] и который приводит в единственную вершину '21; из вершины 121 фирма F2 затем делает ход (CXP), который приводит только в одну конечную вершину с вектором прибылей (7; 7). В результате таких ходов вектор прибылей фирм P1 и F2 (вектор выигрышей игроков P1 и P2) есть вектор (7; 7).

Любое решение динамической игры с совершенной информацией, полученное методом обратной индукции, есть равновесие по Нэшу (в чистых стратегиях).

Метод обратной индукции оказывается вполне безупречным, если его применять к играм с совершенной информацией. Однако он непосредственно не обобщается для других игр.

Важная особенность динамических игр с неполной информацией — наличие неизвестных вероятностей, с которыми игрок находится в той или иной вершине своего информационного множества, состоящего, естественно, более чем из одной вершины. Поэтому игрок должен делать предположения относительно того, с какой вероятностью он окажется в той или иной вершине своего информационного множества. Если у игрока есть такие предположения, то на их основе он выбирает стратегию, которая может обеспечить ему наибольший ожидаемый выигрыш.

[1] Черемных Ю. Н. Микроэкономика. Продвинутый уровень: учебник. М.: ИНФРА-М, 2008. С. 412−413.
[2] Здесь и далее цифры условные.
[3] Kuhn Н. Extensive Games and the Problem of Information. Annals Mathematical Studies of Princeton University Press. 1953. № 28.

Показать весь текст

Заполнить форму текущей работой

Другие работы

Формы территориальной организации производительных сил в рыночной экономике

Опыт показывает, что размещение группы предприятий различных видов экономической деятельности на компактной территории приводит к сокращению территории, необходимой для промышленного строительства, в среднем на 30% по сравнению с их рассредоточенным размещением, на 3% уменьшается сметная стоимость строительства, на 25% — количество зданий и сооружений. Экономия достигает 20% затрат на общие…

Реферат