Файл: Теория_игр_УП_ЭК_ЭлРесурс.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 31.07.2021

Просмотров: 704

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
background image

 

71

Определение

 5.

 

Ситуация

 

в

 

игре

приемлемая

 

для

 

всех

 

игроков

называется

 

ситуацией

 

равновесия

 

по

 

Нэшу

 (

равновесной

 

ситуацией

). 

Иными

 

словами

ситуация

 

х

 

называется

 

равновесной

если

 

для

 

любого

 

игрока

 

і

выполняется

 

условие

 (5.1). 

Из

 

определения

 

видно

что

 

ни

 

один

 

из

 

игроков

 

не

 

заинтересован

 

в

 

отклонении

 

от

 

своей

 

стратегии

образующих

 

в

 

совокупности

 

ситуацию

 

равновесия

В

 

случае

 

антагонистической

 

игры

 

приемлемые

 

стратегии

 

игроков

 

совпадают

 

с

 

их

 

оптимальными

 

стратегиями

Для

 

неантагонистических

 

игр

 

понятие

 

оптимальной

 

стратегии

 

может

 

вообще

 

не

 

иметь

 

смысла

в

 

таких

 

играх

 

оптимальными

 

оказываются

 

не

 

стратегии

 

отдельных

 

игроков

а

 

их

 

сочетания

 

для

 

всех

 

игроков

 

сразу

В

 

бескоалиционных

 

играх

 

как

 

оптимальные

 

следует

 

квалифицировать

 

не

 

действия

 

того

 

или

 

иного

 

игрока

а

 

совокупность

 

действий

 

всех

 

игроков

Поэтому

 

в

 

бескоалиционной

 

игре

 

решение

 

игры

 – 

это

 

чаще

нахождение

 

ситуаций

 

равновесия

Пример

 1. 

Игра

 “

Семейный

 

спор

” 

Одна

 

из

 

наиболее

 

распространенных

 

интерпретаций

 

игры

 

следующая

Муж

  (

первый

 

игрок

и

 

жена

  (

второй

 

игрок

могут

 

выбрать

 

одно

 

из

 

двух

 

вечерних

 

развлечений

футбольный

 

матч

 

или

 

балет

Естественно

 

предположить

что

 

муж

 

предпочтет

 

футбол

а

 

жена

 – 

балет

Однако

 

для

 

обоих

 

гораздо

 

важнее

 

идти

 

вместе

чем

 

смотреть

 

предпочитаемое

 

зрелище

 

в

 

одиночестве

В

 

данной

 2

х

биматричной

 

игре

 

функции

 

выигрышей

 

Н

1

 

и

 

Н

2

 

соответственного

 

первого

 

и

 

второго

 

игроков

 

можно

 

представить

 

в

 

виде

 

1

0

0

2

1

H

   

и

 

2

0

0

1

2

H

где

 

стратегии

 

игрока

 1: 

А

1

 – 

выбираю

 

футбол

А

2

 – 

иду

 

на

 

балет

игрока

 2: 

В

1

 – 

иду

 

на

 

футбол

В

2

 – 

на

 

балет

Очевидно

что

 

для

 

первого

 

игрока

 

предпочтительнее

 

ситуация

  (

А

1

В

1

), 

а

 

для

 

второго

 (

А

2

В

2

), 

и

 

эти

 

ситуации

 

являются

 

равновесными

Однако

 

в

 

данном

 

примере

 

как

 

будет

 

показано

 

ниже

есть

 

еще

 

и

 

третья

 

ситуация

 

равновесия

состоящая

 

в

 

выборе

 

игроками

 

смешанных

 

стратегий

3

1

;

3

2

A

S

3

2

;

3

1

B

S

 

с

 

ценой

 

игры

 

для

 

обоих

 

игроков

 

3

2

Однако

 

выигрыши

 

каждого

 

из

 

игроков

 

в

 

этой

 

ситуации

 

равновесия

 

меньше

чем

 

в

 

двух

 

первых

 

ситуациях

 

равновесия

где

 

они

 

равны

 2 

или

 1, 

в

 

зависимости

 

от

 

ситуации

 

и

 

игрока

Хотя

 

стратегии

  (

А

1

,

В

1

и

  (

А

2

,

В

2

являются

 

оптимальными

поскольку

 

дают

 

максимальные

 

выигрыши

однако

 

приносят

 

игрокам

 

не

 

одинаковые

 

выигрыши

поэтому

 

не

 

являются

 

справедливыми

.  

Отметим

 

также

что

 

если

 

в

 

матричной

 

игре

 

ни

 

одному

 

из

 

игроков

 

не

 

выгодно

 

информировать

 

противника

 

о

 

своей

 

стратегии

то

 

в

 

данной

 

биматричной

 

игре

 

это

 

свойство

 

не

 

выполняется

Действительно

если

 

игроки

 

не

 

общаются

 

до

 

игры

 

и

 

оба

 

обладают

 

твердыми

 

характерами

т

.

е

первый

 

игрок

 

выбирает

 

стратегию

 

А

1

а

 

второй

 

– 

В

2

то

 

в

 

результате

 

они

 

оба

 

проигрывают

Аналогичная

 

ситуация

 


background image

 

72

получиться

 

и

 

в

 

том

 

случае

когда

 

каждый

 

из

 

игроков

 

имеет

 

мягкий

 

характер

 

и

 

решает

 

уступить

.

 

Так

 

сочетание

 

устойчивости

 

со

 

справедливостью

 

вступает

 

в

 

противоречие

 

с

 

сочетанием

 

устойчивости

 

и

 

выгодности

Лучшим

 

для

 

игроков

 

в

 

рассматриваемой

 

игре

 

является

 

договорный

 

вариант

  (

А

1

,

В

1

или

  (

А

2

,

В

2

), 

причем

 

справедливым

 

решением

 

будет

 

их

 

выбор

 

одного

 

из

 

этих

 

вариантов

 

путем

 

бросания

 

монеты

Выпадение

 

герба

 

будет

 

означать

например

что

 

семейство

 

идет

 

на

 

матч

 

по

 

футболу

а

 

решки

 

– 

на

 

балет

Заметим

что

 

в

 

антагонистической

 

игре

 

в

 

отличие

 

от

 

биматричной

 

нет

 

смысла

 

вести

 

переговоры

 

до

 

игры

 

и

 

уславливаться

 

о

 

совместном

 

плане

 

действий

В

 

рассматриваемой

 

игре

ясно

что

 

если

 

игроки

 

договорились

 

бы

 

играть

 

оба

скажем

 

первую

 

чистую

 

стратегию

причем

 

игрок

 1 

за

 

получение

 

большего

 

выигрыша

чем

 

игрок

 2, 

заплатил

 

бы

 

ему

 1/2, 

то

 

решение

 

было

 

бы

 

выгодным

 

и

 

справедливым

 

для

 

обоих

 

игроков

Однако

 

в

 

рамках

 

бескоалиционных

 

игр

 

такого

 

рода

 

дележи

 

не

 

предусматриваются

5.2. 

Ситуации

оптимальные

 

по

 

Парето

 

Как

 

уже

 

отмечалось

формальное

 

понятие

 

оптимальности

 

призвано

 

отражать

 

различные

 

варианты

 

содержательных

 

представлений

 

об

 

устойчивости

выгодности

 

и

 

справедливости

Можно

 

считать

что

 

устойчивость

 

ситуации

 

проявляется

 

в

 

ее

 

равновесности

Другой

 

вариант

 

устойчивости

 

ситуации

 

в

 

большей

 

степени

чем

 

равновесность

отражающей

 

черты

 

ее

 

выгодности

состоит

 

в

 

ее

 

оптимальности

 

по

 

Парето

1

Определение

 6.

 

Ситуация

 

х

0

 

в

 

бескоалиционной

 

игре

 

называется

 

оптимальной

 

по

 

Парето

если

 

не

 

существует

 

ситуации

 

х



для

 

которой

 

имеет

 

место

 

векторное

 

неравенство

 

)

(

)

(

0

x

H

x

H

i

i

для

 

всех

  

і

І

. (5.2) 

Иными

 

словами

в

 

оптимальной

 

по

 

Парето

 

ситуации

 

игроки

 

не

 

могут

 

совместными

 

усилиями

 

увеличить

 

выигрыш

 

кого

-

либо

 

из

 

них

не

 

уменьшив

 

при

 

этом

 

выигрыш

 

кого

-

либо

 

другого

Подчеркнем

 

различие

 

ситуации

 

равновесия

 

от

 

ситуации

оптимальной

 

по

 

Парето

в

 

первой

 

ни

 

один

 

игрок

действуя

 

в

 

одиночку

не

 

может

 

увеличить

 

свой

 

собственный

 

выигрыш

во

 

второй

, – 

все

 

игроки

действуя

 

совместно

не

 

могут

 (

даже

 

нестрого

увеличить

 

выигрыш

 

каждого

Вопросы

 

об

 

оптимальных

 

по

 

Парето

 

ситуациях

 

решаются

 

в

 

принципе

 

проще

чем

 

аналогичные

 

вопросы

 

о

 

ситуациях

 

равновесия

  (

оптимальных

 

по

 

Нэшу

). 

Проиллюстрируем

 

графический

 

метод

 

определения

 

ситуаций

 

оптимальных

 

по

 

Парето

На

 

рис

. 5.1 

изображено

 

множество

 

возможных

 

стратегий

 

х

1

,

х

2

 

двух

 

игроков

Каждой

 

точке

 

х



 

соответствует

 

точка

 

на

 

множестве

 

Н

 

значений

 

функций

 

выигрышей

 

Н

1

(

х

и

 

Н

2

(

х

) (

рис

. 5.2). 

 

                                                 

1

 

В

.

Парето

 – 

итальянский

 

экономист


background image

 

73

Н

1

Н

1

(x

1

x

2

)

1

x

1

x

2

X

2

Н

2

(x

1

x

2

)

Н

2

x

Н

А

С

В

 

 

Рис

5.1.    

Рис

. 5.2. 

На

 

рис

. 5.2 

дуга

 

АСВ

 

соответствует

 

множеству

 

ситуаций

 

оптимальных

 

по

 

Парето

так

 

как

 

никакими

 

совместными

 

усилиями

 

игроков

нельзя

 

увеличить

 

выигрыш

 

одного

 

из

 

них

не

 

уменьшив

 

при

 

этом

 

выигрыш

 

другого

Определение

 7.

 

Игра

 

G

 

называется

 

аффинно

 

эквивалентной

 

игре

 

G

если

 

число

 

игроков

 

N

N

стратегии

 

одной

 

игры

 

i

i

X

X

N

i

  (

отсюда

 

следует

что

 

игры

 

G

 

и

 

G

 

имеют

 

одно

 

и

 

то

 

же

 

множество

 

ситуаций

), 

а

 

функции

 

выигрыша

 

N

i

c

x

H

k

x

H

i

i

i

i

,

)

(

)

(

,     

где

 

0

i

k

N

i

Различие

 

между

 

двумя

 

аффинно

 

эквивалентными

 

играми

 

по

 

существу

 

состоит

 

в

 

различии

 

начальных

 

капиталов

 

игроков

 

и

 

в

 

соотношениях

 

единиц

 

измерения

 

выигрышей

определяемых

 

соответственно

 

величинами

 

C

i

 

и

 

k

i

Для

 

однородно

 

аффинно

 

эквивалентных

 

игр

 

k

i

=k

, i

N. 

Очевидно

что

 

для

 

антагонистических

 

игр

 

понятия

 

аффинной

 

эквивалентности

 

и

 

однородной

 

аффинной

 

эквивалентности

 

совпадают

Теорема

 1.

 

Всякая

 

бескоалиционная

 

игра

 

с

 

постоянной

 

суммой

 

аффинно

 

эквивалентна

 

некоторой

 

игре

 

с

 

нулевой

 

суммой

Теорема

 2.

 

Аффинно

 

эквивалентные

 

игры

 

имеют

 

одни

 

и

 

те

 

же

 

оптимальные

 

по

 

Парето

 

ситуации

Рассмотрим

 

пример

 

для

 

нахождения

 

ситуации

 

оптимальной

 

по

 

Парето

Пример

 2. 

Игра

 “

Дилемма

 

заключенного

” 

Каждый

 

из

 

двух

 

игроков

 

располагает

 

двумя

 

стратегиями

А

2

 

и

 

В

2

 – 

стратегии

 

агрессивного

 

поведения

а

 

А

1

 

и

 

В

1

 – 

миролюбивое

 

поведение

Предположим

что

  “

мир

” (

оба

 

игрока

 

миролюбивы

лучше

 

для

 

обоих

 

игроков

чем

  “

война

”. 

Случай

когда

 

один

 

игрок

 

агрессивный

а

 

другой

 

миролюбивый

выгоднее

 

агрессору

Пусть

 

матрицы

 

выигрышей

 

игроков

 1 

и

 2 

в

 

данной

 

биматричной

 

игре

 

имеют

 

вид

 

1

3

0

2

2

1

1

2

1

A

A

H

B

B

,    

1

0

3

2

2

1

2

2

1

A

A

H

B

B

Для

 

обоих

 

игроков

 

агрессивные

 

стратегии

 

А

2

 

и

 

В

2

 

доминируют

 

мирные

 

стратегии

 

А

1

 

и

 

В

1

Таким

 

образом

единственное

 

равновесие

 

в

 

доминирующих

 

стратегиях

 

имеет

 

вид

  (

А

2

,

В

2

), 

т

.

е

постулируется

что

 


background image

 

74

результатом

 

некооперативного

 

поведения

 

является

 

война

В

 

то

 

же

 

время

 

исход

  (

А

1

,

В

1

) (

мир

дает

 

больший

 

выигрыш

 

для

 

обоих

 

игроков

Таким

 

образом

некооперативное

 

эгоистическое

 

поведение

 

вступает

 

в

 

противоречие

 

с

 

коллективными

 

интересами

Коллективные

 

интересы

 

диктуют

 

выбор

 

мирных

 

стратегий

В

 

то

 

же

 

время

если

 

игроки

 

не

 

обмениваются

 

информацией

война

 

является

 

наиболее

 

вероятным

 

исходом

В

 

данном

 

случае

 

ситуация

  (

А

1

В

1

является

 

оптимальной

 

по

 

Парето

Однако

 

эта

 

ситуация

 

неустойчива

что

 

ведет

 

к

 

возможности

 

нарушения

 

игроками

 

установленного

 

соглашения

Действительно

если

 

первый

 

игрок

 

нарушит

 

соглашение

а

 

второй

 

не

 

нарушит

то

 

выигрыш

 

первого

 

игрока

 

увеличится

 

до

 

трех

а

 

второго

 

упадет

 

до

 

нуля

 

и

наоборот

Причем

каждый

 

игрок

не

 

нарушающий

 

соглашение

теряет

 

больше

 

при

 

нарушении

 

соглашения

 

вторым

 

игроком

нежели

 

в

 

том

 

случае

когда

 

они

 

оба

 

нарушают

 

соглашение

Как

 

видим

в

 

отличие

 

от

 

примера

 1 (

игра

  “

семейный

 

спор

”), 

где

 

кооперация

 

игроков

 

была

 

им

 

выгодна

в

 

этом

 

примере

 

кооперация

 

не

 

выгодна

 

для

 

игроков

5.3. 

Состояние

 

равновесия

 

по

 

Нэшу

 

Определение

 8.

 

Стратегии

 

i

x

*

N

i

,

1

 

в

 

игре

 

N

 

лиц

 

с

 

ненулевой

 

суммой

 

называются

 

оптимальными

 

по

 

Нэшу

  (

решением

 

по

 

Нэшу

 

или

 

точкой

 

равновесия

 

по

 

Нэшу

), 

если

 

для

 

каждого

 

N

i

,

1

 

)

(

max

)

(

*

x

H

x

H

i

i

,

 x



(5.3)

 

т

.

е

каждый

 

игрок

 

в

 

ситуации

 

х

*

 

получает

 

свой

 

наибольший

 

выигрыш

 

(

в

 

той

 

мере

в

 

какой

 

это

 

от

 

него

 

самого

 

зависит

). 

В

 

рассмотренной

 

игре

  “

семейный

 

спор

” 

ситуации

  (

А

1

,

В

1

и

  (

А

2

,

В

2

являются

 

решением

 

по

 

Нэшу

а

 

в

 

игре

  “

дилемма

 

заключенного

” 

таковой

 

является

 

ситуация

 (

А

2

,

В

2

). 

В

 

случае

 

антагонистической

 

игры

 

равновесные

 

стратегии

 

игроков

 

совпадают

 

с

 

их

 

оптимальными

 

стратегиями

Для

 

неантагонистических

 

игр

 

понятие

 

оптимальной

 

стратегии

 

игрока

 

нередко

 

вообще

 

не

 

имеет

 

смысла

в

 

таких

 

играх

 

оптимальными

 

оказываются

 

не

 

стратегии

 

отдельных

 

игроков

а

 

их

 

сочетания

  (

ситуации

и

 

притом

 

для

 

всех

 

игроков

 

сразу

Поэтому

 

в

 

общих

 

бескоалиционных

 

играх

 

оптимальными

 

следует

 

понимать

 

совокупность

 

действия

 

всех

 

игроков

 (

ситуацию

 

в

 

игре

), 

которая

 

и

 

является

 

решением

 

игры

Как

 

и

 

в

 

играх

 

двух

 

лиц

 

с

 

нулевой

 

суммой

игра

 N 

лиц

 

с

 

ненулевой

 

суммой

 

может

 

не

 

иметь

 

решение

 

по

 

Нэшу

 

в

 

чистых

 

стратегиях

Приведенное

 

выше

 

определение

 7 

решения

 

по

 

Нэшу

 

в

 

чистых

 

стратегиях

 

легко

 

обобщается

 

на

 

случай

 

смешанных

 

стратегий

 

путем

 

подстановки

 

смешанных

 

стратегий

 

I

i

x

x

x

X

N

i

i

i

i

,

1

,

,...

,

2

1

представляющих

 

собой

 

вероятностное

 

распределение

 

на

 

множестве

 

чистых

 

стратегий

Таким

 

образом

 

мы

 

приходим

 

к

 

вероятностному

 

распределению

 

Х

 

на

 

множестве

 

всех

 

ситуаций

Другими

 

словами

ситуация

 

игры

 

в

 

смешанных

 

стратегиях

 

реализует

 

различные

 

ситуации

 

в

 

чистых

 

стратегиях

 

с

 

некоторыми

 

вероятностями

Значение

 

функции

 

выигрыша

 

каждого

 

из

 


background image

 

75

игроков

 

оказывается

 

случайной

 

величиной

В

 

качестве

 

значения

 

функции

 

выигрыша

 

принимается

 

математическое

 

ожидание

 

этой

 

случайной

 

величины

Дж

Нэшем

 

было

 

доказано

 

существование

 

ситуации

 

равновесия

 

для

 

любой

 

конечной

 

бескоалиционной

 

игры

Теорема

 

Нэша

.

 

В

 

каждой

 

бескоалиционной

 

игре

 

существует

 

хотя

 

бы

 

одна

 

ситуация

 

равновесия

 

в

 

классе

 

смешанных

 

стратегий

Если

кроме

 

того

функции

 

Н

i

(

х

)

 

выпуклые

 

вверх

то

 

решение

 

по

 

Нэшу

 

достигается

 

в

 

классе

 

чистых

 

стратегий

Заметим

что

 

принципиальная

 

важность

 

теоремы

 

Нэша

 

ограничивается

 

существованием

 

ситуации

 

равновесия

Непосредственно

 

применять

 

ее

 

для

 

нахождения

 

таких

 

ситуаций

 

не

 

удается

Дж

Нэшем

 

была

 

доказана

 

также

 

следующая

 

теорема

Теорема

 2.

 

Конечная

 

бескоалиционная

 

игра

 

имеет

 

симметричные

 

ситуации

 

равновесия

в

 

которых

 

игроки

равноправно

 

входящие

 

в

 

игру

 

согласно

 

ее

 

условиям

фактически

 

оказываются

 

в

 

одинаковом

 

положении

Ее

 

применение

 

позволяет

 

избежать

 

отдельных

 

ошибок

 

при

 

решении

 

конечных

 

бескоалиционных

 

игр

Одним

 

из

 

простых

 

классов

 

бескоалиционных

 

игр

 

ход

 

решения

 

которых

 

поддается

 

элементарному

 

описанию

 

являются

 

биматричные

 

игры

представляющие

 

собой

 

бескоалиционную

 

игру

 

двух

 

игроков

 

с

 

ненулевой

 

суммой

5.4. 

Описание

 

биматричных

 

игр

 

Пусть

 

в

 

биматричной

 

игре

 

игрок

 1 

имеет

 m 

чистых

 

А

і

і

,

1

m

а

 

игрок

 

имеет

 n 

чистых

 

стратегий

 

В

j

j

n

1

,

 

и

 

в

 

каждой

 

ситуации

 (A

i

, B

j

игрок

 1 

получает

 

выигрыш

 a

ij

а

 

игрок

 2 – 

выигрыш

 b

ij

Значение

 

обеих

 

функций

 

выигрыша

 

игроков

 

естественно

 

представить

 

в

 

виде

 

пары

 

матриц

 

А

а

а

a

a

n

m

mn

11

1

1

...

....

...

....

...

,

 

В

b

b

b

b

n

m

mn

11

1

1

...

....

...

....

...

.

 

Поэтому

 

такие

 

игры

 

и

 

называются

 

биматричными

Используют

 

также

 

запись

 

платежных

 

матриц

 

А

 

и

 

В

 

в

 

следующем

 

виде

а

11

 

        b

11

 

 

......... 

a

1n

 

        b

1n

 

 

........ 

 

......... 

 

........ 

a

m1

 

        b

m1

 

 

......... 

a

mn

 

        b

mn

 

где

  “

северо

-

западное

” 

число

 

в

 

каждой

 

клетке

 

обозначает

 

выигрыш

 

первого

 

игрока

а

 “

юго

-

восточное

” – 

выигрыш

 

второго

 

игрока

Смешанные

 

стратегии

 X 

и

 Y, 

естественно

понимаются

 

как

 

векторы

причем