ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 31.07.2021
Просмотров: 704
Скачиваний: 2
71
Определение
5.
Ситуация
в
игре
,
приемлемая
для
всех
игроков
,
называется
ситуацией
равновесия
по
Нэшу
(
равновесной
ситуацией
).
Иными
словами
,
ситуация
х
называется
равновесной
,
если
для
любого
игрока
і
N
выполняется
условие
(5.1).
Из
определения
видно
,
что
ни
один
из
игроков
не
заинтересован
в
отклонении
от
своей
стратегии
,
образующих
в
совокупности
ситуацию
равновесия
.
В
случае
антагонистической
игры
приемлемые
стратегии
игроков
совпадают
с
их
оптимальными
стратегиями
.
Для
неантагонистических
игр
понятие
оптимальной
стратегии
может
вообще
не
иметь
смысла
:
в
таких
играх
оптимальными
оказываются
не
стратегии
отдельных
игроков
,
а
их
сочетания
для
всех
игроков
сразу
.
В
бескоалиционных
играх
как
оптимальные
следует
квалифицировать
не
действия
того
или
иного
игрока
,
а
совокупность
действий
всех
игроков
.
Поэтому
в
бескоалиционной
игре
решение
игры
–
это
чаще
,
нахождение
ситуаций
равновесия
.
Пример
1.
Игра
“
Семейный
спор
”
Одна
из
наиболее
распространенных
интерпретаций
игры
следующая
.
Муж
(
первый
игрок
)
и
жена
(
второй
игрок
)
могут
выбрать
одно
из
двух
вечерних
развлечений
:
футбольный
матч
или
балет
.
Естественно
предположить
,
что
муж
предпочтет
футбол
,
а
жена
–
балет
.
Однако
для
обоих
гораздо
важнее
идти
вместе
,
чем
смотреть
предпочитаемое
зрелище
в
одиночестве
.
В
данной
2
х
2
биматричной
игре
функции
выигрышей
Н
1
и
Н
2
соответственного
первого
и
второго
игроков
можно
представить
в
виде
1
0
0
2
1
H
и
2
0
0
1
2
H
,
где
стратегии
игрока
1:
А
1
–
выбираю
футбол
;
А
2
–
иду
на
балет
;
игрока
2:
В
1
–
иду
на
футбол
,
В
2
–
на
балет
.
Очевидно
,
что
для
первого
игрока
предпочтительнее
ситуация
(
А
1
,
В
1
),
а
для
второго
(
А
2
,
В
2
),
и
эти
ситуации
являются
равновесными
.
Однако
в
данном
примере
как
будет
показано
ниже
,
есть
еще
и
третья
ситуация
равновесия
,
состоящая
в
выборе
игроками
смешанных
стратегий
:
3
1
;
3
2
A
S
;
3
2
;
3
1
B
S
с
ценой
игры
для
обоих
игроков
3
2
.
Однако
выигрыши
каждого
из
игроков
в
этой
ситуации
равновесия
меньше
,
чем
в
двух
первых
ситуациях
равновесия
,
где
они
равны
2
или
1,
в
зависимости
от
ситуации
и
игрока
.
Хотя
стратегии
(
А
1
,
В
1
)
и
(
А
2
,
В
2
)
являются
оптимальными
,
поскольку
дают
максимальные
выигрыши
,
однако
приносят
игрокам
не
одинаковые
выигрыши
,
поэтому
не
являются
справедливыми
.
Отметим
также
,
что
если
в
матричной
игре
ни
одному
из
игроков
не
выгодно
информировать
противника
о
своей
стратегии
,
то
в
данной
биматричной
игре
это
свойство
не
выполняется
.
Действительно
,
если
игроки
не
общаются
до
игры
и
оба
обладают
твердыми
характерами
,
т
.
е
.
первый
игрок
выбирает
стратегию
А
1
,
а
второй
–
В
2
,
то
в
результате
они
оба
проигрывают
.
Аналогичная
ситуация
72
получиться
и
в
том
случае
,
когда
каждый
из
игроков
имеет
мягкий
характер
и
решает
уступить
.
Так
сочетание
устойчивости
со
справедливостью
вступает
в
противоречие
с
сочетанием
устойчивости
и
выгодности
.
Лучшим
для
игроков
в
рассматриваемой
игре
является
договорный
вариант
(
А
1
,
В
1
)
или
(
А
2
,
В
2
),
причем
справедливым
решением
будет
их
выбор
одного
из
этих
вариантов
путем
бросания
монеты
.
Выпадение
герба
будет
означать
,
например
,
что
семейство
идет
на
матч
по
футболу
,
а
решки
–
на
балет
.
Заметим
,
что
в
антагонистической
игре
в
отличие
от
биматричной
нет
смысла
вести
переговоры
до
игры
и
уславливаться
о
совместном
плане
действий
.
В
рассматриваемой
игре
,
ясно
,
что
если
игроки
договорились
бы
играть
оба
,
скажем
первую
чистую
стратегию
,
причем
игрок
1
за
получение
большего
выигрыша
,
чем
игрок
2,
заплатил
бы
ему
1/2,
то
решение
было
бы
выгодным
и
справедливым
для
обоих
игроков
.
Однако
в
рамках
бескоалиционных
игр
такого
рода
дележи
не
предусматриваются
.
5.2.
Ситуации
,
оптимальные
по
Парето
Как
уже
отмечалось
,
формальное
понятие
оптимальности
призвано
отражать
различные
варианты
содержательных
представлений
об
устойчивости
,
выгодности
и
справедливости
.
Можно
считать
,
что
устойчивость
ситуации
проявляется
в
ее
равновесности
.
Другой
вариант
устойчивости
ситуации
в
большей
степени
,
чем
равновесность
,
отражающей
черты
ее
выгодности
,
состоит
в
ее
оптимальности
по
Парето
1
.
Определение
6.
Ситуация
х
0
в
бескоалиционной
игре
называется
оптимальной
по
Парето
,
если
не
существует
ситуации
х
,
для
которой
имеет
место
векторное
неравенство
)
(
)
(
0
x
H
x
H
i
i
,
для
всех
і
І
. (5.2)
Иными
словами
,
в
оптимальной
по
Парето
ситуации
игроки
не
могут
совместными
усилиями
увеличить
выигрыш
кого
-
либо
из
них
,
не
уменьшив
при
этом
выигрыш
кого
-
либо
другого
.
Подчеркнем
различие
ситуации
равновесия
от
ситуации
,
оптимальной
по
Парето
:
в
первой
ни
один
игрок
,
действуя
в
одиночку
,
не
может
увеличить
свой
собственный
выигрыш
;
во
второй
, –
все
игроки
,
действуя
совместно
,
не
могут
(
даже
нестрого
)
увеличить
выигрыш
каждого
.
Вопросы
об
оптимальных
по
Парето
ситуациях
решаются
в
принципе
проще
,
чем
аналогичные
вопросы
о
ситуациях
равновесия
(
оптимальных
по
Нэшу
).
Проиллюстрируем
графический
метод
определения
ситуаций
оптимальных
по
Парето
.
На
рис
. 5.1
изображено
множество
возможных
стратегий
х
1
,
х
2
двух
игроков
.
Каждой
точке
х
соответствует
точка
на
множестве
Н
значений
функций
выигрышей
Н
1
(
х
)
и
Н
2
(
х
) (
рис
. 5.2).
1
В
.
Парето
–
итальянский
экономист
.
73
Н
1
Н
1
(x
1
x
2
)
1
x
1
x
2
X
2
Н
2
(x
1
x
2
)
Н
2
x
Н
А
С
В
Рис
.
5.1.
Рис
. 5.2.
На
рис
. 5.2
дуга
АСВ
соответствует
множеству
ситуаций
оптимальных
по
Парето
,
так
как
никакими
совместными
усилиями
игроков
,
нельзя
увеличить
выигрыш
одного
из
них
,
не
уменьшив
при
этом
выигрыш
другого
.
Определение
7.
Игра
G
называется
аффинно
эквивалентной
игре
G
,
если
число
игроков
N
N
,
стратегии
одной
игры
i
i
X
X
,
N
i
(
отсюда
следует
,
что
игры
G
и
G
имеют
одно
и
то
же
множество
ситуаций
),
а
функции
выигрыша
N
i
c
x
H
k
x
H
i
i
i
i
,
)
(
)
(
,
где
0
i
k
,
N
i
.
Различие
между
двумя
аффинно
эквивалентными
играми
по
существу
состоит
в
различии
начальных
капиталов
игроков
и
в
соотношениях
единиц
измерения
выигрышей
,
определяемых
соответственно
величинами
C
i
и
k
i
.
Для
однородно
аффинно
эквивалентных
игр
k
i
=k
, i
N.
Очевидно
,
что
для
антагонистических
игр
понятия
аффинной
эквивалентности
и
однородной
аффинной
эквивалентности
совпадают
.
Теорема
1.
Всякая
бескоалиционная
игра
с
постоянной
суммой
аффинно
эквивалентна
некоторой
игре
с
нулевой
суммой
.
Теорема
2.
Аффинно
эквивалентные
игры
имеют
одни
и
те
же
оптимальные
по
Парето
ситуации
.
Рассмотрим
пример
для
нахождения
ситуации
оптимальной
по
Парето
.
Пример
2.
Игра
“
Дилемма
заключенного
”
Каждый
из
двух
игроков
располагает
двумя
стратегиями
:
А
2
и
В
2
–
стратегии
агрессивного
поведения
,
а
А
1
и
В
1
–
миролюбивое
поведение
.
Предположим
,
что
“
мир
” (
оба
игрока
миролюбивы
)
лучше
для
обоих
игроков
,
чем
“
война
”.
Случай
,
когда
один
игрок
агрессивный
,
а
другой
миролюбивый
,
выгоднее
агрессору
.
Пусть
матрицы
выигрышей
игроков
1
и
2
в
данной
биматричной
игре
имеют
вид
1
3
0
2
2
1
1
2
1
A
A
H
B
B
,
1
0
3
2
2
1
2
2
1
A
A
H
B
B
.
Для
обоих
игроков
агрессивные
стратегии
А
2
и
В
2
доминируют
мирные
стратегии
А
1
и
В
1
.
Таким
образом
,
единственное
равновесие
в
доминирующих
стратегиях
имеет
вид
(
А
2
,
В
2
),
т
.
е
.
постулируется
,
что
74
результатом
некооперативного
поведения
является
война
.
В
то
же
время
исход
(
А
1
,
В
1
) (
мир
)
дает
больший
выигрыш
для
обоих
игроков
.
Таким
образом
,
некооперативное
эгоистическое
поведение
вступает
в
противоречие
с
коллективными
интересами
.
Коллективные
интересы
диктуют
выбор
мирных
стратегий
.
В
то
же
время
,
если
игроки
не
обмениваются
информацией
,
война
является
наиболее
вероятным
исходом
.
В
данном
случае
ситуация
(
А
1
,
В
1
)
является
оптимальной
по
Парето
.
Однако
эта
ситуация
неустойчива
,
что
ведет
к
возможности
нарушения
игроками
установленного
соглашения
.
Действительно
,
если
первый
игрок
нарушит
соглашение
,
а
второй
не
нарушит
,
то
выигрыш
первого
игрока
увеличится
до
трех
,
а
второго
упадет
до
нуля
и
,
наоборот
.
Причем
,
каждый
игрок
,
не
нарушающий
соглашение
,
теряет
больше
при
нарушении
соглашения
вторым
игроком
,
нежели
в
том
случае
,
когда
они
оба
нарушают
соглашение
.
Как
видим
,
в
отличие
от
примера
1 (
игра
“
семейный
спор
”),
где
кооперация
игроков
была
им
выгодна
,
в
этом
примере
кооперация
не
выгодна
для
игроков
.
5.3.
Состояние
равновесия
по
Нэшу
Определение
8.
Стратегии
i
x
*
,
N
i
,
1
в
игре
N
лиц
с
ненулевой
суммой
называются
оптимальными
по
Нэшу
(
решением
по
Нэшу
или
точкой
равновесия
по
Нэшу
),
если
для
каждого
N
i
,
1
)
(
max
)
(
*
x
H
x
H
i
i
,
x
(5.3)
т
.
е
.
каждый
игрок
в
ситуации
х
*
получает
свой
наибольший
выигрыш
(
в
той
мере
,
в
какой
это
от
него
самого
зависит
).
В
рассмотренной
игре
“
семейный
спор
”
ситуации
(
А
1
,
В
1
)
и
(
А
2
,
В
2
)
являются
решением
по
Нэшу
,
а
в
игре
“
дилемма
заключенного
”
таковой
является
ситуация
(
А
2
,
В
2
).
В
случае
антагонистической
игры
равновесные
стратегии
игроков
совпадают
с
их
оптимальными
стратегиями
.
Для
неантагонистических
игр
понятие
оптимальной
стратегии
игрока
нередко
вообще
не
имеет
смысла
:
в
таких
играх
оптимальными
оказываются
не
стратегии
отдельных
игроков
,
а
их
сочетания
(
ситуации
)
и
притом
для
всех
игроков
сразу
.
Поэтому
в
общих
бескоалиционных
играх
оптимальными
следует
понимать
совокупность
действия
всех
игроков
(
ситуацию
в
игре
),
которая
и
является
решением
игры
.
Как
и
в
играх
двух
лиц
с
нулевой
суммой
,
игра
N
лиц
с
ненулевой
суммой
может
не
иметь
решение
по
Нэшу
в
чистых
стратегиях
.
Приведенное
выше
определение
7
решения
по
Нэшу
в
чистых
стратегиях
легко
обобщается
на
случай
смешанных
стратегий
путем
подстановки
смешанных
стратегий
I
i
x
x
x
X
N
i
i
i
i
,
1
,
,...
,
2
1
,
представляющих
собой
вероятностное
распределение
на
множестве
чистых
стратегий
.
Таким
образом
мы
приходим
к
вероятностному
распределению
Х
на
множестве
всех
ситуаций
.
Другими
словами
,
ситуация
игры
в
смешанных
стратегиях
реализует
различные
ситуации
в
чистых
стратегиях
с
некоторыми
вероятностями
.
Значение
функции
выигрыша
каждого
из
75
игроков
оказывается
случайной
величиной
.
В
качестве
значения
функции
выигрыша
принимается
математическое
ожидание
этой
случайной
величины
.
Дж
.
Нэшем
было
доказано
существование
ситуации
равновесия
для
любой
конечной
бескоалиционной
игры
.
Теорема
Нэша
.
В
каждой
бескоалиционной
игре
существует
хотя
бы
одна
ситуация
равновесия
в
классе
смешанных
стратегий
.
Если
,
кроме
того
,
функции
Н
i
(
х
)
выпуклые
вверх
,
то
решение
по
Нэшу
достигается
в
классе
чистых
стратегий
.
Заметим
,
что
принципиальная
важность
теоремы
Нэша
ограничивается
существованием
ситуации
равновесия
.
Непосредственно
применять
ее
для
нахождения
таких
ситуаций
не
удается
.
Дж
.
Нэшем
была
доказана
также
следующая
теорема
.
Теорема
2.
Конечная
бескоалиционная
игра
имеет
симметричные
ситуации
равновесия
,
в
которых
игроки
,
равноправно
входящие
в
игру
согласно
ее
условиям
,
фактически
оказываются
в
одинаковом
положении
.
Ее
применение
позволяет
избежать
отдельных
ошибок
при
решении
конечных
бескоалиционных
игр
.
Одним
из
простых
классов
бескоалиционных
игр
ход
решения
которых
поддается
элементарному
описанию
являются
биматричные
игры
,
представляющие
собой
бескоалиционную
игру
двух
игроков
с
ненулевой
суммой
.
5.4.
Описание
биматричных
игр
Пусть
в
биматричной
игре
игрок
1
имеет
m
чистых
А
і
,
і
,
1
m
,
а
игрок
2
имеет
n
чистых
стратегий
В
j
,
j
n
1
,
и
в
каждой
ситуации
(A
i
, B
j
)
игрок
1
получает
выигрыш
a
ij
,
а
игрок
2 –
выигрыш
b
ij
.
Значение
обеих
функций
выигрыша
игроков
естественно
представить
в
виде
пары
матриц
А
а
а
a
a
n
m
mn
11
1
1
...
....
...
....
...
,
В
b
b
b
b
n
m
mn
11
1
1
...
....
...
....
...
.
Поэтому
такие
игры
и
называются
биматричными
.
Используют
также
запись
платежных
матриц
А
и
В
в
следующем
виде
:
а
11
b
11
.........
a
1n
b
1n
........
.........
........
a
m1
b
m1
.........
a
mn
b
mn
где
“
северо
-
западное
”
число
в
каждой
клетке
обозначает
выигрыш
первого
игрока
,
а
“
юго
-
восточное
” –
выигрыш
второго
игрока
.
Смешанные
стратегии
X
и
Y,
естественно
,
понимаются
как
векторы
,
причем
,