ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 31.07.2021
Просмотров: 708
Скачиваний: 2
61
4.
БЕСКОНЕЧНЫЕ
АНТАГОНИСТИЧЕСКИЕ
ИГРЫ
4.1.
Общие
сведения
Если
множество
чистых
стратегий
хотя
бы
одного
из
игроков
бесконечно
,
то
игры
называются
бесконечными
.
Различие
между
конечными
и
бесконечными
антагонистическими
играми
приводит
к
необходимости
применять
для
исследования
бесконечных
игр
более
сложный
математический
аппарат
,
заменять
линейно
–
алгебраические
уравнения
функционально
–
аналитическими
,
интегральными
уравнениями
,
которые
в
благоприятных
случаях
сводятся
к
системам
дифференциальных
уравнений
.
Но
,
как
и
во
всякой
антагонистической
игре
,
в
бесконечной
антагонистической
игре
принципом
оптимального
поведения
игроков
остается
принцип
«
максимина
».
Обозначим
через
Х
и
У
–
произвольные
множества
,
элементы
которых
являются
соответственно
стратегиями
игроков
1
и
2,
а
через
Н
(
х
,
у
) –
функцию
выигрыша
игрока
1
в
ситуации
(
х
,
у
).
Далее
будем
считать
,
что
функция
Н
(
х
,
у
)
непрерывна
на
пространстве
ситуаций
Х
*Y
и
ограничена
.
Принцип
“
максимина
”
может
быть
реализован
тогда
и
только
тогда
,
когда
существуют
и
равны
смешанные
экстремумы
:
m a x i n f H ( x , y )
и
m i n
s u p
H ( x , y
).
x
X ; y
Y
y
Y ; x
X
Для
бесконечных
антагонистических
игр
,
в
отличие
от
конечных
,
существование
оптимальных
смешанных
стратегий
не
обязательно
имеет
место
.
Пусть
,
например
, X
и
Y
принадлежат
(0, 1),
а
функция
выигрыша
Н
(
х
,
у
) =
х
+
у
.
Очевидно
,
что
если
бы
1
и
0
входили
в
число
возможных
стратегий
игроков
,
то
ситуация
(1, 0)
соответствовала
бы
седловой
точке
.
Поскольку
эту
ситуацию
реализовать
нельзя
,
то
в
описываемой
игре
можно
говорить
об
оптимальности
стратегии
игроков
«
с
точностью
до
произвольного
0
».
Определение
1.
Ситуация
( , )
x y
в
бесконечной
антагонистической
игре
называется
ситуацией
–
равновесия
,
если
для
любых
стратегий
х
,
у
соответственно
игроков
1
и
2
имеет
место
неравенство
:
H x y
H x y
H x y
( ,
)
( ,
)
( , )
.
Точка
( , )
x y
,
для
которой
выполняется
это
соотношение
,
называется
–
седловой
точкой
функции
Н
.
Определение
2.
Стратегии
x
и
y
,
составляющие
ситуацию
–
равновесия
в
бесконечной
антагонистической
игре
,
называются
–
оптимальными
стратегиями
.
Этот
термин
отражает
тот
факт
,
что
такие
стратегии
являются
оптимальными
“
с
точностью
до
”.
Именно
,
если
отклонение
от
оптимальной
стратегии
никакой
пользы
игроку
принести
не
может
,
то
его
отклонение
от
–
оптимальной
стратегии
может
увеличить
его
выигрыш
,
но
не
более
чем
на
.
Теорема
1.
Если
при
всяком
,
функция
Н
(
х
,
у
)
имеет
–
седловые
точки
,
то
62
sup inf ( , ) inf sup ( , )
x
y
y
x
H x y
H x y
.
Экстремумы
sup inf ( , )
x
y
H x y
и
inf sup ( , )
y
x
H x y
называются
соответственно
нижним
и
верхним
значениями
бесконечной
антагонистической
игры
.
Как
и
в
случае
конечных
игр
,
при
отсутствии
решения
в
чистых
стратегиях
,
необходимо
расширение
стратегических
возможностей
игроков
–
введение
смешанных
стратегий
.
Смешанными
стратегиями
в
бесконечной
антагонистической
игре
являются
вероятностные
распределения
S ( x )
и
S ( y )
на
множествах
их
чистых
стратегий
Х
и
У
.
Пара
таких
вероятностных
распределений
является
статистически
независимыми
.
Если
S x
x
( )
и
S y
y
( )
–
смешанные
стратегии
игроков
1
и
2,
то
выигрыши
Н
(
Х
,
у
) ,
Н
(
х
, Y )
и
H
( X , Y )
являются
по
определению
математическими
ожиданиями
:
).
(
)
(
)
,
(
)
(
)
,
(
)
(
)
,
(
)
,
(
,
)
(
)
,
(
)
,
(
,
)
(
)
,
(
)
,
(
y
dS
x
dS
y
x
H
y
dS
y
X
H
x
dS
Y
x
H
Y
X
H
y
dS
y
x
H
Y
x
H
x
dS
y
x
H
y
X
H
y
XY
x
Y
y
X
x
Y
y
X
x
Для
смешанных
стратегий
в
бесконечных
антагонистических
играх
можно
доказать
теоремы
,
аналогичные
тем
,
которые
справедливы
для
смешанных
стратегий
в
матричных
играх
.
Покажем
методику
решения
бесконечных
антагонистических
игр
на
отдельных
примерах
для
наиболее
простого
случая
–
игр
на
единичном
квадрате
.
4.2.
Решение
выпуклых
игр
на
единичном
квадрате
Определение
3.
Класс
антагонистических
игр
,
в
которых
х
,
у
[0,1]
называются
играми
на
единичном
квадрате
.
В
играх
на
единичном
квадрате
любая
ситуация
(
х
,
у
)
понимается
как
точка
единичного
квадрата
.
Определение
4.
Бесконечная
антагонистическая
игра
на
единичном
квадрате
называется
строго
выпуклой
,
если
ее
функция
выигрыша
Н
(
х
,
у
)
строго
выпукла
по
у
при
любом
х
.
Решение
выпуклых
игр
на
единичном
квадрате
базируется
на
следующих
основных
теоремах
[2].
Теорема
2.
В
строго
выпуклой
игре
игрок
2
имеет
единственную
оптимальную
стратегию
у
*
,
которая
является
чистой
и
является
решением
уравнения
*)
,
(
max
y
x
H
x
,
где
–
цена
игры
.
Теорема
3.
Пусть
в
выпуклой
бесконечной
антагонистической
игре
на
единичном
квадрате
с
функцией
Н
(
х
,
у
)
дифференцируемой
по
у
при
любом
х
,
у
*
–
оптимальная
чистая
стратегия
игрока
2,
а
-
цена
игры
.
Тогда
:
1)
если
у
*
= 1,
то
среди
оптимальных
стратегий
игрока
1
имеется
чистая
стратегия
x
,
для
которой
H
y
(
x
,
у
)
0;
2)
если
у
*
= 0,
то
среди
оптимальных
стратегий
игрока
1
имеется
чистая
стратегия
x
,
для
которой
H
y
(
x
,
у
)
0;
63
3)
если
0<
у
*<
1,
то
среди
оптимальных
стратегий
игрока
1
найдется
такая
,
которая
является
смесью
стратегий
x
и
x
.
Для
этих
стратегий
H
y
(
x
,
у
*)
0,
H
y
(
x
,
у
*)
0.
При
этом
стратегии
x
и
x
употребляются
с
вероятностями
р
и
1-
р
,
где
р
находится
из
уравнения
р
H
y
(
x
,
у
*
) + (1-
р
)
H
y
(
x
,
у
*)
=0.
4.3.
Примеры
решения
бесконечных
антагонистических
игр
Игра
«
Борьба
за
рынки
»
Пусть
одна
из
фирм
(
игрок
1)
пытается
вытеснить
другую
фирму
(
игрок
2),
имеющую
два
рынка
сбыта
,
с
одного
из
этих
рынков
.
Общая
сумма
средств
,
выделяемых
игроком
1
на
эту
цель
,
равна
единице
(
Х
).
Стратегии
игрока
1
состоят
в
распределении
этих
средств
между
двумя
рынками
.
Если
на
первый
рынок
направляется
сумма
х
,
то
на
второй
–
(1-
х
)
.
Пусть
игрок
2
для
удержания
рынков
также
располагает
единичной
суммой
средств
,
и
его
стратегия
будет
состоять
в
выделении
суммы
у
на
первый
рынок
и
(1-
у
) –
на
второй
.
Считается
,
что
игрок
1,
добившись
превосходства
средств
на
одном
из
рынков
,
вытесняет
своего
противника
с
этого
рынка
и
получает
выигрыш
,
равный
избытку
своих
средств
,
который
берется
с
коэффициентом
,
характеризующим
важность
рынка
(
пусть
этот
коэффициент
равен
k
1
для
первого
рынка
и
k
2
для
второго
).
Рассматриваемая
игра
является
игрой
на
единичном
квадрате
.
В
этой
игре
пара
чисел
(
х
,
у
),
где
х
,
у
0,1
являются
точками
единичного
квадрата
.
Функция
выигрыша
в
рассматриваемом
примере
,
),
(
;
),
(
)
,
(
2
1
y
x
если
y
x
h
y
x
если
y
x
h
y
x
H
где
h
1
h
.
Решение
.
График
зависимости
H
(
х
0
,y)
от
у
для
некоторого
х
=
х
0
представлен
на
рис
. 4.1.
H
k
1
x
0
k
2
(1-x
0
)
y=x
0
0
1
y
Рис
. 4.1.
Очевидно
,
что
при
любых
х
0
функция
Н
(
х
0
,
у
)
является
выпуклой
функцией
от
у
.
Имеем
64
y
h
y
h
x
y
h
y
x
h
y
x
H
x
y
x
y
x
x
x
2
1
2
1
),
1
(
max
)
(
max
),
(
max
max
)
,
(
max
.
Поэтому
цена
игры
)
(
),
1
(
max
min
)
,
(
max
min
2
1
y
h
y
h
y
x
H
v
x
y
x
y
.
График
функции
)
(
),
1
(
max
2
1
y
h
y
h
x
выделен
на
рис
. 4.2
жирной
ломаной
.
H
k
1
k
1
(1-y)
y*
0
1
y
k
2
y
k
2
Рис
. 4.2.
Первый
член
под
знаком
максимума
с
ростом
у
убывает
,
а
второй
–
возрастает
.
Поэтому
при
малых
значениях
у
максимум
достигается
на
отрезке
k
1
(1-
у
)
,
а
при
больших
–
на
отрезке
прямой
k
2
у
.
Следовательно
,
минимальное
значение
этот
максимум
принимает
при
таком
у
*,
для
которого
k
y
k y
1
2
1
(
*)
*
,
т
.
е
.
при
y
k
k
k
*
1
1
2
. (4.1)
Таким
образом
,
найденное
у
*
является
единственной
оптимальной
чистой
стратегией
игрока
2.
Она
состоит
в
распределении
имеющихся
средств
между
рынками
пропорционально
важности
рынков
.
Значение
цены
игры
2
1
1
2
2
1
1
2
2
1
2
1
,
1
max
*)
,
(
max
)
,
(
max
min
k
k
k
k
k
k
k
k
h
h
h
h
y
x
H
y
x
H
v
x
x
y
. (4.2)
Далее
надо
найти
оптимальную
стратегию
игрока
1.
Случаи
х
у
*
и
х
у
*
будем
рассматривать
порознь
.
Теорема
3
утверждает
,
что
если
Н
(
х
,
у
)
–
выпукла
и
0
у
*
1
,
то
среди
оптимальных
стратегий
игрока
1
найдется
такая
,
которая
является
смесью
двух
активных
стратегий
x
и
x
.
Для
этих
стратегий
H x y
y
( ' , *)
0
и
H x y
y
( '', *)
0
. (4.3)
При
этом
стратегии
x
и
x
употребляются
с
вероятностями
р
и
(1-
р
)
,
где
р
находится
из
уравнения
.
0
*)
,
(
)
1
(
*)
,
(
y
y
x
H
p
y
y
x
H
p
(4.4)
Для
случая
х
у
*
уравнение
(4.2)
принимает
вид
2
1
1
2
2
1
1
1
k
k
k
k
k
k
k
x
k
,
откуда
x
=1.
65
Для
случая
х
у
*
уравнение
(4.2)
имеет
уже
другой
вид
:
2
1
1
2
2
1
1
2
k
k
k
k
x
k
k
k
k
,
откуда
x
=0.
Таким
образом
,
активными
стратегиями
игрока
1
оказываются
:
x
=0;
и
x
=1.
Поэтому
игрок
1
должен
применять
смешанную
стратегию
,
являющуюся
смесью
этих
двух
активных
стратегий
.
Для
нахождения
вероятности
р
,
используем
уравнение
(4.4).
Частные
производные
H
y
y
y
k y
k
y y
y y
( , )
*
*
0
0
2
2
;
H
y
y
y
k
y
k
y y
y y
( , )
(
)
*
*
1
1
0
1
1
.
Тогда
уравнение
(4.4)
для
данной
игры
приобретает
вид
pk
p
k
2
1
1
0
(
)(
)
,
откуда
p
k
k
k
1
1
2
. (4.5)
Таким
образом
,
оптимальная
стратегия
игрока
1
состоит
в
концентрации
всех
его
средств
на
одном
из
рынков
,
причем
вероятность
выбора
рынка
обратно
пропорциональна
его
важности
.
Этот
результат
объясняется
просто
:
чем
важнее
рынок
,
тем
больше
средств
вложит
противник
в
его
сохранение
и
тем
меньше
свободных
средств
останется
на
нем
после
вытеснения
противника
,
и
тем
менее
значимой
будет
победа
над
ним
.
Игра
с
выбором
момента
времени
(
игра
типа
дуэли
)
Формулировка
.
Пусть
каждый
из
двух
игроков
намерен
выполнить
некоторое
действие
(
выбросить
на
рынок
партию
товара
,
внести
на
совещание
предложение
,
произвести
выстрел
и
т
.
д
.).
При
этом
обстоятельства
часто
складываются
так
,
что
,
во
-
первых
,
целесообразно
выполнить
это
действие
как
можно
позже
,
а
во
-
вторых
,
желательно
своим
действием
упредить
сходное
действие
противника
.
Такой
конфликт
в
условиях
противоположных
интересов
его
участников
естественно
моделировать
бесконечной
антагонистической
игрой
на
единичном
квадрате
,
в
которой
функция
выигрыша
Н
в
общем
случае
имеет
вид
,
при
),
,
(
;
при
),
(
;
при
),
,
(
y
x
y
x
y
x
x
y
x
y
x
(4.6)
где
каждая
из
функций
и
а
)
непрерывна
по
обеим
переменным
;
б
)
монотонно
возрастает
по
х
при
любых
значениях
y
;
в
)
монотонно
убывает
по
y
при
любом
значении
х
;
г
)
удовлетворяет
условию
( , )
( )
( , )
x x
x
x x
.
Игра
с
функцией
выигрыша
Н
(
х
,
у
),
удовлетворяющая
перечисленным
условиям
называется
игрой
с
выбором
момента
времени
,
или
игрой
типа
дуэли
.