Файл: Теория_игр_УП_ЭК_ЭлРесурс.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 31.07.2021

Просмотров: 683

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
background image

 

61

4. 

БЕСКОНЕЧНЫЕ

 

АНТАГОНИСТИЧЕСКИЕ

 

ИГРЫ

 

4.1.

Общие

 

сведения

 

Если

 

множество

 

чистых

 

стратегий

 

хотя

 

бы

 

одного

 

из

 

игроков

 

бесконечно

то

 

игры

 

называются

 

бесконечными

Различие

 

между

 

конечными

 

и

 

бесконечными

 

антагонистическими

 

играми

 

приводит

 

к

 

необходимости

 

применять

 

для

 

исследования

 

бесконечных

 

игр

 

более

 

сложный

 

математический

 

аппарат

заменять

 

линейно

 – 

алгебраические

 

уравнения

 

функционально

 – 

аналитическими

интегральными

 

уравнениями

которые

 

в

 

благоприятных

 

случаях

 

сводятся

 

к

 

системам

 

дифференциальных

 

уравнений

Но

как

 

и

 

во

 

всякой

 

антагонистической

 

игре

в

 

бесконечной

 

антагонистической

 

игре

 

принципом

 

оптимального

 

поведения

 

игроков

 

остается

 

принцип

 «

максимина

». 

Обозначим

 

через

 

Х

 

и

 

У

 – 

произвольные

 

множества

элементы

 

которых

 

являются

 

соответственно

 

стратегиями

 

игроков

 1 

и

 2, 

а

 

через

 

Н

(

х

у

) – 

функцию

 

выигрыша

 

игрока

 1 

в

 

ситуации

 (

х

у

). 

Далее

 

будем

 

считать

что

 

функция

 

Н

(

х

у

непрерывна

 

на

 

пространстве

 

ситуаций

 

Х

*Y

 

и

 

ограничена

Принцип

  “

максимина

” 

может

 

быть

 

реализован

 

тогда

 

и

 

только

 

тогда

когда

 

существуют

 

и

 

равны

 

смешанные

 

экстремумы

m a x   i n f   H ( x , y )  

 

и

  m i n  

s u p  

H ( x , y

). 

x

X ;   y

Y  

 

 

 

y

Y ;   x

X  

Для

 

бесконечных

 

антагонистических

 

игр

в

 

отличие

 

от

 

конечных

существование

 

оптимальных

 

смешанных

 

стратегий

 

не

 

обязательно

 

имеет

 

место

Пусть

например

, X 

и

 Y 

принадлежат

 (0, 1), 

а

 

функция

 

выигрыша

 

Н

(

х

,

у

) = 

х

 + 

у

Очевидно

что

 

если

 

бы

 1 

и

 0 

входили

 

в

 

число

 

возможных

 

стратегий

 

игроков

то

 

ситуация

 (1, 0) 

соответствовала

 

бы

 

седловой

 

точке

Поскольку

 

эту

 

ситуацию

 

реализовать

 

нельзя

то

 

в

 

описываемой

 

игре

 

можно

 

говорить

 

об

 

оптимальности

 

стратегии

 

игроков

  «

с

 

точностью

 

до

 

произвольного

 

0

». 

Определение

  1. 

Ситуация

 

( , )

x y

 

в

 

бесконечной

 

антагонистической

 

игре

 

называется

 

ситуацией

 

 – 

равновесия

если

 

для

 

любых

 

стратегий

 

х

у

 

соответственно

 

игроков

 1 

и

 2 

имеет

 

место

 

неравенство

H x y

H x y

H x y

( ,

)

( ,

)

( , )

Точка

 

( , )

x y

для

 

которой

 

выполняется

 

это

 

соотношение

называется

 

 – 

седловой

 

точкой

 

функции

 

Н

Определение

  2. 

Стратегии

 

x

 

и

 

y

составляющие

 

ситуацию

 

 – 

равновесия

 

в

 

бесконечной

 

антагонистической

 

игре

называются

 

 – 

оптимальными

 

стратегиями

Этот

 

термин

 

отражает

 

тот

 

факт

что

 

такие

 

стратегии

 

являются

 

оптимальными

  “

с

 

точностью

 

до

 

”. 

Именно

если

 

отклонение

 

от

 

оптимальной

 

стратегии

 

никакой

 

пользы

 

игроку

 

принести

 

не

 

может

то

 

его

 

отклонение

 

от

 

 – 

оптимальной

 

стратегии

 

может

 

увеличить

 

его

 

выигрыш

но

 

не

 

более

 

чем

 

на

 

Теорема

 1.

 

Если

 

при

 

всяком

 

 

 

функция

 

Н

(

х

у

имеет

 

 – 

седловые

 

точки

то

  


background image

 

62

sup inf ( , ) inf sup ( , )

x

y

y

x

H x y

H x y

Экстремумы

 

sup inf ( , )

x

y

H x y

 

и

 

inf sup ( , )

y

x

H x y

 

называются

 

соответственно

 

нижним

 

и

 

верхним

 

значениями

 

бесконечной

 

антагонистической

 

игры

Как

 

и

 

в

 

случае

 

конечных

 

игр

при

 

отсутствии

 

решения

 

в

 

чистых

 

стратегиях

необходимо

 

расширение

 

стратегических

 

возможностей

 

игроков

 – 

введение

 

смешанных

 

стратегий

Смешанными

 

стратегиями

 

в

 

бесконечной

 

антагонистической

 

игре

 

являются

 

вероятностные

 

распределения

 

S ( x )

 

и

 

S ( y )

 

на

 

множествах

 

их

 

чистых

 

стратегий

 

Х

 

и

 

У

Пара

 

таких

 

вероятностных

 

распределений

 

является

 

статистически

 

независимыми

Если

 

S x

x

( )

 

и

 

S y

y

( )

 – 

смешанные

 

стратегии

 

игроков

 1 

и

 2, 

то

 

выигрыши

 

Н

(

Х

,

у

) ,  

Н

(

х

, Y )

 

и

 H

( X , Y )

 

являются

 

по

 

определению

 

математическими

 

ожиданиями

).

(

)

(

)

,

(

)

(

)

,

(

)

(

)

,

(

)

,

(

,

)

(

)

,

(

)

,

(

,

)

(

)

,

(

)

,

(

y

dS

x

dS

y

x

H

y

dS

y

X

H

x

dS

Y

x

H

Y

X

H

y

dS

y

x

H

Y

x

H

x

dS

y

x

H

y

X

H

y

XY

x

Y

y

X

x

Y

y

X

x



 

Для

 

смешанных

 

стратегий

 

в

 

бесконечных

 

антагонистических

 

играх

 

можно

 

доказать

 

теоремы

аналогичные

 

тем

которые

 

справедливы

 

для

 

смешанных

 

стратегий

 

в

 

матричных

 

играх

Покажем

 

методику

 

решения

 

бесконечных

 

антагонистических

 

игр

 

на

 

отдельных

 

примерах

 

для

 

наиболее

 

простого

 

случая

 – 

игр

 

на

 

единичном

 

квадрате

4.2. 

Решение

 

выпуклых

 

игр

 

на

 

единичном

 

квадрате

 

Определение

  3. 

Класс

 

антагонистических

 

игр

в

 

которых

 

х

,

у

   [0,1] 

называются

 

играми

 

на

 

единичном

 

квадрате

В

 

играх

 

на

 

единичном

 

квадрате

 

любая

 

ситуация

 

(

х

,

у

)

 

понимается

 

как

 

точка

 

единичного

 

квадрата

Определение

  4. 

Бесконечная

 

антагонистическая

 

игра

 

на

 

единичном

 

квадрате

 

называется

 

строго

 

выпуклой

если

 

ее

 

функция

 

выигрыша

 

Н

(

х

,

у

)

 

строго

 

выпукла

 

по

 

у

 

при

 

любом

 

х

Решение

 

выпуклых

 

игр

 

на

 

единичном

 

квадрате

 

базируется

 

на

 

следующих

 

основных

 

теоремах

 [2]. 

Теорема

 2.

 

В

 

строго

 

выпуклой

 

игре

 

игрок

 2 

имеет

 

единственную

 

оптимальную

 

стратегию

 

у

*

которая

 

является

 

чистой

 

и

 

является

 

решением

 

уравнения

 

*)

,

(

max

y

x

H

x

где

 

– 

цена

 

игры

Теорема

 3.

 

Пусть

 

в

 

выпуклой

 

бесконечной

 

антагонистической

 

игре

 

на

 

единичном

 

квадрате

 

с

 

функцией

 

Н

(

х

,

у

)

 

дифференцируемой

 

по

 

у

 

при

 

любом

 

х

у

*

 – 

оптимальная

 

чистая

 

стратегия

 

игрока

 2, 

а

 

цена

 

игры

Тогда

:  

1)

 

если

 

у

*

 = 1, 

то

 

среди

 

оптимальных

 

стратегий

 

игрока

 1 

имеется

 

чистая

 

стратегия

 

x

для

 

которой

 

H

y

(

x

,

у

)

   0; 

2)

 

если

 

у

*

 = 0, 

то

 

среди

 

оптимальных

 

стратегий

 

игрока

 1 

имеется

 

чистая

 

стратегия

 

x



для

 

которой

 

H

y

(

x



,

у

)

   0; 


background image

 

63

3)

 

если

 0<

у

*<

1, 

то

 

среди

 

оптимальных

 

стратегий

 

игрока

 1 

найдется

 

такая

которая

 

является

 

смесью

 

стратегий

 

x

 

и

 

x



.

 

Для

 

этих

 

стратегий

 

H

y

(

x

,

у

*)

   0, 

H

y

(

x



,

у

*)

   0. 

При

 

этом

 

стратегии

 

x

 

и

 

x



 

употребляются

 

с

 

вероятностями

 

р

 

и

 

1-

р

,  

где

 

р

 

находится

 

из

 

уравнения

 

р

 

H

y

(

x

,

у

*

) + (1-

р

)

 

H

y

(

x



,

у

*)

=0. 

 

4.3. 

Примеры

 

решения

 

бесконечных

 

антагонистических

 

игр

 

Игра

 «

Борьба

 

за

 

рынки

» 

Пусть

 

одна

 

из

 

фирм

  (

игрок

 1) 

пытается

 

вытеснить

 

другую

 

фирму

 

(

игрок

 2), 

имеющую

 

два

 

рынка

 

сбыта

с

 

одного

 

из

 

этих

 

рынков

Общая

 

сумма

 

средств

выделяемых

 

игроком

 1 

на

 

эту

 

цель

равна

 

единице

 

(

Х

 

 



).

 

Стратегии

 

игрока

 1 

состоят

 

в

 

распределении

 

этих

 

средств

 

между

 

двумя

 

рынками

Если

 

на

 

первый

 

рынок

 

направляется

 

сумма

 

х

то

 

на

 

второй

 

– 

(1-

х

)

Пусть

 

игрок

 2 

для

 

удержания

 

рынков

 

также

 

располагает

 

единичной

 

суммой

 

средств

и

 

его

 

стратегия

 

будет

 

состоять

 

в

 

выделении

 

суммы

 

у

 

на

 

первый

 

рынок

 

и

 (1-

у

) – 

на

 

второй

Считается

что

 

игрок

 1, 

добившись

 

превосходства

 

средств

 

на

 

одном

 

из

 

рынков

вытесняет

 

своего

 

противника

 

с

 

этого

 

рынка

 

и

 

получает

 

выигрыш

равный

 

избытку

 

своих

 

средств

который

 

берется

 

с

 

коэффициентом

характеризующим

 

важность

 

рынка

  (

пусть

 

этот

 

коэффициент

 

равен

 

k

1

 

для

 

первого

 

рынка

 

и

 

k

2

 

для

 

второго

). 

Рассматриваемая

 

игра

 

является

 

игрой

 

на

 

единичном

 

квадрате

В

 

этой

 

игре

 

пара

 

чисел

 

(

х

у

),

 

где

 

х

,

 

у

 



0,1

 

являются

 

точками

 

единичного

 

квадрата

Функция

 

выигрыша

 

в

 

рассматриваемом

 

примере

  

,

),

(

;

),

(

)

,

(

2

1

y

x

если

y

x

h

y

x

если

y

x

h

y

x

H

 

где

    h

1



 h



Решение

График

 

зависимости

 H

(

х

0

,y)

 

от

 

у

 

для

 

некоторого

 

х

=

х

0

 

представлен

 

на

 

рис

. 4.1. 

H

k

1

x

0

k

2

(1-x

0

)

y=x

0

0

1

y

 

Рис

. 4.1. 

Очевидно

что

 

при

 

любых

 

х

0

 

функция

 

Н

  (

х

0

у

)

 

является

 

выпуклой

 

функцией

 

от

 

у

Имеем

 


background image

 

64

y

h

y

h

x

y

h

y

x

h

y

x

H

x

y

x

y

x

x

x

2

1

2

1

),

1

(

max

)

(

max

),

(

max

max

)

,

(

max

Поэтому

 

цена

 

игры

 

)

(

),

1

(

max

min

)

,

(

max

min

2

1

y

h

y

h

y

x

H

v

x

y

x

y

График

 

функции

 

)

(

),

1

(

max

2

1

y

h

y

h

x

 

выделен

 

на

 

рис

. 4.2 

жирной

 

ломаной

H

k

1

k

1

(1-y)

y*

0

1

y

k

2

y

k

2

 

Рис

. 4.2. 

Первый

 

член

 

под

 

знаком

 

максимума

 

с

 

ростом

 

у

 

убывает

а

 

второй

 – 

возрастает

Поэтому

 

при

 

малых

 

значениях

 

у

 

максимум

 

достигается

 

на

 

отрезке

 

k

1

(1-

у

)

а

 

при

 

больших

 – 

на

 

отрезке

 

прямой

  k

2

у

Следовательно

минимальное

 

значение

 

этот

 

максимум

 

принимает

 

при

 

таком

 

у

*, 

для

 

которого

  

k

y

k y

1

2

1

(

*)

*

т

.

е

при

 

y

k

k

k

*

1

1

2

. (4.1) 

Таким

 

образом

найденное

 

у

является

 

единственной

 

оптимальной

 

чистой

 

стратегией

 

игрока

 2. 

Она

 

состоит

 

в

 

распределении

 

имеющихся

 

средств

 

между

 

рынками

 

пропорционально

 

важности

 

рынков

Значение

 

цены

 

игры

 

2

1

1

2

2

1

1

2

2

1

2

1

,

1

max

*)

,

(

max

)

,

(

max

min

k

k

k

k

k

k

k

k

h

h

h

h

y

x

H

y

x

H

v

x

x

y





. (4.2) 

Далее

 

надо

 

найти

 

оптимальную

 

стратегию

 

игрока

 1. 

Случаи

 

х

у

*

 

и

 

х

у

*

 

будем

 

рассматривать

 

порознь

Теорема

 3 

утверждает

что

 

если

 

Н

(

х

,

у

)

 – 

выпукла

 

и

 

0

у

*

1

то

 

среди

 

оптимальных

 

стратегий

 

игрока

 1 

найдется

 

такая

которая

 

является

 

смесью

 

двух

 

активных

 

стратегий

 

x

 

и

 

x



Для

 

этих

 

стратегий

 

H x y

y

( ' , *)

0

      

и

       

H x y

y

( '', *)

0

. (4.3) 

При

 

этом

 

стратегии

 

x

 

и

 

x



 

употребляются

 

с

 

вероятностями

 

р

 

и

 

(1-

р

)

где

 

р

 

находится

 

из

 

уравнения

  

.

0

*)

,

(

)

1

(

*)

,

(



y

y

x

H

p

y

y

x

H

p

 (4.4) 

Для

 

случая

 

х

у

*

 

уравнение

 (4.2) 

принимает

 

вид

  

2

1

1

2

2

1

1

1

k

k

k

k

k

k

k

x

k





,     

откуда

 

x

=1. 


background image

 

65

Для

 

случая

 

х

у

*

 

уравнение

 (4.2) 

имеет

 

уже

 

другой

 

вид

2

1

1

2

2

1

1

2

k

k

k

k

x

k

k

k

k





,    

откуда

 

x



=0. 

Таким

 

образом

активными

 

стратегиями

 

игрока

 1 

оказываются

x

=0; 

и

 

x



=1.

Поэтому

 

игрок

 1 

должен

 

применять

 

смешанную

 

стратегию

являющуюся

 

смесью

 

этих

 

двух

 

активных

 

стратегий

Для

 

нахождения

 

вероятности

 

р

используем

 

уравнение

 (4.4). 

Частные

 

производные

 

H

y

y

y

k y

k

y y

y y

( , )

*

*

0

0

2

2

;             

H

y

y

y

k

y

k

y y

y y

( , )

(

)

*

*

1

1

0

1

1

  

Тогда

 

уравнение

 (4.4) 

для

 

данной

 

игры

 

приобретает

 

вид

 

pk

p

k

2

1

1

0

 

(

)(

)

откуда

  

p

k

k

k

1

1

2

. (4.5) 

Таким

 

образом

оптимальная

 

стратегия

 

игрока

 1 

состоит

 

в

 

концентрации

 

всех

 

его

 

средств

 

на

 

одном

 

из

 

рынков

причем

 

вероятность

 

выбора

 

рынка

 

обратно

 

пропорциональна

 

его

 

важности

Этот

 

результат

 

объясняется

 

просто

чем

 

важнее

 

рынок

тем

 

больше

 

средств

 

вложит

 

противник

 

в

 

его

 

сохранение

 

и

 

тем

 

меньше

 

свободных

 

средств

 

останется

 

на

 

нем

 

после

 

вытеснения

 

противника

и

 

тем

 

менее

 

значимой

 

будет

 

победа

 

над

 

ним

Игра

 

с

 

выбором

 

момента

 

времени

 (

игра

 

типа

 

дуэли

Формулировка

Пусть

 

каждый

 

из

 

двух

 

игроков

 

намерен

 

выполнить

 

некоторое

 

действие

  (

выбросить

 

на

 

рынок

 

партию

 

товара

внести

 

на

 

совещание

 

предложение

произвести

 

выстрел

 

и

 

т

.

д

.). 

При

 

этом

 

обстоятельства

 

часто

 

складываются

 

так

что

во

-

первых

целесообразно

 

выполнить

 

это

 

действие

 

как

 

можно

 

позже

а

 

во

-

вторых

желательно

 

своим

 

действием

 

упредить

 

сходное

 

действие

 

противника

Такой

 

конфликт

 

в

 

условиях

 

противоположных

 

интересов

 

его

 

участников

 

естественно

 

моделировать

 

бесконечной

 

антагонистической

 

игрой

 

на

 

единичном

 

квадрате

в

 

которой

 

функция

 

выигрыша

 

Н

 

в

 

общем

 

случае

 

имеет

 

вид

  

,

при

),

,

(

;

при

),

(

;

при

),

,

(

y

x

y

x

y

x

x

y

x

y

x

 (4.6) 

где

 

каждая

 

из

 

функций

 

 

и

 

  

а

непрерывна

 

по

 

обеим

 

переменным

б

монотонно

 

возрастает

 

по

 

х

 

при

 

любых

 

значениях

 

y

в

монотонно

 

убывает

 

по

 

y

 

при

 

любом

 

значении

 

х

г

удовлетворяет

 

условию

 

( , )

( )

( , )

x x

x

x x

Игра

 

с

 

функцией

 

выигрыша

 

Н

(

х

,

у

), 

удовлетворяющая

 

перечисленным

 

условиям

 

называется

 

игрой

 

с

 

выбором

 

момента

 

времени

или

 

игрой

 

типа

 

дуэли