ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 31.07.2021
Просмотров: 707
Скачиваний: 2
26
v
A
a
22
v
opt
a
21
0
p
1opt
1
B
2
B
1
N
a
11
a
12
p
1
p
2
=1-p
1
v
A
Рис
. 2.4.
Если
при
этом
игрок
В
применяет
чистую
стратегию
В
1
,
то
выигрыш
игрока
А
равен
а
11
,
а
при
применении
чистой
стратегии
В
2 –
а
12
.
Так
как
значения
р
1
лежат
в
пределах
[0,1],
то
соединяя
крайние
точки
для
стратегий
В
1
и
В
2
(
строя
графики
функций
v
А
=(a
11
-a
21
)p
1
+a
22
и
v
А
=(a
12
-
a
22
)p
1
+a
22
),
получаем
значения
выигрышей
игрока
А
для
всех
промежуточных
значений
р
1
.
В
соответствии
с
принципом
максимина
,
игрок
А
должен
выбрать
такую
смешанную
стратегию
,
при
которой
его
минимальный
выигрыш
максимален
.
Точка
N
пересечения
отрезков
прямых
(
рис
. 2.4)
и
определяет
как
оптимальную
цену
игры
v
opt
,
так
и
оптимальные
вероятности
p
1opt
и
p
2opt
=1-
p
1opt
,
соответствующие
оптимальной
смешанной
стратегии
игрока
А
,
т
.
е
.
дает
решения
системы
уравнений
(2.11), (2.13), (2.14).
Для
графического
решения
системы
уравнений
(2.12), (2.18), (2.19)
отложим
по
оси
абсцисс
вероятность
q
1
[0,1],
а
по
оси
ординат
соответствующие
этой
вероятности
выигрыши
игрока
В
:
v
В
=(a
11
-a
12
)q
1
+a
12
; (2.23)
v
В
=(a
21
-a
22
)q
1
+a
22
. (2.24)
v
B
v
B
a
22
v
opt
a
12
0
q
1opt
1
A
2
A
1
M
a
11
a
21
q
1
Рис
. 2.5.
27
Решением
являются
координат
точки
М
пересечения
прямых
,
описываемых
уравнений
(2.23)
и
(2.24):
q
1opt
;q
2 opt
=1-q
1opt
и
v
o pt
.
Это
же
следует
и
из
принципа
максимина
,
в
соответствии
с
которым
игрок
В
должен
выбрать
такую
смешанную
стратегию
,
при
которой
его
максимальный
проигрыш
будет
минимальным
.
Для
игры
G(2
х
2)
с
седловой
точкой
геометрическая
интерпретация
решения
быть
представлена
,
например
,
следующим
образом
(
рис
. 2.6).
a
22
a
12
0
1
В
2
В
1
N
a
11
a
21
p
1
v
A
v
A
Рис
. 2.6.
Стратегия
В
2
игрока
В
является
для
него
явно
невыгодной
,
так
как
,
применяя
ее
,
он
в
любой
случае
проигрывает
больше
,
чем
при
применении
стратегии
В
1
.
В
данной
игре
р
1 o p t
=1;
р
2 o p t
=0;
v
o p t
=
а
1 1
,
т
.
е
.
игра
имеет
седловую
точку
N
и
решается
в
чистых
стратегиях
.
Игрок
А
должен
применять
стратегию
А
1
,
а
игрок
В
–
стратегию
В
1
.
На
рис
. 2.7
показан
случай
,
в
котором
решением
игры
для
игрока
А
является
чистая
стратегия
А
2
,
а
для
игрока
В
–
стратегия
В
1
.
Игра
имеет
седловую
точку
N.
Пример
:
Найти
алгебраическим
и
геометрическим
методами
решение
игры
,
платежная
матрица
которой
имеет
вид
B
j
A
i
B
1
B
2
i
A
1
4 -2 -2
A
2
1 3 1
j
4
3
28
a
22
a
12
0
1
В
2
В
1
N
a
11
a
21
v
A
v
A
p
1
Рис
. 2.7.
В
данной
игре
нижняя
цена
игры
=1
не
равна
верхней
цены
игры
=3,
поэтому
игра
не
имеет
седловой
точки
и
,
в
соответствии
с
основной
теоремой
матричных
игр
,
имеет
оптимальное
решение
в
смешанных
стратегиях
.
Для
игрока
А
,
в
соответствии
с
формулами
(2.15)
и
(2.16),
оптимальные
вероятности
применения
стратегий
А
1
и
А
2
равны
:
4
1
8
2
2
1
3
4
1
3
12
21
22
11
21
22
1
a
a
a
a
a
a
p
;
p
a
a
a
a
a
a
2
11
12
11
22
21
12
4 2
4 3 1 2
3
4
.
Для
игрока
В
,
в
соответствии
с
формулами
(2.20)
и
(2.21),
оптимальные
вероятности
применения
стратегий
В
1
и
В
2
равны
:
q
a
a
a
a
a
a
1
22
12
11
22
21
12
3 2
4 3 1 2
5
8
;
q
a
a
a
a
a
a
2
22
12
11
22
21
12
4 1
8
3
8
.
Таким
образом
,
оптимальные
смешанные
стратегии
игроков
4
3
;
4
1
A
S
;
S
B
5
8
1
8
;
,
а
цена
игры
в
соответствии
с
формулой
(2.22)
равна
:
a a
a a
a
a
a
a
11
22
12
21
11
22
21
12
4 3
2 1
4 3 1 2
7
4
( )
.
Так
как
,
то
игра
выгодна
для
игрока
А
.
Графическое
изображение
игры
для
игрока
А
показана
на
рис
. 2.8.
29
1,0
2,0
3,0
4,0
4,0
3,0
2,0
1,0
0
0.2
0.4 0.5 0.6
0.8
v
A
v
A
1
N
v
=
1.75
B
2
B
1
0.1
0.3
0.7
0,9
-1,0
-2,0
p
1opt
=0
.25
C
D
p
1
Рис
. 2.8.
Нижняя
граница
выигрыша
игрока
А
определяется
ломаной
CND.
Оптимальное
решение
,
определяется
точкой
N,
естественно
,
дает
тоже
решение
,
что
и
алгебраический
метод
:
S
v
A
0 25 0 75
175
. ; .
,
.
.
Геометрическое
изображение
игры
для
игрока
В
показано
на
рис
. 2.9.
1,0
2,0
3,0
4,0
4,0
3,0
2,0
1,0
0
0.2
0.4
0.6
0.8
v
B
v
B
1
М
А
2
А
1
0.1
-1,0
-2,0
C
D
-1,0
-2,0
q
1
Рис
. 2.9.
Оптимальное
решение
,
определяемое
точкой
М
,
дает
решение
S
v
B
0 625 0 375
175
.
; .
,
.
.
ЗАДАЧИ
Определите
алгебраическим
и
геометрическим
методами
оптимальные
решения
следующих
игр
2
х
2
:
1. B
1
B
2
2. B
1
B
2
3. B
1
B
2
A
1
5 2
A
1
-3 -6
A
1
6 9
A
2
-1 0
A
2
-4 -5
A
2
7 8
4. B
1
B
2
5. B
1
B
2
6. B
1
B
2
A
1
0 7
A
1
8 6
A
1
0 -1
A
2
10 4
A
2
4 7
A
2
-3 0
30
7. B
1
B
2
8. B
1
B
2
9. B
1
B
2
A
1
-10 -16
A
1
7 9
A
1
1 2
A
2
-12 -14
A
2
13 11
A
2
4 3
10. B
1
B
2
11. B
1
B
2
12. B
1
B
2
A
1
-3 -2
A
1
0 2
A
1
-1 1
A
2
0 -2
A
2
3 1
A
2
2 0
13. B
1
B
2
14. B
1
B
2
15. B
1
B
2
A
1
6 -2
A
1
4 -5
A
1
5 6
A
2
-2 6
A
2
-5 4
A
2
6 5
16. B
1
B
2
17. B
1
B
2
18. B
1
B
2
A
1
4 7
A
1
4 -5
A
1
8 -1
A
2
5 4
A
2
-4 5
A
2
1 9
19. B
1
B
2
20. B
1
B
2
21. B
1
B
2
A
1
6 9
A
1
1 -3
A
1
4 -2
A
2
13 11
A
2
-8 5
A
2
-3 5
22. B
1
B
2
23. B
1
B
2
24. B
1
B
2
A
1
5 8
A
1
6 9
A
1
2 5
A
2
7 6
A
2
8 7
A
2
3 4
25. B
1
B
2
26. B
1
B
2
27. B
1
B
2
A
1
0 -3
A
1
12 3
A
1
4 -5
A
2
-1 0
A
2
9 7
A
2
1 -1
2.6.
Упрощение
матричных
игр
Решение
матричных
игр
тем
сложнее
,
чем
больше
размерность
платежной
матрицы
.
Поэтому
для
игр
с
платежными
матрицами
большой
размерности
отыскание
оптимального
решения
можно
упростить
,
если
уменьшить
их
размерность
путем
исключения
дублирующих
и
заведомо
невыгодных
(
доминируемых
)
стратегий
.
Определение
1.
Если
в
платежной
матрице
игры
все
элементы
строки
(
столбца
)
равны
соответствующим
элементам
другой
строки
(
столбца
),
то
соответствующее
этим
строкам
(
столбцам
)
стратегии
называются
дублирующими
.
Определение
2.
Если
в
платежной
матрице
игры
все
элементы
некоторой
строки
,
определяющей
стратегию
А
i
игрока
А
,
не
больше
(
меньше
или
некоторые
равны
)
соответствующих
элементов
другой
строки
,
то
стратегия
А
i
называется
доминируемой
(
заведомо
невыгодной
).
Определение
3.
Если
в
платежной
матрице
игры
все
элементы
некоторого
столбца
,
определяющего
стратегию
В
i
игрока
В
не
меньше