ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 25.10.2023
Просмотров: 63
Скачиваний: 4
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
«Теория игр»
Задания:
1 Платежная матрица приведена в таблице 1. Здесь XYZ –последние три цифры зачетки. Решить игру. Найти нижнюю и верхнюю цену игры. Имеется ли в игре седловая точка?
| F1 | F2 | F3 |
E1 | -X | -Y | -Z |
E2 | -12 | -20 | -24 |
E3 | -5 | -21 | -45 |
| F1 | F2 | F3 | Минимум |
E1 | -1 | -4 | -5 | -5* |
E2 | -12 | -20 | -24 | 1 |
E3 | -5 | -4 | -5 | 1 |
Максимум | -1 | -4 | -5* | |
Нижняя цена игры равна: α = -5
Верхняя цена игры равна: β = -5
Ответ α = β = v = -5, платежная матрица содержит седловую точку; оптимальные значения F3 и E3
2 Решить игру 3*3 в смешанных стратегиях аналитическим и графическим способом.
Вариант 1
| В1 | В2 | В3 |
А1 | 4 | 4 | 3 |
А2 | 5 | 2 | 1 |
А3 | 4 | 1 | 4 |
Определим нижнюю цену игры -α
| Стратегии "B" | | ||
Стратегии "A" | B1 | B2 | B3 | Минимумы строк |
A1 | 4 | 4 | 3 | 3* |
A2 | 5 | 2 | 1 | 1 |
A3 | 4 | 1 | 4 | 1 |
В нашем случае нижняя цена игры равна: α = 3, и для того чтобы гарантировать себе выигрыш не хуже чем 3 игрок "А" должен придерживаться стратегии A1
Определим верхнюю цену игры -β
| Стратегии "B" | | |||
Стратегии "A" | B1 | B2 | B3 | Минимумы строк | |
A1 | 4 | 4 | 3 | 3* | |
A2 | 5 | 2 | 1 | 1 | |
A3 | 4 | 1 | 4 | 1 | |
Максимумы столбцов | 5 | 4+ | 4+ | |
В нашем случае верхняя цена игры равна: β = 4, и для того чтобы гарантировать себе проигрыш не хуже чем 4 игрок "B" должен придерживаться одной из стратегий B2 , B3
α ≠ β, платежная матрица не содержит седловой точки. Это значит, что игра не имеет решения в чистых минимаксных стратегиях, но она всегда имеет решение в смешанных стратегиях.
Смешанная стратегия.
Смешанную стратегию игрока "А" будем обозначать
SA = |
|
где A1, A2, A3 - стратегии игрока "A", а p1, p2, p3 - соответственно вероятности (частоты), с которыми эти стратегии применяются, причем p
1 + p2 + p3 = 1.
Аналогично смешанную стратегию игрока "В" будем обозначать
SB = |
|
где B1, B2, B3 - стратегии игрока "B", а q1, q2, q3 - соответственно вероятности, с которыми эти стратегии применяются, причем q1 + q2 + q3 = 1.
Для определения оптимальных стратегий игроков проведем упрощение платежной матрицы.
Сравнивая стратегии B1 и B2 видим, что B1 является заведомо невыгодной относительно B2, поэтому удалим стратегию B1из платежной матрицы и получим игру представленную в таблице:
| Стратегии "B" | |
Стратегии "A" | B2 | B3 |
A1 | 4 | 3 |
A2 | 2 | 1 |
A3 | 1 | 4 |
Сравнивая стратегии A1 и A2 видим, что A2 является заведомо невыгодной относительно A1, поэтому удалим стратегию A2из платежной матрицы и получим игру представленную в таблице:
| Стратегии "B" | |
Стратегии "A" | B2 | B3 |
A1 | 4 | 3 |
A3 | 1 | 4 |
Из последней таблицы видно, что игроку "A" следует искать свою оптимальную стратегию, смешивая случайным образом стратегии A
1 и A3, а игроку "B" стратегии B2 и B3.
Найдем оптимальную смешанную стратегию для игрока "A": |
|
где: p1 , p3 - вероятности (частоты) с которыми применяются соответственно стратегии A1 и A3
В нашем случае обе стратегии активные, иначе игра бы имела решение в чистых стратегиях. Поэтому если предположить, что игрок "В" будет пользоваться чистой стратегией B2, то средний выигрыш v составит:
k12p1 + k32p3 = v ( 1 )
где: kij - элементы платежной матрицы.
C другой стороны, если предположить, что игрок "В" будет пользоваться чистой стратегией B3, то средний выигрыш составит:
k13p1 + k33p3 = v ( 2 )
Приравняв левые части уравнений (1) и (2) получим:
k12p1 + k32p3 = k13p1 + k33p3
А с учетом того, что p1 + p3 = 1 имеем:
k12p1 + k32(1 - p1) = k13p1 + k33(1 - p1)
Откуда несложно найти оптимальную частоту стратегии A1:
p1 = |
| ( 3 ) |
В данной задаче:
p1 = |
| = |
|
Вероятность р3 найдем вычитанием р1 из единицы:
p3 = 1 - p1 = | 1 | - |
| = |
|
Вычислим цену игры подставив р1, р3 в уравнение (1) :
v = k12p1 + k32p3 = | 4 | · |
| + | 1 | · |
| = |
| | | |||||||||
Найдем оптимальную смешанную стратегию для игрока "B": |
|