ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 16.08.2024
Просмотров: 376
Скачиваний: 0
СОДЕРЖАНИЕ
§1.2. Формальное описание игры.
§2.1.1. Понятие антагонистической игры. Матричная игра.
§2.1.2. Доминирование стратегий. Редукция игры. Решение игры в доминирующих стратегиях.
§2.1.3. Решение игры в чистых стратегиях
§2.1.4. Смешанное расширение игры
§2.1.5. Решение игры в смешанных стратегиях
Свойства игры в смешанных стратегиях.
§2.1.7. Критерии оптимальности решения в условиях неопределённости
§2.1.9. Критерий Вальда (максиминный критерий)
§2.1.10. Критерий Гурвица (критерий взвешенного оптимизма /пессимизма)
§2.1.11. Критерий Сэвиджа (критерий наименьших сожалений)
§2.1.12. Решение игры против природы в смешанных стратегиях
§ 2.2 Неантагонистические игры
§2.2.1. Понятие неантагонистической игры
§2.2.4. Эффективность по Парето2
§2.2.5. Повторяющиеся игры. Применение к микроэкономике.
Глава 3. Кооперативные решения
§3. 1. Понятие коалиционной игры
§3.2. Определение решения игры
§3.3. Эффективность обмена. Ящик Эджворта
Практикум Матричная игра. Доминирование стратегий.
Решение игры в чистых стратегиях.
Решение игры в смешанных стратегиях.
Игра против природы. Критерии Лапласа, Вальда, Сэвиджа, Гурвица.
§2.1.7. Критерии оптимальности решения в условиях неопределённости
Рассмотрим задачу принятия решения, когда на стадии принятия решения ЛПР знает:
а) возможные состояния среды: у1, у2,..уn Є Y – множество состояний окружающей среды.
б) результат, к которому приведёт выбор альтернативы х Є Х для каждого возможного состояния среды: у1, у2,..уn, т. е. знает функцию выигрыша (проигрыша): f(х,y) для всех х Є Х, у = Y.
Х – множество альтернатив
Y – множество состояний среды
При этом ЛПР не располагает информацией о том, как распределены вероятности состояний среды и даже не знает, какие из этих состояний более вероятны. Такая ситуация принятия решений определяется как структурная неопределённость.
Задача выбора «наилучшего» решения требует определить критерий оптимальности. Очевидно, что широкое разнообразие жизненных и экономических ситуаций не может быть описано с помощью единственного критерия оптимальности, в математических моделях принятия решения предложены и исследованы несколько критериев оптимальности.
Сформулируем определение – что из себя должен представлять критерий оптимальности?
Для этого определения выделим следующие моменты:
Любой критерий оптимальности основан на определённых предположениях (гипотезах) о поведении окружающей среды.
Критерий оптимальности представляет собой правило выбора «наилучшего» решения.
Таким образом, критерий оптимальности – это правило выбора «наилучшего» решения в условиях неопределённости, основанное на определённых предположениях относительно поведения окружающей среды и предпочтений ЛПР.
При этом желательно, чтобы критерий оптимальности обладал свойствами, согласующимися со здравым смыслом и рациональностью. Чтобы пояснить, в чем состоит в данном случае рациональный подход, вспомним понятие доминируемости.
Пусть задача принятия решения характеризуется n-состояниями среды: у1, у2,..уn и предусматривает выбор из m-альтернатив: х1, х2,..хm. Причём для каждой пары (хi, yj) определено значение функции f(хi, yj).
Тогда задачу принятия решения можно описать с помощью платёжной матрицы (Таблица 7):
Таблица 7
Состояния среды Альтернативы |
y1 |
y2 |
… |
yj |
… |
yn |
x1 |
f(x1,y1) |
f(x1,y2) |
… |
f(x1,yj) |
… |
f(x1,yn) |
x2 |
f(x2,y1) |
f(x2,y2) |
… |
f(x2,yj) |
… |
f(x2,yn) |
… |
… |
… |
… |
… |
… |
… |
xi |
f(xi,y1) |
f(xi,y2) |
… |
f(xi,yj) |
… |
f(xi,yn) |
… |
… |
… |
… |
… |
… |
… |
xm |
f(xm,y1) |
f(xm,y2) |
… |
f(xm,yj) |
… |
f(xm,yn) |
Предположим, что для некоторых целых чисел i и k Є [1,m] выполняется условие: для любого j f(xi,yj) ≥ f(xk,yj).
В строке i результаты больше, чем в строке k. Следовательно, стратегия xi доминирует стратегию xk, xk – доминируемая стратегия.
Очевидно, что доминируемые стратегии (или альтернативы) заведомо хуже других, а доминирующие заведомо лучше. Отсюда следует, что первый принцип, которому должен удовлетворять критерий оптимальности, это принцип доминирования.
a) Принцип доминирования:
- если существует доминирующая стратегия, то критерий оптимальности должен обеспечивать выбор именно этой стратегии;
- если существуют доминируемые стратегии, то их удаление и введение не должно влиять на выбор наилучшей стратегии.
Так же очевиден смысл двух других принципов:
b) Перенумерация альтернатив (нумерация строк) и/или состояний среды (нумерация столбцов) не должна влиять на выбор наилучшей стратегии.
c) Предположим, что ко всем значениям функции выигрыша добавлено число а: f(xi,yj) + a. Очевидно, что критерий оптимальности должен обеспечивать выбор наилучшей стратегии, которая не зависит от прибавления аддитивной постоянной к функции выигрыша.
Рассмотрим наиболее часто применяемые критерии оптимальности.
§2.1.8 Критерий Лапласа
Критерий Лапласа основан на гипотезе, согласно которой все состояния среды реализуются с одинаковыми вероятностями.
Если возможна реализация 2-х состояний А и В и нет никакой информации об их вероятностях, то естественно предполагать, что:
Р(А) = Р(В) = ½.
Если среда может принимать состояния у1, у2,..уn и нет информации о вероятностях этих значений, то естественно предполагать:
Р(у1) = Р(у2) = ...= Р(уn) = 1/n.
Пусть для задачи принятия решения, заданной Таблицей 1, принята гипотеза равной возможности. Для каждой стратегии xi определим значение функции L (xi):
L (xi) = 1/n*∑ f(xi,yj) (1.32)
Получим L(x1), L(x2),.. L(xn) – среднеарифметические выигрыши для каждой стратегии.
Выбираемая стратегия xi: L(xl) ≥ L(xi) (1.33)
Пример: Найти наилучшую стратегию по критерию Лапласа для задачи принятия решения, заданной платёжной матрицей Таблица 8:
Таблица 8
|
у1 |
у2 |
У3 |
L (xi) |
х1 |
92 |
0 |
4 |
96/3=32 |
х2 |
30 |
50 |
10 |
90/3=30 |
Легко показать, что критерий Лапласа удовлетворяет всем 3-м условиям, определённым в пункте 2.1.1.
Тем не менее, у критерия Лапласа есть недостаток: по критерию Лапласа может быть выбрана рискованная стратегия.
Маленькие значения выигрыша при нахождении среднего перекрываются большими – эффект компенсации.
§2.1.9. Критерий Вальда (максиминный критерий)
Выбор критерия Вальда основан на гипотезе, согласно которой ЛПР стремится получить гарантированный результат при любом состоянии среды.
Пример: Найти наилучшую стратегию по критерию Вальда для задачи принятия решения, заданной платёжной матрицей Таблица 9:
Таблица 9
|
у1 |
у2 |
у3 |
у4 |
у5 |
аi |
х1 |
1 |
3 |
2 |
4 |
5 |
1 |
х2 |
0 |
6 |
8 |
10 |
12 |
0 |
Решение. Найдём выбор по принципу максимина: для любого i min f(xi,yj) = ai – худший результат при выборе i.
maxmin f(xi,yj) = max ai = K.
Легко показать, что критерий Вальда удовлетворяет всем 3-м условиям, определённым в пункте 2.1.1.
Недостаток этого критерия: критерий Вальда отвергает хорошие гипотезы из-за своего крайнего пессимизма.
§2.1.10. Критерий Гурвица (критерий взвешенного оптимизма /пессимизма)
В основе этого критерия лежит гипотеза о том, что уровень пессимизма ЛПР принимает некоторое значение α: 0 ≤ α ≤ 1. Чем больше α, тем пессимистичнее настроен ЛПР. Для каждой строки xi определяется:
- число аi = min f((xi,yj);
- число bi = max f((xi,yj).
Затем для каждого значения xi и α рассчитывается число:
H(xi, α ) = α* аi + (1- α)* bi
и выбирается max H(xi, α ) = h(α).
Пример 3: Для Примера 2 найти наилучшую стратегию по критерию Гурвица, при значении α = ½ Таблица 10.
Таблица 10
|
у1 |
у2 |
у3 |
у4 |
у5 |
аi |
bi |
Hi(1/2) |
х1 |
1 |
3 |
2 |
4 |
5 |
1 |
5 |
1*1/2+5*1/2=3 |
х2 |
0 |
6 |
8 |
10 |
12 |
0 |
12 |
0*1/2+12*1/2=6 |