Файл: Теория игр для экономистов doc.doc

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 16.08.2024

Просмотров: 376

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

СОДЕРЖАНИЕ

Теория игр для экономистов

Глава 1. Введение.

Покажем на популярных примерах игровых задач, как с помощью математической модели можно получить ответы на некоторые вопросы.

§1.2. Формальное описание игры.

§1.3. Классификация игр

Глава 2. Бескоалиционные игры

§2.1. Антагонистические игры

§2.1.1. Понятие антагонистической игры. Матричная игра.

§2.1.2. Доминирование стратегий. Редукция игры. Решение игры в доминирующих стратегиях.

§2.1.3. Решение игры в чистых стратегиях

§2.1.4. Смешанное расширение игры

§2.1.5. Решение игры в смешанных стратегиях

Свойства игры в смешанных стратегиях.

§2.1.6. Игра против природы

§2.1.7. Критерии оптимальности решения в условиях неопределённости

§2.1.8 Критерий Лапласа

§2.1.9. Критерий Вальда (максиминный критерий)

§2.1.10. Критерий Гурвица (критерий взвешенного оптимизма /пессимизма)

§2.1.11. Критерий Сэвиджа (критерий наименьших сожалений)

§2.1.12. Решение игры против природы в смешанных стратегиях

§ 2.2 Неантагонистические игры

§2.2.1. Понятие неантагонистической игры

§2.2.2. Биматричные игры

§2.2.3. Равновесие Нэша

§2.2.4. Эффективность по Парето2

§2.2.5. Повторяющиеся игры. Применение к микроэкономике.

§2.2.6. Последовательные игры

Глава 3. Кооперативные решения

§3. 1. Понятие коалиционной игры

§3.2. Определение решения игры

§3.3. Эффективность обмена. Ящик Эджворта

§3.4. Арбитражное решение

Практикум Матричная игра. Доминирование стратегий.

Решение игры в чистых стратегиях.

Решение игры в смешанных стратегиях.

Игра против природы. Критерии Лапласа, Вальда, Сэвиджа, Гурвица.

Равновесие Нэша.

Кооперативные решения

Типовой расчет по теории игр. Тема:кооперативное решение.

Литература

"Теория игр для экономистов "

156961, Г.Кострома, ул. 1 Мая,14

§2.1.7. Критерии оптимальности решения в условиях неопределённости

Рассмотрим задачу принятия решения, когда на стадии принятия решения ЛПР знает:

а) возможные состояния среды: у1, у2,..уn Є Y – множество состояний окружающей среды.

б) результат, к которому приведёт выбор альтернативы х Є Х для каждого возможного состояния среды: у1, у2,..уn, т. е. знает функцию выигрыша (проигрыша): f(х,y) для всех х Є Х, у = Y.

Х – множество альтернатив

Y – множество состояний среды

При этом ЛПР не располагает информацией о том, как распределены вероятности состояний среды и даже не знает, какие из этих состояний более вероятны. Такая ситуация принятия решений определяется как структурная неопределённость.

Задача выбора «наилучшего» решения требует определить критерий оптимальности. Очевидно, что широкое разнообразие жизненных и экономических ситуаций не может быть описано с помощью единственного критерия оптимальности, в математических моделях принятия решения предложены и исследованы несколько критериев оптимальности.

Сформулируем определение – что из себя должен представлять критерий оптимальности?

Для этого определения выделим следующие моменты:

  1. Любой критерий оптимальности основан на определённых предположениях (гипотезах) о поведении окружающей среды.

  2. Критерий оптимальности представляет собой правило выбора «наилучшего» решения.

Таким образом, критерий оптимальности – это правило выбора «наилучшего» решения в условиях неопределённости, основанное на определённых предположениях относительно поведения окружающей среды и предпочтений ЛПР.

При этом желательно, чтобы критерий оптимальности обладал свойствами, согласующимися со здравым смыслом и рациональностью. Чтобы пояснить, в чем состоит в данном случае рациональный подход, вспомним понятие доминируемости.

Пусть задача принятия решения характеризуется n-состояниями среды: у1, у2,..уn и предусматривает выбор из m-альтернатив: х1, х2,..хm. Причём для каждой пары i, yj) определено значение функции fi, yj).


Тогда задачу принятия решения можно описать с помощью платёжной матрицы (Таблица 7):

Таблица 7

Состояния среды

Альтернативы

y1

y2

yj

yn

x1

f(x1,y1)

f(x1,y2)

f(x1,yj)

f(x1,yn)

x2

f(x2,y1)

f(x2,y2)

f(x2,yj)

f(x2,yn)

xi

f(xi,y1)

f(xi,y2)

f(xi,yj)

f(xi,yn)

xm

f(xm,y1)

f(xm,y2)

f(xm,yj)

f(xm,yn)

Предположим, что для некоторых целых чисел i и k Є [1,m] выполняется условие: для любого j f(xi,yj) ≥ f(xk,yj).

В строке i результаты больше, чем в строке k. Следовательно, стратегия xi доминирует стратегию xk, xk – доминируемая стратегия.


Очевидно, что доминируемые стратегии (или альтернативы) заведомо хуже других, а доминирующие заведомо лучше. Отсюда следует, что первый принцип, которому должен удовлетворять критерий оптимальности, это принцип доминирования.

a) Принцип доминирования:

- если существует доминирующая стратегия, то критерий оптимальности должен обеспечивать выбор именно этой стратегии;

- если существуют доминируемые стратегии, то их удаление и введение не должно влиять на выбор наилучшей стратегии.

Так же очевиден смысл двух других принципов:

b) Перенумерация альтернатив (нумерация строк) и/или состояний среды (нумерация столбцов) не должна влиять на выбор наилучшей стратегии.

c) Предположим, что ко всем значениям функции выигрыша добавлено число а: f(xi,yj) + a. Очевидно, что критерий оптимальности должен обеспечивать выбор наилучшей стратегии, которая не зависит от прибавления аддитивной постоянной к функции выигрыша.

Рассмотрим наиболее часто применяемые критерии оптимальности.


§2.1.8 Критерий Лапласа

Критерий Лапласа основан на гипотезе, согласно которой все состояния среды реализуются с одинаковыми вероятностями.

Если возможна реализация 2-х состояний А и В и нет никакой информации об их вероятностях, то естественно предполагать, что:

Р(А) = Р(В) = ½.

Если среда может принимать состояния у1, у2,..уn и нет информации о вероятностях этих значений, то естественно предполагать:

Р(у1) = Р(у2) = ...= Р(уn) = 1/n.

Пусть для задачи принятия решения, заданной Таблицей 1, принята гипотеза равной возможности. Для каждой стратегии xi определим значение функции L (xi):

L (xi) = 1/n*∑ f(xi,yj) (1.32)

Получим L(x1), L(x2),.. L(xn) – среднеарифметические выигрыши для каждой стратегии.

Выбираемая стратегия xi: L(xl) ≥ L(xi) (1.33)

Пример: Найти наилучшую стратегию по критерию Лапласа для задачи принятия решения, заданной платёжной матрицей Таблица 8:

Таблица 8

у1

у2

У3

L (xi)

х1

92

0

4

96/3=32

х2

30

50

10

90/3=30


Легко показать, что критерий Лапласа удовлетворяет всем 3-м условиям, определённым в пункте 2.1.1.

Тем не менее, у критерия Лапласа есть недостаток: по критерию Лапласа может быть выбрана рискованная стратегия.

Маленькие значения выигрыша при нахождении среднего перекрываются большими – эффект компенсации.

§2.1.9. Критерий Вальда (максиминный критерий)

Выбор критерия Вальда основан на гипотезе, согласно которой ЛПР стремится получить гарантированный результат при любом состоянии среды.


Пример: Найти наилучшую стратегию по критерию Вальда для задачи принятия решения, заданной платёжной матрицей Таблица 9:

Таблица 9

у1

у2

у3

у4

у5

аi

х1

1

3

2

4

5

1

х2

0

6

8

10

12

0


Решение. Найдём выбор по принципу максимина: для любого i min f(xi,yj) = ai – худший результат при выборе i.

maxmin f(xi,yj) = max ai = K.

Легко показать, что критерий Вальда удовлетворяет всем 3-м условиям, определённым в пункте 2.1.1.

Недостаток этого критерия: критерий Вальда отвергает хорошие гипотезы из-за своего крайнего пессимизма.

§2.1.10. Критерий Гурвица (критерий взвешенного оптимизма /пессимизма)

В основе этого критерия лежит гипотеза о том, что уровень пессимизма ЛПР принимает некоторое значение α: 0 ≤ α ≤ 1. Чем больше α, тем пессимистичнее настроен ЛПР. Для каждой строки xi определяется:

- число аi = min f((xi,yj);

- число bi = max f((xi,yj).

Затем для каждого значения xi и α рассчитывается число:

H(xi, α ) = α* аi + (1- α)* bi

и выбирается max H(xi, α ) = h(α).

Пример 3: Для Примера 2 найти наилучшую стратегию по критерию Гурвица, при значении α = ½ Таблица 10.

Таблица 10

у1

у2

у3

у4

у5

аi

bi

Hi(1/2)

х1

1

3

2

4

5

1

5

1*1/2+5*1/2=3

х2

0

6

8

10

12

0

12

0*1/2+12*1/2=6