Файл: М.А. Тынкевич Принятие решений в условия неопределенности (теория игр и статистических решений).pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 01.06.2024

Просмотров: 33

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ

КУЗБАССКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ

Кафедра вычислительной техники и информационных технологий

ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ

(ТЕОРИЯ ИГР И СТАТИСТИЧЕСКИХ РЕШЕНИЙ)

Методические указания и задания к практическим занятиям по курсам

“Исследование операций в экономике” и “Экономико-математические методы”

для студентов экономических специальностей

Составители М.А.Тынкевич О.А. Бияков

Утверждены на заседании кафедры вычислительной техники и информационных технологий Протокол № 5 от 16.01.2001

Рекомендованы к печати учебно-методической комиссией по специальности 351400 Протокол № 3 от 16.01.2001

Кемерово 2001

1

Работа 1. Матричные игры

1.1. Постановка задачи и описание метода решения

Теория игр занимается изучением т. н. конфликтных ситуаций, где сталкиваются интересы индивидов, партий, государств и т. п. Разумеется, не существует математической теории, которая могла бы однозначно предсказать результат реальной игры, но существуют ситуации, подобные игровым и допускающие математический анализ.

Простейшими среди игр являются матричные игры с нулевой суммой. В такой игре участвуют два игрока, первый из которых имеет m выборов и второй - n выборов. Если игрок 1 делает свой i-й выбор, а игрок

2 - свой j-й выбор, то выигрыш игрока 1 (проигрыш игрока 2) равен Rij.

Матрица R = [ Rij / i=1..m , j=1..n ] называется матрицей выигрышей

(платежной матрицей).

Система правил, однозначно определяющая выбор игрока в зависимости от сложившейся ситуации, называется стратегией.

Каждая фиксированная стратегия игрока, где конкретный выбор со-

поставлен любой ситуации, называется

чистой. В реальности чаще ис-

пользуются т.н. смешанные стратегии,

где чистые стратегии смеши-

ваются с некоторыми частотами.

При ведении игры игрок должен ориентироваться на оптимальную политику партнера и наказывать его за отступления от таковой.

С этих позиций игроку 1 гарантирован выигрыш, не меньший

V1 = max min Rij ,

i=1..m j=1..n

а игроку 2 - проигрыш, не превышающий

V2 = max min Rij .

i=1..m j=1..n

Если в матрице выигрышей существует элемент Rk l = V1 = V2, то говорят о наличии оптимальной политики "в пространстве чистых стратегий" и оптимальными выборами для игроков соответственно

являются выборы k

и l .

Пару (k, l) называют

седловой точкой.

Пример 1. Пусть игра определяется матрицей

 

2

3

4

5

 

 

2

 

 

 

 

 

 

 

 

 

 

R =

3

4

5

6

, V1

= max

4

 

 

= 6 , V2

= min [ 6, 6, 8, 10 ] = 6.

 

4

3

4

6

 

 

3

 

 

 

 

 

6

6

8

10

 

 

6

 

 

 

 

Седловые точки - (4, 1) и (4, 2). Цена игры = 6; оптимальный выбор для игрока 1 - четвертый, для игрока 2 равнозначны первый и второй

(под ценой игры понимают гарантированный выигрыш-проигрыш при оптимальной политике обоих игроков).


 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

Пример 2. Пусть игра определяется матрицей

 

 

 

 

 

5

4

3

7

6

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

R =

 

 

 

6

2

4

3

5

 

 

,

V

= max

 

 

 

2

 

 

= 3 ,

V

= min [ 7, 7 4, 7, 6 ] = 4.

 

 

 

 

2

7

3

5

4

 

 

 

1

 

 

 

 

2

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7

3

4

4

4

 

 

 

 

 

 

 

 

3

 

 

 

 

 

Здесь равенство V1 = V2 не выполняется; оптимальной чистой стратегии для игроков нет.

При анализе игр часто пытаются уменьшить размеры изучаемой матрицы, выявляя доминирование между строками и столбцами. Так в примере 1 элементы четвертой строки больше соответствующих элементов других строк: использование выбора 4 выгоднее других выборов при любой политике противника. Противник видит, что в такой ситуации использовать выборы 3 и 4 неразумно.

При отсутствии седловой точки среди чистых стратегий приходится искать таковую среди смешанных.

Если игрок 1 прибегает к своему выбору i

с вероятностью Pi

,а иг-

рок 2 - к своему

j-му выбору с вероятностью

Qj , то ожидаемый

выиг-

рыш игрока 1 (проигрыш игрока 2) равен ∑m Ri j Pi Q j = PT R Q .

 

 

i=1

 

 

Основная

теорема теории игр ( теорема Джона фон Неймана )

утверждает, что любая матричная игра с нулевой суммой всегда имеет седловую точку, т.е. существуют векторы P и Q такие, что

max

min PT RQ =

min max PT RQ = V ,

P

Q

Q P

(V - цена игры).

 

 

Поиск цены игры и соответствующих вероятностей сводится к ре-

шению пары двойственных задач:

 

 

 

максимизировать V

минимизировать V

 

при условиях

при условиях

 

m

Ri j Pi V , j=1 . . n

n

Ri j Q j V , i=1 . . m

 

i= 1

j= 1

 

m

Pi = 1

n

Q j = 1

(1)

i= 1

 

j=

1

 

Pi ≥ 0 , i=1 . . m

Qj ≥ 0 , j=1 . . n

 

Если учесть, что при увеличении элементов матрицы R на любую константу С цена игры увеличится на С и это изменение не окажет влияния на искомые вероятности выборов, то всегда можно добиться положительности элементов матрицы и, следовательно, цены игры.

В предположении V > 0 можно провести замену переменных

Хi = Pi / V , Yj = Q j / V


3

и поставленные задачи преобразовать к задачам с меньшим числом переменных:

минимизировать m

X i

 

 

максимизировать n

Y j

 

при условиях

i= 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j=

1

 

 

 

 

 

 

 

 

 

при условиях

 

 

m

Ri j X i 1 ,

j=1 . . n

 

 

n

R

j

Y

j

1 , i=1 . . m

(2)

i= 1

 

 

 

 

 

 

 

 

 

j=

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

Xi ≥ 0 , i=1 . . m

 

 

 

 

 

 

 

Yj ≥ 0 , j=1 . . n

 

 

Например, для игры с матрицей

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

0

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

3

0

 

 

 

 

 

 

 

 

 

 

возникают задачи:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

максимизировать

 

 

 

 

 

 

 

минимизировать

 

 

Y1 + Y2 + Y3

 

 

 

 

 

 

 

при

X1 + X2 + X3

 

 

при

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Y1 + 2 Y2 + 3 Y3 1

 

 

 

 

 

X1 + 4 X2 + 2 X3 1

 

4 Y1 +

Y3 1

 

 

 

 

 

2 X1

 

 

 

+ 3 X3 1

 

2 Y1 + 3 Y2

1

 

 

 

 

 

 

 

3 X1 + X2

1

 

Y1 , Y2 ,Y3 0

 

 

 

 

 

 

 

 

 

 

 

X1 , X2 , X3 0

 

 

Решение этих задач симплексным методом дает оптимальные зна-

чения

X = { 11/37, 4/37, 5/37 }, Y = { 8/37, 7/37, 5/37 }

и экстремумы целевых функций, равные 20/37. Отсюда

V = 37/20 ,

P = {11/20, 4/20, 5/20} ,

Q = {8/20, 7/20, 5/20}.

Следует учесть, что мы здесь ограничиваемся рассмотрением игр, реализация которых может осуществляться любое число раз, не зависит от результата предыдущих действий и от длительности. Игры, где каждый последующий выбор зависит от результата предыдущих действий, относятся к т.н. многошаговым играм и не имеют столь простого решения [1].

1.2. Контрольные задания

1.2.1. Требования

1. Для матричной игры, соответствующей варианту контрольного задания, проверьте наличие оптимальной чистой стратегии.

2. Поставьте пару двойственных задач и выполните ее решение симплексным или каким-либо другим методом. Оцените полученное опти-


4

мальное решение с позиций здравого смысла.

3. С помощью лекционного материала, учебных пособий или собственных умозаключений выясните правомерность постановки задач (1) и

(2). Зачем при переходе от постановки (1) к (2) требуется уверенность в положительности цены игры ?

1.2.2. Варианты заданий

1.

1

-1

-1

3

 

2.

1

3

5

7

 

3.

-2

0

2

4

 

-1

1

0

-3

 

 

7

5

3

1

 

 

4

2

0

-2

 

-2

2

3

1

 

 

4

4

4

3

 

 

1

0

0

1

4

 

 

 

 

 

5

 

 

 

 

 

6

 

 

 

 

1

6

3

-3

 

1

4

9

16

 

1

9

1

5

 

2

4

3

5

 

 

16

9

4

1

 

 

2

4

4

4

 

3

2

5

-3

 

 

10

10

10

15

 

 

3

1

9

6

7

 

 

 

 

 

8

 

 

 

 

 

9

 

 

 

 

7

5

3

1

 

0

1

-1

0

 

3

-3

4

-4

 

1

3

5

7

 

 

-1

0

0

1

 

 

-3

3

-4

-4

 

4

4

4

3

 

 

2

-2

1

0

 

 

4

-4

3

-3

 

0

5

5

0

 

 

-2

2

0

1

 

 

-4

4

-3

3

10

 

 

 

 

 

11

 

 

 

 

 

12

 

 

 

 

0

1

2

3

4

0

-1

1

2

-2

5

-5

3

-3

 

1

2

4

6

3

 

-1

0

-1

-2

2

 

-5

5

-3

4

 

0

3

2

1

5

 

0

0

0

3

-3

 

-1

0

0

1

13

 

 

 

 

 

14

 

 

 

 

 

15

 

 

 

 

1

2

1

3

2

6

4

2

0

 

4

2

0

-2

 

2

1

4

4

4

 

0

2

4

6

 

 

-2

0

2

4

 

1

3

4

4

4

 

3

3

3

2

 

 

1

1

1

0

 

3

1

1

5

4

 

-1

4

4

-1

 

 

-3

2

2

-3

16

 

 

 

 

 

17

 

 

 

 

 

18

 

 

 

 

1

3

2

1

2

0

2

1

0

1

9

-9

0

 

 

3

1

3

2

4

 

2

0

2

1

3

 

-9

5

1

 

 

5

0

3

3

3

 

4

-1

2

2

2

 

0

1

-1

 

19

 

 

 

 

 

20

 

 

 

 

 

21

 

 

 

 

5

-5

3

4

 

5

-5

3

 

 

0

1

2

3

 

-5

5

4

2

 

 

-5

5

4

 

 

 

1

0

3

2

 

1

1

1

-1

 

 

1

1

1

 

 

 

2

3

0

1

 

0

0

-1

1

 

 

0

0

-1

 

 

 

3

2

1

0

22

1

0

1

-1

 

23

1

0

1

 

 

24

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

-1

1

2

1

2

-2

0

1

0

1

1

2

3

 

 

1

-1

3

2

4

 

0

-2

2

1

3

 

2

3

2

 

 

3

0

3

3

3

 

4

-1

2

2

2

 

3

2

1

 


5

Работа 2. Статистические решения

2.1. Основные понятия теории статистических решений

Теория статистических решений может быть истолкована как теория поиска оптимального недетерминированного поведения в условиях неопределенности. Согласно А.Вальду, поведение считается оптимальным, если оно минимизирует риск в последовательных экспериментах, т.е. математическое ожидание убытков статистического эксперимента. В такой постановке любая задача статистических решений может рассматриваться как игра двух лиц, в которой одним из игроков является "природа".

Иногда усредненные характеристики некоторого случайного процесса испытывают тенденцию к стабилизации и появляется возможность либо замены его детерминированным, либо использования каких-то методов исследования стационарных случайных процессов ( методов теории массового обслуживания и др.).

Однако большинство процессов характеризуется "дурной неопределенностью" , для которой невозможно найти законы распределения и другие вероятностные характеристики. В таких ситуациях приходится прибегнуть к экспертным оценкам.

Возникает и проблема выбора критерия оптимальности, поскольку решение, оптимальное для каких-то условий, бывает неприемлемым в других и приходится искать некоторый компромисс.

Пусть задан некоторый вектор S = (S1,S2,..,Sn), описывающий n со-

стояний внешней среды, и вектор X = (X1,X2,..,Xm), описывающий m до-

пустимых решений. Требуется найти вектор X* =(0,0,..,0, Xi ,0,..,0), который обеспечивает оптимум некоторой функции полезности W(X,S) по некоторому критерию K.

Информация oб указанной функции представляют матрицей размер-

ности m × n c элементами Wij = F(Xi,S j), где F - решающее правило. Рассмотрим типичный пример формирования такой матрицы. Планируется выпуск новой продукции, для чего необходимо заку-

пить станки. Система оптовой торговли может поставить не более 50 станков; комплект поставки - 10 станков. Минимальный объем поставок - 20 станков. Соответственно, вектор решений об объеме поставок X = (20,30,40,50).

Ежегодный доход от продукции, снимаемой с одного станка, cоставляет 21.9 тыс.руб. Оптовая цена одного станка 4.775 тыс. руб., эксплуатационные расходы - 3.6 тыс. руб. Затраты на подготовку производства составляют 25.5 тыс.руб. и не зависят от числа станков и объема выпуска.

Пусть спрос пропорционален количеству продукции, снимаемой с S работающих станков, и для простоты ограничимся вектором состояний