Файл: Международный консорциум Электронный университет Московский государственный университет экономики, статистики и информатики.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 12.12.2023
Просмотров: 456
Скачиваний: 9
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Принятие решений в условиях неопределенности и риска (игры с природой)
63
Матрица игры с природой аналогична матрице стратегической игры:
m,n
ij
a
A =
, где
ij
a – выигрыш игрока 1 при реализации его чистой стратегии i и чистой стратегии j игрока 2
(
)
n
j
m
i
...,
,
;
...,
,
1 1
=
=
Мажорирование стратегий в игре с природой имеет определенную специфику: исключать из рассмотрения можно лишь доминируемые стратегии игрока 1: если для всех j=1, ..., n
,
...,
,
1
,
,
m
l
k
a
a
lj
kj
=
≤
то k-ю стратегию принимающего решения игрока 1 можно не рассматривать и вычеркнуть из матрицы игры. Столбцы, отвечающие страте- гиям природы, вычеркивать из матрицы игры (исключать из рассмотрения) недопусти- мо, поскольку природа не стремится к выигрышу в «игре» с человеком, для нее нет целе- направленно выигрышных или проигрышных стратегий, она действует неосознанно.
*
На первый взгляд, отсутствие обдуманного противодействия упрощает игроку за- дачу выбора решения. Однако, хотя ЛПР никто не мешает, ему труднее обосновать свой выбор, поскольку в этом случае гарантированный результат не известен.
Методы принятия решений в играх с природой зависят от характера неопреде- ленности, точнее от того, известны или нет вероятности состояний (стратегий) природы, т.е. имеет ли место ситуация риска или неопределенности. Ниже будут описаны методы, применяемые в обоих случаях.
Рассмотрим организацию и аналитическое представление игры с природой. Пусть игрок 1 имеет m возможных стратегий: А
1
,А
2
, ..., А
m
, а у природы имеется n возможных со- стояний (стратегий): П
1
,П
2
, ..., П
n
, тогда условия игры с природой задаются матрицей А выигрышей игрока 1:
=
mn
2
m
1
m
m
n
2
22
21
2
n
1
12
11
1
n
2
1
a
a
a
A
a
a
a
A
a
a
a
A
П
П
П
A
Платит, естественно, не природа, а некая третья сторона (или совокупность сто- рон, влияющих на принятие решений игроком 1 и объединенных в понятие «природа»).
Возможен и другой способ задания матрицы игры с природой: не в виде матрицы выигрышей, а в виде так называемой матрицы рисков
m,n
ij
r
R =
или матрицы упущен- ных возможностей. Величина риска – это размер платы за отсутствие информации о со- стоянии среды. Матрица R может быть построена непосредственно из условий задачи или на основе матрицы выигрышей А.
Риском r
ij
игрока при использовании им стратегии А
i
и при состоянии среды П
j
будем называть разность между выигрышем, который игрок получил бы, если бы он знал, что состоянием среды будет П
j
, и выигрышем, который игрок получит, не имея этой информации.
Зная состояние природы (стратегию) П
j
, игрок выбирает ту стратегию, при кото- рой его выигрыш максимальный, т.е.
,
ij
j
ij
a
r
−
β
=
где
ij
m
i
j
a
≤
≤
=
β
1
max при заданном j. Напри- мер, для матрицы выигрышей
=
2 6
6 4
3 4
8 3
9 5
4 1
3 2
1 4
3 2
1
А
А
А
П
П
П
П
A
(97)
9
,
6
,
8
=
,
4 4
3 2
1
=
β
=
β
β
=
β
Моделирование рисковых ситуаций
64
Согласно введенным определениям
j
ij
r
β
и получаем матрицу рисков
=
7 0
2 0
6 2
0 1
0 1
4 3
3 2
1 4
3 2
1
А
А
А
П
П
П
П
R
. (98)
Независимо от вида матрицы игры требуется выбрать такую стратегию игрока
(чистую или смешанную, если последняя имеет смысл), которая была бы наиболее вы- годной по сравнению с другими. Необходимо отметить, что в игре с природой понятие смешанной стратегии игрока не всегда правомерно, поскольку его действия могут быть альтернативными, т.е. выбор одной из стратегий отвергает все другие стратегии (напри- мер, выбор альтернативных проектов).
Вначале следует проверить, нет ли среди стратегий игрока мажорируемых, и, если таковые имеются, исключить их.
4.2. Принятие решений в условиях полной неопределенности
Неопределенность, связанную с отсутствием информации о вероятностях состоя- ний среды (природы), называют «безнадежной» или «дурной».
В таких случаях для определения наилучших решений используются следующие критерии: максимакса, Вальда, Сэвиджа, Гурвица.
Применение каждого из перечисленных критериев проиллюстрируем на примере матрицы выигрышей (97) или связанной с ней матрицы рисков (98).
Критерий максимакса. С его помощью определяется стратегия, максимизирующая максимальные выигрыши для каждого состояния природы. Это критерий крайнего оп- тимизма. Наилучшим признается решение, при котором достигается максимальный вы- игрыш, равный
ij
n
j
m
i
a
M
max
max
≤
≤
≤
≤
=
1 1
Нетрудно увидеть, что для матрицы А наилучшим решением будет А
1
, при кото- ром достигается максимальный выигрыш – 9.
Следует отметить, что ситуации, требующие применения такого критерия, в эко- номике в общем нередки, и пользуются им не только безоглядные оптимисты, но и игро- ки, поставленные в безвыходное положение, когда они вынуждены руководствоваться принципом «или пан, или пропал».
Максиминный критерий Вальда. С позиций данного критерия природа рассматри- вается как агрессивно настроенный и сознательно действующий противник типа тех, ко- торые противодействуют в стратегических играх (см. тему 3). Выбирается решение, для которого достигается значение
ij
n
j
m
i
a
W
1 1
min max
≤
≤
≤
≤
=
Для платежной матрицы А (3.1) нетрудно рассчитать:
• для первой стратегии (i=1)
=
≤
≤
ij
j
a
min
4 1
1;
• для второй стратегии (i=2)
=
≤
≤
ij
j
a
min
4 1
3;
• для третьей стратегии (i=3)
=
≤
≤
ij
j
a
min
4 1
2.
Тогда
3
min max
4 1
3 1
=
=
≤
≤
≤
≤
ij
j
i
a
W
, что соответствует второй стратегии А
2
игрока 1
В соответствии с критерием Вальда из всех самых неудачных результатов выбира- ется лучший (W = 3). Это перестраховочная позиция крайнего пессимиста, рассчитанная
Принятие решений в условиях неопределенности и риска (игры с природой)
65
на худший случай. Такая стратегия приемлема, например, когда игрок не столь заинте- ресован в крупной удаче, но хочет себя застраховать от неожиданных проигрышей. Вы- бор такой стратегии определяется отношением игрока к риску.
Критерий минимаксного риска Сэвиджа. Выбор стратегии аналогичен выбору страте- гии по принципу Вальда с тем отличием, что игрок руководствуется не матрицей выиг- рышей А (97), а матрицей рисков R (98):
ij
n
j
m
i
r
S
1 1
max min
≤
≤
≤
≤
=
Для матрицы R (98) нетрудно рассчитать:
• для первой стратегии (i=1)
ij
j
r
4 1
max
≤
≤
= 4;
• для второй стратегии (i=2)
ij
j
r
4 1
max
≤
≤
= 6;
• для третьей стратегии (i=3)
ij
j
r
4 1
max
≤
≤
= 7.
Минимально возможный из самых крупных рисков, равный 4, достигается при ис- пользовании первой стратегии А
1
Критерий пессимизма—оптимизма Гурвица.
Этот критерий при выборе решения рекомендует руководствоваться некоторым средним результатом, характеризующим состояние между крайним пессимизмом и безу- держным оптимизмом. Согласно этому критерию, стратегия в матрице А выбирается в соответствии со значением
( )
=
≤
≤
≤
≤
≤
≤
ij
n
j
ij
n
j
m
i
A
a
-p
a
p
H
max
1
+
min max
1 1
1
, где p – коэффициент пессимизма (0 ≤ р ≤ 1).
При p = 0 критерий Гурвица совпадает с максимаксным критерием, а при p = 1 – с критерием Вальда.
Покажем процедуру применения данного критерия для матрицы А (97) при р = 0,5:
• для первой стратегии
(
)
(
)
5 9
1 5
0
max
+
min
5
,
0 1
=
i
4 1
4 1
=
+
=
≤
≤
≤
≤
,
a
a
ij
j
ij
j
;
• для второй стратегии
(
)
(
)
5
,
5 8
3 5
0
max
+
min
5
,
0 2
=
i
4 1
4 1
=
+
=
≤
≤
≤
≤
,
a
a
ij
j
ij
j
;
• для третьей стратегии
(
)
(
)
4 6
2 5
0
max
+
min
5
,
0 3
=
i
4 1
4 1
=
+
=
≤
≤
≤
≤
,
a
a
ij
j
ij
j
Тогда
5 5
max
+
min
5 0
max
4 1
4 1
3 1
,
a
a
,
=
H
ij
j
ij
j
i
A
=
≤
≤
≤
≤
≤
≤
, т.е. оптимальной является вторая стра- тегия А
2
Применительно к матрице рисков R критерий пессимизма-оптимизма Гурвица имеет вид:
(
)
−
≤
≤
≤
≤
≤
≤
ij
n
j
ij
n
j
m
i
R
r
p
r
p
=
H
min
1
+
max min
1 1
1
,
При р = 0 выбор стратегии игрока 1 осуществляется по условию наименьшего из всех возможных рисков (
ij
j
i
r
,
min
); при р = 1 – по критерию минимаксного риска Сэвиджа.
Моделирование рисковых ситуаций
66
В случае, когда по принятому критерию рекомендуются к использованию не- сколько стратегий, выбор между ними может делаться по дополнительному критерию, например, в расчет могут приниматься средние квадратичные отклонения от средних выигрышей при каждой стратегии. Данная идея отвечает подходу, рассмотренному в пункте 1.2 (см. рис. 1). Еще раз подчеркнем, что здесь стандартного подхода нет. Выбор может зависеть от склонности к риску ЛПР.
В заключение приведем результаты применения рассмотренных выше критериев на примере следующей матрицы выигрышей:
5 45 5
85 25 25 80 25 20 35 20 75 15 15 30 20 4
3 2
1 3
2 1
A
A
A
A
П
П
П
П
4
Для игрока 1 лучшими являются стратегии:
• по критерию Вальда – А
3
;
• по критерию Сэвиджа – А
2
и А
3
;
• по критерию Гурвица (при р = 0,6) – А
3
;
• по критерию максимакса – А
4
Поскольку стратегия А
3
фигурирует в качестве оптимальной по трем критериям выбора из четырех испытанных, степень ее надежности можно признать достаточно вы- сокой для того, чтобы рекомендовать эту стратегию к практическому применению.
Таким образом, в случае отсутствия информации о вероятностях состояний среды теория не дает однозначных и математически строгих рекомендаций по выбору критериев принятия решений. Это объясняется в большей мере не слабостью теории, а неопределенностью самой ситуации. Единственный разумный выход в подобных случаях – попытаться получить дополнительную информацию, например, путем про- ведения исследований или экспериментов. В отсутствие дополнительной информа- ции принимаемые решения теоретически недостаточно обоснованы и в значительной мере субъективны. Хотя применение математических методов в играх с природой не дает абсолютно достоверного результата и последний в определенной степени явля- ется субъективным (вследствие произвольности выбора критерия принятия решения), оно тем не менее создает определенное упорядочение имеющихся в распоряжении
ЛПР данных: определяются множество состояний природы, альтернативные решения, выигрыши и потери при различных сочетаниях состояния «среда – решение». Такое упорядочение представлений о проблеме само по себе способствует повышению каче- ства принимаемых решений.
1 2 3 4 5 6 7 8 9 10 11
4.3. Принятие решений в условиях риска
Методы принятия решений в условиях риска разрабатываются и обосновываются в рамках так называемой теории статистических решений. При этом в случае «доброка- чественной», или стохастической, неопределенности, когда состояниям природы постав- лены в соответствие вероятности, заданные экспертно либо вычисленные, решение обычно принимается на основе критерия максимума ожидаемого среднего выигрыша или минимума ожидаемого среднего риска (матрицы типа (97) либо (98)).
Принятие решений в условиях неопределенности и риска (игры с природой)
67
Если для некоторой игры с природой, задаваемой платежной матрицей
m,n
ij
a
A =
, стратегиям природы П
j
соответствуют вероятности p
j
, то лучшей стратегией игрока 1 будет та, которая обеспечивает ему максимальный средний выигрыш, т.е. max
1 1
ij
n
j
j
m
i
a
p
∑
=
≤
≤
(99)
Применительно к матрице рисков (матрице упущенных выгод) лучшей будет та стратегия игрока, которая обеспечивает ему минимальный средний риск:
∑
=
≤
≤
n
j
ij
j
r
p
1
m i
1
min
(100)
Заметим, что когда говорится о среднем выигрыше или риске, то подразумевается многократное повторение акта принятия решений. Условность предположения заклю- чается в том, что реально требуемого количества повторений чаще всего может и не быть.
Покажем, что критерии (99) и (100) эквивалентны в том смысле, что оптимальные значения для них обеспечивает одна и та же стратегия А
i
игрока 1. Действительно,
(
)
=
−
β
=
−
β
=
∑
∑
∑
∑
=
=
≤
≤
=
≤
≤
=
≤
≤
n
j
ij
j
n
j
j
j
m
i
ij
j
n
j
j
m
i
n
j
ij
j
m
i
a
p
p
a
p
r
p
1 1
1 1
1 1
1
min min min
ij
n
j
j
m
i
j
n
j
j
m
i
a
p
p
∑
∑
=
≤
≤
=
≤
≤
−
β
=
1 1
1 1
min min
= const +
∑
=
≤
≤
n
j
ij
j
m
i
a
p
1 1
max
,
т.е. значения критериев отличаются на постоянную величину, поэтому принятое реше- ние не зависит от стратегии А
i
Например, для игры, задаваемой матрицей А (97) или матрицей R (98), при усло- вии, что p
1
= p
2
= p
3
= p
4
= 1/4, А
1
– лучшая стратегия игрока 1 по критерию (99), по- скольку
4 19
max
4 1
4 4
1
=
3 1
4 1
1
=
=
∑
∑
≤
≤
=
j
ij
i
j
j
a
a
Эта же стратегия является лучшей для игрока 1 по критерию (100) относительно обеспечения минимального уровня риска:
=
∑
=
4 1
j
ij
j
r
p
2
min
4 1
4 1
=
3 1
=
∑
≤
≤
j
ij
i
r
На практике целесообразно отдавать предпочтение матрице выигрышей (97) или матрице рисков (98) в зависимости от того, какая из них определяется с большей досто- верностью. Это особенно важно учитывать при экспертных оценках элементов матриц А и R.
4.4. Выбор решений с помощью дерева решений (позиционные игры)
Рассмотрим более сложные (позиционные, или многоэтапные) решения в услови- ях риска. Одноэтапные игры с природой, таблицы решений (см. разд. 3.3), удобно ис- пользовать в задачах, имеющих одно множество альтернативных решений и одно множе- ство состояний среды. Многие задачи, однако, требуют анализа последовательности ре- шений и состояний среды, когда одна совокупность стратегий игрока и состояний природы порождает другое состояние подобного типа. Если имеют место два или более