Файл: Международный консорциум Электронный университет Московский государственный университет экономики, статистики и информатики.pdf

Скачать файл (1,32Мб)

Заказать решение

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 12.12.2023

Просмотров: 456

Скачиваний: 9

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Принятие решений в условиях неопределенности и риска (игры с природой)
63
Матрица игры с природой аналогична матрице стратегической игры:
m,n
ij
a
A =
, где
ij
a – выигрыш игрока 1 при реализации его чистой стратегии i и чистой стратегии j игрока 2
(
)
n
j
m
i
...,
,
;
...,
,
1 1
=
=
Мажорирование стратегий в игре с природой имеет определенную специфику: исключать из рассмотрения можно лишь доминируемые стратегии игрока 1: если для всех j=1, ..., n
,
...,
,
1
,
,
m
l
k
a
a
lj
kj
=
≤
то k-ю стратегию принимающего решения игрока 1 можно не рассматривать и вычеркнуть из матрицы игры. Столбцы, отвечающие страте- гиям природы, вычеркивать из матрицы игры (исключать из рассмотрения) недопусти- мо, поскольку природа не стремится к выигрышу в «игре» с человеком, для нее нет целе- направленно выигрышных или проигрышных стратегий, она действует неосознанно.
*
На первый взгляд, отсутствие обдуманного противодействия упрощает игроку за- дачу выбора решения. Однако, хотя ЛПР никто не мешает, ему труднее обосновать свой выбор, поскольку в этом случае гарантированный результат не известен.
Методы принятия решений в играх с природой зависят от характера неопреде- ленности, точнее от того, известны или нет вероятности состояний (стратегий) природы, т.е. имеет ли место ситуация риска или неопределенности. Ниже будут описаны методы, применяемые в обоих случаях.
Рассмотрим организацию и аналитическое представление игры с природой. Пусть игрок 1 имеет m возможных стратегий: А
1
,А
2
, ..., А
m
, а у природы имеется n возможных со- стояний (стратегий): П
1
,П
2
, ..., П
n
, тогда условия игры с природой задаются матрицей А выигрышей игрока 1:












=
mn
2
m
1
m
m
n
2
22
21
2
n
1
12
11
1
n
2
1
a
a
a
A
a
a
a
A
a
a
a
A
П
П
П
A
Платит, естественно, не природа, а некая третья сторона (или совокупность сто- рон, влияющих на принятие решений игроком 1 и объединенных в понятие «природа»).
Возможен и другой способ задания матрицы игры с природой: не в виде матрицы выигрышей, а в виде так называемой матрицы рисков
m,n
ij
r
R =
или матрицы упущен- ных возможностей. Величина риска – это размер платы за отсутствие информации о со- стоянии среды. Матрица R может быть построена непосредственно из условий задачи или на основе матрицы выигрышей А.
Риском r
ij
игрока при использовании им стратегии А
i
и при состоянии среды П
j
будем называть разность между выигрышем, который игрок получил бы, если бы он знал, что состоянием среды будет П
j
, и выигрышем, который игрок получит, не имея этой информации.
Зная состояние природы (стратегию) П
j
, игрок выбирает ту стратегию, при кото- рой его выигрыш максимальный, т.е.
,
ij
j
ij
a
r
−
β
=
где
ij
m
i
j
a
≤
≤
=
β
1
max при заданном j. Напри- мер, для матрицы выигрышей










=
2 6
6 4
3 4
8 3
9 5
4 1
3 2
1 4
3 2
1
А
А
А
П
П
П
П
A
(97)
9
,
6
,
8
=
,
4 4
3 2
1
=
β
=
β
β
=
β

Моделирование рисковых ситуаций
64
Согласно введенным определениям
j
ij
r
β
и получаем матрицу рисков










=
7 0
2 0
6 2
0 1
0 1
4 3
3 2
1 4
3 2
1
А
А
А
П
П
П
П
R
. (98)
Независимо от вида матрицы игры требуется выбрать такую стратегию игрока
(чистую или смешанную, если последняя имеет смысл), которая была бы наиболее вы- годной по сравнению с другими. Необходимо отметить, что в игре с природой понятие смешанной стратегии игрока не всегда правомерно, поскольку его действия могут быть альтернативными, т.е. выбор одной из стратегий отвергает все другие стратегии (напри- мер, выбор альтернативных проектов).
Вначале следует проверить, нет ли среди стратегий игрока мажорируемых, и, если таковые имеются, исключить их.
4.2. Принятие решений в условиях полной неопределенности
Неопределенность, связанную с отсутствием информации о вероятностях состоя- ний среды (природы), называют «безнадежной» или «дурной».
В таких случаях для определения наилучших решений используются следующие критерии: максимакса, Вальда, Сэвиджа, Гурвица.
Применение каждого из перечисленных критериев проиллюстрируем на примере матрицы выигрышей (97) или связанной с ней матрицы рисков (98).
Критерий максимакса. С его помощью определяется стратегия, максимизирующая максимальные выигрыши для каждого состояния природы. Это критерий крайнего оп- тимизма. Наилучшим признается решение, при котором достигается максимальный вы- игрыш, равный
ij
n
j
m
i
a
M
max
max
≤
≤
≤
≤
=
1 1
Нетрудно увидеть, что для матрицы А наилучшим решением будет А
1
, при кото- ром достигается максимальный выигрыш – 9.
Следует отметить, что ситуации, требующие применения такого критерия, в эко- номике в общем нередки, и пользуются им не только безоглядные оптимисты, но и игро- ки, поставленные в безвыходное положение, когда они вынуждены руководствоваться принципом «или пан, или пропал».
Максиминный критерий Вальда. С позиций данного критерия природа рассматри- вается как агрессивно настроенный и сознательно действующий противник типа тех, ко- торые противодействуют в стратегических играх (см. тему 3). Выбирается решение, для которого достигается значение
ij
n
j
m
i
a
W
1 1
min max
≤
≤
≤
≤
=
Для платежной матрицы А (3.1) нетрудно рассчитать:
• для первой стратегии (i=1)
=
≤
≤
ij
j
a
min
4 1
1;
• для второй стратегии (i=2)
=
≤
≤
ij
j
a
min
4 1
3;
• для третьей стратегии (i=3)
=
≤
≤
ij
j
a
min
4 1
2.
Тогда
3
min max
4 1
3 1
=
=
≤
≤
≤
≤
ij
j
i
a
W
, что соответствует второй стратегии А
2
игрока 1
В соответствии с критерием Вальда из всех самых неудачных результатов выбира- ется лучший (W = 3). Это перестраховочная позиция крайнего пессимиста, рассчитанная

Принятие решений в условиях неопределенности и риска (игры с природой)
65
на худший случай. Такая стратегия приемлема, например, когда игрок не столь заинте- ресован в крупной удаче, но хочет себя застраховать от неожиданных проигрышей. Вы- бор такой стратегии определяется отношением игрока к риску.
Критерий минимаксного риска Сэвиджа. Выбор стратегии аналогичен выбору страте- гии по принципу Вальда с тем отличием, что игрок руководствуется не матрицей выиг- рышей А (97), а матрицей рисков R (98):
ij
n
j
m
i
r
S
1 1
max min
≤
≤
≤
≤
=
Для матрицы R (98) нетрудно рассчитать:
• для первой стратегии (i=1)
ij
j
r
4 1
max
≤
≤
= 4;
• для второй стратегии (i=2)
ij
j
r
4 1
max
≤
≤
= 6;
• для третьей стратегии (i=3)
ij
j
r
4 1
max
≤
≤
= 7.
Минимально возможный из самых крупных рисков, равный 4, достигается при ис- пользовании первой стратегии А
1
Критерий пессимизма—оптимизма Гурвица.
Этот критерий при выборе решения рекомендует руководствоваться некоторым средним результатом, характеризующим состояние между крайним пессимизмом и безу- держным оптимизмом. Согласно этому критерию, стратегия в матрице А выбирается в соответствии со значением
( )






=
≤
≤
≤
≤
≤
≤
ij
n
j
ij
n
j
m
i
A
a
-p
a
p
H
max
1
+
min max
1 1
1
, где p – коэффициент пессимизма (0 ≤ р ≤ 1).
При p = 0 критерий Гурвица совпадает с максимаксным критерием, а при p = 1 – с критерием Вальда.
Покажем процедуру применения данного критерия для матрицы А (97) при р = 0,5:
• для первой стратегии
(
)
(
)
5 9
1 5
0
max
+
min
5
,
0 1
=
i
4 1
4 1
=
+
=






≤
≤
≤
≤
,
a
a
ij
j
ij
j
;
• для второй стратегии
(
)
(
)
5
,
5 8
3 5
0
max
+
min
5
,
0 2
=
i
4 1
4 1
=
+
=






≤
≤
≤
≤
,
a
a
ij
j
ij
j
;
• для третьей стратегии
(
)
(
)
4 6
2 5
0
max
+
min
5
,
0 3
=
i
4 1
4 1
=
+
=






≤
≤
≤
≤
,
a
a
ij
j
ij
j
Тогда
5 5
max
+
min
5 0
max
4 1
4 1
3 1
,
a
a
,
=
H
ij
j
ij
j
i
A
=












≤
≤
≤
≤
≤
≤
, т.е. оптимальной является вторая стра- тегия А
2
Применительно к матрице рисков R критерий пессимизма-оптимизма Гурвица имеет вид:
(
)






−
≤
≤
≤
≤
≤
≤
ij
n
j
ij
n
j
m
i
R
r
p
r
p
=
H
min
1
+
max min
1 1
1
,
При р = 0 выбор стратегии игрока 1 осуществляется по условию наименьшего из всех возможных рисков (
ij
j
i
r
,
min
); при р = 1 – по критерию минимаксного риска Сэвиджа.

Моделирование рисковых ситуаций
66
В случае, когда по принятому критерию рекомендуются к использованию не- сколько стратегий, выбор между ними может делаться по дополнительному критерию, например, в расчет могут приниматься средние квадратичные отклонения от средних выигрышей при каждой стратегии. Данная идея отвечает подходу, рассмотренному в пункте 1.2 (см. рис. 1). Еще раз подчеркнем, что здесь стандартного подхода нет. Выбор может зависеть от склонности к риску ЛПР.
В заключение приведем результаты применения рассмотренных выше критериев на примере следующей матрицы выигрышей:












5 45 5
85 25 25 80 25 20 35 20 75 15 15 30 20 4
3 2
1 3
2 1
A
A
A
A
П
П
П
П
4
Для игрока 1 лучшими являются стратегии:
• по критерию Вальда – А
3
;
• по критерию Сэвиджа – А
2
и А
3
;
• по критерию Гурвица (при р = 0,6) – А
3
;
• по критерию максимакса – А
4
Поскольку стратегия А
3
фигурирует в качестве оптимальной по трем критериям выбора из четырех испытанных, степень ее надежности можно признать достаточно вы- сокой для того, чтобы рекомендовать эту стратегию к практическому применению.
Таким образом, в случае отсутствия информации о вероятностях состояний среды теория не дает однозначных и математически строгих рекомендаций по выбору критериев принятия решений. Это объясняется в большей мере не слабостью теории, а неопределенностью самой ситуации. Единственный разумный выход в подобных случаях – попытаться получить дополнительную информацию, например, путем про- ведения исследований или экспериментов. В отсутствие дополнительной информа- ции принимаемые решения теоретически недостаточно обоснованы и в значительной мере субъективны. Хотя применение математических методов в играх с природой не дает абсолютно достоверного результата и последний в определенной степени явля- ется субъективным (вследствие произвольности выбора критерия принятия решения), оно тем не менее создает определенное упорядочение имеющихся в распоряжении
ЛПР данных: определяются множество состояний природы, альтернативные решения, выигрыши и потери при различных сочетаниях состояния «среда – решение». Такое упорядочение представлений о проблеме само по себе способствует повышению каче- ства принимаемых решений.

1 2 3 4 5 6 7 8 9 10 11

4.3. Принятие решений в условиях риска
Методы принятия решений в условиях риска разрабатываются и обосновываются в рамках так называемой теории статистических решений. При этом в случае «доброка- чественной», или стохастической, неопределенности, когда состояниям природы постав- лены в соответствие вероятности, заданные экспертно либо вычисленные, решение обычно принимается на основе критерия максимума ожидаемого среднего выигрыша или минимума ожидаемого среднего риска (матрицы типа (97) либо (98)).

Принятие решений в условиях неопределенности и риска (игры с природой)
67
Если для некоторой игры с природой, задаваемой платежной матрицей
m,n
ij
a
A =
, стратегиям природы П
j
соответствуют вероятности p
j
, то лучшей стратегией игрока 1 будет та, которая обеспечивает ему максимальный средний выигрыш, т.е. max
1 1
ij
n
j
j
m
i
a
p
∑
=
≤
≤
(99)
Применительно к матрице рисков (матрице упущенных выгод) лучшей будет та стратегия игрока, которая обеспечивает ему минимальный средний риск:
∑
=
≤
≤
n
j
ij
j
r
p
1
m i
1
min
(100)
Заметим, что когда говорится о среднем выигрыше или риске, то подразумевается многократное повторение акта принятия решений. Условность предположения заклю- чается в том, что реально требуемого количества повторений чаще всего может и не быть.
Покажем, что критерии (99) и (100) эквивалентны в том смысле, что оптимальные значения для них обеспечивает одна и та же стратегия А
i
игрока 1. Действительно,
(
)
=








−
β
=
−
β
=
∑
∑
∑
∑
=
=
≤
≤
=
≤
≤
=
≤
≤
n
j
ij
j
n
j
j
j
m
i
ij
j
n
j
j
m
i
n
j
ij
j
m
i
a
p
p
a
p
r
p
1 1
1 1
1 1
1
min min min
ij
n
j
j
m
i
j
n
j
j
m
i
a
p
p
∑
∑
=
≤
≤
=
≤
≤
−








β
=
1 1
1 1
min min
= const +
∑
=
≤
≤
n
j
ij
j
m
i
a
p
1 1
max
,
т.е. значения критериев отличаются на постоянную величину, поэтому принятое реше- ние не зависит от стратегии А
i
Например, для игры, задаваемой матрицей А (97) или матрицей R (98), при усло- вии, что p
1
= p
2
= p
3
= p
4
= 1/4, А
1
– лучшая стратегия игрока 1 по критерию (99), по- скольку
4 19
max
4 1
4 4
1
=
3 1
4 1
1
=
=
∑
∑
≤
≤
=
j
ij
i
j
j
a
a
Эта же стратегия является лучшей для игрока 1 по критерию (100) относительно обеспечения минимального уровня риска:
=
∑
=
4 1
j
ij
j
r
p
2
min
4 1
4 1
=
3 1
=
∑
≤
≤
j
ij
i
r
На практике целесообразно отдавать предпочтение матрице выигрышей (97) или матрице рисков (98) в зависимости от того, какая из них определяется с большей досто- верностью. Это особенно важно учитывать при экспертных оценках элементов матриц А и R.
4.4. Выбор решений с помощью дерева решений (позиционные игры)
Рассмотрим более сложные (позиционные, или многоэтапные) решения в услови- ях риска. Одноэтапные игры с природой, таблицы решений (см. разд. 3.3), удобно ис- пользовать в задачах, имеющих одно множество альтернативных решений и одно множе- ство состояний среды. Многие задачи, однако, требуют анализа последовательности ре- шений и состояний среды, когда одна совокупность стратегий игрока и состояний природы порождает другое состояние подобного типа. Если имеют место два или более

Смотрите также файлы

Таырыбы xxi асыр кшбасшысы.docx

Програма Інформаційні технології проектування.docx

Центры обработки данных. Центр обработки данных (цод).docx

Пират показывает пальцем на небо.docx

Викторина для будущих хозяюшек Кулинарная.pptx

Файл: Международный консорциум Электронный университет Московский государственный университет экономики, статистики и информатики.pdf

Смотрите также файлы

Информация

Списки файлов

Дополнительно