ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 03.12.2020
Просмотров: 532
Скачиваний: 4
11
Ожидаемая полезность события
– сумма произведений вероятностей
возникновения данного события на значение полезности последствий этих
событий
n
i
i
i
p
1
W
W
.
Выбор ЛПР в условиях риска формализуется при помощи понятия потери,
при этом ЛПР проявляет свои индивидуальные вкусы и склонность к риску.
Решение ЛПР может быть найдено на основе следующего алгоритма:
1 Присваиваются произвольные значения полезности выигрышу для
лучшего и худшего последствия, причем худшему из последствий ставится в
соответствие меньшее значение полезности.
2 Игроку предоставляется выбор:
- получить определенную гарантированную сумму W, которая находится в
промежутке между худшим (s) и лучшим (S) значениями выигрышей
S
W
s
;
- принять участие в игре, т.е. получить с вероятностью
р
наибольшую
денежную сумму S и с вероятностью (1-
р
) получить наименьшую денежную
сумму s, при этом вероятность следует изменять (уменьшать или повышать) до
тех пор пока ЛПР не станет безразличным к отношению выбора между
гарантированной суммой и игрой.
Функция полезности имеет вид:
U(s)
)
0
(1-
U(S)
0
W
p
p
, где
р
0
– заданная
вероятность.
Безусловный денежный эквивалент (БДЭ)
– максимальная сумма денег,
которую ЛПР готов заплатить за участие в игре (лотерее) или минимальная сумма
денег, за которую он готов отказаться от игры.
Ожидаемая денежная оценка (ОДО)
– средний выигрыш в игре.
Вывод:
если БДЭ = ОДО
ЛПР – объективист. Если БДЭ ≠ ОДО
ЛПР
– субъективист (если БДЭ > ОДО
ЛПР – склонен к риску; если БДЭ < ОДО
ЛПР – не склонен к риску).
Основные функции полезности используются для изучения, анализа и
оценки поведения субъектов риска:
1
0)
(b
bx;
a
U(x)
- функция, отражающая нейтральность к риску.
2
1)
a
-b,
(x
b);
x
(
log
U(x)
a
- функция, выражающая убывающую
несклонность к риску.
3
0)
(c
;
-e
U(x)
-cx
- постоянная несклонность к риску.
4
0)
(c
;
-e
U(x)
cx
- постоянная склонность к риску.
5
)
2c
b
x
0;
(c
;
cx
-
bx
a
U(x)
2
- возрастающая несклонность к риску.
6
0)
(x
;
-x
U(x)
2
- возрастающая склонность к риску.
7
)
2c
b
x
0;
(c
;
cx
bx
a
U(x)
2
- убывающая склонность к риску.
8 Функция с интервальной нейтральностью к риску.
Одним из основных видов функции полезности, характеризующей
финансовое поведение людей, является функция
lnx
U(x)
, т.е. полезность
12
бесконечно малого выигрыша прямо пропорциональна этому выигрышу и
обратно пропорциональна денежной сумме, которой игрок обладает. Из этого
следует, что если полезность описывается функцией
lnx
U(x)
, то потери более
ощутимы, чем выигрыш.
Детерминированный эквивалент лотереи
L
– это гарантированная сума
x
, получение которой эквивалентно участию в лотерее, т.е.
L
x
. Итак
x
определяется из уравнения
)
(
)],
(
[
)
(
1
x
MU
u
x
или
x
U
M
x
U
.
(1)
Премия за риск
– это сумма, которой субъект готов пожертвовать из
среднего выигрыша за то, чтобы избежать риска, связанного с лотерей. Премию за
риск определяют таким образом:
x
x
x
x
M
x
)]
(
[
)
(
.
(2)
Страховая сумма
– величина детерминированного эквивалента с
противоположным знаком.
13
ЛАБОРАТОРНАЯ РАБОТА № 3
Принятие оптимального решения на основе теории игры
Цель:
научиться осуществлять выбор альтернативы на основе теории игры
и применять полученные знания при создании программных продуктов.
Постановка задачи
.
Предприятие выпускает определенную продукцию
партиями фиксированного размера. Из-за случайных сбоев в производственном
процессе возможный выпуск партий с недопустимо высоким процентом
бракованной продукции. Определяют состояния внешней среды:
1
– пригодная
партия изделий,
2
– бракованная партия изделий.
Пусть бракованные изделия в пригодной партии составляют
%
б
(
1
),
в
непригодной –
%
б
(
2
)
. Проведенные на предприятии расчеты показывают, что
вероятность производства бракованной партии составляет
)
(
2
p
.
Предприятие отправляет партии товаров
m
потребителям, для которых
контрактом обусловленный возможный предельный процент бракованных
деталей –
%
б-потреб-l
соответственно. За один процент превышения установленных
границ предполагается штраф размером
P
тыс.грн. С другой стороны,
производство партии товаров более высокого качества увеличивает затраты
предприятия на
V
тыс.грн. за каждый процент.
В результате проверки двух изделий из всей партии может быть
установлено, что: 1) оба изделия пригодны; 2) одно из изделий пригодно; 3) оба
изделия бракованы. Пусть
3
2
1
,
,
– эти три возможные события соответственно.
Задание.
Построить программный модуль, позволяющий:
1) принять оптимальное решение в условиях отсутствия риска
(гарантированный результат);
2) принять оптимальное решение, используя априорные вероятности
событий;
3) принять оптимальное решение, используя апостериорные вероятности
событий.
Исходные данные представлены в таблице 1. Процент брака выбирается
студентом случайным образом в заданных границах, используя генератор
случайных чисел.
Предусмотреть возможность ввода задаваемого пользователем количества
альтернатив (покупателей), величин процента бракованной продукции и
вероятностей пребывания внешней среды в одном из своих состояний.
Программа должна выдавать сообщение о выборе оптимальной
альтернативы в каждом конкретном случае (при использовании различной
информации и при указанных результатах контрольной проверки деталей), а
также критерий, с помощью которого принималось решение.
14
Таблица 1 – Исходные данные
№
варианта
Процент брака
относительно требований
покупателя
%
б-потреб-l
%
б
(
1
)
%
б
(
2
)
)
(
2
p
P
V
Количество
покупателей
m
l
..
1
min
max
1
5
8
4
13
0,2
100 80
2
2
6
10
5
15
0,3
120 100
3
3
4
10
3
16
0,15
130 110
4
4
5
9
4
12
0,25
115 95
5
5
6
9
5
13
0,3
125 105
2
6
4
10
3
14
0,2
145 125
5
7
5
11
4
15
0,2
140 120
4
8
6
11
5
15
0,15
135 115
3
9
4
9
3
14
0,25
130 110
6
10
5
10
4
12
0,2
125 105
6
11
5
9
4
13
0,15
120 95
5
12
6
10
5
15
0,3
115 100
4
13
6
11
5
16
0,2
110 80
5
14
4
8
3
15
0,15
110 85
4
15
4
9
3
16
0,1
105 75
3
16
5
9
4
14
025
100 80
2
17
6
10
5
14
0,25
105 85
2
18
4
7
3
13
0,3
115 90
4
19
4
9
3
16
0,2
120 100
3
20
6
10
5
15
0,2
125 95
4
21
5
10
4
14
0,15
125 100
5
22
6
11
5
16
0,15
130 100
2
23
6
9
5
15
0,3
115 80
3
24
4
10
3
16
0,25
105 70
3
25
5
11
4
16
0,3
110 85
5
Краткие теоретические сведения
Статистическая игра
– это основная модель теории принятия решений в
условиях частичной неопределенности.
Статистическая игра
– игра с природой, модель ситуации принятия
решений в условиях неопределенности и риска.
Природа
– совокупность внешних обстоятельств, в которых приходится
принимать решения или совокупность неопределенных факторов влияющих на
эффективность принимаемых решений.
Человек
– лицо, принимающее решение (ЛПР), или статистик.
Задача ЛПР
– принятие наилучшего управленческого решения в каждой
конкретной ситуации с учетом имеющейся информации.
Под стратегией природы понимают полную совокупность внешних
условий, в которых приходится принимать решение. Данную совокупность
назовем состоянием природы
(
П
).
В общем случае существует некоторое
множество возможных состояний природы:
={ 1,
2
,…,
j
,…,
n
}, которое
называется пространством состояния природы, а элементы
j
– чистыми
стратегиями природы.
15
Обычно известен только перечень чистых стратегий природы (нет полного
знания о состоянии природы), и из прошлого опыта известно, как часто природа
применяет ту или иную из своих чистых стратегий, т.е. известно априорное
распределение вероятностей
q
j
(
j
)
на пространстве состояний природы . Отсюда
смешанная стратегия природы – априорное распределение вероятностей
q( ).
Критерии принятия решений (для
F
)
1
Критерий Байеса.
Используется при известном распределении
вероятностей различных состояний природы. Оптимальной считается стратегия
А
i
, при которой максимальный средний выигрыш статистика
i
a
, т.е.
i
i
a
opt
max
, где
n
j
j
ij
i
q
a
a
1
(
m
i
,
1
), где
j
q
– вероятность j-го состояния
природы.
2
Критерий Лапласа
(принцип недостаточного основания). Используется
в случае когда все состояния природы полагаются равновероятными, т.е.
n
q
q
q
q
n
j
1
...
...
2
1
. Оптимальной считается стратегия, обеспечивающая
максимум среднего выигрыша
i
i
a
opt
max
, где
n
j
ij
i
a
n
a
1
1
(
m
i
,
1
).
Применяя этот критерий, отступают от условий полной неопределенности
(отсутствия информации о состоянии природы), считая, что возможным
состояниям природы можно приписать определенную вероятность их появления.
В этом случае, определив математическое ожидание выигрыша для каждого
решения, выбирают то, которое обеспечивает наибольшее значение выигрыша.
Принцип Байеса–Лапласа можно применять, если состояния природы,
которые изучаются, и решения, которые принимаются, многократно повторяются.
Тогда, например, статистическими методами, базируясь на частотах появления
отдельных состояний природы в прошлом, можно оценивать вероятности их
появления в будущем.
Перечисленные критерии не исчерпывают всего многообразия критериев
выбора решения в условиях неопределенности, в частности, критериев выбора
наилучших смешанных стратегий.
Оптимальное поведение по большей части зависит от принятого критерия
оптимизации. Поэтому выбор критерия является вопросом ответственности в
исследовании операций. Каждый выбор критерия предопределяет одобрение
решения, которое может отличаться от решения, принятого в соответствии с
другим критерием. Однако ситуация никогда не бывает настолько
неопределенной, чтобы нельзя было получить хотя бы частичную информацию о
вероятностях распределения состояний природы в ситуации, которая
анализируется. В этом случае, оценив распределение вероятностей состояний
природы, применяют критерий Байеса–Лапласа или проводят эксперимент,
который дает возможность уточнить поведение природы.