Файл: Метод_лаб_2011_ТПР_стац_pdf.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 03.12.2020

Просмотров: 532

Скачиваний: 4

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
background image

11 

 

Ожидаемая  полезность  события

  –  сумма  произведений  вероятностей 

возникновения  данного  события  на  значение  полезности  последствий  этих 

событий 

n

i

i

i

p

1

W

W

Выбор ЛПР в условиях риска формализуется при помощи понятия потери, 

при  этом  ЛПР  проявляет  свои  индивидуальные  вкусы  и  склонность  к  риску. 
Решение ЛПР может быть найдено на основе следующего алгоритма: 

1  Присваиваются  произвольные  значения  полезности  выигрышу  для 

лучшего  и  худшего  последствия,  причем  худшему  из  последствий  ставится  в 
соответствие меньшее значение полезности. 

2 Игроку предоставляется выбор: 
-  получить  определенную  гарантированную  сумму  W,  которая  находится  в 

промежутке между худшим (s) и лучшим (S) значениями выигрышей 

S

W

s

-  принять  участие  в  игре,  т.е.  получить  с  вероятностью 

р

  наибольшую 

денежную  сумму  S  и  с  вероятностью  (1-

р

)  получить  наименьшую  денежную 

сумму  s,  при  этом  вероятность  следует  изменять  (уменьшать  или  повышать)  до 
тех  пор  пока  ЛПР  не  станет  безразличным  к  отношению  выбора  между 
гарантированной суммой и игрой. 

Функция полезности имеет вид: 

U(s)

)

0

(1-

U(S)

0

W

p

p

, где 

р

0

 – заданная 

вероятность. 

Безусловный  денежный  эквивалент  (БДЭ) 

–  максимальная  сумма  денег, 

которую ЛПР готов заплатить за участие в игре (лотерее) или минимальная сумма 
денег, за которую он готов отказаться от игры. 

Ожидаемая денежная оценка (ОДО) 

– средний выигрыш в игре. 

Вывод: 

если БДЭ = ОДО 

 ЛПР – объективист. Если БДЭ ≠ ОДО 

 ЛПР 

– субъективист (если БДЭ > ОДО 

 ЛПР – склонен к риску; если БДЭ < ОДО 

 

ЛПР – не склонен к риску).

 

Основные  функции  полезности  используются  для  изучения,  анализа  и 

оценки поведения субъектов риска: 

0)

(b

  

bx;

a

U(x)

 - функция, отражающая нейтральность к риску. 

1)

a

 

-b,

(x

  

b);

x

(

log

U(x)

a

  -  функция,  выражающая  убывающую 

несклонность к риску. 

0)

(c

  

;

-e

U(x)

-cx

 - постоянная несклонность к риску. 

0)

(c

  

;

-e

U(x)

cx

 - постоянная склонность к риску. 

)

2c

b

 x

0;

(c

  

;

cx

-

bx

a

U(x)

2

 - возрастающая несклонность к риску. 

0)

(x

  

;

-x

U(x)

2

 - возрастающая склонность к риску. 

)

2c

b

 x

0;

(c

  

;

cx

bx

a

U(x)

2

 - убывающая склонность к риску. 

8 Функция с интервальной нейтральностью к риску. 

Одним  из  основных  видов  функции  полезности,  характеризующей 

финансовое  поведение  людей,  является  функция 

lnx

U(x)

,  т.е.  полезность 


background image

12 

 

бесконечно  малого  выигрыша  прямо  пропорциональна  этому  выигрышу  и 
обратно  пропорциональна  денежной  сумме,  которой  игрок  обладает.  Из  этого 
следует,  что  если  полезность  описывается  функцией 

lnx

U(x)

,  то  потери  более 

ощутимы, чем выигрыш. 

Детерминированный  эквивалент  лотереи 

L

  –  это  гарантированная  сума 

x

,  получение  которой  эквивалентно  участию  в  лотерее,  т.е. 

L

x

.  Итак 

x

 

определяется из уравнения 

)

(

)],

(

[

)

(

1

x

MU

u

x

или

x

U

M

x

U

 

 

 

(1) 

Премия  за  риск

 

–  это  сумма,  которой  субъект  готов  пожертвовать  из 

среднего выигрыша за то, чтобы избежать риска, связанного с лотерей. Премию за 
риск определяют таким образом: 

x

x

x

x

M

x

)]

(

[

)

(

.  

 

 

 

(2) 

Страховая  сумма

  –  величина  детерминированного  эквивалента  с 

противоположным знаком. 

 


background image

13 

 

ЛАБОРАТОРНАЯ РАБОТА № 3 

Принятие оптимального решения на основе теории игры 

 

Цель: 

научиться осуществлять выбор альтернативы на основе теории игры 

и применять полученные знания при создании программных продуктов.

 

Постановка  задачи

.

  Предприятие  выпускает  определенную  продукцию 

партиями  фиксированного  размера.  Из-за  случайных  сбоев  в  производственном 
процессе  возможный  выпуск  партий  с  недопустимо  высоким  процентом 
бракованной  продукции.  Определяют  состояния  внешней  среды: 

1

  –  пригодная 

партия изделий, 

2

 – бракованная партия изделий. 

Пусть  бракованные  изделия  в  пригодной  партии  составляют 

%

б

(

1

), 

в 

непригодной  – 

%

б

(

2

)

.  Проведенные  на  предприятии  расчеты  показывают,  что 

вероятность производства бракованной партии составляет 

)

(

2

p

Предприятие  отправляет  партии  товаров 

m

  потребителям,  для  которых 

контрактом  обусловленный  возможный  предельный  процент  бракованных 
деталей – 

%

б-потреб-l

 

соответственно. За один процент превышения установленных 

границ  предполагается  штраф  размером 

P

  тыс.грн.  С  другой  стороны, 

производство  партии  товаров  более  высокого  качества  увеличивает  затраты 
предприятия на 

V

 тыс.грн. за каждый процент. 

В  результате  проверки  двух  изделий  из  всей  партии  может  быть 

установлено, что: 1) оба изделия пригодны; 2) одно из изделий пригодно;  3) оба 
изделия бракованы. Пусть 

3

2

1

,

,

 – эти три возможные события соответственно. 

Задание.

 Построить программный модуль, позволяющий: 

1)  принять  оптимальное  решение  в  условиях  отсутствия  риска 

(гарантированный результат); 

2)  принять  оптимальное  решение,  используя  априорные  вероятности 

событий; 

3)  принять  оптимальное  решение,  используя  апостериорные  вероятности 

событий. 

Исходные  данные  представлены  в  таблице  1.  Процент  брака  выбирается 

студентом  случайным  образом  в  заданных  границах,  используя  генератор 
случайных чисел. 

Предусмотреть  возможность  ввода  задаваемого  пользователем  количества 

альтернатив  (покупателей),  величин  процента  бракованной  продукции  и 
вероятностей пребывания внешней среды в одном из своих состояний. 

Программа  должна  выдавать  сообщение  о  выборе  оптимальной 

альтернативы  в  каждом  конкретном  случае  (при  использовании  различной 
информации  и  при  указанных  результатах  контрольной  проверки  деталей),  а 
также критерий, с помощью которого принималось решение. 


background image

14 

 

Таблица 1 – Исходные данные 

№ 

варианта 

Процент брака 

относительно требований 

покупателя 

%

б-потреб-l

 

%

б

(

1

)

 

%

б

(

2

)

 

)

(

2

p

 

P

 

V

 

Количество 

покупателей 

m

l

..

1

 

min 

max 

13 

0,2 

100  80 

10 

15 

0,3 

120  100 

10 

16 

0,15 

130  110 

12 

0,25 

115  95 

13 

0,3 

125  105 

10 

14 

0,2 

145  125 

11 

15 

0,2 

140  120 

11 

15 

0,15 

135  115 

14 

0,25 

130  110 

10 

10 

12 

0,2 

125  105 

11 

13 

0,15 

120  95 

12 

10 

15 

0,3 

115  100 

13 

11 

16 

0,2 

110  80 

14 

15 

0,15 

110  85 

15 

16 

0,1 

105  75 

16 

14 

025 

100  80 

17 

10 

14 

0,25 

105  85 

18 

13 

0,3 

115  90 

19 

16 

0,2 

120  100 

20 

10 

15 

0,2 

125  95 

21 

10 

14 

0,15 

125  100 

22 

11 

16 

0,15 

130  100 

23 

15 

0,3 

115  80 

24 

10 

16 

0,25 

105  70 

25 

11 

16 

0,3 

110  85 

 

Краткие теоретические сведения 

Статистическая  игра

  –  это  основная  модель  теории  принятия  решений  в 

условиях частичной неопределенности. 

Статистическая  игра

  –  игра  с  природой,  модель  ситуации  принятия 

решений в условиях неопределенности и риска. 

Природа

  –  совокупность  внешних  обстоятельств,  в  которых  приходится 

принимать  решения  или  совокупность  неопределенных  факторов  влияющих  на 
эффективность принимаемых решений.  

Человек 

– лицо, принимающее решение (ЛПР), или статистик. 

Задача  ЛПР

  –  принятие  наилучшего  управленческого  решения  в  каждой 

конкретной ситуации с учетом имеющейся информации. 

Под  стратегией  природы  понимают  полную  совокупность  внешних 

условий,  в  которых  приходится  принимать  решение.  Данную  совокупность 
назовем  состоянием  природы 

  (

П

).

  В  общем  случае  существует  некоторое 

множество  возможных  состояний  природы: 

={ 1,

2

,…,

j

,…,

n

},  которое 

называется  пространством  состояния  природы,  а  элементы 

j

  –  чистыми 

стратегиями природы. 


background image

15 

 

Обычно известен только перечень чистых стратегий природы (нет полного 

знания о состоянии природы), и из прошлого опыта известно, как часто природа 
применяет  ту  или  иную  из  своих  чистых  стратегий,  т.е.  известно  априорное 
распределение вероятностей 

q

j

(

j

)

 на пространстве состояний природы  . Отсюда 

смешанная стратегия природы – априорное распределение вероятностей 

q( ).

 

Критерии принятия решений (для 

F

 1

 

Критерий  Байеса.

  Используется  при  известном  распределении 

вероятностей  различных  состояний  природы.  Оптимальной  считается  стратегия 
А

i

,  при  которой  максимальный  средний  выигрыш  статистика 

i

a

,  т.е. 

i

i

a

opt

max

,  где 

n

j

j

ij

i

q

a

a

1

  (

m

i

,

1

),  где 

j

q

–  вероятность  j-го  состояния 

природы. 

 2

 

Критерий Лапласа

 (принцип недостаточного основания). Используется 

в  случае  когда  все  состояния  природы  полагаются  равновероятными,  т.е. 

n

q

q

q

q

n

j

1

...

...

2

1

.  Оптимальной  считается  стратегия,  обеспечивающая 

максимум среднего выигрыша 

i

i

a

opt

max

, где 

n

j

ij

i

a

n

a

1

1

 (

m

i

,

1

). 

Применяя  этот  критерий,  отступают  от  условий  полной  неопределенности 

(отсутствия  информации  о  состоянии  природы),  считая,  что  возможным 
состояниям природы можно приписать определенную вероятность их появления. 
В  этом  случае,  определив  математическое  ожидание  выигрыша  для  каждого 
решения, выбирают то, которое обеспечивает наибольшее значение выигрыша. 

Принцип  Байеса–Лапласа  можно  применять,  если  состояния  природы, 

которые изучаются, и решения, которые принимаются, многократно повторяются. 
Тогда,  например,  статистическими  методами,  базируясь  на  частотах  появления 
отдельных  состояний  природы  в  прошлом,  можно  оценивать  вероятности  их 
появления в будущем.  

Перечисленные  критерии  не  исчерпывают  всего  многообразия  критериев 

выбора  решения  в  условиях  неопределенности,  в  частности,  критериев  выбора 
наилучших смешанных стратегий. 

Оптимальное  поведение  по  большей  части  зависит  от  принятого  критерия 

оптимизации.  Поэтому  выбор  критерия  является  вопросом  ответственности  в 
исследовании  операций.  Каждый  выбор  критерия  предопределяет  одобрение 
решения,  которое  может  отличаться  от  решения,  принятого  в  соответствии  с 
другим  критерием.  Однако  ситуация  никогда  не  бывает  настолько 
неопределенной, чтобы нельзя было получить хотя бы частичную информацию о 
вероятностях  распределения  состояний  природы  в  ситуации,  которая 
анализируется.  В  этом  случае,  оценив  распределение  вероятностей  состояний 
природы,  применяют  критерий  Байеса–Лапласа  или  проводят  эксперимент, 
который дает возможность уточнить поведение природы.