Файл: Метод_лаб_2011_ТПР_стац_pdf.pdf

Скачать файл (1,34Мб)

Заказать решение

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 03.12.2020

Просмотров: 532

Скачиваний: 4

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Ожидаемая полезность события

– сумма произведений вероятностей

возникновения данного события на значение полезности последствий этих

событий

Выбор ЛПР в условиях риска формализуется при помощи понятия потери,

при этом ЛПР проявляет свои индивидуальные вкусы и склонность к риску.
Решение ЛПР может быть найдено на основе следующего алгоритма:

1 Присваиваются произвольные значения полезности выигрышу для

лучшего и худшего последствия, причем худшему из последствий ставится в
соответствие меньшее значение полезности.

2 Игроку предоставляется выбор:
- получить определенную гарантированную сумму W, которая находится в

промежутке между худшим (s) и лучшим (S) значениями выигрышей

;

- принять участие в игре, т.е. получить с вероятностью

наибольшую

денежную сумму S и с вероятностью (1-

) получить наименьшую денежную

сумму s, при этом вероятность следует изменять (уменьшать или повышать) до
тех пор пока ЛПР не станет безразличным к отношению выбора между
гарантированной суммой и игрой.

Функция полезности имеет вид:

U(s)

)

(1-

U(S)

, где

– заданная

вероятность.

Безусловный денежный эквивалент (БДЭ)

– максимальная сумма денег,

которую ЛПР готов заплатить за участие в игре (лотерее) или минимальная сумма
денег, за которую он готов отказаться от игры.

Ожидаемая денежная оценка (ОДО)

– средний выигрыш в игре.

Вывод:

если БДЭ = ОДО

ЛПР – объективист. Если БДЭ ≠ ОДО

ЛПР

– субъективист (если БДЭ > ОДО

ЛПР – склонен к риску; если БДЭ < ОДО

ЛПР – не склонен к риску).

Основные функции полезности используются для изучения, анализа и

оценки поведения субъектов риска:

bx;

U(x)

- функция, отражающая нейтральность к риску.

-b,

b);

(

log

U(x)

- функция, выражающая убывающую

несклонность к риску.

;

-e

U(x)

-cx

- постоянная несклонность к риску.

;

-e

U(x)

- постоянная склонность к риску.

)

;

U(x)

- возрастающая несклонность к риску.

;

-x

U(x)

- возрастающая склонность к риску.

)

;

U(x)

- убывающая склонность к риску.

8 Функция с интервальной нейтральностью к риску.

Одним из основных видов функции полезности, характеризующей

финансовое поведение людей, является функция

lnx

U(x)

, т.е. полезность

бесконечно  малого  выигрыша  прямо  пропорциональна  этому  выигрышу  и
обратно  пропорциональна  денежной  сумме,  которой  игрок  обладает.  Из  этого
следует,  что  если  полезность  описывается  функцией

lnx

U(x)

, то потери более

ощутимы, чем выигрыш.

Детерминированный эквивалент лотереи

– это гарантированная сума



, получение которой эквивалентно участию в лотерее, т.е.



. Итак



определяется из уравнения

)

(

)],

(

[

)

(

или



(1)

Премия за риск

– это сумма, которой субъект готов пожертвовать из

среднего выигрыша за то, чтобы избежать риска, связанного с лотерей. Премию за
риск определяют таким образом:



)]

(

[

)

(

(2)

Страховая сумма

– величина детерминированного эквивалента с

противоположным знаком.

ЛАБОРАТОРНАЯ РАБОТА № 3

Принятие оптимального решения на основе теории игры

Цель:

научиться осуществлять выбор альтернативы на основе теории игры

и применять полученные знания при создании программных продуктов.

Постановка задачи

Предприятие выпускает определенную продукцию

партиями  фиксированного  размера.  Из-за  случайных  сбоев  в  производственном
процессе  возможный  выпуск  партий  с  недопустимо  высоким  процентом
бракованной  продукции.  Определяют  состояния  внешней  среды:

– пригодная

партия изделий,

– бракованная партия изделий.

Пусть бракованные изделия в пригодной партии составляют

(

непригодной –

(

)

. Проведенные на предприятии расчеты показывают, что

вероятность производства бракованной партии составляет

)

(

Предприятие отправляет партии товаров

потребителям, для которых

контрактом обусловленный возможный предельный процент бракованных
деталей –

б-потреб-l

соответственно. За один процент превышения установленных

границ предполагается штраф размером

тыс.грн. С другой стороны,

производство партии товаров более высокого качества увеличивает затраты
предприятия на

тыс.грн. за каждый процент.

В результате проверки двух изделий из всей партии может быть

установлено, что: 1) оба изделия пригодны; 2) одно из изделий пригодно; 3) оба
изделия бракованы. Пусть

– эти три возможные события соответственно.

Задание.

Построить программный модуль, позволяющий:

1) принять оптимальное решение в условиях отсутствия риска

(гарантированный результат);

2) принять оптимальное решение, используя априорные вероятности

событий;

3) принять оптимальное решение, используя апостериорные вероятности

событий.

Исходные данные представлены в таблице 1. Процент брака выбирается

студентом случайным образом в заданных границах, используя генератор
случайных чисел.

Предусмотреть возможность ввода задаваемого пользователем количества

альтернатив (покупателей), величин процента бракованной продукции и
вероятностей пребывания внешней среды в одном из своих состояний.

Программа должна выдавать сообщение о выборе оптимальной

альтернативы в каждом конкретном случае (при использовании различной
информации и при указанных результатах контрольной проверки деталей), а
также критерий, с помощью которого принималось решение.

Таблица 1 – Исходные данные

№

варианта

Процент брака

относительно требований

покупателя

б-потреб-l

(

)

(

)

(

Количество

покупателей

min

max

0,2

100 80

0,3

120 100

0,15

130 110

0,25

115 95

0,3

125 105

0,2

145 125

0,2

140 120

0,15

135 115

0,25

130 110

0,2

125 105

0,15

120 95

0,3

115 100

0,2

110 80

0,15

110 85

0,1

105 75

025

100 80

0,25

105 85

0,3

115 90

0,2

120 100

0,2

125 95

0,15

125 100

0,15

130 100

0,3

115 80

0,25

105 70

0,3

110 85

Краткие теоретические сведения

Статистическая игра

– это основная модель теории принятия решений в

условиях частичной неопределенности.

Статистическая игра

– игра с природой, модель ситуации принятия

решений в условиях неопределенности и риска.

Природа

– совокупность внешних обстоятельств, в которых приходится

принимать решения или совокупность неопределенных факторов влияющих на
эффективность принимаемых решений.

Человек

– лицо, принимающее решение (ЛПР), или статистик.

Задача ЛПР

– принятие наилучшего управленческого решения в каждой

конкретной ситуации с учетом имеющейся информации.

Под стратегией природы понимают полную совокупность внешних

условий, в которых приходится принимать решение. Данную совокупность
назовем состоянием природы

(

В общем случае существует некоторое

множество возможных состояний природы:

={ 1,

,…,

}, которое

называется пространством состояния природы, а элементы

– чистыми

стратегиями природы.

Обычно известен только перечень чистых стратегий природы (нет полного

знания о состоянии природы), и из прошлого опыта известно, как часто природа
применяет ту или иную из своих чистых стратегий, т.е. известно априорное
распределение вероятностей

(

)

на пространстве состояний природы . Отсюда

смешанная стратегия природы – априорное распределение вероятностей

q( ).

Критерии принятия решений (для

)

Критерий Байеса.

Используется при известном распределении

вероятностей различных состояний природы. Оптимальной считается стратегия
А

, при которой максимальный средний выигрыш статистика

, т.е.

opt

max

, где

(

), где

– вероятность j-го состояния

природы.

Критерий Лапласа

(принцип недостаточного основания). Используется

в случае когда все состояния природы полагаются равновероятными, т.е.

...

. Оптимальной считается стратегия, обеспечивающая

максимум среднего выигрыша

opt

max

, где

(

Применяя этот критерий, отступают от условий полной неопределенности

(отсутствия информации о состоянии природы), считая, что возможным
состояниям природы можно приписать определенную вероятность их появления.
В этом случае, определив математическое ожидание выигрыша для каждого
решения, выбирают то, которое обеспечивает наибольшее значение выигрыша.

Принцип Байеса–Лапласа можно применять, если состояния природы,

которые изучаются, и решения, которые принимаются, многократно повторяются.
Тогда,  например,  статистическими  методами,  базируясь  на  частотах  появления
отдельных  состояний  природы  в  прошлом,  можно  оценивать  вероятности  их
появления в будущем.

Перечисленные критерии не исчерпывают всего многообразия критериев

выбора решения в условиях неопределенности, в частности, критериев выбора
наилучших смешанных стратегий.

Оптимальное поведение по большей части зависит от принятого критерия

оптимизации.  Поэтому  выбор  критерия  является  вопросом  ответственности  в
исследовании  операций.  Каждый  выбор  критерия  предопределяет  одобрение
решения,  которое  может  отличаться  от  решения,  принятого  в  соответствии  с
другим  критерием.  Однако  ситуация  никогда  не  бывает  настолько
неопределенной, чтобы нельзя было получить хотя бы частичную информацию о
вероятностях  распределения  состояний  природы  в  ситуации,  которая
анализируется.  В  этом  случае,  оценив  распределение  вероятностей  состояний
природы,  применяют  критерий  Байеса–Лапласа  или  проводят  эксперимент,
который дает возможность уточнить поведение природы.

Смотрите также файлы

Лекция1ТМПЗДМ.docx

таблица1.3 чистая.doc

страница1.docx

страница3.docx

Глава 10.doc

Файл: Метод_лаб_2011_ТПР_стац_pdf.pdf

Смотрите также файлы

Информация

Списки файлов

Дополнительно