Файл: Принятие решений в условиях неопределенности. Игры с природой.rtf
Добавлен: 09.01.2024
Просмотров: 49
Скачиваний: 3
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ
ГРОЗНЕНСКИЙ ГОСУДАРСТВЕННЫЙ НЕФТЯНОЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
им. акад. М.Д. Миллионщикова
Кафедра «Информационные технологии»
КУРСОВАЯ РАБОТА
по дисциплине: «Принятие решений в ИС»
на тему: «Принятие решений в условиях неопределенности. Игры с природой»
Выполнила студентка
группы ИТО-10
Дулатова М.С.
Грозный 2014
Содержание
Введение
Глава 1. Понятие игры с природой
Глава 2. Принятие решений в условиях полной неопределенности
Глава 3. Принятие решений в условиях риска
Глава 4. Выбор решений с помощью дерева решений (позиционные игры)
4.1 Принятие решений с применением дерева решений
4.2 Анализ и решение задач с помощью дерева решений
4.3 Ожидаемая ценность точной информации
Заключение
Список использованных источников
Введение
Ситуации в экономической практике могут не в полной мере оказаться адекватными действительности, поскольку реализация модели предполагает многократность повторения действий (решений), предпринимаемых в похожих условиях. В реальности количество принимаемых экономических решений в неизменных условиях жестко ограничено.
Нередко экономическая ситуация является уникальной, и решение в условиях неопределенности должно приниматься однократно. Это порождает необходимость развития методов моделирования принятия решений в условиях неопределенности и риска.[2]
Ошибки в платежной матрице не могут быть компенсированы никакими вычислительными методами и приведут к неверному итоговому результату.[4]
Традиционно следующим этапом такого развития являются игры с природой. Формально изучение игр с природой, так же как и стратегических, должно начинаться с построения платежной матрицы, что является, по существу, наиболее трудоемким этапом подготовки принятия решения.
Глава 1. Понятие игры с природой
Отличительная особенность игры с природой состоит в том, что в ней сознательно действует только один из участников, в большинстве случаев называемый игроком 1. Игрок 2 (природа) сознательно против игрока 1 не действует, а выступает как не имеющий конкретной цели и случайным образом выбирающий очередные "ходы" партнер по игре. Поэтому термин "природа" характеризует некую объективную действительность, которую не следует понимать буквально, хотя вполне могут встретиться ситуации, в которых "игроком" 2 действительно может быть природа (например, обстоятельства, связанные с погодными условиями или с природными стихийными силами).
На примере игры с природой рассмотрим проблему заготовки угля на зиму.[5]
ИГРА 1. Необходимо закупить уголь для обогрева дома. Количество хранимого угля ограничено и в течение холодного периода должно быть полностью израсходовано. Предполагается, что неизрасходованный зимой уголь в лето пропадает. Покупать уголь можно в любое время, однако летом он дешевле, чем зимой. Неопределенность состоит в том, что не известно, какой будет зима: суровой, тогда придется докупать уголь, или мягкой, тогда часть угля может остаться неиспользованной. Очевидно, что у природы нет злого умысла и она ничего против человека "не имеет". С другой стороны, долгосрочные прогнозы, составляемые метеорологическими службами, неточны и поэтому могут использоваться в практической деятельности только как ориентировочные при принятии решений.[3]
Решение. Матрица игры с природой аналогична матрице стратегической игры:
А = ||аij||,
где аij - выигрыш игрока 1 при реализации его чистой стратегии i и чистой стратегии j игрока 2 (i = 1,., m; j = 1,., п).
Мажорирование стратегий в игре с природой имеет определенную специфику: исключать из рассмотрения можно лишь доминируемые стратегии игрока 1: если для всех j=1,., п , k, l = 1,., т, то k-ю стратегию принимающего решения игрока 1 можно не рассматривать и вычеркнуть из матрицы игры. Столбцы, отвечающие стратегиям природы, вычеркивать из матрицы игры (исключать из рассмотрения) недопустимо, поскольку природа не стремится к выигрышу в "игре" с человеком, для нее нет целенаправленно выигрышных или проигрышных стратегий, она действует неосознанно.[5]
На первый взгляд отсутствие обдуманного противодействия упрощает игроку задачу выбора решения. Однако, хотя ЛПР никто не мешает, ему труднее обосновать свой выбор, поскольку в этом случае гарантированный результат не известен.
Методы принятия решений в играх с природой зависят от характера неопределенности, точнее от того, известны или нет вероятности состояний (стратегий) природы, т.е. имеет ли место ситуация риска или неопределенности. Ниже будут описаны методы, применяемые в обоих случаях.[7]
Рассмотрим организацию и аналитическое представление игры с природой. Пусть игрок 1 имеет т возможных стратегий: А1, A2,., Аm, а у природы имеется п возможных состояний (стратегий): П1, П2,., Пn, тогда условия игры с природой задаются матрицей А выигрышей игрока 1:
Платит, естественно, не природа, а некая третья сторона (или совокупность сторон, влияющих на принятие решений игроком 1 и объединенных в понятие "природа").
Возможен и другой способ задания матрицы игры с природой: не в виде матрицы выигрышей, а в виде так называемой матрицы рисков R = ||rij||m,n или матрицы упущенных возможностей. Величина риска - это размер платы за отсутствие информации о состоянии среды. Матрица R может быть построена непосредственно из условий задачи или на основе матрицы выигрышей А.[4]
Риском rij игрока при использовании им стратегии Аi и при состоянии среды Пj будем называть разность между выигрышем, который игрок получил бы, если бы он знал, что состоянием среды будет Пj, и выигрышем, который игрок получит, не имея этой информации.[5]
Зная состояние природы (стратегию) Пj, игрок выбирает ту стратегию, при которой его выигрыш максимальный, т.е. rij = bj - aij при заданном j. Например, для матрицы выигрышей
Согласно введенным определениям rij и bj получаем матрицу рисков
Независимо от вида матрицы игры требуется выбрать такую стратегию игрока (чистую или смешанную, если последняя имеет смысл), которая была бы наиболее выгодной по сравнению с другими. Необходимо отметить, что в игре с природой понятие смешанной стратегии игрока не всегда правомерно, поскольку его действия могут быть альтернативными, т.е. выбор одной из стратегий отвергает все другие стратегии (например, выбор альтернативных проектов). Прежде всего, следует проверить, нет ли среди стратегий игрока мажорируемых, и, если таковые имеются, исключить их.[8]
Глава 2. Принятие решений в условиях полной неопределенности
Неопределенность, связанную с отсутствием информации о вероятностях состоянии среды (природы), называют "безнадежной" или "дурной".
В таких случаях для определения наилучших решении используются следующие критерии: максимакса, Вальда, Сэвиджа, Гурвица.[4]
Применение каждого из перечисленных критериев проиллюстрируем на примере матрицы выигрышей (1) или связанной с ней матрицы рисков (2).
Критерий максимакса
С его помощью определяется стратегия, максимизирующая максимальные выигрыши для каждого состояния природы. Это критерий крайнего оптимизма. Наилучшим признается решение, при котором достигается максимальный выигрыш, равный
.
Нетрудно увидеть, что для матрицы А наилучшим решением будет А1, при котором достигается максимальный выигрыш - 9.
Следует отметить, что ситуации, требующие применения такого критерия, в экономике в общем нередки, и пользуются им не только безоглядные оптимисты, но и игроки, поставленные в безвыходное положение, когда они вынуждены руководствоваться принципом "или пан, или пропал".[1]
Максиминный критерий Вальда
С позиций данного критерия природа рассматривается как агрессивно настроенный и сознательно действующий противник типа тех, которые противодействуют в стратегических играх (см. гл.2). Выбирается решение, для которого достигается значение
.
Для платежной матрицы А (1) нетрудно рассчитать:
для первой стратегии (i = 1) ;
для второй стратегии (i=2) ;
для третьей стратегии (i=3) .
Тогда , что соответствует второй стратегии
A2 игрока 1.
В соответствии с критерием Вальда из всех самых неудачных результатов выбирается лучший (W = 3). Это перестраховочная позиция крайнего пессимизма, рассчитанная на худший случай. [1]
Такая стратегия приемлема, например, когда игрок не столь заинтересован в крупной удаче, но хочет себя застраховать от неожиданных проигрышей. Выбор такой стратегии определяется отношением игрока к риску.[7]
Критерий минимаксного риска Сэвиджа
Выбор стратегии аналогичен выбору стратегии по принципу Вальда с тем отличием, что игрок руководствуется не матрицей выигрышей А (1), а матрицей рисков R (2):
Для матрицы R (2) нетрудно рассчитать:
для первой стратегии (i=1) ;
для второй стратегии (i=2) ;
для третьей стратегии (i=3) .
Минимально возможный из самых крупных рисков, равный 4, достигается при использовании первой стратегии А1.[7]
Критерий пессимизма-оптимизма Гурвица
Этот критерий при выборе решения рекомендует руководствоваться некоторым средним результатом, характеризующим состояние между крайним пессимизмом и безудержным оптимизмом. Согласно этому критерию стратегия в матрице А выбирается в соответствии со значением
При p = 0 критерий Гурвица совпадает с максимаксным критерием, а при р = 1 - с критерием Вальда. Покажем процедуру применения данного критерия для матрицы А (1) при р = 0,5:
для первой стратегии:
для второй стратегии:
для третьей стратегии:
Тогда , т.е. оптимальной является вторая стратегия А2.[3]
Применительно к матрице рисков