Файл: Система, в которой выделена управляющая подсистема.docx
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 06.12.2023
Просмотров: 38
Скачиваний: 1
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Лекция 2. РИНЯТИЕ РЕШЕНИЯ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ.
Системное описание задачи принятия решения в условиях неопределенности состоит в следующем. Имеется некоторая система, в которой выделена управляющая подсистема, и вся система погружена в некоторую среду. Управляющая подсистема может воздействовать на систему с помощью альтернативных управляющих воздействий, приводящих к изменению состояния этой системы. Выбор управляющего воздействия происходит в соответствии с целями управляющей подсистемы. Принятие решения, то есть выбор одной из имеющихся альтернатив, - является центральным моментом управления.
Состояние системы определяется двумя факторами: выбранным управляющим воздействием со стороны управляющей подсистемы и состоянием среды.
Математическая модель задачи принятия решения (далее - ЗПР) в условиях неопределенности представляет собой формализацию указанной конструкции. Пусть Х - множество управлявших воздействий (альтернатив) управляющей подсистемой. Y - множество состояний среды. В соответствии со сказанным выше, состояние системы однозначно определяется парой (х,у), где х принадлежит Х и у принадлежит У. Управляющая подсистема оценивает каждое состояние системы некоторым числом, выражающим "полезность" этого состояния для управляющей подсистемы; таким образом, возникает функция F: X*Y R.
Значение функции F (x, y) есть оценка полезности (с точки зрения управляющей подсистемы) того состояния системы, которое возникает, если управляющая подсистема выбирает управляющее воздействие х, а среда принимает состояние у. Принципиальным является то обстоятельство, что при принятии решения управляющая система "не знает", в каком состоянии находится среда, то есть она не имеет информации о наличном состоянии среды. Именно это обстоятельство имеют в виду, когда говорят, что принятие решения происходит в условиях неопределенности. Отметим, что эта неопределенность не является абсолютной, так как принимающему решение известно множество состояний среды (то есть множество Y) и известна функция F (x, y).
В теории игр описанную выше ЗПР называют игрой с природой, причем управляющую подсистему принято называть игроком, выбираемые им альтернативные воздействия - стратегиями
, а функцию F(x, y) - функцией выигрыша игрока. Таким образом, в теоретико-игровой терминологии задача принятия решения в условиях неопределенности формулируется следующим образом. Пусть Х - множество стратегий игрока, Y - множество состояний среды (природы), F (x, y) - функция выигрыша игрока. Требуется указать наилучшую в некотором смысле альтернативу, или, как говорят в теории игр, найти оптимальную стратегию. Подчеркнем еще раз, что основная сложность данной задачи, носящая принципиальный характер, связана с отсутствием у игрока информации о состоянии среды (если бы игрок такую информацию имел, то его функция выигрыша стала бы функцией одной переменной х и задача нахождения оптимальной стратегии превратилась бы в задачу нахождения наибольшего значения этой функции).
В случае, когда и Х, и У конечны, функцию выигрыша F(x,y) удобно задавать в виде матрицы A=( ), i= 1,n; j = 1,m, считая Х={1,,.,n}, Y={1,. ,m}; при этом есть значение функции выигрыша F в ситуации, когда игрок выбирает стратегию і, а среда принимает состояние j.
Замечание. Так как в математической модели " природа" стратегий игрока и состояний среды несущественна, удобно различать их по номерам, полагая Х={1,,.,n}, Y={1,. ,m}.
Надо иметь некоторый способ сравнения двух стратегий. Самый простой и естественный принцип, по которому можно их сравнить - это принцип доминирования, состоящий в следующем: стратегия называется доминирующей стратегию .
Основной метод, позволяющий найти оптимальную стратегию в ЗПР в условиях неопределенности, состоит в следующем: формулируется некоторая гипотеза о поведении среды, позволяющая дать единственную численную оценку каждой стратегии. Оптимальной считается та стратегия, для которой численная оценка является максимальной.
Заметим, что задание оценки каждой стратегии позволяет сравнить любые две стратегии: из двух стратегий лучшей считается та, которая имеет большую оценку (стратегии, имеющие одинаковую численную оценку, считаются эквивалентными). Таким образом, задание оценок стратегий устанавливает
критерий для сравнения стратегий. Рассмотрим теперь важнейшие критерии, используемые для задач принятия решений в условиях неопределенности.
КРИТЕРИЙ ЛАПЛАСА (L) основан на гипотезе равновероятности и содержательно может быть сформулирован следующим образом: «поскольку мы ничего не знаем о состояниях среды, их надо считать равновероятными». Иногда этот принцип называется также принципом недостаточного основания. При принятии данной гипотезы в качестве оценки стратегии і надо брать соответствующий ей средний выигрыш, то есть
Оптимальная по данному критерию стратегия находится из условия
Пример. Определить оптимальные варианты из множества решении, заданных матрицей решений с использованием критерия Лапласа (Байеса-Лапласа) , при равновесных состояниях.
КРИТЕРИЙ ВАЛЬДА (V) основан на гипотезе крайней осторожности (крайнего пессимизма), которая формулируется так: "При выборе той или иной стратегии надо рассчитывать на худший из возможных вариантов". Если принять эту гипотезу, то оценкой стратегии і является число
Принцип оптимальности, основанный на критерии Вальда, называется принципом максимина.
Ясно, что при a=1
КРИТЕРИЙ СЭВИДЖА (S) определятся так:
В отличие от предыдущих критериев, оптимальная стратегия - та, что минимизирует значение S(i). Этот критерий - мера сожаления о незнании истинного состояния среды. Критерий Ходжа-Лемана - линейная комбинация критериев Вальда и математического ожидания. Более сложным образом рассчитываются критерии Гермейера и произведения.
Замечание. В общем случае оптимальные решения, полученные по указанным критериям, могут не совпадать (как говорят, критерии противоречат друг другу). Это неудивительно, ибо эти критерии основаны на разных гипотезах. Вводя ту или иную гипотезу, мы тем самым "снимаем неопределенность", однако, гипотеза является только предположением, а не знанием. Было бы странно, если бы различные предположения приводили всегда к одному и тому же результату.
Задание. Найти оптимальный вариант электростанции по критериям Лапласа, Вальда, Гурвица с показателями 0,8 и 0,3 и Сэвиджа по заданной таблице эффективностей:
Таблица эффективностей
Среда Варианты | В1 | В2 | В3 | В4 |
А1 | 10 | 8 | 4 | 11 |
А2 | 9 | 9 | 5 | 10 |
А3 | 8 | 10 | 3 | 14 |
А4 | 7 | 7 | 8 | 12 |
Решение:
Критерий Лапласа. В основе критерия лежит предположение: поскольку о состояниях обстановки ничего не известно, то их можно считать равновероятными. Исходя из этого действуют формуле:
Критерий Вальда. Это максиминный критерий, он гарантирует определенный выигрыш при наихудших условиях. Критерий основывается на том, что, если состояние обстановки неизвестно, нужно поступать самым осторожным образом, ориентируясь на минимальное значение эффективности каждой системы.
Критерий Гурвина с показателями 0,8 и 0,3. Это критерий обобщенного максимина.
Согласно данному критерию при оценке и выборе систем неразумно проявлять как осторожность, так и азарт, а следует, учитывая самое высокое и самое низкое значения эффективности, занимать промежуточную позицию (взвешиваются наихудшие и наилучшие условия). Для этого вводится коэффициент оптимизма а (0 ≤ а ≤ 1), характеризующий отношение к риску лица, принимающего решение. Эффективность систем находится как взвешенная с помощью коэффициента а сумма максимальной и минимальной оценок:
Критерий Сэвиджа. Минимивирует потери эффективности при наихудших условиях. Для оценки систем на основе данного критерия матрица эффективности должна быть преобразована в матрицу потерь (риска). Каждый элемент матрицы потерь определяется как разность между максимальным и текущим значениями оценок эффективности в столбце:
Среда Варианты | В1 | В2 | В3 | В4 |
А1 | 10 | 8 | 4 | 11 |
А2 | 9 | 9 | 5 | 10 |
А3 | 8 | 10 | 3 | 14 |
А4 | 7 | 7 | 8 | 12 |
Матрице эффективности будет соответствовать матрица потерь:
Среда Варианты | В1 | В2 | В3 | В4 |
А1 | 0 | 2 | 4 | 3 |
А2 | 1 | 1 | 3 | 4 |
А3 | 2 | 0 | 5 | 0 |
А4 | 3 | 3 | 0 | 2 |