ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 12.01.2024
Просмотров: 334
Скачиваний: 4
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
43
Метод градиентного поиска
Градиент (от лат. Gradiens – шагающий, растущий) это вектор, своим направлением указывающий направление наибольшего возрастания исследуемой функции. Поиск экстремума выполня- ется вдоль градиента, который вычисля- ется через частные производные по каж- дому из входных параметров, так для двухпараметрической модели геометриче- ское представление градиента показано на рис. 51.
Как и в методе покоординатного подъ-
ёма можно выполнить две реализации:
- в начальной точке находим частные производные по каждому из входных параметров и вдоль полученного гра- диента с заданным шагом ищем наилучшую точку, в ней строим новый градиент;
- определив градиент в заданной точке сразу ищем вдоль этого градиента наилучшую точку с помощью, например, надстройки «Поиск решения» и в ней строим следующий гра- диент и повторяем процедуру.
Реализуем эти решения в Excel.
Рис. 50. Построение градиента
X
2
dX
1
Y
dX
2
Градиент
X
1
44
Первой задачей, которую надо решить, является способ по- строения точек вдоль градиента. Чтобы решение имело наимень- шие ошибки всегда надо выбирать основной шаг по параметру, который имеет наибольшее значение производной и через отно- шение производных находим остальные шаги по оставшимся па- раметрам, которые всегда будут меньше опорного шага. В про- тивном случае, если опорный шаг взять для параметра с мини- мальным значением производной, то шаги по оставшимся производным будут больше оперного шага и стремиться к большим значениям. Для наглядного представления формулы расчёта шагов рассмотрим рис. 51. Примем опорный шаг
h
оп
, найдём максимальный градиент без учёта знака (по абсолютной величине) и запишем нашу формулу:
dX
dX
h
h
i
оп
i
max
(1)
Для реализации первого решения готовим таблицу (рис. 52) с координатами началь- ной точки поиска, ко- торые вводим руками, в столбцы
Y
, dY(X1)
и dY(X2)
формулы для расчёта функции и частных производных, которые были вычислены в предыдущей работе (см. стр. 41). В следующей строке таблицы формируем формулы для следующих значений Х
1
:
=ЕСЛИ(ABS(D43)>ABS(E43);A43+F43*D43/ABS(D43);A43+F43*D43/ABS(E43)) где:
D43
и
E43
– адреса ячеек с производными из предыдущей строки таблицы;
A43
– значение Х
1
в предыдущей строке таб- лицы;
F43
– опорный шаг поиска. и Х
2
:
=ЕСЛИ(ABS(D43)>ABS(E43);B43+F43*E43/ABS(D43);B43+F43*E43/ABS(E43))
Рис. 51. Определение шагов вдоль гради- ента
X
2
dX
1
Y
dX
2
Градиент
X
1
h
2
h
1
Рис. 52. Шапка таблицы для градиентного метода
45 где:
B43
– значение Х2 в предыдущей строке.
Четыре оставшиеся ячейки копируем из предыдущей строки и далее вторую строку просто растягиваем до получения нужного значения экстремума.
Рис. 53. Таблица и путь поиска экстремума градиентным методом
Данное решение построено по градиентам, определённым в каждой предыдущей точке. В результате видно, что идёт за- кругление пути, а в районе экстремума точки прыгают во- круг него. Для уменьшения расчётов можно пользоваться производными, вычислен- ными в первой точке, тогда путь поиска будет иметь вид, показанный на рис. 54. Доста- точно для расчёта следующей точки использовать первую строку и не вычислять произ- водные, пока не будет достигнута наилучшая точка вдоль этого градиента. Потом вычисляются новые производные и процедура повторяется.
Можно ускорить процесс поиска, воспользовавшись надстрой-
Рис. 54. Поиск от начальной точки
46 кой «
Поиск решения
», но для этого надо немного переделать фор- мулу, которая должна зависеть от значения в дополнительной ячейке, которая будет изменяться во время поиска решения, а зна- чение для параметра с максимальным значением производной бу- дет браться из неё, остальные параметры выбираются по форму- лам от их производных и максимального значения.
Изменим вид таблицы для поиска
(рис. 55). Во второй строке формулы для Х
1
и Х
2
изме- няем:
=ЕСЛИ(ABS(E60)>ABS(F60);A61;B60+(C61-C60)*E60/F60)
и
=ЕСЛИ(ABS(E60)>ABS(F60);C60+(B61-B60)*F60/E60;A61) где:
E60
и
F60
– адреса ячеек с производными из предыдущей строки таблицы;
A61
– значение Х для проведения поиска экс- тремума;
C61-C60
и
B61-B60
– разности между текущим предыду- щим значениями X
i
для Х
2
и Х
1
соответственно.
Остальные формулы остаются без изменения и копируются из предыдущей таблицы. Поиск экстремума начинаем со второй строки таблицы и использованием надстройки «
Поиск решения
», где ячейка для оптимизации – значение Y, которая оптимизируется до максимального значения при изменении значения в столбце Х.
После оптимизации эта ячейка копируется и поиск экстремума повторяется уже для третьей строки. Два первых шага показаны на рис. 56.
Данные методы требуют вычисления производных, что не все- гда возможно, вторая проблема возникает при наличии ограниче- ний при выполнении оптимизации многопараметрических функ- ций. Для решения таких задач надо использовать методы с ис- пользованием специальных подходов или функций.
Рис. 55. Таблица для поиска экстремума
47
Наиболее простой из них это комплексный метод, который ведёт поиск экстремума на ос- нове данных из вершин фигуры, которая называется комплексом и имеет 2n вершин, где n – раз- мерность факторного простран- ства (число входных парамет- ров). Разберём этот метод более подробно.
Комплексный метод
Нахождение интегралов функций
Основные понятия
Задачи, в которых требуется вычисление интегралов, возни- кают почти во всех областях прикладной математики. Иногда удаётся найти аналитическую формулу, т. е. выразить неопреде- лённый интеграл в виде комбинации алгебраических и трансцен- дентных функций, после чего остаётся вычислить значение опре- делённого интеграла, подставляя в формулу пределы интегриро- вания.
Во многих случаях, однако, не удаётся найти никакой аналити- ческой формулы, или же она получается настолько сложной, что вычислять интеграл с её помощью очень трудно. В таких ситуа- циях приходится применять численные методы интегрирования, которые основаны на том, что интеграл представляется в виде предела суммы площадей, и позволяют вычислить эту сумму с за- данной точностью.
Рис. 56. Поиск экстремума
48
Вспомним немного об интегралах. Интегралы показывают вы- полненную работу, необходимую энергию или проделанный путь по известным уравнениям изменения силы, температуры или скорости от времени соответственно. Геометри- чески интеграл определяется площа- дью под кривой, описанной заданной функцией (рис. 4.1). Существуют аналитические и численные методы вычисления интегралов. Первые из них требуют знания интегралов уравнений и формул для вычисления определённых интегралов, что не всегда бывает доступно, осо- бенно для сложных уравнений. Вторые позволяют находить ин- тегралы уравнений с заданной точностью, разбивая интервал ин- тегрирования на заданное число сечений, находя площади каж- дого из них по упрощённым формулам, заменяя их площадями прямоугольников, трапеций или аппроксимируя функцию поли- номами определённых порядков (обычно не более второй сте- пени). Однако они требуют большого объёма вычислений, но стремительное развитие вычислительной техники позволило в настоящее время широко их использовать.
Рассмотрим механизм нахождения интеграла численным мето- дом. Заданный интервал интегрирования делим на заданное число сечений n. Потом находим площади всех полученных сечений.
Рассмотрим способы вычисления площади сечения (рис. 4.2). Как видим, каждое сечение представляет собой криволинейную тра- пецию. Существует несколько вариантов решения данной задачи, каждый из которых отличается объёмом вычислений и соответ- ственно точностью полученного результата. Самый простой спо- соб – это нахождение площади сечения через прямоугольник, по- строенный по начальной, конечной или средней высоте сечения
(рис. 4.2а, б, в). Ясно, что первый и второй варианты имеют более
Y
0
X
In
Y=F(X)
Рис. 4.1 Интеграл уравнения
49 грубую ошибку, чем третий, но последний требует дополнитель- ного вычисления середины сечения. Четвёртый способ – нахож- дения площади сечения через площадь трапеции (рис. 4.2д), бли- зок по точности к третьему, но требует двух вычислений высот на границах сечения. Последний вариант – нахождение площади се- чения через площадь криволинейной трапеции при её аппрокси- мации полиномом второго порядка – явно повышает точность ре- шения, но одновременно усложняет расчёты из-за трёх вычисле- ний высот в сечении.
X
Y
n
0
X
n
X
X
k
Y
k
X
X
c
Y
c
X
X
n
X
k
Y
k
Y
n
X
X
n
X
k
Y
k
Y
n
Y
c
X
c
а б в г д
Рис. 4.2. Схемы вычисления площади сечения: а – по начальной вы- соте; б – по конечной высоте; в – по средней высоте; г – через площадь прямолинейной трапеции; д – аппроксимацией криволинейной трапе- цией через полином второго порядка
Формулы для каждого из методов:
n
i
i
h
X
F
In
,
1
по схеме рис. 4.2а
n
i
i
h
h
X
F
In
,
1
по схеме рис. 4.2б
n
i
i
h
h
X
F
In
,
1 2
по схеме рис. 4.2в
n
i
i
i
h
X
F
h
X
F
In
,
1 2
по схеме рис. 4.2г
n
i
i
i
i
h
h
X
F
h
X
F
X
F
In
,
1 6
2 4
по схеме рис. 4.2д
50
Решения дифференциальных уравнений
Основные понятия
51
Математическое моделирование процессов и систем
Моделирование – метод познания окружающего мира, который можно отнести к общенаучным методам, применяемым как на эм- пирическом, так и на теоретическом уровне познания.
Основным объектом исследования в моделировании является
модель. При построении и исследовании модели могут приме- няться практически все известные методы познания.
Чаше всего термин модель используют для обозначения:
- устройства, воспроизводящего строение или действие какого- либо другого устройства;
- аналога какого-либо явления, процесса или предмета.
К недостаткам термина «модель» следует отнести его много- значность. Для нас наиболее интересны два варианта:
- модель как аналог реального объекта,
- модель как образец будущего изделия.
Под моделью (от лат. modulus – мера, образец, норма) пони- мают такой материальный или мысленно представляемый объект, который в процессе познания (изучения) замещает объект-ориги- нал, сохраняя некоторые важные для данного исследования его типичные черты. Отсюда можно снова перейти к понятию моде-
лирования, которое является процессом построения и использова- ния модели для изучения последней.
К основным свойствам модели следует отнести:
- Адекватность модели – её достоверность с учётом принятых ограничений и условий;
- Простота (сложность) модели – условия использования мо- дели. Простые модели более предпочтительны в работе;
- Потенциальность модели – мощность модели при предсказа- нии поведения исследуемого объекта.
Эти свойства доказывают, что модель справедлива с учётом определённых условий, принятых для решения данной задачи.
Всегда надо выбирать между простотой и достаточностью для описания объекта его моделью. Потенциальность обеспечивает
52 возможность расширения модели и её углубление для описания объекта исследования.
Чаще всего нам модель нужна для того, чтобы:
- понять, как устроен конкретный объект: какова его структура, внутренние связи, основные свойства, законы развития, само- развития и взаимодействия с окружающей средой;
- научиться управлять объектом или процессом, определять наилучшие способы управления при заданных целях и крите- риях;
- прогнозировать прямые и косвенные последствия реализации заданных способов и форм воздействия на объект.
Чтобы было проще понять, как строить мо- дели рассмотрим их классифика- цию (рис. 2), ко- торая нам пока- зывает последо- вательность их построения.
При наблюде- нии за объектом- оригиналом в го- лове исследова- теля формиру- ется некий мысленный образ объекта, его идеальная модель, ко- торую в научной литературе принято называть когнитивной
(мысленной, способствующей познанию). Формируя такую мо- дель, исследователь, как правило, стремится ответить на конкрет- ные вопросы, поэтому от бесконечно сложного устройства объ- екта отсекается все ненужное с целью получения его более ком- пактного и лаконичного описания.
Представление когнитивной модели на естественном языке
Рис. 2. Классификация моделей и их связь с реальностью.
53 называется содержательной моделью.
Когнитивные модели субъективны, так как формируются умо- зрительно («в голове» исследователя) на основе всех его предыду- щих знаний и опыта. Получить представление о когнитивной мо- дели можно только описав её в знаковой форме. Нельзя утвер- ждать, что когнитивные и содержательные модели эквивалентны, поскольку первые могут содержать элементы, которые исследо- ватель не сможет или не хочет сформулировать словесно. В то же время, если содержательная модель сформулирована кем-то дру- гим или является продуктом коллективного творчества, то её ин- терпретация, уровень понимания, степень доверия могут суще- ственно изменяться в зависимости от того или иного интерпрета- тора. В естественно-научных дисциплинах и в технике содержа- тельную модель часто называют технической постановкой про- блемы.
По функциональному признаку и целям содержательные мо- дели подразделяются на описательные, объяснительные и про-
гностические:
Описательной моделью можно назвать любое описание объ- екта. Объяснительная модель позволяет ответить на вопрос, по- чему что-либо происходит. Прогностическая модель должна опи- сывать поведение объекта. Можно заметить, что прогностическая модель не обязана включать в себя объяснительную.
Концептуальной моделью принято называть содержательную модель, при формулировке которой используются понятия и представления предметных областей знания, занимающихся изу- чением объекта моделирования.
Выделяют три вида концептуальных моделей:
Логико-семантическая модель является описанием объекта в терминах и определениях соответствующих предметных обла- стей знаний, включающим все известные логически непротиворе- чивые утверждения и факты. Анализ таких моделей осуществля- ется средствами логики с привлечением знаний, накопленных в соответствующих предметных областях;