Файл: Востриков. Основы теории непрерывных и дискретных систем регулирования.pdf

Скачать файл (12,39Мб)

Заказать решение

ВУЗ: Новосибирский государственный технический университет

Категория: Учебное пособие

Дисциплина: Основы теории управления

Добавлен: 15.02.2019

Просмотров: 19922

Скачиваний: 135

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ

436

траекторию перехода из точки x(t) в точку x(T) и организовать движе-

ние из начальной точки x(0) в конечную x(T) по новой оптимальной

траектории. Это невозможно, так как для системы существует лишь

одна оптимальная траектория перехода из одной точки в другую.

13.3.2. ОСНОВНЫЕ СООТНОШЕНИЯ МЕТОДА

ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

Будем рассматривать общий класс объектов управления, который

описывается уравнением (13.1)

( , ),

f x u



Полагаем, что переменные состояния

n и ресурс управ-

ления

m ограничены.

Необходимо определить управляющее воздействие, которое обес-

печивало бы переход из начального состояния x(t) в конечное x(T) за

время T (рис. 13.7) в соответствии с критерием оптимальности

min

x u d .

(13.12)

x(t)

x (t+ t)

x(T)

(

)

x t

( )

x t

( )

x T

Рис. 13.7. Иллюстрация оптимального перехода

из одной точки в другую

13.3. Метод динамического программирования

437

Выберем на оптимальной траектории перехода промежуточную

точку  x(t+ t),  расположенную  достаточно  близко  к  заданной  началь-
ной точке. Согласно принципу оптимальности конечный участок есть
также  оптимальная  траектория,  поэтому  представим  критерий  опти-
мальности  (13.12)  в  виде  суммы  двух  критериев,  соответствующих
двум участкам движения:

min

( , )

min

( , )

x u d

(13.13)

или после преобразований

min

( , )

x u d

(13.14)

Рассматривая второй интеграл выражения (13.14) как функцию нижне-
го предела, обозначим его

(

)

( , )

V x t

x u d .

(13.15)

С учетом (13.15) соотношение (13.14) представим в виде

min

( , )

(

)

x u d

V x t

(13.16)

Полагая промежуток времени t достаточно малым, сделаем в

(13.16) следующие упрощения:

1) интеграл приближенно заменим произведением

( , )

x u d

x u

t ;

(13.17)

2) функцию

(

)

V x t

разложим в ряд Тейлора в окрестности за-

данной начальной точки

Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ

438

(

)

( )

V x t

(13.18)

где R – остаточные члены ряда разложения, которыми можно пренеб-

речь.

Учитывая приближенные замены (13.17) и (13.18), преобразуем вы-

ражение (13.16):

min

( , )

( )

x u

V x t

(13.19)

Представим min

в равенстве (13.19) в виде суммы двух состав-

ляющих следующим образом:

min

( , )

min

( )

x u

V x t

(13.20)

Обсудим получившееся выражение. Согласно введенному обозначе-

нию (13.15) здесь

min

( )

V x t

J ,

(13.21)

поэтому вместо (13.20) получим

min

( , )

x u

(13.22)

Поделим обе части равенства (13.22) на t

min

( , )

x u

а затем устремим t 0 и получим следующее уравнение:

min

( , )

x u



(13.23)

13.3. Метод динамического программирования

439

Поскольку рассматривается оптимальная траектория движения для

объекта (13.1), подставим в (13.23) вместо x правую часть уравнения
объекта и получим основное уравнение метода динамического про-

граммирования в виде

min

( , )

x u

f x u

(13.24)

Таким образом, оптимальным будет управление, которое миними-

зирует выражение (13.24). Однако использовать его для вычисления

u нельзя, так как одно уравнение (13.24) содержит m + 1 неизвестную

величину (

R и

R ).

13.3.3. РАСЧЕТНЫЕ СООТНОШЕНИЯ

МЕТОДА ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

В случае оптимального управления

u соотношение (13.24)

принимает вид

x u

f x u

(13.25)

Продифференцируем (13.25) по u вдоль оптимальной траектории

( , )

u u

x u

f x u

(13.26)

Добавив уравнения (13.26) к (13.25), получим систему из m+1 урав-

нения с m+1 неизвестным, решая которую можно найти оптимальное

управление.

Поскольку (13.25) и (13.26) представляют собой систему уравнений

в частных производных, для определения из нее оптимального управ-

ления, как правило, приходится использовать приближенные числен-

ные методы. В результате найденное управление получается не опти-

мальным, а близким к нему.

Задача отыскания точного оптимального управления методом ди-

намического программирования носит название задачи АКОР (анали-

Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ

440

тического конструирования оптимальных регуляторов). Эта задача

имеет решение при наличии следующих условий [1, 3, 17].

1. Объект управления описывается линейным уравнением состоя-

ния (13.3)



R ,

n .

2. Переход из начальной точки (0)

в конечную ( )

x T рассматрива-

ется на бесконечном интервале времени (

)

3. Критерий оптимальности имеет вид квадратичной формы (13.11)

min

x Px

u Qu d

Оптимальное управление, полученное методом динамического про-

граммирования, для такой постановки задачи будет иметь вид

Kx .

Таким образом, оптимальным для задачи АКОР будет пропорцио-

нальный закон управления.

ПРИМЕР 13.2

Объект, модель которого имеет вид

100,

20,

x u



необходимо перевести из начальной точки (0) 0

в конечную ( )

x T

Время процесса не ограничено, а критерий оптимальности следующий:

min



Запишем основное уравнение метода динамического программирова-

ния (13.25)

x u

Смотрите также файлы

Основы Теории управления Раздобреев Лекции (часть 1).doc

Основы Теории управления Раздобреев Лекции (часть 2).doc

РГР ОТУ 2016.doc

ОТУ 2016-09-01 Лекция 1.pdf

ОТУ 2016-09-01 Лекция 2.pdf

Файл: Востриков. Основы теории непрерывных и дискретных систем регулирования.pdf

Смотрите также файлы

Информация

Списки файлов

Дополнительно