Файл: Востриков. Основы теории непрерывных и дискретных систем регулирования.pdf
ВУЗ: Новосибирский государственный технический университет
Категория: Учебное пособие
Дисциплина: Основы теории управления
Добавлен: 15.02.2019
Просмотров: 19923
Скачиваний: 135
13.2. Постановка задачи синтеза оптимальных систем
431
Отметим, что множество начальных состояний объекта [x(0)], как
правило, совпадает с пространством состояний, а множество конечных
состояний [x(T)] является подмножеством пространства состояний.
Кроме этого, объект управления нужно перевести не в любую точку
пространства состояний, а лишь в ту, которая принадлежит подмноже-
ству реализуемых равновесных состояний (см. разд. 11.2).
x(0)
x(T)
x
1
x
n
[x(T)]
x(0)
x
1
x
n
[x(T)]
[x(0)]
x
1
x
n
[x(0)]
x(T)
x
1
x
n
Задача с фиксированными концами
Задача с фиксированным левым
концом
Задача с фиксированным правым
концом
Задача с подвижными концами
а
в
б
г
x
n
x
n
x
n
x
n
x
1
x
1
x
1
x
1
( )
x T
x(0)
x(0)
x(Т)
( )
x T
x(Т)
Рис. 13.4. Иллюстрация четырех типов задач синтеза:
а – с фиксированными концами; б – с одним правым; в – с левым; г – задача
с подвижными концами
Рассмотрим на примере определение реализуемых равновесных со-
стояний объекта.
Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ
432
ПРИМЕР 13.2
Определить множество равновесных состояний для объекта, поведение
которого описывает система уравнений
1
1
2
2
1
2
2
,
5
2 .
x
x
x
u
x
x
x
u
Запишем для него уравнения статики
0
0
1
2
0
0
1
2
2
0,
5
2
0.
x
x
u
x
x
u
Определим управляющее воздействие из первого уравнения и подста-
вим во второе. После преобразования получим уравнение множества реа-
лизуемых равновесных состояний в виде
0
0
2
1
5
3
x
x .
Графической интерпретацией этого множества в пространстве состоя-
ний является прямая, именно ей должно принадлежать конечное состояние
объекта. В другую точку пространства состояний его перевести невозмож-
но (точнее, перевести можно, но стабилизировать нельзя).
13.2.3. ОГРАНИЧЕНИЯ НА ПЕРЕМЕННЫЕ СОСТОЯНИЯ
И УПРАВЛЕНИЕ
Любая задача оптимизации имеет практический смысл только при
ограничениях на переменные состояния и ресурс управления.
Ограничения на переменные состояния дают некоторую рабочую
область
x
в пространстве состояний (рис. 13.5, а). Наиболее часто они
носят характер модуля,
,
1,
i
i
x
x
i
n .
На управляющие воздействия также накладываются ограничения,
которые в общем случае можно представить в виде некоторой рабочей
области
u
(рис. 13.5, б). В реальных системах ограничение на ресурс
управления, как правило, также носит характер ограничения по моду-
лю
,
1,
j
j
u
U
j
m .
13.2. Постановка задачи синтеза оптимальных систем
433
x
i
x
n
x
x
i
x
n
x
U
i
U
m
U
u
i
u
m
u
а
б
Рис. 13.5. Иллюстрация рабочих областей:
а –переменных состояния; б – управляющих воздействий
На этапе постановки задачи синтеза необходимо убедиться в том,
что множество начальных [x(0)] и конечных [x(T)] состояний объ-
екта находится внутри рабочей области пространства состояний
x
.
13.2.4. КРИТЕРИЙ ОПТИМАЛЬНОСТИ
Критерий оптимальности в обобщенной форме отражает требова-
ния к качеству переходных процессов замкнутой системы. В задаче
синтеза оптимальных систем его принято представлять в виде инте-
грального функционала
0
0
0
min
,
u
T
u
J
f
x u dt ,
(13.4)
где T – время перехода из начального состояния в конечное.
В зависимости от требований к качеству работы системы можно
выделить несколько наиболее часто встречающихся критериев опти-
мальности.
1. Критерий быстродействия отражает требование минимизации
времени переходного процесса и может быть записан в виде
0
min
u
u
J
T .
(13.5)
Этот критерий представим в форме интегрального функционала
0
0
min
u
T
u
J
dt .
(13.6)
Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ
434
2. Критерий минимума затрат энергии по состоянию. В случае,
когда требуется минимизировать затраты энергии только по одной из
компонент вектора состояния, критерий оптимальности имеет вид
0
2
0
min
u
T
i
u
J
x
t dt .
(13.7)
Если речь идет о минимизации затрат энергии по всему вектору со-
стояния, то он принимает форму
0
0
min
u
T
T
u
J
x Pxdt ,
(13.8)
где P – матрица коэффициентов квадратичной формы размера n n .
3. Критерий минимума затрат энергии на управление. Он может
быть записан аналогично (13.7) относительно одной из компонент
управляющего воздействия
0
2
0
min
u
T
j
u
J
u dt
(13.9)
или относительно всего вектора управления
0
0
min
u
T
T
u
J
u Qudt ,
(13.10)
где Q – матрица квадратичной формы размера
m m
.
4. Критерий минимума полных затрат энергии. Это общий случай
критерия минимума затрат энергии, объединяющий критерии (13.8) и
(13.9):
0
0
min
u
T
T
T
u
J
x Px
u Qu dt .
(13.11)
13.3. Метод динамического программирования
435
13.2.5. ФОРМА РЕЗУЛЬТАТА
При постановке задачи заранее оговаривается тип управляющего
воздействия, которое необходимо определить в процессе синтеза. На-
пример, для одноактных систем, работающих без помех и возмущений,
можно рассчитывать программное оптимальное управление
0
0
( )
u
u t .
Однако более часто применяют оптимальное управление в виде обрат-
ной связи
0
0
( )
u
u
x .
Задача синтеза оптимальной системы формулируется следующим
образом. Для объекта, описанного в переменных состояния с заданны-
ми ограничениями на управление и состояние, необходимо найти та-
кой закон управления, который обеспечивал бы переход системы из
начального состояния в конечное в соответствии с определенным кри-
терием оптимальности.
13.3. МЕТОД ДИНАМИЧЕСКОГО
ПРОГРАММИРОВАНИЯ
Метод динамического программирования, предложенный в начале
1950-х годов Р. Беллманом [1, 3, 41, 44], используется для синтеза оп-
тимальных систем управления, при выводе его основных соотношений
используется принцип оптимальности.
13.3.1. ПРИНЦИП ОПТИМАЛЬНОСТИ
Формулировка принципа оптимальности следующая: конечный
участок оптимальной траектории есть также оптимальная траектория.
Доказательство этого принципа можно
найти в [3], здесь ограничимся лишь его
пояснением.
Предположим, что существует един-
ственная оптимальная траектория пере-
хода из точки x(0) в точку x(T) (рис. 13.6).
Промежуточная точка x(t) разбивает эту
траекторию на две части. Причем ее
конечный участок представляет собой
оптимальную траекторию, иначе можно
было бы найти новую оптимальную
x(0)
x (t)
x(T)
x
1
x
n
x
n
x(t)
x(T)
x(0)
x
1
Рис. 13.6. Иллюстрация прин-
ципа оптимальности