Файл: Востриков. Основы теории непрерывных и дискретных систем регулирования.pdf
ВУЗ: Новосибирский государственный технический университет
Категория: Учебное пособие
Дисциплина: Основы теории управления
Добавлен: 15.02.2019
Просмотров: 19914
Скачиваний: 135
13.4. Принцип максимума Понтрягина
451
Запишем гамильтониан быстродействия
б
1 2
2
1
2
(
2
)
H
x
x
dx
u
и определим оптимальное управление
0
2
sgn
u
U
.
Система дифференциальных уравнений для сопряженных координат
имеет вид
1
2
1
2
1
2
2
,
2
.
H
x
H
d
x
Ее можно представить в виде одного дифференциального уравнения
1
1
1
2
0
d
,
которому соответствует характеристическое уравнение
2
2
1
0
p
dp
.
При d 1 его корни
1
и
2
будут вещественными и положительными,
следовательно, оптимальное управление принимает вид
1
2
0
1
2
sgn
t
t
u
U
c e
c e
,
где
const,
1, 2
i
c
i
.
t
1
t
e
2
t
e
t
э
к
с
п
о
н
е
н
т
ы
с
у
м
м
а
э
к
с
п
о
н
е
н
т
1
t
e
2
t
e
а
б
Рис. 13.9. Иллюстрация теоремы о числе переключений:
а – одно переключение; б – без переключений; штриховая линия – сумма
экспонент
Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ
452
Сумма двух экспонент может только один раз изменить знак, что со-
ответствует однократному переключению управляющего воздействия
(рис. 13.9, а), либо не изменит знака совсем. В последнем случае не будет
переключений управляющего воздействия (рис. 13.9, б).
13.5. МЕТОД
ПОВЕРХНОСТИ ПЕРЕКЛЮЧЕНИЯ
13.5.1. ОСНОВНЫЕ ПОНЯТИЯ
Этот метод применяется для формирования оптимального управле-
ния в виде обратной связи в случае, когда управление носит разрыв-
ный (релейный) характер.
Рассматривается общая задача синтеза оптимальной системы для
объекта (13.1)
( , ),
,
,
n
m
x
f x u
x
R
u
R
m
n
и переход из произвольных начальных состояний (0)
x
в заданные ко-
нечные ( )
x T
в соответствии с некоторым критерием оптимальности
0
0
min
,
u
T
u
J
f
x u d
.
(13.42)
Оптимальный закон управления в этом случае имеет вид
0
sgn
u
U
S x ,
(13.43)
где
m
U
R – вектор максимальных значений управления,
m
S
R –
вектор функций, определяющих в пространстве состояний некоторую
поверхность, которая называется поверхностью переключения [42]
0
S x
.
(13.44)
Для определения этой поверхности предварительно конечная точка
«приводится» к началу координат с помощью замены переменных
( )
x
x
x T
.
(13.45)
13.5. Метод поверхности переключения
453
Затем в пространстве состояний исследуются траектории перехода из
произвольных начальных состояний (0)
x
в конечную точку ( )
0
x T
.
На траекториях перехода выделяются точки, где происходит смена
знака управления, которые объединяются в поверхность переключения
( )
0
S x
.
(13.46)
Однако чтобы получить траекторию перехода из начальной точки
1
(0)
x
в начало координат пространства состояний, необходимо также
задавать в соответствии с принципом максимума и начальные условия
для сопряженных координат (0) . Если эти начальные условия вы-
браны неудачно, то получим тра-
екторию перехода не в ( ) 0
x T
, а
в произвольную точку простран-
ства состояний. В этом случае
следует задать новые начальные
условия для сопряженных коор-
динат
(0)
и вновь попытаться
отыскать траекторию перехода в
начало координат (рис.13.10).
Для новой начальной точки
2
(0)
x
траектория перехода в на-
чало координат также может быть
получена в результате перебора начальных условий для сопряженных
координат (рис.13.10).
Объединяя точки переключения управления на всех траекториях
перехода из произвольных состояний в начало координат, можно по-
лучить поверхность переключения в виде (13.46) или, разрешив урав-
нение (13.46) относительно
n
x , в следующей форме:
1
n
x
F x
,
(13.47)
где
1
x – «усеченный» вектор состояния (без последней компоненты).
С учетом (13.47) оптимальный закон управления (13.43) можно за-
писать в виде
0
1
sgn
n
u
U
x
F x
.
(13.48)
x
n
x
1
x
2
(0)
x
1
(0)
x(Т)
Рис. 13.10. Иллюстрация построения
траекторий перехода в начало коор-
динат
Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ
454
Таким образом, метод поверхности переключения позволяет полу-
чить оптимальный закон управления в виде обратной связи. Однако при
этом приходится рассматривать две совокупности начальных условий:
для переменных состояния (0)
x
и сопряженных координат
(0) , что
существенно затрудняет определение управляющего воздействия.
13.5.2. МЕТОД ОБРАТНОГО ВРЕМЕНИ
С целью упрощения задачи определения поверхности переключе-
ния предлагается поменять местами начальную (0)
x
и конечную
( )
0
x T
точки, что в пространстве состояний соответствует движению
в обратную сторону. Для динамической системы это означает замену
времени t на –t. При этом вместо двух совокупностей начальных усло-
вий
(0);
(0)
x
нужно рассматривать только одну –
(0)
, так как
(0)
0
x
.
Постановка задачи синтеза оптимальной системы в обратном вре-
мени формулируется следующим образом. Для объекта
( , )
x
f x u
с ограниченным ресурсом управления необходимо определить опти-
мальное управление в виде обратной связи, которое обеспечивает пе-
реход из начальной точки (0) 0
x
в конечную ( )
x T
в соответствии с
критерием оптимальности (13.4). При этом заранее известно, что оп-
тимальное управление имеет релейный характер.
Отметим, что в этом случае необходимо перебирать только одну
совокупность начальных условий
(0)
. Причем каждому конкрет-
ному значению
(0)
i
соответствует оптимальная траектория перехода
из заданной начальной точки (0) 0
x
в некоторую конечную
( )
i
x T .
В соответствии с методом поверхности переключений в пространст-
ве состояний на траекториях перехода выделяются точки, где про-
исходит смена знака управления и объединяются в поверхность
1
( )
( )
n
S x
x
F x .
13.5. Метод поверхности переключения
455
В обычном времени следует изменить направление движения на
противоположное. В результате находится оптимальное управление в
виде (13.43)
0
sgn
u
U
S x
или в форме (13.48).
ПРИМЕР 13.5
Рассмотрим процедуру определения оптимального управления методом
обратного времени для объекта
2
1
y
u
p
с ограничением на управление
u
A
. Необходимо перейти из начальной
точки
0
x
в конечную
0
x T
с критерием оптимальности
0
min
u
t
u
J
d .
Запишем уравнения объекта в переменных состояния
1
2
2
,
,
x
x
x
u
где
1
2
,
x
y x
y .
Поскольку рассматривается задача оптимального быстродействия, оп-
тимальное управление носит релейный характер
0
2
sgn
u
A
.
Для определения
0
u
в виде функции переменных состояния использу-
ем метод поверхностей переключения. Предварительно запишем уравне-
ния объекта в обратном времени
1
2
2
,
.
x
x
x
u