Файл: Востриков. Основы теории непрерывных и дискретных систем регулирования.pdf
ВУЗ: Новосибирский государственный технический университет
Категория: Учебное пособие
Дисциплина: Основы теории управления
Добавлен: 15.02.2019
Просмотров: 19918
Скачиваний: 135
13.3. Метод динамического программирования
441
и дополним его уравнением в частных производных (13.26)
0
2
0
T
V
u
x
.
Выразим из второго уравнения V
x и подставим в первое, в резуль-
тате получим
2
2
2
2
0
0
0
5
4
2
0
x
u
xu
u
или после приведения подобных
2
2
0
0
4
5
0
u
xu
x
.
Решение квадратного уравнения относительно управления дает два
значения:
0
0
1
2
5 ,
.
u
x
u
x
Поскольку для одной системы двух оптимальных законов управления
быть не может, одно из найденных значений не является оптимальным.
Для определения оптимального управления проверим устойчивость замк-
нутой системы.
В уравнение объекта подставим значение
0 1
u
и получим уравнение
замкнутой системы
3
x
x
.
Как видим, система неустойчива, а значит, первое управляющее воздейст-
вие не является оптимальным.
В уравнение объекта подставим значение
0 2
u
, при этом уравнение
замкнутой системы примет вид
3
x
x
и она будет устойчивой.
Таким образом, оптимальный закон управления имеет вид
0
u
Kx , где
1
K
.
Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ
442
13.4. ПРИНЦИП МАКСИМУМА
ПОНТРЯГИНА
13.4.1. ОСНОВНОЕ СООТНОШЕНИЕ
ПРИНЦИПА МАКСИМУМА
Принцип максимума Понтрягина представляет собой метод расчета
оптимального управления. Он был сформулирован независимо [1, 3,
31] и почти в то же время, что и метод динамического программирова-
ния. Впоследствии оказалось, что уравнения одного метода можно по-
лучить из другого и наоборот. Запишем основные соотношения прин-
ципа максимума на основе уравнений метода динамического програм-
мирования.
Рассмотрим основное соотношение (13.24)
0
min
( , )
( , )
0
u
T
u
V
f
x u
f x u
x
.
Поскольку минимум функции равен максимуму этой же функции с
противоположным знаком, то справедливо:
0
max
( , )
( , )
0
u
T
u
V
f
x u
f x u
x
.
(13.27)
Преобразуем уравнение (13.27), предварительно введя ряд обозна-
чений.
1. Введем расширенный вектор состояния
1
n
z
R
, дополнив его
компонентой x
0
:
0
0
0
1
1
( , )
T
n
n
f
x u d
x
x
z
x
x
x
.
(13.28)
13.4. Принцип максимума Понтрягина
443
2. Введем соответствующий расширенный вектор правых частей
1
n
R
:
0
1
( , )
( , )
( , )
( , )
n
f
x u
f x u
x u
f
x u
.
(13.29)
3. Вектор сопряженных координат
1
n
R
:
1
( )
1,
,
,
n
V
V
z
x
x
.
(13.30)
Определим скалярное произведение вектора сопряженных координат и
расширенного вектора правых частей, которое называется функцией
Понтрягина
(
гамильтониан):
( ) ( , )
H
z
x u
.
(13.31)
Если вместо вектора сопряженных координат и расширенного вектора
правых частей подставить их значения согласно (13.30) и (13.29) в вы-
ражение (13.31), то последнее можно представить следующим образом:
0
1
1
( , )
( , )
1,
, ...,
( , )
n
n
f
x u
f x u
V
V
H
x
x
f
x u
,
или окончательно
0
( , )
( , )
T
V
H
f x u
f x u
x
.
(13.32)
С учетом (13.32) уравнение (13.27) можно записать в виде
max
( , )
0
u
u
H z u
,
(13.33)
которое и представляет собой основное соотношение принципа мак-
симума.
Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ
444
При этом сопряженные координаты определяются системой диффе-
ренциальных уравнений
T
H
z
.
(13.34)
Формулировка принципа максимума. Оптимальным является управ-
ление из области допустимых значений, которое обеспечивает макси-
мум выражения (13.33).
В случае, когда ресурс управления объекта не ограничен, для нахо-
ждения максимума гамильтониана можно воспользоваться необходи-
мым условием экстремума
0
T
H
u
.
( 13.35)
При ограниченном ресурсе (например, u U ) вычисленное с по-
мощью (13.35) оптимальное управляющее воздействие может нахо-
диться вне области допустимых значений, поэтому для отыскания мак-
симума гамильтониана необходимо использовать максимальное значе-
ние управления U .
13.4.2. ПРОЦЕДУРА ОПРЕДЕЛЕНИЯ
ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
На основе рассмотренных соотношений принципа максимума
Понтрягина можно предложить следующую процедуру расчета регу-
лятора.
1. Описание объекта следует привести к стандартному для теории
оптимального управления виду (13.1):
( , ),
x
f x u
u
U
.
Записывается критерий оптимальности (13.4) в форме
0
0
0
min
( , )
u
T
u
J
f
x u dt .
13.4. Принцип максимума Понтрягина
445
2. Формируется расширенный вектор состояния z и правых час-
тей ( , );
z u в общем виде записывается вектор сопряженных координат
0
1
,
,...,
.
n
3. В форме скалярного произведения векторов ( ) и ( ) записы-
вается выражение
( ) ( , )
H
z
z u
.
4. Из условия максимума определяется оптимальное управление как
функция сопряженных координат
0
0
max
:
( )
u
u
H
u
u
.
5. Формируется система дифференциальных уравнений для нахож-
дения сопряженных координат
T
H
z
.
6. Вычисляется оптимальное управление в виде функции времени
(программное управление)
0
0
( )
u
u t .
7. По возможности осуществляется переход к оптимальному управ-
лению в виде обратной связи
0
0
( )
u
u
x ,
т. е. решается задача синтеза регулятора.
Рассмотрим вычисление оптимального управления с помощью опи-
санной процедуры на примере.