Файл: Востриков. Основы теории непрерывных и дискретных систем регулирования.pdf

Добавлен: 15.02.2019

Просмотров: 19918

Скачиваний: 135

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
background image

13.3. Метод  динамического  программирования 

441 

и дополним его уравнением в частных производных (13.26) 

0

2

0

T

V

u

x

Выразим из второго уравнения  V

 и подставим в первое, в резуль-

тате получим 

2

2

2

2

0

0

0

5

4

2

0

x

u

xu

u

 

или после приведения подобных 

2

2

0

0

4

5

0

u

xu

x

Решение  квадратного  уравнения  относительно  управления  дает  два 

значения: 

0

0

1

2

5 ,

.

u

x

u

 

Поскольку  для  одной  системы  двух  оптимальных  законов  управления 

быть  не  может,  одно  из  найденных  значений  не  является  оптимальным. 

Для определения оптимального  управления  проверим  устойчивость замк-

нутой системы. 

В  уравнение  объекта  подставим  значение 

0 1

u

  и  получим  уравнение 

замкнутой системы 

3

x

x

Как видим, система неустойчива, а значит, первое управляющее воздейст-

вие не является оптимальным. 

В  уравнение  объекта  подставим  значение 

0 2

u

,  при  этом  уравнение 

замкнутой системы примет вид 

3

x

x

 

и она будет устойчивой. 

Таким образом, оптимальный закон управления имеет вид 

0

u

Kx , где 

1

K

 

 
 
 
 


background image

Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ 

442 

13.4. ПРИНЦИП МАКСИМУМА  

ПОНТРЯГИНА 

 

13.4.1. ОСНОВНОЕ СООТНОШЕНИЕ  

ПРИНЦИПА МАКСИМУМА 

 

Принцип максимума Понтрягина представляет собой метод расчета 

оптимального  управления.  Он  был  сформулирован  независимо  [1,  3, 
31] и почти в то же время, что и метод динамического программирова-

ния. Впоследствии оказалось, что уравнения одного метода можно по-

лучить из другого и наоборот. Запишем основные соотношения прин-

ципа максимума на основе уравнений метода динамического програм-

мирования. 

Рассмотрим основное соотношение (13.24) 

 

0

min

( , )

( , )

0

u

T

u

V

f

x u

f x u

x

Поскольку  минимум  функции  равен  максимуму  этой  же  функции  с 

противоположным знаком, то справедливо: 

 

0

max

( , )

( , )

0

u

T

u

V

f

x u

f x u

x

(13.27) 

Преобразуем  уравнение  (13.27),  предварительно  введя  ряд  обозна-

чений. 

1.  Введем  расширенный  вектор  состояния 

1

n

z

R

,  дополнив  его 

компонентой x

0

: 

 

0

0

0

1

1

( , )

T

n

n

f

x u d

x

x

z

x

x

x

(13.28) 


background image

13.4. Принцип максимума Понтрягина 

443 

2.  Введем  соответствующий  расширенный  вектор  правых  частей 

1

n

R

 

0

1

( , )

( , )

( , )

( , )

n

f

x u

f x u

x u

f

x u

(13.29) 

3. Вектор сопряженных координат 

1

n

R

 

1

( )

1,

,

,

n

V

V

z

x

x

(13.30) 

Определим скалярное произведение вектора сопряженных координат и 

расширенного  вектора  правых  частей,  которое  называется  функцией 
Понтрягина

 (

гамильтониан): 

 

( ) ( , )

H

z

x u

(13.31) 

Если  вместо  вектора  сопряженных  координат  и  расширенного  вектора 

правых частей подставить их значения согласно (13.30) и (13.29) в вы-

ражение (13.31), то последнее можно представить следующим образом: 

 

0

1

1

( , )

( , )

1,

, ...,

( , )

n

n

f

x u

f x u

V

V

H

x

x

f

x u

или окончательно 

 

0

( , )

( , )

T

V

H

f x u

f x u

x

(13.32) 

С учетом (13.32) уравнение (13.27) можно записать в виде 

 

max

( , )

0

u

u

H z u

(13.33) 

которое  и  представляет  собой  основное  соотношение  принципа  мак-

симума. 


background image

Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ 

444 

При этом сопряженные координаты определяются системой диффе-

ренциальных уравнений 

 

T

H

z

(13.34) 

Формулировка принципа максимума. Оптимальным является управ-

ление из области допустимых значений, которое обеспечивает макси-

мум выражения (13.33). 

В случае, когда ресурс управления объекта не ограничен, для нахо-

ждения  максимума  гамильтониана  можно  воспользоваться  необходи-

мым условием экстремума 

 

0

T

H

u

( 13.35) 

При  ограниченном  ресурсе  (например,  u U )  вычисленное  с  по-

мощью  (13.35)  оптимальное  управляющее  воздействие  может  нахо-

диться вне области допустимых значений, поэтому для отыскания мак-

симума гамильтониана необходимо использовать максимальное значе-
ние управления 

13.4.2. ПРОЦЕДУРА ОПРЕДЕЛЕНИЯ  

ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 

На  основе  рассмотренных  соотношений  принципа  максимума 

Понтрягина можно предложить следующую процедуру расчета регу-

лятора. 

1.  Описание  объекта  следует  привести  к  стандартному  для  теории 

оптимального управления виду (13.1): 

 

( , ),

x

f x u

u

U

Записывается критерий оптимальности (13.4) в форме 

 

0

0

0

min

( , )

u

T

u

J

f

x u dt 


background image

13.4. Принцип максимума Понтрягина 

445 

2.  Формируется  расширенный  вектор  состояния    и  правых  час-

тей ( , );

z u  в общем виде записывается вектор сопряженных координат 

 

0

1

,

,...,

.

n

 

3. В форме скалярного произведения векторов  ( )  и  ( )  записы-

вается выражение 

 

( ) ( , )

H

z

z u

4. Из условия максимума определяется оптимальное управление как 

функция сопряженных координат 

 

0

0

max

:

( )

u

u

H

u

u

5. Формируется система дифференциальных уравнений для нахож-

дения сопряженных координат 

 

T

H

z

6.  Вычисляется  оптимальное  управление  в  виде  функции  времени 

(программное управление) 

 

0

0

( )

u

u t 

7. По возможности осуществляется переход к оптимальному управ-

лению в виде обратной связи 

 

0

0

( )

u

u

т. е. решается задача синтеза регулятора. 

Рассмотрим вычисление оптимального управления с помощью опи-

санной процедуры на примере.