Файл: Управление двухзвенным манипулятором с использованием нечеткого управления скользящего.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 07.11.2023

Просмотров: 37

Скачиваний: 4

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

АВТОМАТИЗАЦИЯ И УПРАВЛЕНИЕ
ТЕХНОЛОГИЧЕСКИМИ ПРОЦЕССАМИ
И ПРОИЗВОДСТВАМИ
DOI: 10.18698/0236-3933-2015-6-30-45
УДК 621.865
УПРАВЛЕНИЕ ДВУХЗВЕННЫМ МАНИПУЛЯТОРОМ
С ИСПОЛЬЗОВАНИЕМ НЕЧЕТКОГО УПРАВЛЕНИЯ СКОЛЬЗЯЩЕГО
ТИПА
С.Х. Забихифар
1
, А.Х.Д. Маркази
2
, А.С. Ющенко
1 1
МГТУ им. Н.Э. Баумана, Москва, Российская Федерация e-mail: zabihifar.iust@yahoo.com; yusch@bmstu.ru
2
Иранский университет Науки и Технологий, Тегеран, Иран e-mail: markazi@iust.ac.ir
При решении ряда сложных манипуляционных задач целесообразно применение
нечеткой логики, воспроизводящей опыт человека–оператора. К таким зада-
чам можно отнести управление крупными манипуляторами космического ба-
зирования, а также наземными манипуляционными системами, применяемыми
в строительстве, при ликвидации последствий аварий и катастроф. Однако
для подобных манипуляционных систем управление усложняется за счет слож-
ной и нелинейной динамики конструкции, которая может быть не полностью
описана. Преимущество применения нечеткой логики для таких задач состо-
ит в том, что правила управления не зависят от математической модели
объекта. Однако по мере усложнения динамики объекта число таких правил
существенно возрастает. В связи с этим в последнее время получил развитие
новый подход, основанный на применении скользящего режима, который, в
свою очередь, формируется с помощью нечеткого контроллера. Представляет
интерес исследование такого подхода для управления манипулятором с су-
щественным динамическим взаимовлиянием звеньев. Рассмотрен адаптивный
метод управления с использованием скользящего режима, условия которого, в
свою очередь, являются нечеткими. Метод обеспечивает устойчивость систе-
мы к внешним возмущениям, причем для его реализации не требуется знания
динамической модели системы.
Ключевые слова
: адаптивное управление, нечеткое управление, скользящие ре- жимы, нелинейные системы.
TWO LINK MANIPULATOR CONTROL USING FUZZY SLIDING MODE
APPROACH
S.H. Zabikhifar
1
, A.H.D. Markazi
2
, A.S. Yuschenko
1 1
Bauman Moscow State Technical University, Moscow, Russian Federation e-mail: zabihifar.iust@yahoo.com; yusch@bmstu.ru
2
Iran University of Science and Technology e-mail: markazi@iust.ac.ir
In solving a number of complex manipulating problems, it is desirable to use the
fuzzy logic which reproduces the human-operator’s experience. Controlling large
space-based manipulators and ground handling systems used both in construction
30 ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2015. № 6


and post-accident cleaning-up can be considered such problems. However, the
control of these manipulation systems becomes complicated due to sophisticated
and nonlinear structure dynamics, which cannot be fully described.That the control
rules are independent from a mathematical model of an object is the advantage of
using the fuzzy logic for solving these problems. Nevertheless, as the complexity of
the object dynamics grows, the number of such rules increases significantly. In this
context, a new approach has recently been developed. It is based on the sliding mode
application, which in its turn is generated by a fuzzy controller. The study of this
approach seems important for controlling the manipulator with a significant dynamic
unit interaction. The paper describes an adaptive control method using a sliding mode
based on the fuzzy approach. The method enables the system to withstand external
disturbances. Its implementation does not require awareness of the system dynamic
model.
Keywords
: adaptive control, fuzzy control, sliding mode, nonlinear systems.
Большая часть методов управления нелинейными системами пред- полагает достаточно точное описание объекта управления. В послед- нее время разрабатываются методы, позволяющие управлять нели- нейными системами с неполным математическим описанием. Хорошо известный подход к управлению с помощью скользящих режимов является одним из методов, позволяющих управлять нелинейными системами с неопределенностью [1, 2]. Недостатком традиционных скользящих режимов является появление “дребезга” в цепи входного сигнала в тех случаях, когда область неопределенности недостаточно мала. Высокочастотная составляющая сигнала, возникающая за счет переключений в окрестности поверхности скольжения, может повре- дить систему управления двигателями и даже привести к неустойчи- вости всей системы.
Управление с использованием методов нечеткой логики является альтернативным подходом, также позволяющим обойтись без точного знания математической модели управляемого объекта и справляться с внешними возмущениями [3, 4]. Однако методы нечеткого управления пока не позволяют на систематической основе формировать продук- ционные правила, обеспечивающие устойчивость замкнутой системы управления.
Для того чтобы сочетать преимущества каждого из перечислен- ных методов, т.е. скользящих режимов и нечеткой логики, разрабаты- ваются новые методы, комбинирующие тем или иным способом эти подходы [5, 6]. Их основная тенденция — справиться с неопределенно- стью математической модели и, по возможности, устранить “дребезг”
переключений. Один из таких гибридных методов управления полу- чил название “Адаптивное нечеткое скользящее управление” (Adaptive
Fuzzy Sliding-mode Control (AFSMC). Этот метод показывает хорошие результаты в применении к системам с высоким уровнем неопреде- ленности [7, 8]. Метод предусматривает систематическое формиро- вание нечетких продукционных правил и при выполнении определен-
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2015. № 6 31

ных условий обеспечивает асимптотическую устойчивость замкнутой системы управления [9].
Метод AFSMC успешно применялся для задач управления нели- нейными системами управления различных типов [10, 11]. Предста- вляется возможным и его применение в робототехнике для задачи управления манипулятором в условиях, когда математическое описа- ние динамики манипулятора известно неполностью.
Постановка задачи. Рассмотрим класс MIMO аффинных нелиней- ных систем, описываемых дифференциальными уравнениями следу- ющего вида:



y
(r1)
1
y
(r m
)
m


 =



f
1
(x)
f m
(x)


 +



g
11 0
0 0
... 0 0
0
g mm






u
1
u m


 .
(1)
Запишем эту систему дифференциальных уравнений более ком- пактно:
y
(r)
= F (x) + Gu,
(2)
где y = [y
1
, . . . , y m
]
T
и y r
= [y r
1 1
, . . . , y r
m m
]
T
— вектор выходных сиг- налов и их производных. Вектор состояний x = [y
1
, ˙y
1
, . . . , y
(r
1
−1)
1
,
. . . , y m
, ˙y m
, . . . , y
(r m
−1)
m
]
T
предполагается наблюдаемым. Здесь обозна- чено также u = [u
1
, . . . , u m
]
T
— вектор сигналов управления, F (x) =
= [f
1
(x), . . . , f m
(x)]
T
— вектор неизвестной функции х, G =
= diag [g
11
. . . g mm
] — неизвестная диагональная матрица с постоянны- ми элементами и r = [r
1
, . . . , r m
]
T
, причем степень рассматриваемой системы равна r
1
+ r
2
+ . . . + r m
= n.
При наличии дополнительной аддитивной неопределенности в правой части системы (2) еe описание может быть модифицировано следующим образом:
y
(r)
= F (x) + Gu + d,
(3)
где d = [d
1
, . . . , d m
]
T
— вектор сосредоточенных неопределенностей,
которые, как предполагается, ограничены, т.е. |d i
| < δ
i
Рассмотрим желаемую траекторию вектора y d
= [y d1
, . . . , y dm
]
T
Ошибку отработки этой траектории определим как
˜
y = y d
− y.
(4)
Теперь задача состоит в том, чтобы определить закон управления,
т.е. выбрать вектор u таким, чтобы ошибка ˜y сходилась к нулю асимп- тотически.
Метод управления. Для того чтобы исследовать принципиаль- ные возможности применения метода для управления манипулятором с компенсацией динамических и статических возмущений, рассмо- трим задачу управления двухзвенным манипулятором в плоскости.
32 ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2015. № 6

При этом звенья будем считать стержнями, а шарниры отнесем к иде- альным кинематическим парам 5-го класса. Предположим вначале,
что все элементы g ii
(i = 1, . . . , m) в уравнении (1) не нулевые. Это предположение будет в дальнейшем ослаблено.
Разработка скользящего режима управления включает в себя два этапа: первый шаг состоит в определении скользящей поверхности s(x), которая описывает “желаемую” — идеализированную динамику системы, которая является значительно более простой по сравнению с реальной. Второй шаг заключается в разработке системы управле- ния с переменной структурой, в которой сигнал управления u обес- печивает достижение поверхности скольжения за конечное время при любых начальных условиях. На скользящей поверхности выполняет- ся скользящий режим, соответствующий динамике идеализированной системы. Тем самым обеспечивается устойчивость траектории на по- верхности скольжения s(x).
Определим m поверхностей скольжения как
S = C ˜
Y = [s
1
, . . . , s m
]
T
,
(5)
где s i
= C
T
i
˜
y i
и C
i
= [c i1
, . . . , c i(r i
−1)
, 1]
T
— вектор коэффициентов Гур- вица, а ˜
Y
i
= [˜
y i
, . . . , ˜
y
(r i
−1)
i
]
T
— вектор ошибки слежения с элементами
˜
y i
= y di
− y i
˜
y
(r i
−1)
i
= y
(r i
−1)
di
− y
(r i
−1)
i i = 1, . . . , m.
(6)
Дифференцируя по времени уравнение поверхности скольжения,
получаем
˙s i
= c i
˙˜
Y
i
=
r i
P
j=1
λ
ij
˜
y j
i
=
=
r i
−1
P
j=1
λ
ij
˜
y j
i

+ ˜
y
(r i
)
i
=
=
r i
−1
P
j=1
λ
ij
˜
y j
i

+ y
(r i
)
di
− y
(r i
)
i
=
= E
λi
+ y
(r i
)
di
− y
(r i
)
i
=
= E
λi
+ y
(r i
)
di
− f i
(x)
− g ii u
i
− d i
,
(7)
где обозначено
E
λi
=
r i
−1
X
j=1
λ
ij
˜
y j
i

(8)
Закон управления в скользящем режиме определяется как [5]
u = u eq
+ u r
,
(9)
где “эквивалентный” закон управления u eq определяется из условия
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2015. № 6 33


˙s = 0, т.е.
˙s i
= E
λi
+ y
(r i
)
di
− f i
(x)
− g ii u
eq i
= 0
⇒ u eq i
=

1
g ii

E
λi
+ y
(r i
)
di
− f i
(x)

(10)
“Робастный закон управления” u rb используется для преодоления неопределенности системы, обеспечивая конечное время достижения поверхности скольжения:
u rb
= G
−1
ν.
(11)
Здесь
ν
i
= δ
i sgn(s i
)
⇒ ν = [Δsgn(S)]
T
,
(12)
sgn(S) = [sgn(s
1
), . . . , sgn(s m
)]
T
Отсюда следует с учетом (7)
˙s i
= E
λi
+ y
(r i
)
di
− f i
(x)
− g ii u
i
− d i
=
= E
λi
+ y
(r i
)
di
− f i
(x)
− g ii u
eq i
+ u rb i

− d i
=
= E
λi
+ y
(r i
)
di
− f i
(x)


E
λi
+ y
(r i
)
di
− f i
(x) + ν
i

− d i
=
=
−d i
− ν
i
=
−d i
− δ
i sgn(s i
).
(13)
Для исследования устойчивости выберем функцию Ляпунова как
L
i
=
1 2
s
2
i
,
(14)
е¨e производная по времени в силу системы (13) равна
˙L
i
= s i
˙s i
=
−s i
d i
− |s i
| δ
i
≤ |s i
| |d i
| − |s i
| δ
i
=
=
− |s i
| (δ
i
− |d i
|) ≤ 0.
(15)
Таким образом, управление в скользящем режиме (9) обеспечивает устойчивость системы (2) по Ляпунову.
Предлагаемый контроллер AFSMC. Целью сочетания нечеткого управления и скользящего режима является использование нечеткой логики для того, чтобы представить управление u как нелинейную функцию скользящей поверхности [11]. Контроллер, обеспечивающий нечеткий скользящий режим контроллера, — это нечеткий логический контроллер, входными сигналами которого служат параметры сколь- зящей поверхности или их производные. Выходными сигналами кон- троллера являются сигналы управления u. Если параметры системы
(1) точно известны, то управление можно определить как u

= u eq
. Но на практике трудно получить точную модель системы. Поэтому для то- го, чтобы аппроксимировать идеальный контроллер u

, применяются методы нечеткой логики.
Рассмотрим нечеткую систему Такаги – Сугено с одним входом s k
,
определяющим поверхность скольжения k-й подсистемы во введенной
34 ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2015. № 6
ранее системе, и одним выходом u f uz k
. Зададим n r
нечетких продукци- онных правил в следующем виде.
Правило r. Если s k
есть A
r k
, то u f uz k
= b r
k
, r = 1, . . . , n r
, где b
r k
— это нечеткий синглтон для выходной переменной r-го правила и
A
r k
— нечеткое множество, которое характеризуется гауссовой функ- цией принадлежности
μ
A
r k
(s k
) = exp
"


s k
− c r
k
σ
r k

2
#
(16)
Параметры c r
k и σ
r k
определяют центр и ширину функции принад- лежности соответственно. Используя нечеткий синглтон, продукцион- ный вывод и вычисление центрального среднего в качестве процедуры дефаззификации, получаем выходную переменную нечеткой системы в виде u
f uz k
=
n r
X
r=1
b r
k
μ
A
r k
(s k
)
n r
X
r=1
μ
A
r k
(s k
)
(17)
Определяя силу r-го правила как w
r k
=
μ
A
r k
(s k
)
n r
X
r=1
μ
A
r k
(s k
)
, r = 1, . . . , n r
,
(18)
выходную переменную нечеткой системы можно записать в виде u
f uz k
(s k
, b k
) = b
T
k w
k
,
(19)
где w k
= [w
1
k
, . . . , w n
r k
]
T
, b k
= [b
1
k
, . . . , b n
r k
]
T
В том случае, когда известна точная математическая модель систе- мы, вектор выходных координат нечеткого контроллера для системы с
m входами S = [s
1
, . . . , s m
]
T
и m выходами u f uz
1
, . . . , u f uz m
обозначается как u
f uz

=
h u
f uz

1
(s
1
, b

1
), . . . , u f uz

m
(s m
, b

m
)
i
T
(20)
и “идеальное” управление может быть определено как u

= u f uz

(S, B

) + Ξ = diag(B
∗T
W ) + Ξ,
(21)
где W = [w
1
, . . . , w m
]
T
, B
∗T
= [b

1
, . . . , b

m
]
T
, a Ξ = [ξ
1
, . . . , ξ
m
]
T
— это ошибка аппроксимации или неопределенность, которая по предполо- жению ограничена: |ξ
k
| < κ
k
На практике оптимальный вектор параметров b

k
, а также границы неопределенности K = [κ
1
, . . . , κ
m
]
T
могут быть неизвестны. Обозна-
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2015. № 6 35

чая оценку это неопределенной границы как ˆ
K, определяем погреш- ность оценки
˜
K(t) = K

_
K (t).
(22)
Выход нечеткой системы, аппроксимирующей идеальный контрол- лер, можно переписать следующим образом:
_
u f uz k
(s k
,
_
b k
) =
_
b
T
k w
k
, k = 1, 2, . . . , m,
(23)
где
_
b k
— это оценка b

k
. Таким образом, закон управления может быть представлен как u
k
=
_
u f uz k
(s k
,
_
b k
) + u rb k
(s k
), k = 1, 2, . . . , m.
(24)
Здесь составляющая u rb k
используется для того, чтобы компенсировать разницу между нечетким и идеальным контроллером. Подставляя (24)
в (1), получаем y
(r)
= F (x) + G
h
_
u f uz
+u rb i
(25)
Определяя ошибки аппроксимации как
˜
u f uz
= u


_
u f uz
,
˜
B = B


_
B
(26)
и учитывая (21), (23) и (26), получаем
˜
u f uz
= diag( ˜
B
T
W ) + Ξ.
(27)
Основное положение теории управления AFSM можно сформули- ровать следующим образом.
Теорема. Пусть в системе (1) с законом управления (24) нечеткий
контроллер настраивается по закону адаптации
˙
_
B =

˙˜
B = α
1
W diag(S).
(28)
Робастный контроллер формируется как
u rb
= diag(
_
K)sgn(G)sgn(S(t)),
(29)
оценка величины границы неопределенности адаптивно настраивает-
ся в соответствии с выражением
˙
_
K =

˙˜
K = α
2
sgn(G)
|S(t)| ,
(30)
где α
1
и α
2
— предварительно выбранные положительные параметры,
определяющие скорость адаптации. Тогда ошибка слежения асимп-
тотически стремится к нулю.
36 ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2015. № 6

Доказательство. Выберем функцию Ляпунова в виде
V =
m
P
k=1
V
k
;
V
k
(s k
, ˜b k
, ˜
κ
k
) =
1 2
s
2
k
+
1 2α
1
g kk
˜b
T
k
˜b k
+
1 2α
2
g kk

κ
k
)(˜
κ
k
).
(31)
Дифференцируя (31) по времени, с учетом (27), (28), (29) и (30), можно записать:
˙
V
k
(s k
, ˜b k
, ˜
κ
k
) =
= s k
˙s k
+
1
α
1
|g kk
| ˜b
T
k
˙˜b k
+
1
α
2
|g kk
| (˜κ
k
)( ˙˜
κ
k
) =
= s k
g kk h
˜b
T
k w
k
+ ξ
k
− u rb k
i
+
1
α
1
|g kk
| ˜b
T
k
˙˜b k
+
1
α
2
|g kk
| (˜κ
k
)( ˙˜
κ
k
) =
=
|g kk
| ˜b
T
k

s k
w k
sgn(g kk
) +
˙˜b k
α
1

+s k
g kk
ξ
k
− u rb k

+
1
α
2
|g kk
| (˜κ
k
)( ˙˜
κ
k
) =
= s k
g kk
ξ
k
− s k
g kk
_
κ
k sgn (g kk
) sgn (s k
)

1
α
2
|g kk
| (˜κ
k

2
|s k
| =
= s k
g kk
ξ
k
− |s k
| |g kk
|

_
κ
k

κ
k

= s k
g kk
ξ
k
− |s k
| |g kk
| (κ
k
) =
= s k
g kk
ξ
k
− |s k
| |g kk
| (κ
k
)
≤ (|s k
| |g kk
| ξ
k
− |s k
| |g kk
| (κ
k
)) =
=
− (|s k
| |g kk
| (κ
k
− |ξ
k
|)) ≤ 0.
(32)
Определим функцию
Γ(t) =
m
X
i=1
(
|s k
| |g kk
| (ψ
k
− |ξ
k
|)) ≤ − ˙V .
(33)
Интегрируя обе части этого уравнения по времени, получаем t
Z
0
Γ(τ )dτ
≤ V (S(0), ˜
B, ˜
Ψ)
− V (S(t), ˜
B, ˜
Ψ),
(34)
где величина V (S(0), ˜
B, ˜
Ψ) ограничена, а функция V (S(t), ˜
B, ˜
Ψ), по крайней мере, не возрастает, поэтому t
Z
0
Γ(τ )dτ
≤ ∞.
(35)
Поскольку функция ˙V неположительна и учитывая тот факт, что абсолютные значения функций в (33) равномерно непрерывны, можно сделать заключение (с учетом леммы Барбалата), что lim t
→∞
Γ(t) = 0.
(36)
Таким образом, при t → ∞ скользящая поверхность S(t) → 0 равно-
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2015. № 6 37