ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 09.11.2023
Просмотров: 18
Скачиваний: 2
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Известия ТРТУ Тематический выпуск «Интеллектуальные САПР»
222
- диагностика психофизического потенциала пациента;
- профессиональный отбор;
- семейное консультирование;
- регистрация измененных состояний сознания.
Исследованияразличныхжидкостей, веществиматериалов:
- оценка структурных изменений в жидкофазных объектах;
- исследование пищевых продуктов;
- энергетические свойства растений, камней и минералов.
В настоящее время разработан ряд модификаций программно-аппаратных комплексов для исследования параметров газоразрядного свечения объектов раз- личной природы. На сегодняшний день методом ГРВ только в нескольких Санкт-
Петербургских клиниках обследовано более 2000 пациентов. Работы ведутся на базе СПб гос. Института Точной Механики и Оптики, Института Биохимии АН
РФ, СПб гос. Медицинского Университета им. И.П. Павлова, СПб Военно-
Медицинской Академии, Онкологического Центра Грузии, СПб НИИ Спорта, СПб
Академии Спорта, Скандинавского международного Университета.
УДК 621.3.06
Г.Н. Метан
ПРИМЕНЕНИЕНЕЙРО-НЕЧЕТКОЙТЕХНОЛОГИИ ANFIS ВЗАДАЧАХ
ФИЛЬТРАЦИИЗВУКОВЫХСИГНАЛОВ
∗
Введение. Эволюция средств хранения аудиоинформации от аналоговых
(
пластинка, магнитная лента) к цифровым (компакт-диск и др.), а также эволюция студийных аппаратных, а позже программных средств поставили вопрос о цифро- вой реставрации звука – восстановлении старых записей и переиздании их на со- временных носителях. Основная работа реставратора – подавление шипения и щелчков и (по возможности) восстановление исходного звука. В данной работе под фильтрацией подразумевается подавление шумов, т.е. задача реставрации ре- шается только в первой ее части.
Сегодня широко распространены средства реставрации на базе метода спек- трального анализа (основной алгоритм – быстрое дискретное преобразование Фу- рье). В данной работе предложена и протестирована более перспективная техноло- гия реставрации (цифровой адаптивный фильтр), которая предполагает обработку конкретного поступающего сигнала в два этапа: а) распознавание сигнала (с помощью аппарата нейросетей); б) реакция на сигнал по нечетким правилам, заложенным разработчиком.
Дальнейшая эволюция средств реставрации должна привести, на наш взгляд, к появлению в будущем активных цифровых средств (программных агентов). Это будут средства, манипулирующие хранилищами звука и библиотеками шумов с использованием определенной стратегии и опирающиеся на гибридные интеллек- туальные технологии [Тарасов, 2001]. Такие устройства уже нельзя будет отнести собственно к фильтрам, скорее их можно назвать автоматизированными системами
∗
Работа выполнена при финансовой поддержке РФФИ по совместному гранту
РФФИ-БРФФИ, проект № 02-01-81037
Раздел «Вычислительные комплексы нового поколения и нейрокомпьютеры»
223
нелинейного звукового монтажа, способными при необходимости работать в авто- номном режиме (без участия человека).
1.
Обоснованиенеобходимостиразработкиновыхсредствшумоподавле-
ния. Теоретической основой фильтров, реализованных программным путем в со- ставе звуковых редакторов, служит спектральный анализ. Этот подход развивается уже более 50 лет и является классическим. Здесь алгоритмическую основу форми- руют быстрые преобразования Фурье (БПФ). Сегодня на основе этого метода стро- ятся программно-аппаратные комплексы для монтажных студий. Примерами слу- жат продукты фирм Steinberg (www.steinberg.de), Sonic Foundry
(www.sonicfoundry.com), difitec (www.difitec.de) и множество дополнительно под- ключаемых звуковых модулей третьих фирм.
В такой, ставшей уже классической постановке задачи, звуковой сигнал рас- сматривается с точки зрения электротехники, а его обработка проводится с помо- щью электрических схем (или их компьютерных моделей). Такие схемы в принци- пе не могут содержать знания об элементарных свойствах звука, в частности, вол- новой природе звука, тембре, гармониках и пр. Поэтому их эффективность в реше- нии задачи подавления шумов весьма ограничена. А ведь есть и более сложные задачи. К тому же такие средства принципиально не дают возможность осуществ- лять автоматизацию деятельности человека. Применение спектрального анализа требует аккуратной настройки множества параметров в зависимости от конкретной задачи и специфики анализируемых сигналов, а для правильной интерпретации результатов нужен некоторый практический опыт.
В работе предложен новый нейро-нечеткий подход к реставрации звуков, опирающийся на современные достижения искусственного интеллекта и направ- ленный на повышение эффективности фильтрации.
2.
Основынейро-нечеткогоподхода. Ключевым преимуществом нечеткой логики является ее способность описывать желаемое поведение системы простыми
«
если-то»-правилами [Заде, 1976]. При этом можно использовать все доступные инженерные ноу-хау, для непосредственного улучшения системы. Во многих при- ложениях это дает более простое решение за меньшее время. Однако, во многих случаях, знания, описывающие желаемое поведение системы, содержатся в набо- рах данных. Здесь разработчик получает «если-то»-правила из наборов данных вручную. Большие объемы данных требуют больших вычислений. В этом случае хорошо подходит методология нейронных сетей, которые обучаются на наборах данных.
Для объединения сильных сторон обоих подходов создаются гибридные ме- тодологии и соответствующие инструментальные системы. Одну из них – ANFIS
(Adaptive Network Based Fuzzy Inference System)[
Ярушкина, 2001] – мы взяли на вооружение. В новой постановке задачи речь идет о создании адаптивного фильт- ра, который сначала обучается распознавать звуковой образ шума, а затем, получая на вход смесь полезного сигнала и шума, распознает шум и вычитает его (здесь используются операции нечеткой арифметики [Дюбуа и Прад, 1990]).
Общая методика создания нейро-нечетких моделей включает следующие ша- ги:
1)
Получение наборов данных для обучения. В данных содержатся неявные знания, которые предстоит выявить с помощью нейронной сети.
2)
Создание системы нечеткой логики. Здесь производится подбор функций принадлежности, нечетких правил и метода дефаззификации.
Известия ТРТУ Тематический выпуск «Интеллектуальные САПР»
224 3)
Выбор метода обучения и настройка его параметров. Метод обучения оп- ределяет, как по рассогласованию между реальным и желаемым выходом системы должны изменяться правила и функции принадлежности.
4)
Собственно обучение.
5)
Оптимизация и проверка.
3.
Алгоритмобучения. Обучение нейронной сети производится методом об- ратного распространения ошибки. Это наиболее известный метод обучения много- слойной нейросети без обратных связей. Он является итеративным градиентным алгоритмом. Его суть – распространение сигналов ошибки от выходов нейронной сети к ее входам в направлении, обратном прямому распространению сигналов в обычном режиме работы [Короткий, 2000]. При обучении ставится задача миними- зации ошибки нейронной сети, которая определяется методом наименьших квадра- тов. Для сети с одним выходом (как в нашем случае) ошибка определяется соот- ношением:
(
)
∑
=
−
=
p
j
j
j
d
y
E
1 2
2 1
,
(1) где y i
– значение выхода нейросети для каждого компонента входного векто- ра (дискретных звуковых отсчетов в нашем случае), а d j
– желаемое значение вы- хода нейросети.
Полный алгоритм обучения нейронной сети с помощью процедуры обратного распространения строится так:
1)
Подать на входы сети один из возможных образов и в режиме обычного функционирования нейронной сети, когда сигналы распространяются от входов к выходам, рассчитать значения последних. Напомним, что выход нейросети рассчи- тывается по формуле
∑
=
−
⋅
=
M
i
n
ij
n
i
n
j
w
y
s
0
)
(
)
1
(
)
(
,
(2) где M – число нейронов в слое n-1 с учетом нейрона с постоянным выходным состоянием +1, задающего смещение; y
i
(n-1)=x ij
(n) – i- й вход нейрона j-го слоя n; y
j
(n) = f(s j
(n)), где f() – функция активации нейрона; y
q
(0)=I
q
, где I
q
– q- я компонента вектора входного образа;
2)
Рассчитать
δ
(N)
для выходного слоя (слоя N)
l
l
l
N
l
l
l
l
N
l
ds
dy
d
y
ds
dy
y
E
⋅
−
=
⋅
=
)
(
)
(
)
(
∂
∂
δ
. (3)
3)
Рассчитать изменения весов ∆w(N) слоя N.
)
1
(
)
(
)
(
−
⋅
⋅
−
=
∆
n
i
n
j
n
ij
y
w
δ
η
,
(4) где
η
– коэффициент скорости обучения, 0<
η
<1.
4)
Рассчитать по формулам (3) и (4) соответственно
δ
(n)
и
∆
w
(n)
для всех ос- тальных слоев, n = N-1,...,1.
5)
Скорректировать все веса в нейронной сети
)
(
)
1
(
)
(
)
(
)
(
)
(
t
w
t
w
t
w
n
ij
n
ij
n
ij
∆
+
−
=
,
(5) где t – номер текущей итерации, n – номер слоя.
6)
Если ошибка сети больше заданной или число итераций обучения не дос- тигло заданного предела, то перейти к шагу 1. В противном случае – конец.
Раздел «Вычислительные комплексы нового поколения и нейрокомпьютеры»
225
4.
Описаниеэксперимента
В нашей работе адаптивный фильтр был постро- ен на основе нейронечеткой архитектуры ANFIS с использованием модуля Fuzzy
Logic Toolbox в среде MATLAB 6.1. Для построения графиков использованы ко- манды из Signal Processing Toolbox.
Порядок обработки звука таким фильтром следующий:
1)
Подготовить в виде файла исходный материал.
2)
Выбрать тип удаляемого шума: шипение или щелчки.
3)
Обучить фильтр на небольшом (0.1..0.5 сек) участке.
4)
Подать на вход фильтра весь исходный материал.
5)
Результат записать в новый файл (при необходимости контроля прослу- шать исходный и полученный результаты).
На первом этапе исследования для выбранного типа полезного сигнала и шу- ма выявлялось, как влияет изменение структуры и параметров простого адаптивно- го фильтра, построенного по гибридной методологии ANFIS, на качество фильтра- ции. Ключевые особенности: шкала времени – дискретная, шкала значений – не- прерывная. На втором этапе изменялся тип полезного сигнала при неизменных источнике шума и структуре ANFIS. Новый тип полезного сигнала – волновой па- кет. Ключевые особенности: сигнал ограничен во времени и по частоте. Ниже рас- смотрим подробнее формулировку задачи.
Первыйэтап. Пусть имеется тестовый синусоидальный сигнал x
0
на интер- вале времени от 0 до 6 секунд с частотой дискретизации Fs 1000 Гц. По теореме
Котельникова, максимально возможная частота – Fs/2, т.е. 500 Гц. Таким образом, пусть за 6 секунд частота полезного сигнала меняется от 0,5 кГц до 20 Гц. Такой сигнал называют частотно-модулируемым (ЧМ). Выбор сигнала связан с необхо- димостью определить эффективность фильтрации в широком диапазоне частот.
Пусть также имеется источник шума: псевдослучайные числа с нормальным распределением. Такой шум называется широкополосным или белым. Параметры генератора случайных чисел: среднее значение - 0, среднее квадратическое откло- нение - 1.
)
(
1
time
randn
n
=
. (6)
Шум накладывается на источник по сложному нелинейному закону:
(
)
2 1
1 0
1 1
1 1
sin
4 2
d
d
d
n
n
n
n
+
⋅
⋅
=
,
(7) где: n1
d0
– сигнал в момент времени i, n1
d1
– сигнал в момент времени i-1
(
исходный сигнал с задержкой).
Измеренный (входной) сигнал имеет вид:
2 0
n
x
m
+
=
. (8)
Этот сигнал поступает на вход адаптивного фильтра на основе ANFIS. Будем полагать, что полезный сигнал n2 "загрязнен" сигналом x
0
Иными словами, на входе ANFIS имеем сигнал n1, а на выходе - сигнал m. Обучение ставит целью научить ANFIS воспроизводить функцию n2(n1). Тогда предполагаемый вид сиг- нала x f
можно получить из соотношения (8):
f
f
n
n
m
x
)
1
(
2
−
=
,
(9) где
f
n
n
)
1
(
2
– предполагаемый вид сигнала ошибки – результат обучения нейро-нечеткой модели (предполагается, что порядок нелинейности сигнала шума известен и составляет 2).
Известия ТРТУ Тематический выпуск «Интеллектуальные САПР»
226
Создаем модель ANFIS с двумя входами для n1
d0
и n1
d1
соответственно
(
рис.1). На каждый вход назначаются по две колоколообразные функции принад- лежности.
Рис.1. Структурамодели ANFIS
Обучение производится по алгоритму обратного распространения ошибки.
Параметры этого алгоритма: количество эпох (итераций алгоритма) – 10; целевая функция – минимизация ошибки. Начальный размер шага обучения установим равным 0.2.
Теперь можно начинать фильтрацию сигнала. Результат выполнения фильт- рации обученным фильтром приведен на рис.2 и 3. Самый лучший способ опреде- лить эффективность алгоритма шумоподавления – это прослушать результаты. За отсутствием такой возможности приводятся результаты, полученные двумя спосо- бами, общепринятыми в сфере анализа электроакустических сигналов: временное представление и периодограмма. Можно предоставить файлы формата wav в ответ на запрос по электронной почте, а также исходники программ MATLAB.
При увеличении начального шага обучения до 0.5 улучшений не произошло.
Увеличение периодов обучения с 10 до 30 привело к некоторому улучшению каче- ства распознавания (но и к увеличению времени). Оставив число периодов обуче- ния 10, увеличим количество функций принадлежности на каждый вход с 2 до 4.
Полученный результат лучше предыдущего и гораздо лучше первоначального. Од- нако затраченное время возросло с 12 до 220 секунд.
0 1
2 3
4 5
6
-3
-2
-1 0
1 2
3
S ec onds
A
m pl it ude x
f m
Рис.2. Сигналы: входной (m) [0..3 c], выходной (x
f
) [3..6 c]
Раздел «Вычислительные комплексы нового поколения и нейрокомпьютеры»
227 0
50 100 150 200 250 300 350 400 450 500
-60
-55
-50
-45
-40
-35
-30
-25
-20
-15
Frequency (Hz)
Po w
e r Sp e
c tr a
l D
e n
s it y
(
d
B/H
z
)
x f
x
0
m
Рис.3. Спектральнаяплотностьмощностисигналов взависимостиотчастоты (периодограмма)
Второйэтап. Короткий синусоидальный импульс, модулированный функци- ей Гаусса (частота дискретизации – 44100 Гц, амплитуда – 1, основная частота – 50
Гц, полоса пропускания – 50%, усечение происходит ниже 40 дБ), загрязнен тем же типом шума. После обучения фильтра и фильтрации сигнала, амплитуда шума уменьшилась на ≈10 дБ, что видно на рис.4 и 5.
-0.05
-0.04
-0.03
-0.02
-0.01 0
0.01 0.02 0.03 0.04 0.05
-1
-0.5 0
0.5 1
1.5
Seconds
A
m pl it ude m x
f
Рис.4. Сигналы: входной (m) [-0.05..0 c], выходной (x
f
) [0..+0.05 c]