Файл: Лавриненко О.Ю. - Алгоритми та програмні засоби фільтрації і стиснення сигналів в ТКС.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 23.04.2019

Просмотров: 2732

Скачиваний: 3

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
background image

 

61 

більш  гладку  апроксимацію  сигналу,  і  навпаки  -  «короткі»  вейвлети  краще 

відстежують піки апроксимується. 

Для  дзвінких  звуків  переважно  використовувати  вейвлети  Добеши  низьких 

порядків,  за  винятком  першого  порядку  (вейвлет  Хаара),  так  як  він  має  різкі 

перепади,  що  погано  позначається  на  представленні  низькочастотних  складових. 

Для  глухих  звуків  переважно  використовувати  Койфлети  або  вейвлети  Добеши 

високих порядків. 

Для визначення типу поточного відрізка мовного сигналу можна скористатися 

технікою  використовуваної  в  вокодера  -  визначення  вокалізованності  мови  з 

наступним адаптивним вибором вейвлет-функції. 

Дана  техніка  грунтується  на  визначенні  одного  і  найважливіших  параметрів 

мовного сигналу - періоду основного тону. 

Глибина розкладання впливає на масштаб відсіяних деталей. Іншими словами, 

при збільшенні глибини розкладання модель віднімає шум все більшого рівня,  поки 

не настане укрупнення масштабу деталей і перетворення почне спотворювати форму 

вихідного  сигналу.  Мірою  оптимальності  зазвичай  служить  концентрація  числа 

вейвлет-коефіцієнтів для реконструкції сигналу з заданою точністю (похибкою). 

Будь-яке  усереднення  коефіцієнтів  збільшує  ентропію.  При  аналізі  дерева 

обчислюється  ентропія  вузлів  дерева  розкладання  і  його  розділених  частин.  Якщо 

при  поділі  вузла  ентропія  не  зменшується,  то  подальше  розгалуження  (збільшення 

глибини розкладання) з цього вузла не має сенсу. 

Для  фільтрації  коефіцієнтів  деталізації  краще  використовувати  метод  «м'якої» 

порогової  фільтрації.  При  цьому  коефіцієнти,  абсолютне  значення  яких  менше 

порогового, обнуляються, а всі інші залишаються без зміни.  

Порог для даного методу наведена на рис. 3.2. 


background image

 

62 

 

Рис. 3.2. «М’яка» порогова фільтрація 

На  малюнку    x  -  значення коефіцієнта  до  фільтрації,  y  -  значення  коефіцієнта 

після фільтрації, θ - поріг. 

Для  вибору  величини  θ  використовується  критерій  балансу  між  кількістю 

нульових коефіцієнтів і залишкової енергією сигналу. Суть цього методу полягає в 

тому, що коефіцієнти деталізації з абсолютним значенням близьким до нуля містять 

лише невелику частину енергії сигналу. Обнулення цих коефіцієнтів призводить до 

незначних втрат  енергії. Оптимальним є таке значення порога, при якому відсоток 

обнуляти  коефіцієнтів  деталізації  буде  приблизно  дорівнює  відсотку  залишкової 

енергії  сигналу  після  порогової  фільтрації  (рис.  3.3).  Підвищення  порогу 

підвищуватиме  ступінь  стиснення,  але,  разом  з  тим,  зростатимуть  втрати  якості. 

Зниження  порогу  дозволяє  зменшити  втрати  при  стисненні,  але  знижує  його 

ефективність. 

Якщо сигнал не містить великомасштабних (низькочастотних) складових або їх 

енергія  невисока,  то  коефіцієнти  апроксимації  в  розкладанні  такого  сигналу  також 

будуть близькі до нуля. Отже, порогову фільтрацію при стисненні краще проводити 

не для кожного рівня розкладання, а для всього розкладання в цілому. Такий метод 

фільтрації  дозволяє  більш  точно  відновити  різкі  зміни  сигналу  і  зберегти  більшу 

кількість енергії в реконструкції сигналу. 

Цифровий  мовний  сигнал  представляється  у  вигляді  8  або  16  бітних  цілих 

чисел.  Для  передачі  даних  також  використовується  даний  формат.  Оскільки 

коефіцієнти  деталізації  та  апроксимації  є  речовими  числами,  то  перед  тим  як 

виконати  стиснення  сигналу  по  одному  з  вище  наведених  алгоритмів,  необхідно 

перетворити коефіцієнти в цілий числовий діапазон відповідає обраному формату. В 


background image

 

63 

іншому  випадку  потік  стислих  вейвлет-коефіцієнтів  буде  більше  потоку  мовного 

сигналу. 

 

Рис. 3.3. Граничне значення для голосних і шиплячих звуків мови 

Дану операцію можна виконати за допомогою рівномірного або нерівномірного 

квантувателя.  При  цьому  виникне  помилка  квантування,  яка  вносить  додаткові 

спотворення в переданий мовний сигнал. 

Вейвлет-перетворення являє собою лише метод первинної обробки сигналу для 

підвищення  ефективності  його  стиснення.  Безпосередньо  стиск  виконується  після 

цієї предобработки класичними методами. При цьому стиск виконується, зрозуміло, 

для  коефіцієнтів  вейвлет-перетворення  сигналу,  а  його  реконструкція  за  цими 

коефіцієнтам виробляється на етапі відновлення (декомпресії). 

В  даний  час  існують  ефективні  алгоритми  стиснення,  такі  як  адаптивне 

стиснення  Хаффмана  і  арифметичне  стиснення.  Модель  адаптивного  кодера 

представлена на рис. 3.4. 


background image

 

64 

 

Рис. 3.4. Модель адаптивного статистичного кодера 

Модель  декодера  працює  по  зворотній  схемі.  На  вхід  кодера  подається 

послідовність  байт  представляє  собою  квантовані  коефіцієнти  вейвлет-

перетворення.  На  виході  кодером  формується  бітова  послідовність  стислих  даних, 

яка передається через канал зв'язку. 

Критерій  вибору  алгоритму  залежить  від  ступеня  стиснення  даних  і 

продуктивності 

алгоритму. 

Результати 

експериментального 

дослідженнязастосування  даних  алгоритмів  в  розробленої  моделі  показали,  що 

алгоритм  арифметичного  стискання  вимагає  набагато  більше  обчислювальних 

витрат. При цьому ступінь стиснення, яка безпосередньо залежить від стискуваних 

даних  не  завжди  більше,  ніж  при  використанні  алгоритму  Хаффмана.  Тому  в 

кінцевої реалізації ефективніше застосовувати кодер Хаффмана. 

 

3.2. Обгрунтування вибору ВП в якості первинного методу обробки мовних 

сигналів в алгоритмі стиснення 

Недоліки ПФ демонструється на рис. 3.5а, б, і рис. 3.6а, б. 

 

          а 


background image

 

65 

    

 

            б 

Рис. 3.5. ПФ сигнала 

)

(

1

t

U

 

а – сигнал 

)

(

1

t

U

;  б – спектр ПФ сигнала 

)

(

1

t

U

 

            а 

    

 

             б 

Рис. 3.6. ПФ сигнала 

)

(

2

t

U

 

а – сигнал 

)

(

2

t

U

;  б – спектр ПФ сигнала 

)

(

2

t

U