Файл: Лавриненко О.Ю. - Алгоритми та програмні засоби фільтрації і стиснення сигналів в ТКС.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 23.04.2019

Просмотров: 2715

Скачиваний: 3

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
background image

 

11 

 

обґрунтування  необхідності  стиснення  даних  при  передачі  мовної 

інформації; 

 

порівняльний  аналіз  ефективності  стиснення  мовних  сигналів  при 

використанні перетворення Фур’є  і вейвлет-перетворення; 

 

аналіз  і  розробка  алгоритмів  підвищення  якості  стиснення  мовних 

сигналів.  

Об’єкт  дослідження  –  мовний  сигнал,  який  використовується  для  передачі  по 

канал цифрового зв’язку. 

Предмет  дослідження  -    засоби  підвищення  якості  стиснення  мовного  сигналу 

при передачі по каналу цифрового зв'язку. 

Новизна результатів полягає в наступному: 

 

розроблено  алгоритм  стиснення  мовного  сигналу  з  використанням 

вейвлет-перетворення; 

 

запропоновано  використовувати  вейвлет-перетворення  для  очищення 

сигналів від шуму.  

Практичне  значення  одержаних  результатів  у  тому,  що  розроблений  алгоритм 

дозволяє  зменшити  об’єм  мовного  сигналу  та  завдяки  цьому  збільшити  пропускну 

спроможність каналу зв’язку. 

На  захист  виноситься  підвищення  пропускної  здатності  каналів  зв’язку  при 

передачі  мовних  сигналів  за  допомогою  стиснення  даних,  ефективність 

використання ВП. 

 


background image

 

12 

РОЗДІЛ 1 

ОГЛЯД МЕТОДІВ СТИСНЕННЯ МОВНОГО СИГНАЛУ 

 

1.1. Надмірність мовного сигналу 

Джерелом акустичної мовної хвилі є артикуляційний апарат людини, який при 

проходженні через нього повітря утворює звукові коливання. Якщо сказати інакше, 

то  утворюються  звуки  людської  мови.  Для  полегшення  розуміння  подальшого 

матеріалу  приведемо  декілька  визначень  частотних  параметрів,  що  властиві  лише 

для мовного сигналу:  

Голосовий тракт – гортань і ротова порожнина.  

В    акустиці    голосовий    тракт    розглядається    як    система    резонаторів, 

характеристики  яких повільно  змінюються  в  часі.  Частоти  і  області  резонансів  

називаються  відповідно   формантними частотами і областями, якщо ж скорочено, 

то формантами.  

Піки  в  частотній  області,  що  виникають  через  квазіперіодичні  коливання  

голосових зв’язок, називають періодом основного тону.  

Звуки,    при    формуванні    яких    голосові    зв’язки    роблять    коливальні    рухи,  

називають  вокалізованими.  Вони  мають  в  частотній  області   чітко  виражений  

період    основного    тону  (‘а’,’o’,’e’...).  Усі  решта  звуків  можна  віднести  до 

невокалізованих. Точніше до останніх належать фрикативні звуки, що виникають  у  

разі  утворення  турбулентного  широкосмугового  шуму (‘с’,’ш’...),  і  вибухові,  які 

формуються   утворенням  в  тракті  перепони,  на  шляху   повітря,  з  подальшим  

вивільненням  стиснутого  в  області  за  перепоною  повітря  (‘ч’,’п’,’к’...).  Такими  

параметрами,    як    період    основного    тону,    форманти,    вокалізованість    і 

невокалізованість    можна    лише    поверхнево    охарактеризувати    тип    сигналу,  

оскільки артикуляційний  апарат  є  нелінійною  параметричною  системою, яка  не  

піддається  точному математичному опису. 

Як  правило,  мовний  сигнал  є  нестаціонарним  випадковим  процесом.  Тому 

оцінка його таких імовірнісних характеристик, як функція імовірності, спектральна 

густина, кореляційна функція і інші, не  можлива  лише  на  основі  усереднення  в  


background image

 

13 

часі    однієї    реалізації.    Таке    усереднення    можна    виконати  лише    на    коротких  

інтервалах    часу,    де    характеристики    можна    вважати    постійними.    Однак    при 

проектуванні  систем  передачі,  в  яких  властивість  нестаціонарності  не 

використовується,  можна  вважати  сигнал  стаціонарним  та  ергодичним  і  тоді 

операція усереднення за великий інтервал часу набуває змісту оцінки характеристик 

близького  до  мовного  сигналу  стаціонарного  випадкового  процесу.  У  результаті 

одержуються усереднені за часом статистичні характеристики мовних коливань.  

Аналіз  цифрових  мовних  сигналів  показує,  що  при  переході  від  одного 

дискрета  до  іншого  проявляється  значна  надмірність.  Насправді  коефіцієнт 

кореляції  (міра  передбачуваності)  між  сусідніми  дискретами,  наступними  з 

частотою  8  кГц,  становить  у  загальному  випадку  0.85  або  більше.  На  додаток  до 

кореляції,  що  існує  між  сусідніми  дискретами  мовного  сигналу,  для  зменшення 

швидкості передачі кодованого сигналу можна використовувати і кілька інших видів 

надмірності. Вони перераховані в табл.1.1. 

Таблиця 1.1 

Види надмірності мовного сигналу. 

У часовій області 

1. Нерівномірний амплітудний розподіл 

2. Кореляція між дискретами 

3. Кореляція, пов'язана з періодичністю в сигналі 

4. Кореляція між періодами основного тону 

5. Надмірність, пов'язана з не активністю мови (паузи) 

У частотній області 

6. Нерівномірний усереднений спектр 

7. Короткочасний спектр звуку 

 

1)  Нерівномірний  розподіл  амплітуд  передбачає  використання  деяких  видів 

адаптивної  регулювання  посилення.  Це  обумовлено  тим,  що  дискрети  з  меншими 

значеннями зустрічаються частіше, ніж дискрети з великими значеннями.  


background image

 

14 

2)  Кореляція  між  дискретами  мови  -  кодується  тільки  різниця  між  сусідніми 

дискретами.  Результати  вимірювань  різниць  накопичуються  потім  у  декодері  для 

відновлення сигналу.  

3) Кореляція, пов'язана з періодичністю в сигналі пояснюється тим, що в будь-

який  конкретний  момент  часу  певні  звуки  можуть  бути  побудовані  тільки  з 

коливань  декількох  основних  частот.  Тому  спостерігається  сильна  кореляція  між 

великим числом дискретів, що відносяться до декількох періодів коливань. 

4)  Кореляція  між  періодами  основного  тону  -  наслідок  довготривалої 

періодичності,  що  відноситься  до  основного  тону.  Кодуються  дзвінкі  відрізки 

мовлення  на  одному  періоді  основного  тону  і  результати  цього  кодування 

використовуються як шаблон для наступних періодів основного тону в цьому звуці. 

5)  Надмірність,  пов'язана  з  не  активністю  мови  (паузи)  визначається  досить 

великою тривалістю пауз в розмові (близько 60%). Кодування полягає у визначенні 

мовної активності і звільнення каналу по завершенню кожного відрізка мови.  

При  розгляді  питань  застосування  цифрової  обробки  мовних  сигналів  до 

завдань  зв'язку  слід  виділити  два  основних  способи  кодування  мовних  сигналів: 

форми і параметрів (вокодерні методи).  

Кодування форми мовного сигналу заснована на збереженні форми коливання в 

процесі дискретизації і квантування.  

Параметричне представлення базується на описі мовного сигналу, як вихідного 

відгуку моделі мово-створення.  

На  першому  етапі  побудови  параметричного  представлення,  мовленнєве 

коливання  піддається  дискретизації  і  квантуванню,  а  потім  обробляється  для 

отримання моделі. Параметри моделі зазвичай поділяються на параметри збудження 

і  параметри  голосового  тракту.  Згідно  з  рекомендаціями  МККТТ  і  вимогам  ЕАСС 

(ВСС)  смуга  частот  утвореного  мовного  сигналу  обмежується  інтервалом  частот 

0,3...3,4  кГц,  а  частота  дискретизації  при  ІКМ  відповідно  до  теореми  відліків 

приймається рівною f

Д

=8 кГц.  

Шкала  рівнів  квантування  розраховується  таким  чином,  щоб  перекрити  весь 

діапазон  зміни  миттєвих  значень  вихідного  сигналу.  Ця  шкала  може  бути 


background image

 

15 

рівномірною або нерівномірною, фіксованою або адаптивною, змінною залежно від 

параметрів РС. 

 

1.2. Імпульсно-кодова модуляція 

Надмірність  при  звичайному,  ІКМ  -  кодуванні  вказує  на  можливість  значної 

економії  смуги  передачі.  Цей  вид  модуляції  заснований  на  дискретизації, 

квантуванні  відліків  і  кодуванні  номера  рівня  квантування  (рис.1.1).  Аналоговий 

сигнал  після  фільтрації  перетвориться  в  послідовність  вузьких  імпульсів, 

модульованих  по  амплітуді.  Отриманий  АІМ  -  сигнал  квантується  за  величиною  з 

використанням  рівномірної,  нерівномірної  або  адаптивно-змінною  шкалою 

квантування.  Конкретне  квантування  значення  мовного  сигналу  перетвориться  в 

кодове  слово,  яке  характеризується  числом  розрядів  і  алфавітом  символів.  В 

основному  цифровому  каналі  використовується  ІКМ  з  А  або  μ  -  законом 

компандування.  Тут  восьми  розрядне  двійкове  кодове  слово  відображає:  знак 

(полярність)  відліку,  трьох  розрядного  номер  сегмента  характеристики 

компандування  і  чотирьох  розрядний  номер  рівня  квантування  в  даному  сегменті. 

Можуть бути передбачені додаткові заходи для підвищення завадостійкості кодових 

слів по відношенню до цифрових помилок в тракті передачі.  

 

 

Рис.1.1. Структурна схема кодека ДІКМ.