Файл: Лавриненко О.Ю. - Алгоритми та програмні засоби фільтрації і стиснення сигналів в ТКС.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 23.04.2019

Просмотров: 2719

Скачиваний: 3

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
background image

 

21 

квантуванням  d(k)  перетворюється  в  логарифмічне  представлення  по  основі  2  і 

масштабується  за  допомогою  y(k),  яка  обчислюється  як  коефіцієнт  масштабування 

блоку адаптації. Для того щоб закодувати рівень квантування, що представляє d(k) 

використовується  вбрання  кількість  розрядів  двійкових  чисел.  Один  з  яких 

призначений для знака, а інші - для кодування величини.  

Зворотній адаптивний квантуватель отримує квантовану версія d

q

(k) різнисного 

сигналу  масштабуванням,  з  використанням  y(k).  Квантуватель  коефіцієнта 

масштабування  адаптації  обчислює  y(k)  -  коефіцієнт  масштабування  для 

квантувателя  і  зворотного  квантувателя.  Основний  принцип  ,  використаний  у 

масштабування квантувателя - це дворежимна адаптація: 

1) швидко для сигналів (наприклад, мови), з великими коливаннями різниці між 

вихідними сигналами; 

2)  повільно  для  сигналів  (наприклад,  дані  в  смузі  частот  мовлення,  тон),  з 

невеликими коливаннями різниці між вихідними сигналами.  

Швидкість  адаптації  управляється  комбінацією  коефіцієнтів  масштабування, 

що  характеризують  швидкі  і  повільні  зміни  сигналу.  Адаптивний  передвісник 

повинен обчислити сигнальну оцінку s

e

(k) з квантованої сигнальної різниці d

q

(k). 

 

Рис. 1.5. Структурна схема кодера АДІКМ. 

 

 

 


background image

 

22 

1.7. Декодер АДІКМ  

На  рис.1.6 представлена  структурна  схема декодера АДІКМ. Функції багатьох 

блоків  декодера  і  кодера  подібні.  Функції  зворотного  адаптивного  квантувателя, 

квантователя  коефіцієнта  масштабування  адаптації,  адаптивного  передвісника  і 

відновника  сигналу  описані  раніше  при  розгляді  структури  кодера.  Спочатку 

виконується  перетворення  сигналу  з  A  -  або  μ-закону  s

p

(k)    в  стандартну  ІКМ  - 

сигнал s

tx

(k) і потім обробляється різнисний сигнал d

x

(k). 

Різнисний сигнал d

x

(k) - потім порівнюється з квантованим АДІКМ сигналом і 

виноситься рішення на інтервалі сигналу. Сигнал  s

d

(k) (s

d

(k) - вихідне кодове слово 

ІКМ декодера) - потім визначається таким чином: 

s

+

p

(k)  -  ІКМ  кодове  слово,  яке  представляє  найбільший  позитивний  вихідний 

рівень ІКМ (коли s

p

(k)  представляє найбільший позитивний вихідний рівень - s

-

p

(k): 

- обмежується, і приймається за s

p

(k)), 

s-

p

(k)  -  кодове  слово  ІКМ,  яке  представляє  найбільший  негативний  вихідний 

рівень ІКМ (коли s

p

(k) представляє найбільший негативний вихідний рівень - s

-

p

(k): - 

обмежується,  і  приймається  за  s

p

(k)).  Можна  бачити,  що  багато  функцій  кодера  і 

декодера подібні, тому їх розгляд проводиться не буде. 

 

Рис 1.6. Структурна схема декодера АДІКМ. 

 

 


background image

 

23 

Звуки  мови  можуть  бути  розділені  на  три  чітко  виражені  групи  за  типом 

збудження: 

1) вокалізованих  звуки  утворюються проштовхуванням повітря через голосову 

щілину,  при  якому  періодично  напружуються  і  розслабляються  голосові  зв'язки  і 

виникає  квазіперіодичного  послідовність  імпульсів  потоку  повітря,  збудлива 

голосової  тракт.  До  вокалізованих  звукам  відносяться  всі  голосні  і  частина 

приголосних звуків. 

2)  Невокалізовані  або  фрикатівні  звуки  генеруються  при  звуженні  голосового 

тракту  в  будь-якому  місці  (зазвичай  в  кінці  рота)  і  проштовхуванні  повітря  через 

звужений  місце  зі  швидкістю,  досить  високою  для  утворення  турбулентного 

повітряного  потоку.  Таким  чином,  формується  джерело  широкосмугового  шуму, 

збудливого голосової тракт. До невокалізованним звукам відносять більшу частину 

приголосних звуків. 

3)  Вибухові  звуки  характеризуються  повністю  закритим  голосовим  трактом 

(зазвичай на початку голосового тракту). Потім повітря раптово вивільняється. Таке 

явище  має  місце  при  проголошенні  звуку.  Різні  звуки  утворюються  шляхом  зміни 

форми  голосового  тракту.  Таким  чином,  спектральні  властивості  мовного  сигналу 

змінюються в часі відповідно до зміни форми голосового тракту. 

 

1.8. Кодування мовних сигналів на основі лінійного передбачення 

Лінійне передбачення є одним з найбільш ефективних методів аналізу мовного 

сигналу.  Цей  метод  стає  домінуючим  при  оцінці  основних  параметрів  мовного 

сигналу,  таких  як,  наприклад,  період  основного  тону,  форманти,  спектр,  функція 

площі  мовного  тракту,  а  також  при  скороченому  поданні  мови  з  метою  її 

низькошвидкістної  передачі  та  економного  зберігання.  Важливість  методу 

обумовлена  високою  точністю  одержуваних  оцінок  і  відносною  простотою 

обчислень.  Основний  принцип  методу  лінійного  передбачення  полягає  в  тому,  що 

поточний  відлік  мовного  сигналу  можна  апроксимувати  лінійною  комбінацією 

попередніх відліків. 


background image

 

24 

Коефіцієнти  передбачення  при  цьому  визначаються  однозначно  мінімізацією 

середнього  квадрата  різниці  між  відліками  мовного  сигналу  і  їх  передбаченими 

значеннями  (на  кінцевому  інтервалі).  Коефіцієнти  передбачення  -  це  вагові 

коефіцієнти,  використовувані  в  лінійній  комбінації.  Основні  положення  методу 

лінійного  передбачення  добре  узгоджуються  з  моделлю  мовостворення,  так  як 

мовний сигнал можна представити у  вигляді сигналу на виході лінійної системи зі 

змінними  в  часі  параметрами,  возбуждаемою  квазіперіодичного  імпульсами  (в 

межах  вокалізованих  сегментів)  або  випадковим  шумом  (на  невокалізованному 

сегменті).  Метод  лінійного  передбачення  дозволяє  точно  і  надійно  оцінити 

параметри цієї лінійної системи зі змінними коефіцієнтами.  

Методи обчислення коефіцієнтів передбачення:  

1) коваріаційний;  

2) автокореляційна;  

3) сходового фільтру;  

4) зворотної фільтрації;  

5) оцінки спектра;  

6) максимального правдоподібності;  

7) скалярної проізводної. 

Доцільність  використання  лінійного  передбачення  обумовлена  високою 

точністю опису мовного сигналу за допомогою моделі. 

 

1.9. Методи аналізу на основі лінійного передбачення  

Загальний  спектр,  обумовлений  випромінюванням,  мовним  трактом  і 

збудженням, описується за допомогою лінійної системи із змінними параметрами і 

придаточною функцією: 

)

1

(

)

(

)

(

)

(

1

P

k

k

k

z

a

G

z

U

z

S

z

H

                                                  

(1.1) 

Ця  система  збуджується  імпульсною  послідовністю  для  вокалізованих  звуків 

мови і шумом для невокалізованних.  


background image

 

25 

Таким чином, модель має наступні параметри:  

1) класифікатор вокалізованих і не вокалізованних звуків;  

2) період основного тону для вокалізованих сегментів;  

3) коефіцієнт підсилення G;  

4) коефіцієнти {а

k

} цифрового фільтра.  

Всі ці параметри повільно змінюються в часі.  

 

Рис.1.7. Структурна схема моделі аналізу мови. 

 

 

Рис.1.8. Структурна схема моделі мово-утворювача.