Файл: Лавриненко О.Ю. - Алгоритми та програмні засоби фільтрації і стиснення сигналів в ТКС.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 23.04.2019
Просмотров: 2719
Скачиваний: 3
21
квантуванням d(k) перетворюється в логарифмічне представлення по основі 2 і
масштабується за допомогою y(k), яка обчислюється як коефіцієнт масштабування
блоку адаптації. Для того щоб закодувати рівень квантування, що представляє d(k)
використовується вбрання кількість розрядів двійкових чисел. Один з яких
призначений для знака, а інші - для кодування величини.
Зворотній адаптивний квантуватель отримує квантовану версія d
q
(k) різнисного
сигналу масштабуванням, з використанням y(k). Квантуватель коефіцієнта
масштабування адаптації обчислює y(k) - коефіцієнт масштабування для
квантувателя і зворотного квантувателя. Основний принцип , використаний у
масштабування квантувателя - це дворежимна адаптація:
1) швидко для сигналів (наприклад, мови), з великими коливаннями різниці між
вихідними сигналами;
2) повільно для сигналів (наприклад, дані в смузі частот мовлення, тон), з
невеликими коливаннями різниці між вихідними сигналами.
Швидкість адаптації управляється комбінацією коефіцієнтів масштабування,
що характеризують швидкі і повільні зміни сигналу. Адаптивний передвісник
повинен обчислити сигнальну оцінку s
e
(k) з квантованої сигнальної різниці d
q
(k).
Рис. 1.5. Структурна схема кодера АДІКМ.
22
1.7. Декодер АДІКМ
На рис.1.6 представлена структурна схема декодера АДІКМ. Функції багатьох
блоків декодера і кодера подібні. Функції зворотного адаптивного квантувателя,
квантователя коефіцієнта масштабування адаптації, адаптивного передвісника і
відновника сигналу описані раніше при розгляді структури кодера. Спочатку
виконується перетворення сигналу з A - або μ-закону s
p
(k) в стандартну ІКМ -
сигнал s
tx
(k) і потім обробляється різнисний сигнал d
x
(k).
Різнисний сигнал d
x
(k) - потім порівнюється з квантованим АДІКМ сигналом і
виноситься рішення на інтервалі сигналу. Сигнал s
d
(k) (s
d
(k) - вихідне кодове слово
ІКМ декодера) - потім визначається таким чином:
s
+
p
(k) - ІКМ кодове слово, яке представляє найбільший позитивний вихідний
рівень ІКМ (коли s
p
(k) представляє найбільший позитивний вихідний рівень - s
-
p
(k):
- обмежується, і приймається за s
p
(k)),
s-
p
(k) - кодове слово ІКМ, яке представляє найбільший негативний вихідний
рівень ІКМ (коли s
p
(k) представляє найбільший негативний вихідний рівень - s
-
p
(k): -
обмежується, і приймається за s
p
(k)). Можна бачити, що багато функцій кодера і
декодера подібні, тому їх розгляд проводиться не буде.
Рис 1.6. Структурна схема декодера АДІКМ.
23
Звуки мови можуть бути розділені на три чітко виражені групи за типом
збудження:
1) вокалізованих звуки утворюються проштовхуванням повітря через голосову
щілину, при якому періодично напружуються і розслабляються голосові зв'язки і
виникає квазіперіодичного послідовність імпульсів потоку повітря, збудлива
голосової тракт. До вокалізованих звукам відносяться всі голосні і частина
приголосних звуків.
2) Невокалізовані або фрикатівні звуки генеруються при звуженні голосового
тракту в будь-якому місці (зазвичай в кінці рота) і проштовхуванні повітря через
звужений місце зі швидкістю, досить високою для утворення турбулентного
повітряного потоку. Таким чином, формується джерело широкосмугового шуму,
збудливого голосової тракт. До невокалізованним звукам відносять більшу частину
приголосних звуків.
3) Вибухові звуки характеризуються повністю закритим голосовим трактом
(зазвичай на початку голосового тракту). Потім повітря раптово вивільняється. Таке
явище має місце при проголошенні звуку. Різні звуки утворюються шляхом зміни
форми голосового тракту. Таким чином, спектральні властивості мовного сигналу
змінюються в часі відповідно до зміни форми голосового тракту.
1.8. Кодування мовних сигналів на основі лінійного передбачення
Лінійне передбачення є одним з найбільш ефективних методів аналізу мовного
сигналу. Цей метод стає домінуючим при оцінці основних параметрів мовного
сигналу, таких як, наприклад, період основного тону, форманти, спектр, функція
площі мовного тракту, а також при скороченому поданні мови з метою її
низькошвидкістної передачі та економного зберігання. Важливість методу
обумовлена високою точністю одержуваних оцінок і відносною простотою
обчислень. Основний принцип методу лінійного передбачення полягає в тому, що
поточний відлік мовного сигналу можна апроксимувати лінійною комбінацією
попередніх відліків.
24
Коефіцієнти передбачення при цьому визначаються однозначно мінімізацією
середнього квадрата різниці між відліками мовного сигналу і їх передбаченими
значеннями (на кінцевому інтервалі). Коефіцієнти передбачення - це вагові
коефіцієнти, використовувані в лінійній комбінації. Основні положення методу
лінійного передбачення добре узгоджуються з моделлю мовостворення, так як
мовний сигнал можна представити у вигляді сигналу на виході лінійної системи зі
змінними в часі параметрами, возбуждаемою квазіперіодичного імпульсами (в
межах вокалізованих сегментів) або випадковим шумом (на невокалізованному
сегменті). Метод лінійного передбачення дозволяє точно і надійно оцінити
параметри цієї лінійної системи зі змінними коефіцієнтами.
Методи обчислення коефіцієнтів передбачення:
1) коваріаційний;
2) автокореляційна;
3) сходового фільтру;
4) зворотної фільтрації;
5) оцінки спектра;
6) максимального правдоподібності;
7) скалярної проізводної.
Доцільність використання лінійного передбачення обумовлена високою
точністю опису мовного сигналу за допомогою моделі.
1.9. Методи аналізу на основі лінійного передбачення
Загальний спектр, обумовлений випромінюванням, мовним трактом і
збудженням, описується за допомогою лінійної системи із змінними параметрами і
придаточною функцією:
)
1
(
)
(
)
(
)
(
1
P
k
k
k
z
a
G
z
U
z
S
z
H
(1.1)
Ця система збуджується імпульсною послідовністю для вокалізованих звуків
мови і шумом для невокалізованних.
25
Таким чином, модель має наступні параметри:
1) класифікатор вокалізованих і не вокалізованних звуків;
2) період основного тону для вокалізованих сегментів;
3) коефіцієнт підсилення G;
4) коефіцієнти {а
k
} цифрового фільтра.
Всі ці параметри повільно змінюються в часі.
Рис.1.7. Структурна схема моделі аналізу мови.
Рис.1.8. Структурна схема моделі мово-утворювача.