ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 03.12.2023
Просмотров: 238
Скачиваний: 7
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
129
en
xn
x n
xn
1
xn +
7.6. Дифференциальная импульсно-кодовая модуляция (ДИКМ)
на основе линейного предсказания
В обычной импульсно-кодовой модуляции каждый отсчет кодируется независимо от других. Однако у многих источников сигнала при стробиро- вании с частотой Найквиста или быстрее проявляется значительная корре- ляция между последовательными отсчетами [42] (в частности, речевой сигнал является квазистационарным источником). Другими словами, из- менения амплитуды между последовательными отсчетами в среднем отно- сительно малы. Следовательно, схема кодирования, которая учитывает из- быточность отсчетов, будет требовать более низкой битовой скорости.
Суть ДИКМ заключается в следующем: текущее значение может быть предсказано по предыдущим M отсчетам. Пусть xn означает текущий от- счет источника, а x n – предсказанное значение (оценку) для xn, опреде- ляемое как
1
M
x
a x
n
k n k
k
=
∑
−
=
. (7.3)
Таким образом,
x n
– взвешенная линейная комбинация M отсчетов, а
}
{
ak
– коэффициенты предсказания. Величины
}
{
ak
выбираются так, чтобы минимизировать некоторую функцию ошибки en между xn и x n .
Проиллюстрируем вышесказанное на отрезке речевого сигнала, где
x
x
e
n
n
n
−
=
(рис. 7.2).
Линейное» предска- зание означает, что x n –
линейная функция преды- дущих отсчетов. При не- линейном предсказании –
нелинейная функция. Ха- рактеристики предсказа- ния (порядок) определя- ются количеством ис- пользуемых предыдущих отсчетов.
Предсказание нулевого и первого порядка является линейным, второго и более высокого порядка – нелинейным. При линейном предсказании восстановить сигнал значительно проще, чем при нелинейном. Будем рассматривать только ли- нейное предсказание.
Рис. 7.2. График ошибки
en
130
Оно имеет следующие разновидности.
1.
Предсказание нулевого порядка (рис.7.3).
Рис. 7.3. График предсказания нулевого порядка
В этом случае для предсказания текущего отсчета используется только предыдущий отсчет речевого сигнала:
1 1
x
x
e
x
x
x
x
n
n
n
n
n
n
n
=
⇒
=
−
=
−
−
−
2.
Предсказание первого порядка (линейная экстраполяция). В этом случае для предсказания текущего отсчета используется не только преды- дущий отсчет, но и разница между предпоследним и последним отсчетами, которая прибавляется к общему результату:
1 1
1 2
1 2
(
) 2
x
x
x x
x
x
x
x
n
n
n
n
n
n
n
=
+ Δ =
+
−
=
−
−
−
−
−
−
− =>
=>
1 2
2
e
x
x
x
x
x
n
n
n
n
n
n
=
−
=
−
+
−
− .
Формирование сигнала ошибки при использовании линейного пред- сказания эквивалентно прохождению исходного сигнала через линейный цифровой фильтр, который называется фильтром сигнала ошибки (ФСО), или обратным фильтром.
Обозначим передаточную функцию такого фильтра как
( )
A z
, следо- вательно
( )
( )
( )
E z
A z
X z
=
, (7.4) где
( )
E z
и
( )
X z
– прямое
Z
-преобразование от сигнала ошибки и вход- ного сигнала соответственно.
x n
en
xn
2
xn
−
1
xn
−
xn
131
На приемной стороне при прохождении сигнала ошибки через форми- рующий фильтр (ФФ) мы должны получить исходный сигнал. Обозначим передаточную функцию формирующего фильтра как
( )
K z
. Передаточная функция
( )
K z
будет связана с
( )
A z
следующим соотношением:
1
( )
( )
( )
( )
X z
K z
A z
E z
=
=
. (7.5)
Последовательность соединения ФСО и ФФ показана на рис. 7.4.
При
( ) ( )
1
A z K z
⋅
= будет обеспечено абсолютно точное восстановление сигнала, т.е.
x
x
n
n
=
. Но в действительности такого быть не может по причи- нам, о которых скажем ниже.
Для примера найдем пере- даточные функции ФСО и ФФ для разных типов линейного предсказания.
Предсказание нулевого порядка
1 1
( )
( )
( )
( )
1
( )
( )
E z
X z
z X z
A z
z
X z
X z
−
−
−
=
=
= −
;
1 1
1
(
0)
( )
( )
(
1)
1
z
K z
A z
z
z
−
−
=
=
=
−
−
Получили, что такой фильтр неустойчив, так как полюс находится на единичной окружности.
Предсказание первого порядка
1 2
1 2
( )
( ) 2
( )
( )
( )
1 2
( )
( )
E z
X z
z X z
z X z
A z
z
z
X z
X z
−
−
−
−
−
+
=
=
= −
+
;
2 1
2 2
1
(
0)
( )
1 2
(
1)
z
K z
z
z
z
−
−
−
=
=
−
+
−
Получили, что и такой фильтр тоже неустойчив.
Общая форма предсказания
Было получено, что
1
M
x
a x
n
k n k
k
= ∑
−
=
=>
1
M
e
x
x
x
a x
n
n
n
n
k n k
k
=
−
=
− ∑
−
=
, следовательно,
( )
( )
( )
1
( )
1
( )
( )
1
M
k
X z
a z
X z
k
M
E z
k
k
A z
a z
k
X z
X z
k
−
− ∑
−
=
=
=
= − ∑
=
;
1 1
( )
( )
1 1
K z
M
A z
k
a z
k
k
=
=
−
− ∑
=
{ }
xn
{ }
en
{ }
x n
( )
A z
( )
K z
Рис. 7.4. Схема соединения фильтров
132
На основании рассмотренных примеров можно сделать следующие выводы. Фильтр сигнала ошибки – это всегда КИХ-фильтр, а формирую- щий фильтр – БИХ-фильтр. Коэффициенты передаточной функции ФФ, являющиеся коэффициентами линейного предсказания, должны быть та- кими, чтобы формирующий фильтр был устойчивым, а ошибка
en
мини- мальна.
Для получения передаточной функции ФФ, наиболее точно воспроиз- водящего частотную характеристику голосового тракта для данного звука, следует определить коэффициенты передаточной функции
}
{
ak исходя из условия наименьшей ошибки линейного предсказания речевого сигнала
(по условию минимума среднего квадрата ошибки).
Запишем выражение для оценки дисперсии сигнала ошибки, которую надо минимзировать:
2 1
2
(
)
min
1
N
x
x
e
n
n
N n
σ
=
⋅
−
=
∑
=
;
2 2
2
(
)
(
)
min
1 1
1
N
N
M
s
x
x
x
a x
n
n
n
k n k
n
n
k
=
−
=
−
=
∑
∑
∑
−
=
=
=
Получили, что
2
( ,
,
,...,
)
1 2
3
s
f a a
a
am
=
– функция нескольких пере- менных. Продифференцируем ее и приравняем частные производные нулю для нахождения экстремума:
2 0,
1,
s
m
M
am
∂
=
=
∂
;
2 2
2(
)
0 1
1 1
N
M
M
a
s
k
x
a x
x
n
k n k
n k
a
a
n
k
k
m
m
⎛
⎞
∂
∂
=
−
−
⋅
=
⎜
⎟
∑
∑
∑
−
−
⎜
⎟
∂
∂
=
=
=
⎝
⎠
, где
1,
0,
a
k m
k
km
k m
am
δ
∂
=
⎧
=
=
⎨
≠
∂
⎩
– символ Кронекера.
Следовательно,
1
M
x
x
km n k
n m
k
δ
=
∑
−
−
=
;
2 2(
)(
) 0 1
M
s
x
a x
x
n
k n k
n m
a
n
k
m
∂
=
−
−
=
∑
∑
−
−
∂
=
; =>
133
=>
2
(
)(
) 0 1
M
s
x
a x
x
n
k n k
n m
a
n
k
m
∂
=
−
=
∑
∑
−
−
∂
=
;
(
)(
)
1
(
)
1
M
x
a x
x
n
k n k
n m
n
k
M
x x
a x
x
n n m
k n k n m
n
k
−
=
∑
∑
−
−
=
=
−
=
∑
∑
−
−
−
=
=
0.
1
M
x x
a x
x
n n m
k n k n m
n
n k
−
=
∑
∑ ∑
−
−
−
=
Получены нормальные уравнения или уравнения Юла – Волкера.
Введем обозначение
( , )
k m
x
x
n k n m
n
ϕ
= ∑ −
− , где ( , )
k m
ϕ
– автокорреляционная функция (АКФ).
(0, )
( , )
1
M
m
a
k m
k
k
ϕ
ϕ
=
⋅
∑
=
. (7.6)
Для вычисления функции ( ,
)
k m
ϕ
необходимо найти пределы сумми- рования по n:
1
M
n N
+ ≤ ≤ , где N – количество отсчетов в сегменте речево- го сигнала, а M – количество отсчетов, необходимых для расчета коэффици- ентов предсказания (M + 1)-го отсчета. Значит, первое предсказанное значе- ние запишется так:
(
,
,
,...,
)
1 2
3
x
f x
x
x
x
n
n
n
n
n M
=
−
−
−
−
, где n = M + 1.
Получим
( , )
1
N
k m
x
x
n k n m
n M
ϕ
=
∑
−
−
=
+
Обозначим n – k = j => n = k + j, n – m = k + j – m <=> n – m = i + j, где
i = k – m. Следовательно,
( , )
1
N k
k m
x x
j j i
j M
k
ϕ
−
=
∑
+
=
+ −
. (7.7)
Таким образом, получаем выражение, имеющее структуру кратковре- менной ненормированной АКФ, зависящей не только от относительного сдвига последовательности i, но и от положения этих последовательностей внутри сегмента речевого сигнала, которые определяются индексом k, вхо- дящим в пределы суммирования. Такой метод определения функции
( , )
k m
ϕ
называется ковариационным [40, 42].
134
Выражение (7.6) представляет собой систему линейных алгебраиче- ских уравнений (СЛАУ) относительно
}
{
ak , у которых все коэффициенты различны.
При использовании ковариационного метода получаются несмещен- ные оценки коэффициентов линейного предсказания, т. е.
{ }
ист
E a
a
k
k
=
, где ист
ak
– истинные значения коэффициентов линейного предсказания.
Другой способ определения коэффициентов системы (7.6) состоит в том, что вместо функции ( , )
k m
ϕ
используется некоторая другая функция
( , )
k m
ϕ
′
, которая определяется как
(
)
|
|
( , )
(|
|),
|
|
1 1
N
k m
N
k m
k m
x
x
x
x
B k m
j
j k m
j
j
k m
j
j
ϕ
− −
− −
′
=
⋅
=
⋅
=
−
∑
∑
+ −
+ −
=
=
( )
1
N i
B i
x x
j j i
j
−
= ∑
+
=
– ненормированная кратковременная корреляционная функция (КФ).
Поскольку определение функции ( , )
k m
ϕ
′
сводится к расчету КФ, то такой метод называется автокорреляционным. При его использовании по- лучаются смещенные оценки коэффициентов линейного предсказания (од- нако при M << N смещение пренебрежимо мало).
Перепишем СЛАУ (7.6) с учетом введенной функции
( , )
k m
ϕ
′
:
(0, )
( , ),
1,
,
1
( , )
(|
|),
(0, )
( ).
M
m
a
k m
m
M
k
k
k m
B k m
m
B m
ϕ
ϕ
ϕ
ϕ
′
′
=
=
∑
=
′
=
−
′
=
( )
(|
|),
1,
1
M
B m
a B k m
m
M
k
k
=
−
=
∑
=
. (7.8)
Для автокорреляционного метода характерно то, что вся информация о сигнале, необходимая для определения коэффициентов линейного пред- сказания, содержится в кратковременной ненормированной АКФ
( )
B i .
Распишем полученную СЛАУ в явном виде
(0)
(1)
(2)
(
1)
(1),
1 2
3
(1)
(0)
(1)
(
2)
(2),
1 2
3
(2)
(1)
(0)
(
3)
(3),
1 2
3
(
1)
(
2)
(
3)
(0)
( ).
1 2
3
B
a
B
a
B
a
B M
a
B
m
B
a
B
a
B
a
B M
a
B
m
B
a
B
a
B
a
B M
a
B
m
B M
a
B M
a
B M
a
B
a
B M
m
+
+
+ +
−
=
⎫
⎪
+
+
+ +
−
=
⎪
⎪
+
+
+ +
−
=
⎬
⎪
⎪
⎪
−
+
−
+
−
+ +
=
⎭
135
Затем перепишем ее в матричной форме:
(0)
(1)
(
1)
(1)
1
(1)
(0)
(
2)
(2)
2
(
1)
(
2) ...
(0)
( )
a
B
B
B M
B
a
B
B
B M
B
B M
B M
B
B M
am
⎛
⎞
−
⎛
⎞
⎛
⎞
⎜
⎟
⎜
⎟
⎜
⎟
−
⎜
⎟
⎜
⎟
⎜
⎟
⋅
=
⎜
⎟
⎜
⎟
⎜
⎟
⎜
⎟
⎜
⎟
⎜
⎟
⎜
⎟
−
−
⎝
⎠
⎝
⎠
⎝
⎠
Свойства коэффициентов матрицы:
1) симметричность;
2) теплицева матрица (элементы диагонали равны).
Для решения СЛАУ с такой матрицей используется алгоритм Левин- сона – Дарбина, который требует меньших вычислительных затрат, чем стандартные алгоритмы и выглядит следующим образом.
Начальные значения:
(1)
(1)
(0)
;
;
(0);
1 1
1
(0)
2 2
(0)
(1)
(1)
(0)
2
(1
)
1
(0)
B
k
a
k
E
B
B
B
B
E
k
E
B
=
=
=
−
= −
⋅
=
1 (
1)
( )
(
)
1
,
(
1)
( )
(
1)
(
1)
( )
2, .
;
,
1,
1,
( )
(
1)
2
(1
)
,
( );
1,
m
m
B m
a
B m
j
j
j
km
m
E
m
m
m
m
m
M
a
k
a
a
k a
j
m
m
m
j
j
m m
j
m
m
E
k
E
m
M
a
a
k
M
k
k
−
⎫
−
−
−
∑
⎪
⎪
=
=
⎪
−
⎪
⎪
−
−
=
⎬
=
=
−
=
−
−
⎪
⎪
−
= −
⎪
⎪
=
=
⎪⎭
1 ... 5 6 7 8 9 10 11 12 13
7.6.1. Решетчатый фильтр сигнала ошибки предсказания
В процедуре вычисления коэффициентов предсказания Левинсона –
Дарбина в качестве промежуточных величин используются коэффициенты
k m , которые называются коэффициентами отражения. Их физический смысл заключается в следующем. Голосовой тракт человека представляет собой трубу, состоящую из секций, соединенных последовательно и имею- щих разный диаметр. При прохождении звуковой волны через такую сис- тему возникают отражения на стыках секций, так как каждый стык являет- ся неоднородностью. Коэффициент отражения характеризует величину проходимости стыка двух секций (сред) и равен
136 1
;
1 1;
0 1
s
s
m
m
r
r
s
m
m
i
s
s
m
m
−
+
=
− ≤
≤
⇐
≥
+
+
Поясним его смысл на рис. 7.5: жирной линией показана m-я – секция голосового тракта.
Рис. 7.5. Коэффициент отражения
Если
1
rm = −
, то произойдет обрыв в цепи передачи сигнала (обрыв прямой ветви). Такого быть не должно.
Модель акустических труб может быть представлена в виде фильтра, имеющего решетчатую (или лестничную) структуру. Основные параметры такого фильтра – коэффициенты отражения [40, 42].
Система акустических труб – резонансная система, поэтому если фильтр без потерь, то на его амплитудно-частотной характеристике (АЧХ) будут наблюдаться разрывы (всплески в бесконечность). В действительно- сти на месте этих всплесков будут резонансные пики. Частоты таких пиков называются формантными. Обычно в голосовых трактах человека фор- мантных частот (или формант) не более трех.
Так как коэффициенты отражения и коэффициенты предсказания вы- числяются в рамках одной и той же процедуры алгоритма Левинсона –
Дарбина, то они могут быть выражены друг через друга. Рассмотрим эти алгоритмы.
Прямая рекурсия. Коэффициенты предсказания находят по коэффици- ентам отражения
( )
устанавливается,
1,
( )
(
1)
(
1),
1,
1,
( ),
1,
m
a
r
m
m
m
M
m
m
m
a
a
r a
j
m
j
j
m m
j
M
a
a
j
M
j
j
⎫
= −
−
⎪
=
⎬
−
−
⎪
=
+
=
−
−
⎭
=
=
Обратная рекурсия. Коэффициенты отражения находят по коэффици- ентам предсказания
1
rm = −
1
rm =
S m
0 1
S m
=
+
S m
1
S m
→∞
+
m m
137
( )
,
1, ,
( ) устанавливается,
( )
( )
( )
,
, 1.
(
1)
,
1,
1.
2 1
M
a
a
j
M
j
j
m
r
a
m
m
m
m
m
m M
a
a
a
j
m
m
j
m
a
j
m
j
rm
=
=
⎫
= −
−
⎪
⎪
=
⎬
+
−
−
⎪
=
=
−
⎪
−
⎭
Как уже было сказано, фильтры сигнала ошибки представляют собой
КИХ-фильтры, или нерекурсивные фильтры, что означает отсутствие вет- вей обратной связи. Системы с КИХ также могут обладать строго линей- ной фазо-частотной характеристикой (ФЧХ). Линейность ФЧХ – очень важное свойство применительно к речевому сигналу в тех случаях, когда требуется сохранить взаимное расположение элементов сигнала. Это су- щественно облегчает задачу проектирования фильтров и позволяет уделять внимание лишь аппроксимации их АЧХ. За это достоинство приходится расплачиваться необходимостью аппроксимации протяженной импульсной реакции в случае фильтров с крутыми АЧХ [39, 40].
Изобразим граф фильтра, имеющего решетчатую структуру 3-го по- рядка (рис. 7.6).
Рис. 7.6. Граф решетчатого фильтра
В отличие от формирующего фильтра этот фильтр имеет один вход и два выхода:
ei – последовательность отсчетов сигнала ошибки прямого линейного предсказания;
bi – последовательность отсчетов сигнала ошибки обратного линей- ного предсказания, где
1 1
1
b
x
x
n
n
n
=
−
−
−
− .
Важность bi определяется тем, что по ним совместно с сигналом ошибки ei могут быть оценены коэффициенты отражения:
(0)
n
e
1 1
(1)
n
e
1 1
(2)
n
e
1 1
(3)
n
e
n
e
n
x
1
r
2
r
3
r
1
r
2
r
3
r
1
z
−
1 1
z
−
1 1
z
−
1
(0)
n
b
(0)
1
n
b
−
(1)
n
b
(1)
1
n
b
−
(2)
n
b
(2)
1
n
b
−
(3)
n
b
n
b