Файл: 2016.06.07 - Матеріали науково-практичної конференції «Проблеми експлуатації та захисту інформаційно-комунікаційних систем».pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 24.04.2019
Просмотров: 3845
Скачиваний: 2
Н
АУКОВО
-
ПРАКТИЧНА КОНФЕРЕНЦІЯ
«ПРОБЛЕМИ
ЕКСПЛУАТАЦІЇ
ТА
ЗАХИСТУ
ІНФОРМАЦІЙНО-КОМУНІКАЦІЙНИХ
СИСТЕМ»
7
–
9
ЧЕРВНЯ
2016
Р
.,
Н
АЦІОНАЛЬНИЙ АВІАЦІЙНИЙ УНІВЕРСИТЕТ
,
М
.
К
ИЇВ
80
УДК 621.391
А.Ю. Лавриненко
Национальный авиационный университет, Украина
E-mail: oleksandrlavrynenko@gmail.com,
ORCID ID: http://orcid.org/0000-0002-7738-161X
АЛГОРИТМ СЖАТИЯ РЕЧЕВЫХ КОМАНД УПРАВЛЕНИЯ
БЕСПИЛОТНЫМ ЛЕТАТЕЛЬНЫМ АППАРАТОМ
Предложено использовать разработанный алгоритм сжатия
цифровых сигналов речевых команд управления на основе вейвлет-
преобразования в задачах голосового радиоуправления функциями
беспилотного летательного аппарата. Исследованный алгоритм
позволяет добиться оптимального результата в улучшении степени
сжатия передаваемых речевых данных при сохранении достаточного
качества сигналов на приемной стороне для возможности точного
распознавания
речевых
команд
и
выполнения
голосовой
аутентификации легальных субъектов управления. Полученные
результаты экспериментального исследования позволяют сделать
вывод о целесообразности дальнейшего практического применения
предложенного алгоритма сжатия сигналов речевых команд
управления на основе вейвлет-преобразования в разрабатываемой
системе голосового радиоуправления функциями беспилотного
летательного аппарата. В настоящее время наблюдается активное
развитие оборонного производства Украины, одна из основных и
главных
задач
которого,
внедрение
кардинально
новых
высокотехнологических средств в область военной связи, а именно,
создание защищенной системы голосового радиоуправления
функциями беспилотного летательного аппарата (БПЛА) для решения
поставленных задач в военно-разведывательных целях. В работе
приводится разработанный алгоритм сжатия сигналов речевых команд
управления функциями БПЛА на основе ВП с применением
энтропийного арифметического кодирования. Первый эксперимент
(табл. 1) был проведен с учетом критерия, в роли которого выступала
СПБ на выходе алгоритма сжатия речи, в зависимости от которой
изменялись значения КС, КК, ОСШ, ПОСШ и СКО, тем самым, давая
объективную оценку качества сигналов речевых команд и уровня
Н
АУКОВО
-
ПРАКТИЧНА КОНФЕРЕНЦІЯ
«ПРОБЛЕМИ
ЕКСПЛУАТАЦІЇ
ТА
ЗАХИСТУ
ІНФОРМАЦІЙНО-КОМУНІКАЦІЙНИХ
СИСТЕМ»
7
–
9
ЧЕРВНЯ
2016
Р
.,
Н
АЦІОНАЛЬНИЙ АВІАЦІЙНИЙ УНІВЕРСИТЕТ
,
М
.
К
ИЇВ
81
сжатия речевых данных при работе разработанного алгоритма сжатия
на основе ВП на заданной СПБ.
Таблица 1
Отношение зависимости КС, КК, ОСШ, ПОСШ, СКО от СПБ
СПБ
(Кбит/с)
выход
СПБ (Кбит/с)
вход
КС
КК
ОСШ
(дБ)
ПОСШ
(дБ)
СКО
7
64
9,1
0,9567
10,7190
33,8999
0,2911
8
64
8
0,9674
11,9329
35,0363
0,2531
9
64
7,1
0,9750
13,0732
36,1438
0,2220
10
64
6,4
0,9807
14,1775
37,4021
0,1955
11
64
5,8
0,9851
15,2810
38,4896
0,1722
12
64
5,3
0,9886
16,4407
39,6629
0,1506
Второй эксперимент (табл. 2) был проведен с учетом первичного
критерия, в роли которого выступал КС речевых данных, в
зависимости от которого изменялись значения СПБ, КК, ОСШ,
ПОСШ и СКО, тем самым, давая объективную оценку качества
сигналов речевых команд управления функциями БПЛА и скорости
передачи речевых данных при работе алгоритма в режиме с заданным
КС.
Таблица 2
Отношение зависимости СПБ, КК, ОСШ, ПОСШ, СКО от КС
КС СПБ (Кбит/с)
выход
СПБ (Кбит/с)
вход
КК
ОСШ
(дБ)
ПОСШ
(дБ)
СКО
5
12,8
64
0,9907
17,3374
40,5606
0,1359
6
10,6
64
0,9836
14,8819
38,0955
0,1803
7
9,1
64
0,9759
13,2237
36,2976
0,2182
8
8
64
0,9673
11,9213
35,0245
0,2535
9
7,1
64
0,9579
10,8414
34,0217
0,2870
10
6,4
64
0,9484
9,9750
33,0762
0,3171
Из представленных выше результатов исследования (табл. 1, 2)
наглядно видно, что оптимальным решением по критерию
соотношения качества сигналов речевых команд от уровня сжатия
передаваемых данных будет, робота представленного алгоритма
сжатия со СПБ = 8 Кбит/с, что позволяет сохранить достаточно
Н
АУКОВО
-
ПРАКТИЧНА КОНФЕРЕНЦІЯ
«ПРОБЛЕМИ
ЕКСПЛУАТАЦІЇ
ТА
ЗАХИСТУ
ІНФОРМАЦІЙНО-КОМУНІКАЦІЙНИХ
СИСТЕМ»
7
–
9
ЧЕРВНЯ
2016
Р
.,
Н
АЦІОНАЛЬНИЙ АВІАЦІЙНИЙ УНІВЕРСИТЕТ
,
М
.
К
ИЇВ
82
приемлемый КС = 8, при этом главные показатели критерия качества
сигналов речевых команд КК = 0,9674 (0,9673), ОСШ = 11,9329
(11,9213) дБ, ПОСШ = 35,0363 (35,0245) дБ и СКО = 0,2531 (0,2535)
показывают довольно высокие результаты, сохраняя индивидуальные
характеристики голоса субъекта управления, что дает возможность
точного распознавания речевых команд управления функциями БПЛА
и выполнения голосовой аутентификации легальных субъектов
управления
на
приемной
стороне
системе
голосового
радиоуправления функциями БПЛА [1].
Выводы
В данной статье представлен разработанный алгоритм сжатия
сигналов речевых команд управления функциями БПЛА на основе ВП
с применением арифметического кодирования и проведено
моделирование в программном пакете MATLAB. Разработан алгоритм
сжатия сигналов речевых команд управления функциями БПЛА на
основе ВП, который позволит добиться нужного результата в
улучшении степени сжатия передаваемых речевых данных при
сохранении достаточного качества сигналов на приемной стороне для
возможности точного распознавания речевых команд и выполнения
голосовой аутентификации легальных субъектов управления, что в
свою очередь обеспечит передачу речевых данных на низких
скоростях и уменьшение потока передаваемой информации, тем
самым увеличивая пропускную способность радио-канала передачи.
Оптимальным решением с точки зрения качества сигналов речевых
команд при достаточно неплохом сжатии данных будет, робота
представленного алгоритма сжатия со СПБ = 8 Кбит/с, что выдает
результат КС = 8, при этом главные показатели критерия качества
сигналов речевых команд – КК = 0,9674 (0,9673), ОСШ = 11,9329
(11,9213) дБ, ПОСШ = 35,0363 (35,0245) дБ и СКО = 0,2531 (0,2535)
показывают довольно высокие результаты.
Литература
[1] The comparative analysis the Fourier trans-form, cosine transform
and wavelet transform as a spectral analysis of the digital speech signals /
G.F. Konahovich, O.I. Davletyants, O.Y. Lavrynenko, D.I. Bakhtiyarov. //
Science-Based Technologies. – 2015. – Vol. 27, No. 3. – P. 210-220.
Н
АУКОВО
-
ПРАКТИЧНА КОНФЕРЕНЦІЯ
«ПРОБЛЕМИ
ЕКСПЛУАТАЦІЇ
ТА
ЗАХИСТУ
ІНФОРМАЦІЙНО-КОМУНІКАЦІЙНИХ
СИСТЕМ»
7
–
9
ЧЕРВНЯ
2016
Р
.,
Н
АЦІОНАЛЬНИЙ АВІАЦІЙНИЙ УНІВЕРСИТЕТ
,
М
.
К
ИЇВ
83
УДК 621.391
А.Ю. Лавриненко
Национальный авиационный университет, Украина
E-mail: oleksandrlavrynenko@gmail.com,
ORCID ID: http://orcid.org/0000-0002-7738-161X
СИСТЕМА РАСПОЗНАВАНИЯ ГОЛОСОВЫХ КОМАНД
УПРАВЛЕНИЯ НА ОСНОВЕ КЕПСТРАЛЬНОГО АНАЛИЗА
Несмотря на бурное развитие вычислительной техники, задача
распознавания голосовых команд по-прежнему не может считаться
полностью решенной. При этом ее актуальность со временем только
увеличивается. Наиболее удобными и эффективными средствами
взаимодействия человека с машиной были бы те, которые являются
естественными для него: через визуальные образы и речь (голос). В
связи с этим все более актуальной становится потребность в
альтернативных, более естественных методах управления различными
объектами. Одним из наиболее естественных для человека является
управление посредством голосовых команд.
Система распознавания
голосовых команд управления на основе кепстрального анализа,
предложенная в данной статье, может охватывать различные области
технологического применения вплоть до управления высокоточными
военными объектами, такими как беспилотные летательные аппараты
и т.д.
Разработанная система распознавания голосовых команд имеет
два режима: режим обучения и режим распознавания (тестирования).
Эти режимы входят в функциональную схему системы распознавания
голосовых команд, задача, которой заключается в первичной
обработке речевого сигнала, выделения признаков распознавания, в
качестве которых используются МЧКК. Дальнейшее поведение
системы зависит от режима работы. Если система находится в режиме
обучения, полученные на этапе выделения признаков распознавания
значения МЧКК, сохраняются в базу эталонных голосовых образов.
При нахождении системы в состоянии распознавания, полученный
набор значений МЧКК сравнивается с наборами из базы эталонных
голосовых образов. Задача функции принятия решения определить
наилучший результат сравнения по одному из существующих
критериев и выдать результат распознавания [1].
Н
АУКОВО
-
ПРАКТИЧНА КОНФЕРЕНЦІЯ
«ПРОБЛЕМИ
ЕКСПЛУАТАЦІЇ
ТА
ЗАХИСТУ
ІНФОРМАЦІЙНО-КОМУНІКАЦІЙНИХ
СИСТЕМ»
7
–
9
ЧЕРВНЯ
2016
Р
.,
Н
АЦІОНАЛЬНИЙ АВІАЦІЙНИЙ УНІВЕРСИТЕТ
,
М
.
К
ИЇВ
84
Все
научно-экспериментальные
исследования
системы
распознавания голосовых команд управления, изложенные ниже
(табл. 1).
Таблица 1
Результаты тестирования системы распознавания
голосовых команд субъекта управления №1
Обучение
Тестирование
Субъект
управления №1
Субъект
управления №1
Голосовые
команды
управления
«Вверх»
«Вниз»
«Вправо»
«Влево»
«Вверх»
0.0311
0.1921
0.2879
0.1479
«Вниз»
0.5323
0.0648
0.7345
0.4284
«Вправо»
0.3255
0.5048
0.0123
0.1699
«Влево»
0.1737
0.1935
0.1648
0.0112
В первом эксперименте (табл. 1) были проведены сравнения МЧКК
голосовых команд субъекта управления №1: «вверх», «вниз»,
«вправо», «влево», которые сохранены на уровне обучения в базу
эталонных голосовых образов с МЧКК голосовых команд того же
субъекта управления №1, но уже в режиме тестирования системы
(МЧКК произнесенных голосовых команд в режиме тестирования
сравниваются с МЧКК голосовых команд, произнесенных ранее в
режиме обучения системы). Из полученных результатов (табл. 1)
видно, что МЧКК голосовых команд субъекта управления №1
соответствуют критерию минимальной дисперсии
min
D
в заданном
пороге
допустимого
распознавания
15
.
0
:
«вверх»
–
0311
.
0
D
min
, «вниз» –
0648
.
0
D
min
, «вправо» –
0123
.
0
D
min
,
«влево» –
0112
.
0
D
min
, исходя из этого, принимается решение о
положительной
семантической
идентификации произнесенных
голосовых команд (голосовые команды распознаются).
В других случаях (табл. 1) наглядно видно, что значения
min
D
не
соответствуют
выбранному
критерию,
а
значит,
МЧКК
произнесенных голосовых команд не совпадают с МЧКК, которые
сохранены в базе эталонных голосовых образов, то есть, голосовые
команды не распознаются [2].