Файл: 2016.06.07 - Матеріали науково-практичної конференції «Проблеми експлуатації та захисту інформаційно-комунікаційних систем».pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 24.04.2019

Просмотров: 3717

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
background image

Н

АУКОВО

-

ПРАКТИЧНА КОНФЕРЕНЦІЯ

 

«ПРОБЛЕМИ

 

ЕКСПЛУАТАЦІЇ

 

ТА

 

ЗАХИСТУ

 

ІНФОРМАЦІЙНО-КОМУНІКАЦІЙНИХ

 

СИСТЕМ» 

7

 

 

9

 ЧЕРВНЯ 

2016

 Р

.,

 

Н

АЦІОНАЛЬНИЙ АВІАЦІЙНИЙ УНІВЕРСИТЕТ

,

 М

.

 

К

ИЇВ

 

80 

 

УДК 621.391 

А.Ю. Лавриненко 

Национальный авиационный университет, Украина 

E-mail: oleksandrlavrynenko@gmail.com, 

ORCID ID: http://orcid.org/0000-0002-7738-161X 

АЛГОРИТМ СЖАТИЯ РЕЧЕВЫХ КОМАНД УПРАВЛЕНИЯ 

БЕСПИЛОТНЫМ ЛЕТАТЕЛЬНЫМ АППАРАТОМ 

Предложено  использовать  разработанный  алгоритм  сжатия 

цифровых  сигналов  речевых  команд  управления  на  основе  вейвлет-
преобразования  в  задачах  голосового  радиоуправления  функциями 
беспилотного  летательного  аппарата.  Исследованный  алгоритм 
позволяет  добиться  оптимального  результата  в  улучшении  степени 
сжатия  передаваемых  речевых  данных  при  сохранении  достаточного 
качества  сигналов  на  приемной  стороне  для  возможности  точного 
распознавания 

речевых 

команд 

и 

выполнения 

голосовой 

аутентификации  легальных  субъектов  управления.  Полученные 
результаты  экспериментального  исследования  позволяют  сделать 
вывод  о  целесообразности  дальнейшего  практического  применения 
предложенного  алгоритма  сжатия  сигналов  речевых  команд 
управления  на  основе  вейвлет-преобразования  в  разрабатываемой 
системе  голосового  радиоуправления  функциями  беспилотного 
летательного  аппарата.  В  настоящее  время  наблюдается  активное 
развитие  оборонного  производства  Украины,  одна  из  основных  и 
главных 

задач 

которого, 

внедрение 

кардинально 

новых 

высокотехнологических  средств  в  область  военной  связи,  а  именно, 
создание  защищенной  системы  голосового  радиоуправления 
функциями беспилотного летательного аппарата (БПЛА) для решения 
поставленных  задач  в  военно-разведывательных  целях.  В  работе 
приводится разработанный алгоритм сжатия сигналов речевых команд 
управления  функциями  БПЛА  на  основе  ВП  с  применением 
энтропийного  арифметического  кодирования.  Первый  эксперимент 
(табл. 1) был проведен с учетом критерия, в роли которого выступала 
СПБ  на  выходе  алгоритма  сжатия  речи,  в  зависимости  от  которой 
изменялись значения КС, КК, ОСШ, ПОСШ и СКО, тем самым, давая 
объективную  оценку  качества  сигналов  речевых  команд  и  уровня 


background image

Н

АУКОВО

-

ПРАКТИЧНА КОНФЕРЕНЦІЯ

 

«ПРОБЛЕМИ

 

ЕКСПЛУАТАЦІЇ

 

ТА

 

ЗАХИСТУ

 

ІНФОРМАЦІЙНО-КОМУНІКАЦІЙНИХ

 

СИСТЕМ» 

7

 

 

9

 ЧЕРВНЯ 

2016

 Р

.,

 

Н

АЦІОНАЛЬНИЙ АВІАЦІЙНИЙ УНІВЕРСИТЕТ

,

 М

.

 

К

ИЇВ

 

81 

 

сжатия речевых данных при работе разработанного алгоритма сжатия 
на основе ВП на заданной СПБ. 

Таблица 1 

Отношение зависимости КС, КК, ОСШ, ПОСШ, СКО от СПБ 

СПБ 

(Кбит/с) 

выход 

СПБ (Кбит/с) 

вход 

КС 

КК 

ОСШ 

(дБ) 

ПОСШ 

(дБ) 

СКО 

64 

9,1 

0,9567 

10,7190 

33,8999 

0,2911 

64 

0,9674 

11,9329 

35,0363 

0,2531 

64 

7,1 

0,9750 

13,0732 

36,1438 

0,2220 

10 

64 

6,4 

0,9807 

14,1775 

37,4021 

0,1955 

11 

64 

5,8 

0,9851 

15,2810 

38,4896 

0,1722 

12 

64 

5,3 

0,9886 

16,4407 

39,6629 

0,1506 

Второй  эксперимент  (табл.  2)  был  проведен  с  учетом  первичного 

критерия,  в  роли  которого  выступал  КС  речевых  данных,  в 
зависимости  от  которого  изменялись  значения  СПБ,  КК,  ОСШ, 
ПОСШ  и  СКО,  тем  самым,  давая  объективную  оценку  качества 
сигналов  речевых  команд  управления  функциями  БПЛА  и  скорости 
передачи речевых данных при работе алгоритма в режиме с заданным 
КС. 

Таблица 2 

Отношение зависимости СПБ, КК, ОСШ, ПОСШ, СКО от КС 

КС  СПБ (Кбит/с) 

выход 

СПБ (Кбит/с) 

вход 

КК 

ОСШ 

(дБ) 

ПОСШ 

(дБ) 

СКО 

12,8 

64 

0,9907 

17,3374 

40,5606 

0,1359 

10,6 

64 

0,9836 

14,8819 

38,0955 

0,1803 

9,1 

64 

0,9759 

13,2237 

36,2976 

0,2182 

64 

0,9673 

11,9213 

35,0245 

0,2535 

7,1 

64 

0,9579 

10,8414 

34,0217 

0,2870 

10 

6,4 

64 

0,9484 

9,9750 

33,0762 

0,3171 

Из  представленных  выше  результатов  исследования  (табл.  1,  2) 

наглядно  видно,  что  оптимальным  решением  по  критерию 
соотношения  качества  сигналов  речевых  команд  от  уровня  сжатия 
передаваемых  данных  будет,  робота  представленного  алгоритма 
сжатия  со  СПБ  =  8  Кбит/с,  что  позволяет  сохранить  достаточно 


background image

Н

АУКОВО

-

ПРАКТИЧНА КОНФЕРЕНЦІЯ

 

«ПРОБЛЕМИ

 

ЕКСПЛУАТАЦІЇ

 

ТА

 

ЗАХИСТУ

 

ІНФОРМАЦІЙНО-КОМУНІКАЦІЙНИХ

 

СИСТЕМ» 

7

 

 

9

 ЧЕРВНЯ 

2016

 Р

.,

 

Н

АЦІОНАЛЬНИЙ АВІАЦІЙНИЙ УНІВЕРСИТЕТ

,

 М

.

 

К

ИЇВ

 

82 

 

приемлемый КС = 8, при этом главные показатели критерия качества 
сигналов  речевых  команд    КК  =  0,9674  (0,9673),  ОСШ  =  11,9329 
(11,9213)  дБ,  ПОСШ  =  35,0363  (35,0245)  дБ  и  СКО  =  0,2531  (0,2535) 
показывают довольно высокие результаты, сохраняя индивидуальные 
характеристики  голоса  субъекта  управления,  что  дает  возможность 
точного распознавания речевых команд управления функциями БПЛА 
и  выполнения  голосовой  аутентификации  легальных  субъектов 
управления 

на 

приемной 

стороне 

системе 

голосового 

радиоуправления функциями БПЛА [1]. 

Выводы 

В  данной  статье  представлен  разработанный  алгоритм  сжатия 

сигналов речевых команд управления функциями БПЛА на основе ВП 
с  применением  арифметического  кодирования  и  проведено 
моделирование в программном пакете MATLAB. Разработан алгоритм 
сжатия  сигналов  речевых  команд  управления  функциями  БПЛА  на 
основе  ВП,  который  позволит  добиться  нужного  результата  в 
улучшении  степени  сжатия  передаваемых  речевых  данных  при 
сохранении достаточного качества сигналов на приемной стороне для 
возможности  точного  распознавания  речевых  команд  и  выполнения 
голосовой  аутентификации  легальных  субъектов  управления,  что  в 
свою  очередь  обеспечит  передачу  речевых  данных  на  низких 
скоростях  и  уменьшение  потока  передаваемой  информации,  тем 
самым  увеличивая  пропускную  способность  радио-канала  передачи. 
Оптимальным  решением  с  точки  зрения  качества  сигналов  речевых 
команд  при  достаточно  неплохом  сжатии  данных  будет,  робота 
представленного  алгоритма  сжатия  со  СПБ  =  8  Кбит/с,  что  выдает 
результат  КС  =  8,  при  этом  главные  показатели  критерия  качества 
сигналов  речевых  команд  –  КК  =  0,9674  (0,9673),  ОСШ  =  11,9329 
(11,9213)  дБ,  ПОСШ  =  35,0363  (35,0245)  дБ  и  СКО  =  0,2531  (0,2535) 
показывают довольно высокие результаты. 

Литература 

[1]  The  comparative  analysis  the  Fourier  trans-form,  cosine  transform 

and  wavelet  transform  as a  spectral analysis  of  the  digital  speech  signals  / 
G.F. Konahovich, O.I. Davletyants, O.Y. Lavrynenko, D.I. Bakhtiyarov.  // 
Science-Based Technologies. – 2015. – Vol. 27, No. 3. – P. 210-220. 


background image

Н

АУКОВО

-

ПРАКТИЧНА КОНФЕРЕНЦІЯ

 

«ПРОБЛЕМИ

 

ЕКСПЛУАТАЦІЇ

 

ТА

 

ЗАХИСТУ

 

ІНФОРМАЦІЙНО-КОМУНІКАЦІЙНИХ

 

СИСТЕМ» 

7

 

 

9

 ЧЕРВНЯ 

2016

 Р

.,

 

Н

АЦІОНАЛЬНИЙ АВІАЦІЙНИЙ УНІВЕРСИТЕТ

,

 М

.

 

К

ИЇВ

 

83 

 

УДК 621.391 

А.Ю. Лавриненко 

Национальный авиационный университет, Украина 

E-mail: oleksandrlavrynenko@gmail.com, 

ORCID ID: http://orcid.org/0000-0002-7738-161X 

СИСТЕМА РАСПОЗНАВАНИЯ ГОЛОСОВЫХ КОМАНД 

УПРАВЛЕНИЯ НА ОСНОВЕ КЕПСТРАЛЬНОГО АНАЛИЗА 

Несмотря  на  бурное  развитие  вычислительной  техники,  задача 

распознавания  голосовых  команд  по-прежнему  не  может  считаться 
полностью  решенной.  При  этом  ее  актуальность  со  временем  только 
увеличивается.  Наиболее  удобными  и  эффективными  средствами 
взаимодействия  человека  с  машиной  были  бы  те,  которые  являются 
естественными  для  него:  через  визуальные  образы  и  речь  (голос).  В 
связи  с  этим  все  более  актуальной  становится  потребность  в 
альтернативных, более естественных методах управления различными 
объектами.  Одним  из  наиболее  естественных  для  человека  является 
управление  посредством  голосовых  команд.

 

Система  распознавания 

голосовых  команд  управления  на  основе  кепстрального  анализа, 
предложенная  в  данной  статье,  может  охватывать различные  области 
технологического  применения  вплоть  до  управления  высокоточными 
военными объектами, такими как беспилотные летательные аппараты 
и  т.д.

 

Разработанная  система  распознавания  голосовых  команд  имеет 

два режима: режим обучения и режим распознавания (тестирования). 
Эти режимы входят в функциональную схему системы распознавания 
голосовых  команд,  задача,  которой  заключается  в  первичной 
обработке  речевого  сигнала,  выделения  признаков  распознавания,  в 
качестве  которых  используются  МЧКК.  Дальнейшее  поведение 
системы зависит от режима работы. Если система находится в режиме 
обучения,  полученные  на  этапе  выделения  признаков  распознавания 
значения  МЧКК,  сохраняются  в  базу  эталонных  голосовых  образов. 
При  нахождении  системы  в  состоянии  распознавания,  полученный 
набор  значений  МЧКК  сравнивается  с  наборами  из  базы  эталонных 
голосовых  образов.  Задача  функции  принятия  решения  определить 
наилучший  результат  сравнения  по  одному  из  существующих 
критериев и выдать результат распознавания [1]. 


background image

Н

АУКОВО

-

ПРАКТИЧНА КОНФЕРЕНЦІЯ

 

«ПРОБЛЕМИ

 

ЕКСПЛУАТАЦІЇ

 

ТА

 

ЗАХИСТУ

 

ІНФОРМАЦІЙНО-КОМУНІКАЦІЙНИХ

 

СИСТЕМ» 

7

 

 

9

 ЧЕРВНЯ 

2016

 Р

.,

 

Н

АЦІОНАЛЬНИЙ АВІАЦІЙНИЙ УНІВЕРСИТЕТ

,

 М

.

 

К

ИЇВ

 

84 

 

Все 

научно-экспериментальные 

исследования 

системы 

распознавания  голосовых  команд  управления,  изложенные  ниже 
(табл. 1). 

Таблица 1 

Результаты тестирования системы распознавания 

голосовых команд субъекта управления №1 

Обучение 

Тестирование 

Субъект 

управления №1 

Субъект 

управления №1 

Голосовые 

команды 

управления 

 

«Вверх» 

 

«Вниз» 

 

«Вправо» 

 

«Влево» 

«Вверх» 

0.0311 

0.1921 

0.2879 

0.1479 

«Вниз» 

0.5323 

0.0648 

0.7345 

0.4284 

«Вправо» 

0.3255 

0.5048 

0.0123 

0.1699 

«Влево» 

0.1737 

0.1935 

0.1648 

0.0112 

В первом эксперименте (табл. 1) были проведены сравнения МЧКК 

голосовых  команд  субъекта  управления  №1:  «вверх»,  «вниз», 
«вправо»,  «влево»,  которые  сохранены  на  уровне  обучения  в  базу 
эталонных  голосовых  образов  с  МЧКК  голосовых  команд  того  же 
субъекта  управления  №1,  но  уже  в  режиме  тестирования  системы 
(МЧКК  произнесенных  голосовых  команд  в  режиме  тестирования 
сравниваются  с  МЧКК  голосовых  команд,  произнесенных  ранее  в 
режиме  обучения  системы).  Из  полученных  результатов  (табл.  1) 
видно,  что  МЧКК  голосовых  команд  субъекта  управления  №1 
соответствуют  критерию  минимальной  дисперсии 

min

D

  в  заданном 

пороге 

допустимого 

распознавания 

15

.

0

«вверх» 

– 

0311

.

0

D

min

,  «вниз»  – 

0648

.

0

D

min

,  «вправо»  – 

0123

.

0

D

min

«влево»  – 

0112

.

0

D

min

,  исходя  из  этого,  принимается  решение  о 

положительной 

семантической 

идентификации  произнесенных 

голосовых команд (голосовые команды распознаются). 

В других случаях (табл. 1) наглядно видно, что значения 

min

D

  не 

соответствуют 

выбранному 

критерию, 

а 

значит, 

МЧКК 

произнесенных  голосовых  команд  не  совпадают  с  МЧКК,  которые 
сохранены  в  базе  эталонных  голосовых  образов,  то  есть,  голосовые 
команды не распознаются [2].