Файл: 2016.06.07 - Матеріали науково-практичної конференції «Проблеми експлуатації та захисту інформаційно-комунікаційних систем».pdf

Скачать файл (6,09Мб)

Заказать решение

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 24.04.2019

Просмотров: 3793

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

АУКОВО

ПРАКТИЧНА КОНФЕРЕНЦІЯ

«ПРОБЛЕМИ

ЕКСПЛУАТАЦІЇ

ТА

ЗАХИСТУ

ІНФОРМАЦІЙНО-КОМУНІКАЦІЙНИХ

СИСТЕМ»

–

ЧЕРВНЯ

2016

АЦІОНАЛЬНИЙ АВІАЦІЙНИЙ УНІВЕРСИТЕТ

ИЇВ

УДК 621.391

А.Ю. Лавриненко

Национальный авиационный университет, Украина

E-mail: oleksandrlavrynenko@gmail.com,

ORCID ID: http://orcid.org/0000-0002-7738-161X

АЛГОРИТМ СЖАТИЯ РЕЧЕВЫХ КОМАНД УПРАВЛЕНИЯ

БЕСПИЛОТНЫМ ЛЕТАТЕЛЬНЫМ АППАРАТОМ

Предложено использовать разработанный алгоритм сжатия

цифровых  сигналов  речевых  команд  управления  на  основе  вейвлет-
преобразования  в  задачах  голосового  радиоуправления  функциями
беспилотного  летательного  аппарата.  Исследованный  алгоритм
позволяет  добиться  оптимального  результата  в  улучшении  степени
сжатия  передаваемых  речевых  данных  при  сохранении  достаточного
качества  сигналов  на  приемной  стороне  для  возможности  точного
распознавания

речевых

команд

выполнения

голосовой

аутентификации  легальных  субъектов  управления.  Полученные
результаты  экспериментального  исследования  позволяют  сделать
вывод  о  целесообразности  дальнейшего  практического  применения
предложенного  алгоритма  сжатия  сигналов  речевых  команд
управления  на  основе  вейвлет-преобразования  в  разрабатываемой
системе  голосового  радиоуправления  функциями  беспилотного
летательного  аппарата.  В  настоящее  время  наблюдается  активное
развитие  оборонного  производства  Украины,  одна  из  основных  и
главных

задач

которого,

внедрение

кардинально

новых

высокотехнологических  средств  в  область  военной  связи,  а  именно,
создание  защищенной  системы  голосового  радиоуправления
функциями беспилотного летательного аппарата (БПЛА) для решения
поставленных  задач  в  военно-разведывательных  целях.  В  работе
приводится разработанный алгоритм сжатия сигналов речевых команд
управления  функциями  БПЛА  на  основе  ВП  с  применением
энтропийного  арифметического  кодирования.  Первый  эксперимент
(табл. 1) был проведен с учетом критерия, в роли которого выступала
СПБ  на  выходе  алгоритма  сжатия  речи,  в  зависимости  от  которой
изменялись значения КС, КК, ОСШ, ПОСШ и СКО, тем самым, давая
объективную  оценку  качества  сигналов  речевых  команд  и  уровня

АУКОВО

ПРАКТИЧНА КОНФЕРЕНЦІЯ

«ПРОБЛЕМИ

ЕКСПЛУАТАЦІЇ

ТА

ЗАХИСТУ

ІНФОРМАЦІЙНО-КОМУНІКАЦІЙНИХ

СИСТЕМ»

–

ЧЕРВНЯ

2016

АЦІОНАЛЬНИЙ АВІАЦІЙНИЙ УНІВЕРСИТЕТ

ИЇВ

сжатия речевых данных при работе разработанного алгоритма сжатия
на основе ВП на заданной СПБ.

Таблица 1

Отношение зависимости КС, КК, ОСШ, ПОСШ, СКО от СПБ

СПБ

(Кбит/с)

выход

СПБ (Кбит/с)

вход

КС

КК

ОСШ

(дБ)

ПОСШ

(дБ)

СКО

9,1

0,9567

10,7190

33,8999

0,2911

0,9674

11,9329

35,0363

0,2531

7,1

0,9750

13,0732

36,1438

0,2220

6,4

0,9807

14,1775

37,4021

0,1955

5,8

0,9851

15,2810

38,4896

0,1722

5,3

0,9886

16,4407

39,6629

0,1506

Второй эксперимент (табл. 2) был проведен с учетом первичного

критерия,  в  роли  которого  выступал  КС  речевых  данных,  в
зависимости  от  которого  изменялись  значения  СПБ,  КК,  ОСШ,
ПОСШ  и  СКО,  тем  самым,  давая  объективную  оценку  качества
сигналов  речевых  команд  управления  функциями  БПЛА  и  скорости
передачи речевых данных при работе алгоритма в режиме с заданным
КС.

Таблица 2

Отношение зависимости СПБ, КК, ОСШ, ПОСШ, СКО от КС

КС СПБ (Кбит/с)

выход

СПБ (Кбит/с)

вход

КК

ОСШ

(дБ)

ПОСШ

(дБ)

СКО

12,8

0,9907

17,3374

40,5606

0,1359

10,6

0,9836

14,8819

38,0955

0,1803

9,1

0,9759

13,2237

36,2976

0,2182

0,9673

11,9213

35,0245

0,2535

7,1

0,9579

10,8414

34,0217

0,2870

6,4

0,9484

9,9750

33,0762

0,3171

Из представленных выше результатов исследования (табл. 1, 2)

наглядно  видно,  что  оптимальным  решением  по  критерию
соотношения  качества  сигналов  речевых  команд  от  уровня  сжатия
передаваемых  данных  будет,  робота  представленного  алгоритма
сжатия  со  СПБ  =  8  Кбит/с,  что  позволяет  сохранить  достаточно

АУКОВО

ПРАКТИЧНА КОНФЕРЕНЦІЯ

«ПРОБЛЕМИ

ЕКСПЛУАТАЦІЇ

ТА

ЗАХИСТУ

ІНФОРМАЦІЙНО-КОМУНІКАЦІЙНИХ

СИСТЕМ»

–

ЧЕРВНЯ

2016

АЦІОНАЛЬНИЙ АВІАЦІЙНИЙ УНІВЕРСИТЕТ

ИЇВ

приемлемый КС = 8, при этом главные показатели критерия качества
сигналов  речевых  команд    КК  =  0,9674  (0,9673),  ОСШ  =  11,9329
(11,9213)  дБ,  ПОСШ  =  35,0363  (35,0245)  дБ  и  СКО  =  0,2531  (0,2535)
показывают довольно высокие результаты, сохраняя индивидуальные
характеристики  голоса  субъекта  управления,  что  дает  возможность
точного распознавания речевых команд управления функциями БПЛА
и  выполнения  голосовой  аутентификации  легальных  субъектов
управления

на

приемной

стороне

системе

голосового

радиоуправления функциями БПЛА [1].

Выводы

В данной статье представлен разработанный алгоритм сжатия

сигналов речевых команд управления функциями БПЛА на основе ВП
с  применением  арифметического  кодирования  и  проведено
моделирование в программном пакете MATLAB. Разработан алгоритм
сжатия  сигналов  речевых  команд  управления  функциями  БПЛА  на
основе  ВП,  который  позволит  добиться  нужного  результата  в
улучшении  степени  сжатия  передаваемых  речевых  данных  при
сохранении достаточного качества сигналов на приемной стороне для
возможности  точного  распознавания  речевых  команд  и  выполнения
голосовой  аутентификации  легальных  субъектов  управления,  что  в
свою  очередь  обеспечит  передачу  речевых  данных  на  низких
скоростях  и  уменьшение  потока  передаваемой  информации,  тем
самым  увеличивая  пропускную  способность  радио-канала  передачи.
Оптимальным  решением  с  точки  зрения  качества  сигналов  речевых
команд  при  достаточно  неплохом  сжатии  данных  будет,  робота
представленного  алгоритма  сжатия  со  СПБ  =  8  Кбит/с,  что  выдает
результат  КС  =  8,  при  этом  главные  показатели  критерия  качества
сигналов  речевых  команд  –  КК  =  0,9674  (0,9673),  ОСШ  =  11,9329
(11,9213)  дБ,  ПОСШ  =  35,0363  (35,0245)  дБ  и  СКО  =  0,2531  (0,2535)
показывают довольно высокие результаты.

Литература

[1] The comparative analysis the Fourier trans-form, cosine transform

and wavelet transform as a spectral analysis of the digital speech signals /
G.F. Konahovich, O.I. Davletyants, O.Y. Lavrynenko, D.I. Bakhtiyarov. //
Science-Based Technologies. – 2015. – Vol. 27, No. 3. – P. 210-220.

АУКОВО

ПРАКТИЧНА КОНФЕРЕНЦІЯ

«ПРОБЛЕМИ

ЕКСПЛУАТАЦІЇ

ТА

ЗАХИСТУ

ІНФОРМАЦІЙНО-КОМУНІКАЦІЙНИХ

СИСТЕМ»

–

ЧЕРВНЯ

2016

АЦІОНАЛЬНИЙ АВІАЦІЙНИЙ УНІВЕРСИТЕТ

ИЇВ

УДК 621.391

А.Ю. Лавриненко

Национальный авиационный университет, Украина

E-mail: oleksandrlavrynenko@gmail.com,

ORCID ID: http://orcid.org/0000-0002-7738-161X

СИСТЕМА РАСПОЗНАВАНИЯ ГОЛОСОВЫХ КОМАНД

УПРАВЛЕНИЯ НА ОСНОВЕ КЕПСТРАЛЬНОГО АНАЛИЗА

Несмотря на бурное развитие вычислительной техники, задача

распознавания  голосовых  команд  по-прежнему  не  может  считаться
полностью  решенной.  При  этом  ее  актуальность  со  временем  только
увеличивается.  Наиболее  удобными  и  эффективными  средствами
взаимодействия  человека  с  машиной  были  бы  те,  которые  являются
естественными  для  него:  через  визуальные  образы  и  речь  (голос).  В
связи  с  этим  все  более  актуальной  становится  потребность  в
альтернативных, более естественных методах управления различными
объектами.  Одним  из  наиболее  естественных  для  человека  является
управление  посредством  голосовых  команд.

Система распознавания

голосовых  команд  управления  на  основе  кепстрального  анализа,
предложенная  в  данной  статье,  может  охватывать различные  области
технологического  применения  вплоть  до  управления  высокоточными
военными объектами, такими как беспилотные летательные аппараты
и  т.д.

Разработанная система распознавания голосовых команд имеет

два режима: режим обучения и режим распознавания (тестирования).
Эти режимы входят в функциональную схему системы распознавания
голосовых  команд,  задача,  которой  заключается  в  первичной
обработке  речевого  сигнала,  выделения  признаков  распознавания,  в
качестве  которых  используются  МЧКК.  Дальнейшее  поведение
системы зависит от режима работы. Если система находится в режиме
обучения,  полученные  на  этапе  выделения  признаков  распознавания
значения  МЧКК,  сохраняются  в  базу  эталонных  голосовых  образов.
При  нахождении  системы  в  состоянии  распознавания,  полученный
набор  значений  МЧКК  сравнивается  с  наборами  из  базы  эталонных
голосовых  образов.  Задача  функции  принятия  решения  определить
наилучший  результат  сравнения  по  одному  из  существующих
критериев и выдать результат распознавания [1].

АУКОВО

ПРАКТИЧНА КОНФЕРЕНЦІЯ

«ПРОБЛЕМИ

ЕКСПЛУАТАЦІЇ

ТА

ЗАХИСТУ

ІНФОРМАЦІЙНО-КОМУНІКАЦІЙНИХ

СИСТЕМ»

–

ЧЕРВНЯ

2016

АЦІОНАЛЬНИЙ АВІАЦІЙНИЙ УНІВЕРСИТЕТ

ИЇВ

Все

научно-экспериментальные

исследования

системы

распознавания голосовых команд управления, изложенные ниже
(табл. 1).

Таблица 1

Результаты тестирования системы распознавания

голосовых команд субъекта управления №1

Обучение

Тестирование

Субъект

управления №1

Субъект

управления №1

Голосовые

команды

управления

«Вверх»

«Вниз»

«Вправо»

«Влево»

«Вверх»

0.0311

0.1921

0.2879

0.1479

«Вниз»

0.5323

0.0648

0.7345

0.4284

«Вправо»

0.3255

0.5048

0.0123

0.1699

«Влево»

0.1737

0.1935

0.1648

0.0112

В первом эксперименте (табл. 1) были проведены сравнения МЧКК

голосовых  команд  субъекта  управления  №1:  «вверх»,  «вниз»,
«вправо»,  «влево»,  которые  сохранены  на  уровне  обучения  в  базу
эталонных  голосовых  образов  с  МЧКК  голосовых  команд  того  же
субъекта  управления  №1,  но  уже  в  режиме  тестирования  системы
(МЧКК  произнесенных  голосовых  команд  в  режиме  тестирования
сравниваются  с  МЧКК  голосовых  команд,  произнесенных  ранее  в
режиме  обучения  системы).  Из  полученных  результатов  (табл.  1)
видно,  что  МЧКК  голосовых  команд  субъекта  управления  №1
соответствуют  критерию  минимальной  дисперсии

min

в заданном

пороге

допустимого

распознавания





«вверх»

–

0311

min



, «вниз» –

0648

min



, «вправо» –

0123

min



«влево» –

0112

min



, исходя из этого, принимается решение о

положительной

семантической

идентификации произнесенных

голосовых команд (голосовые команды распознаются).

В других случаях (табл. 1) наглядно видно, что значения

min

не

соответствуют

выбранному

критерию,

значит,

МЧКК

произнесенных голосовых команд не совпадают с МЧКК, которые
сохранены в базе эталонных голосовых образов, то есть, голосовые
команды не распознаются [2].

Смотрите также файлы

2016.06.07 - Матеріали науково-практичної конференції «Проблеми експлуатації та захисту інформаційно-комунікаційних систем».pdf

2017.06.07 - Матеріали науково-практичної конференції «Проблеми експлуатації та захисту інформаційно-комунікаційних систем».pdf

2017.06.07 - Матеріали науково-практичної конференції «Проблеми експлуатації та захисту інформаційно-комунікаційних систем».pdf

Лавриненко О.Ю. - Алгоритми та програмні засоби фільтрації і стиснення сигналів в ТКС.pdf

()CCC - теор кратко.doc

Файл: 2016.06.07 - Матеріали науково-практичної конференції «Проблеми експлуатації та захисту інформаційно-комунікаційних систем».pdf

Смотрите также файлы

Информация

Списки файлов

Дополнительно