ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 10.01.2024
Просмотров: 1142
Скачиваний: 1
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Тема 13. Аудио и видеотехнологии в правоохранительной деятельности
ОСНОВНЫЕ ВОПРОСЫ:
1. Обработка аудио-видео информации. Аналого-цифровое преобразование.
2. Информационные кросс – технологии.
3. Геоинформационные технологии.
4. Используемые видео и аудио технологии.
1. Обработка аудио-видео информации. Аналого-цифровое преобразование
Отличия цифрового представления сигналов от аналогового.
В аналоговом виде представление сигналов является традиционным и основано на аналогии электрических сигналов представленным ими исходным сигналам, а также аналог форм электрических сигналов в разных точках среды усиленный или передающий тракт. Форма исходного сигнала описывается электрической кривой, максимально приближенной к форме кривой этого сигнала.
Данное представление является более точное, но если будет небольшое искажение формы электрического сигнала являющийся несущим неизбежно влечет за собой такое же искажение формы и сигнала переносимого. Если перейти в теорию информации, тогда можно сказать, что количество информации в несущем сигнале в точности равно количеству информации в сигнале исходном, и электрическое представление не содержит избыточности, которая могла бы защитить переносимый сигнал от искажений при хранении, передаче и усилении.
Цифровое представление электрических сигналов призвано внести в них избыточность, предохраняющую от воздействия паразитных помех. Для этого на несущий электрический сигнал накладываются серьезные ограничения – его амплитуда может принимать только два предельных значения – 0 и 1.
Возможная зона амплитуд делится на три зоны:
Исходя из выше сказанного, любая помеха, амплитуда которой меньше половины амплитуды несущего сигнала, не будет оказывать влияние на правильность передачи значений 0 и 1. Возникающие помехи с большей амплитудой влияние не оказывают, если длительность импульса помехи ощутимо меньше длительности информационного импульса, а фильтр импульсных помех установлен на входе приемника.
Если сформировать таким образом цифровой сигнал то он может переносить любую полезную информацию, которая закодирована нулями и
единицами в виде последовательности битов; но есть и частный случай такой информации это электрические и звуковые сигналы. Количество информации в несущем цифровом сигнале значительно больше, нежели в кодированном исходном, так что несущий сигнал имеет определенную избыточность относительно исходного, и любые искажения формы кривой несущего сигнала, при которых еще сохраняется способность приемника правильно различать нули и единицы, не влияют на достоверность передаваемой этим сигналом информации. Если происходит воздействие значительных помех форма сигнала может искажаться настолько, что точная передача переносимой информации становится невозможной – в ней появляются ошибки, которые при простом способе кодирования приемник не сможет не только исправить, но и обнаружить. Для еще большего повышения стойкости цифрового сигнала к помехам и искажениям применяется цифровое избыточное кодирование двух типов: проверочные (EDC – Error Detection Code, обнаруживающий ошибку код) и корректирующие (ECC – Error Correction Code, исправляющий ошибку код) коды. Цифровое кодирование состоит в простом добавлении к исходной информации дополнительных битов и/или преобразовании исходной битовой цепочки в цепочку большей длины и другой структуры. EDC позволяет просто обнаружить факт ошибки – искажение или выпадение полезной либо появление ложной цифры, однако переносимая информация в этом случае также искажается; ECC позволяет сразу же исправлять обнаруженные ошибки, сохраняя переносимую информацию неизменной. Для удобства и надежности передаваемую информацию разбивают на блоки (кадры), каждый из которых снабжается собственным набором этих кодов.
Каждый вид EDC/ECC имеет свой предел способности обнаруживать и исправлять ошибки, за которым опять начинаются необнаруженные ошибки и искажения переносимой информации. Увеличение объема EDC/ECC относительно объема исходной информации в общем случае повышает обнаруживающую и корректирующую способность этих кодов.
В качестве EDC популярен циклический избыточный код CRC (Cyclic Redundancy Check), суть которого состоит в сложном перемешивании исходной информации в блоке и формированию коротких двоичных слов, разряды которых находятся в сильной перекрестной зависимости от каждого бита блока. Изменение даже одного бита в блоке вызывает значительное изменение вычисленного по нему CRC, и вероятность такого искажения битов, при котором CRC не изменится, исчезающе мала даже при коротких (единицы процентов от длины блока) словах CRC. В качестве ECC используются коды Хэмминга (Hamming) и Рида–Соломона (Reed–Solomon), которые также включают в себя и функции EDC.
Информационная избыточность несущего цифрового сигнала приводит к значительному (на порядок и более) расширению полосы частот, требуемой для его успешной передачи, по сравнению с передачей исходного сигнала в аналоговой форме. Кроме собственно информационной избыточности, к расширению полосы приводит необходимость сохранения достаточно крутых фронтов цифровых импульсов.
Кроме целей помехозащиты, информация в цифровом сигнале может быть подвергнута также линейному или канальному кодированию, задача которого – оптимизировать электрические параметры сигнала (полосу частот, постоянную составляющую, минимальное и максимальное количество нулевых/единичных импульсов в серии и т.п.) под характеристики реального канала передачи или записи сигнала.
Полученный несущий сигнал, в свою очередь, также является обычным электрическим сигналом, и к нему применимы любые операции с такими сигналами – передача по кабелю, усиление, фильтрование, модуляция, запись на магнитный, оптический или другой носитель и т.п. Единственным ограничением является сохранение информационного содержимого – так, чтобы при последующем анализе можно было однозначно выделить и декодировать переносимую информацию, а из нее – исходный сигнал.
Форматы записи-воспроизведения аудио сигналов
Для эффективного кодирования аудиоданных применяются наиболее прогрессивные методы, в основе которых лежит свойство их универсальности и независимости от качества исходного звукового фрагмента, равно как и результирующего, в зависимости от установок, применяемых в ходе сжатия. В настоящее время наиболее известны mp3, wma и divx audio . Все они используют так называемое кодирование для восприятия (perceptual coding), при котором из звукового сигнала удаляется информация, малозаметная для слуха. В результате, несмотря на изменение формы, и спектра сигнала, его слуховое восприятие практически не меняется, а степень сжатия оправдывает незначительное уменьшение качества. Такое кодирование относится к методам сжатия с потерями, когда из сжатого сигнала уже невозможно точно восстановить исходную волновую форму.
Приемы удаления части информации базируются на особенностях человеческого слуха
, называемой маскированием: при наличии в спектре звука выраженных пиков (преобладающих гармоник) более слабые частотные составляющие в непосредственной близости от них на слух практически не воспринимаются (маскируются). При кодировании весь звуковой поток разбивается на мелкие кадры, каждый из которых преобразуется в спектральное представление и делится на ряд частотных полос.
Внутри полос происходит определение и удаление маскируемых звуков, после чего каждый кадр подвергается адаптивному кодированию прямо в спектральной форме. Все эти операции позволяют значительно (в несколько раз) уменьшить объем данных при сохранении качества, приемлемого для большинства слушателей. Каждый из описанных методов кодирования характеризуется скоростью битового потока, с которой сжатая информация должна поступать в декодер при восстановлении звукового сигнала. Декодер преобразует серию сжатых мгновенных спектров сигнала в обычную цифровую волновую форму. В любом видео или аудио потоке содержится значительное количество избыточной информации, которая независимо от ее присутствия или отсутствия не может быть воспринята человеческим ухом или глазом. Информация в MPEG–файле записана последовательными блоками кадрами (frames), которые последовательно считываются, а затем декодируются. Естественно, что чем больше поток, тем большее количество информации остается в файле и соответственно тем большее представление об оригинальном звуке в нем содержится. Аудиоинформация, сжатая по данной схеме, может передаваться потоком (streaming), а может храниться в файлах формата MP3 или WAV–MP3. Отличие второго от первого состоит в наличии дополнительного заголовка WAV–файла, что позволяет при наличии MP3–кодека в системе для работы с таким файлом использовать стандартные средства Windows.
Основная идея, на которой основаны все методики сжатия аудио сигнала с потерями, отказ от кодирования тонких деталей звучания оригинала, лежащих вне пределов возможностей человеческого слуха. Звуки, находящиеся на границах резких перепадов уровня: после очень громкого звука на протяжении небольшого отрезка времени около 100 мс и перед ним на протяжении 5 мс, человеческое ухо неспособно воспринимать другие, более тихие звуки.
И еще одна особенность человеческого слуха была учтена при разработке алгоритма компрессии использование минимального порога слышимости. Наибольшей чувствительностью (2–4 дБ) органы слуха обладают в среднем диапазоне частот порядка 2–5 кГц. На других частотах порогом чувствительности может стать значение громкости звука в 40 дБ. Иными словами, звуки, лежащие за порогом чувствительности, нет смысла сохранять, поскольку они все равно не будут услышаны.
На основании подобных эффектов создается так называемая психоакустическая модель, разбивающая весь частотный спектр на части, в которых уровень звука примерно одинаков, после чего удаляет звуки, не воспринимаемые человеком, как это было описано выше.
Существует три уровня audio MPEG для сжатия стереофонических сигналов:
Программные средства записи-воспроизведения звука
Приведем пример программы для записи звука. Программа для записи звука – Audacity, это бесплатная программа, с помощью которой можно сделать качественные, профессиональные записи с любых источников звука и сохранять их в различных форматах, с последующей публикацией аудио записей на сайте.
Программа для записи звука – Audacity, позволяет создавать очень качественные аудио файлы в широко распространенных форматах, таких, как mp3, wav и много других. Программа для записи звука – Audacity, имеет русский интерфейс.
Интерфейс программы Audacity, интуитивно понятен, и можно быстро эту программу освоить.
В меню можно создать проект, произвести запись с микрофона, открыть проект или аудио запись для редактирования. С помощью редактирования, можно вырезать не нужные куски аудио записи или добавить фрагмент аудио записи.
Кроме того, программа для записи звука Audacity, способна применить к аудио записи различные аудио эффекты. Уменьшить или увеличить уровень аудио записи, применить к аудиозаписи такие эффекты, как выравнивание, инвертирование, авто приглушение, изменение скорости и темпа воспроизведения аудио записи и так далее.
При необходимости, при создании аудио контента, и редактировании аудио записей, Вы можете использовать такие эффекты, как удаление шума, щелчков, автоматическое снижение уровня аудио записи, а так же плавное нарастание аудио звука.
С помощью программы для записи звука Audacity, можно работать как с моно звуком, так и со стерео звуком. При редактировании аудио записи, диаграмма записи выводится в специальные окна, где Вы имеете возможность визуально оценивать уровень амплитуды аудио записи, и при необходимости производить необходимые изменения в аудио запись.
ОСНОВНЫЕ ВОПРОСЫ:
1. Обработка аудио-видео информации. Аналого-цифровое преобразование.
2. Информационные кросс – технологии.
3. Геоинформационные технологии.
4. Используемые видео и аудио технологии.
1. Обработка аудио-видео информации. Аналого-цифровое преобразование
Отличия цифрового представления сигналов от аналогового.
В аналоговом виде представление сигналов является традиционным и основано на аналогии электрических сигналов представленным ими исходным сигналам, а также аналог форм электрических сигналов в разных точках среды усиленный или передающий тракт. Форма исходного сигнала описывается электрической кривой, максимально приближенной к форме кривой этого сигнала.
Данное представление является более точное, но если будет небольшое искажение формы электрического сигнала являющийся несущим неизбежно влечет за собой такое же искажение формы и сигнала переносимого. Если перейти в теорию информации, тогда можно сказать, что количество информации в несущем сигнале в точности равно количеству информации в сигнале исходном, и электрическое представление не содержит избыточности, которая могла бы защитить переносимый сигнал от искажений при хранении, передаче и усилении.
Цифровое представление электрических сигналов призвано внести в них избыточность, предохраняющую от воздействия паразитных помех. Для этого на несущий электрический сигнал накладываются серьезные ограничения – его амплитуда может принимать только два предельных значения – 0 и 1.
Возможная зона амплитуд делится на три зоны:
-
Нижняя представляет нулевые значения; -
Промежуточная является запрещенной – внутрь нее могут попадать только помехи. -
Верхняя – единичные.
Исходя из выше сказанного, любая помеха, амплитуда которой меньше половины амплитуды несущего сигнала, не будет оказывать влияние на правильность передачи значений 0 и 1. Возникающие помехи с большей амплитудой влияние не оказывают, если длительность импульса помехи ощутимо меньше длительности информационного импульса, а фильтр импульсных помех установлен на входе приемника.
Если сформировать таким образом цифровой сигнал то он может переносить любую полезную информацию, которая закодирована нулями и
единицами в виде последовательности битов; но есть и частный случай такой информации это электрические и звуковые сигналы. Количество информации в несущем цифровом сигнале значительно больше, нежели в кодированном исходном, так что несущий сигнал имеет определенную избыточность относительно исходного, и любые искажения формы кривой несущего сигнала, при которых еще сохраняется способность приемника правильно различать нули и единицы, не влияют на достоверность передаваемой этим сигналом информации. Если происходит воздействие значительных помех форма сигнала может искажаться настолько, что точная передача переносимой информации становится невозможной – в ней появляются ошибки, которые при простом способе кодирования приемник не сможет не только исправить, но и обнаружить. Для еще большего повышения стойкости цифрового сигнала к помехам и искажениям применяется цифровое избыточное кодирование двух типов: проверочные (EDC – Error Detection Code, обнаруживающий ошибку код) и корректирующие (ECC – Error Correction Code, исправляющий ошибку код) коды. Цифровое кодирование состоит в простом добавлении к исходной информации дополнительных битов и/или преобразовании исходной битовой цепочки в цепочку большей длины и другой структуры. EDC позволяет просто обнаружить факт ошибки – искажение или выпадение полезной либо появление ложной цифры, однако переносимая информация в этом случае также искажается; ECC позволяет сразу же исправлять обнаруженные ошибки, сохраняя переносимую информацию неизменной. Для удобства и надежности передаваемую информацию разбивают на блоки (кадры), каждый из которых снабжается собственным набором этих кодов.
Каждый вид EDC/ECC имеет свой предел способности обнаруживать и исправлять ошибки, за которым опять начинаются необнаруженные ошибки и искажения переносимой информации. Увеличение объема EDC/ECC относительно объема исходной информации в общем случае повышает обнаруживающую и корректирующую способность этих кодов.
В качестве EDC популярен циклический избыточный код CRC (Cyclic Redundancy Check), суть которого состоит в сложном перемешивании исходной информации в блоке и формированию коротких двоичных слов, разряды которых находятся в сильной перекрестной зависимости от каждого бита блока. Изменение даже одного бита в блоке вызывает значительное изменение вычисленного по нему CRC, и вероятность такого искажения битов, при котором CRC не изменится, исчезающе мала даже при коротких (единицы процентов от длины блока) словах CRC. В качестве ECC используются коды Хэмминга (Hamming) и Рида–Соломона (Reed–Solomon), которые также включают в себя и функции EDC.
Информационная избыточность несущего цифрового сигнала приводит к значительному (на порядок и более) расширению полосы частот, требуемой для его успешной передачи, по сравнению с передачей исходного сигнала в аналоговой форме. Кроме собственно информационной избыточности, к расширению полосы приводит необходимость сохранения достаточно крутых фронтов цифровых импульсов.
Кроме целей помехозащиты, информация в цифровом сигнале может быть подвергнута также линейному или канальному кодированию, задача которого – оптимизировать электрические параметры сигнала (полосу частот, постоянную составляющую, минимальное и максимальное количество нулевых/единичных импульсов в серии и т.п.) под характеристики реального канала передачи или записи сигнала.
Полученный несущий сигнал, в свою очередь, также является обычным электрическим сигналом, и к нему применимы любые операции с такими сигналами – передача по кабелю, усиление, фильтрование, модуляция, запись на магнитный, оптический или другой носитель и т.п. Единственным ограничением является сохранение информационного содержимого – так, чтобы при последующем анализе можно было однозначно выделить и декодировать переносимую информацию, а из нее – исходный сигнал.
Форматы записи-воспроизведения аудио сигналов
Для эффективного кодирования аудиоданных применяются наиболее прогрессивные методы, в основе которых лежит свойство их универсальности и независимости от качества исходного звукового фрагмента, равно как и результирующего, в зависимости от установок, применяемых в ходе сжатия. В настоящее время наиболее известны mp3, wma и divx audio . Все они используют так называемое кодирование для восприятия (perceptual coding), при котором из звукового сигнала удаляется информация, малозаметная для слуха. В результате, несмотря на изменение формы, и спектра сигнала, его слуховое восприятие практически не меняется, а степень сжатия оправдывает незначительное уменьшение качества. Такое кодирование относится к методам сжатия с потерями, когда из сжатого сигнала уже невозможно точно восстановить исходную волновую форму.
Приемы удаления части информации базируются на особенностях человеческого слуха
, называемой маскированием: при наличии в спектре звука выраженных пиков (преобладающих гармоник) более слабые частотные составляющие в непосредственной близости от них на слух практически не воспринимаются (маскируются). При кодировании весь звуковой поток разбивается на мелкие кадры, каждый из которых преобразуется в спектральное представление и делится на ряд частотных полос.
Внутри полос происходит определение и удаление маскируемых звуков, после чего каждый кадр подвергается адаптивному кодированию прямо в спектральной форме. Все эти операции позволяют значительно (в несколько раз) уменьшить объем данных при сохранении качества, приемлемого для большинства слушателей. Каждый из описанных методов кодирования характеризуется скоростью битового потока, с которой сжатая информация должна поступать в декодер при восстановлении звукового сигнала. Декодер преобразует серию сжатых мгновенных спектров сигнала в обычную цифровую волновую форму. В любом видео или аудио потоке содержится значительное количество избыточной информации, которая независимо от ее присутствия или отсутствия не может быть воспринята человеческим ухом или глазом. Информация в MPEG–файле записана последовательными блоками кадрами (frames), которые последовательно считываются, а затем декодируются. Естественно, что чем больше поток, тем большее количество информации остается в файле и соответственно тем большее представление об оригинальном звуке в нем содержится. Аудиоинформация, сжатая по данной схеме, может передаваться потоком (streaming), а может храниться в файлах формата MP3 или WAV–MP3. Отличие второго от первого состоит в наличии дополнительного заголовка WAV–файла, что позволяет при наличии MP3–кодека в системе для работы с таким файлом использовать стандартные средства Windows.
Основная идея, на которой основаны все методики сжатия аудио сигнала с потерями, отказ от кодирования тонких деталей звучания оригинала, лежащих вне пределов возможностей человеческого слуха. Звуки, находящиеся на границах резких перепадов уровня: после очень громкого звука на протяжении небольшого отрезка времени около 100 мс и перед ним на протяжении 5 мс, человеческое ухо неспособно воспринимать другие, более тихие звуки.
И еще одна особенность человеческого слуха была учтена при разработке алгоритма компрессии использование минимального порога слышимости. Наибольшей чувствительностью (2–4 дБ) органы слуха обладают в среднем диапазоне частот порядка 2–5 кГц. На других частотах порогом чувствительности может стать значение громкости звука в 40 дБ. Иными словами, звуки, лежащие за порогом чувствительности, нет смысла сохранять, поскольку они все равно не будут услышаны.
На основании подобных эффектов создается так называемая психоакустическая модель, разбивающая весь частотный спектр на части, в которых уровень звука примерно одинаков, после чего удаляет звуки, не воспринимаемые человеком, как это было описано выше.
Существует три уровня audio MPEG для сжатия стереофонических сигналов:
-
коэффициент сжатия 1:4 при допустимом потоке данных 384 Кбит/с; -
1:6..1:8 при 256..192 Кбит/с; -
1:10..1:12 при 128..112 Кбит/с.
Программные средства записи-воспроизведения звука
Приведем пример программы для записи звука. Программа для записи звука – Audacity, это бесплатная программа, с помощью которой можно сделать качественные, профессиональные записи с любых источников звука и сохранять их в различных форматах, с последующей публикацией аудио записей на сайте.
Программа для записи звука – Audacity, позволяет создавать очень качественные аудио файлы в широко распространенных форматах, таких, как mp3, wav и много других. Программа для записи звука – Audacity, имеет русский интерфейс.
Интерфейс программы Audacity, интуитивно понятен, и можно быстро эту программу освоить.
В меню можно создать проект, произвести запись с микрофона, открыть проект или аудио запись для редактирования. С помощью редактирования, можно вырезать не нужные куски аудио записи или добавить фрагмент аудио записи.
Кроме того, программа для записи звука Audacity, способна применить к аудио записи различные аудио эффекты. Уменьшить или увеличить уровень аудио записи, применить к аудиозаписи такие эффекты, как выравнивание, инвертирование, авто приглушение, изменение скорости и темпа воспроизведения аудио записи и так далее.
При необходимости, при создании аудио контента, и редактировании аудио записей, Вы можете использовать такие эффекты, как удаление шума, щелчков, автоматическое снижение уровня аудио записи, а так же плавное нарастание аудио звука.
С помощью программы для записи звука Audacity, можно работать как с моно звуком, так и со стерео звуком. При редактировании аудио записи, диаграмма записи выводится в специальные окна, где Вы имеете возможность визуально оценивать уровень амплитуды аудио записи, и при необходимости производить необходимые изменения в аудио запись.