Файл: Контрольная работа По дисциплине Основы телекоммуникационных технологий.docx
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 10.01.2024
Просмотров: 50
Скачиваний: 3
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Министерство цифрового развития, связи и
массовых коммуникаций Российской Федерации
Сибирский Государственный Университет Телекоммуникаций и Информатики
Межрегиональный центр переподготовки специалистов
Контрольная работа
По дисциплине: Основы телекоммуникационных технологий
Выполнил: Наумова А.В.
Группа: ТБТ-11
Вариант:8
Проверил: Катунин Геннадий Павлович
Новосибирск, 2022 г
Тема
Способы сжатия звуковой информации.
Введение
Сжатие звука — совокупность технологий по уменьшению объема данных, необходимых для передачи и хранения звуковой информации. Базируясь на основных принципах сжатия информации, при сжатии звука используются особенности звуковой информации, особенности природы, механизмов происхождения звука (речь, музыкальные инструменты и т.д.) и звуковосприятия. В обработке сигналов сжатие данных, кодирование источника или снижение скорости передачи битов-это процесс кодирования информации с использованием меньшего количества битов, чем исходное представление. Сжатие полезно, поскольку оно сокращает ресурсы, необходимые для хранения и передачи данных. Вычислительные ресурсы расходуются в процессах сжатия и декомпрессии. Разработка схем сжатия данных предполагает компромисс между различными факторами, включая степень сжатия, величину вносимых искажений (при использовании сжатия данных с потерями) и вычислительные ресурсы, необходимые для сжатия и распаковки данных. Методы сжатия можно разделить на два основных раздела: Сжатие звука (данных), тип сжатия с потерями или без потерь, при котором объем данных в записанной форме волны уменьшается до разной степени для передачи соответственно с некоторой потерей качества или без нее, используется при кодировании CD и MP3, интернет-радио и т.д. Сжатие динамического диапазона, также называемое сжатием уровня звука, при котором уменьшается динамический диапазон, разница между громким и тихим звуковыми сигналами.
Методы сокращения статистической избыточности аудиоданных также называют сжатием без потерь, а, соответственно, методы сокращения психоакустической избыточности - сжатием с потерями.
Глава 1 Сжатие динамического диапазона
Сжатие динамического диапазона (DRC) или просто сжатие-это операция обработки аудиосигнала, которая уменьшает громкость громких звуков или усиливает тихие звуки, таким образом уменьшая или сжимая динамический диапазон аудиосигнала. Сжатие обычно используется в записи и воспроизведении звука, вещании, усилении живого звука и в некоторых инструментальных усилителях. Специальный электронный аппаратный блок или звуковое программное обеспечение, применяющее сжатие, называется компрессором. В 2000-х годах компрессоры стали доступны в качестве программных плагинов, которые работают в программном обеспечении digital audio workstation. Для настройки алгоритмов и компонентов обработки сигналов сжатия динамического диапазона используется ряд настраиваемых пользователем параметров и функций управления. Компрессор снижает уровень звукового сигнала, если его амплитуда превышает определенный порог. Порог обычно устанавливается в децибелах ( dBFS для цифровых компрессоров и dBu для аппаратных компрессоров), где более низкий порог (например, –60 дБ) означает, что обрабатывается большая часть сигнала. Когда уровень сигнала ниже порогового значения, обработка не выполняется, и входной сигнал без изменений передается на выход. Таким образом, более высокий порог, например, -5 дБ, приводит к меньшей обработке, меньшему сжатию [5]. Величина уменьшения коэффициента усиления определяется соотношением: соотношение 4: 1 означает, что если входной уровень превышает порог на 4 дБ, то уровень выходного сигнала снижается до 1 дБ выше порога. Коэффициент усиления и выходной уровень были уменьшены на 3 дБ. Другими словами любой уровень входного сигнала выше порога будет в этом случае выводиться на уровне, который составляет всего 25% Самое высокое соотношение ∞: 1 часто называют предельным. Это обычно достигается с использованием соотношения 60: 1, и означает, что любой сигнал выше порога снижается до порогового уровня. Компрессор может обеспечить определенную степень контроля над тем
, как быстро он действует. Атака — это период, когда компрессор уменьшает коэффициент усиления в ответ на повышенный уровень на входе, чтобы достичь коэффициента усиления, определенного соотношением. Освобождение это период, когда компрессор увеличивает коэффициент усиления в ответ на пониженный уровень на входе, чтобы достичь выходного коэффициента усиления, определяемого отношением, или, до единицы, как только входной уровень опустился ниже порогового значения [1]. Другой элемент управления, который может предложить компрессор, — это выбор жесткого колена или мягкого колена. Это определяет, является ли изгиб кривой отклика между нижним порогом и верхним порогом резким (жестким) или постепенным (мягким). Мягкое колено медленно увеличивает степень сжатия по мере увеличения уровня и в конечном итоге достигает степени сжатия, установленной пользователем. Мягкое колено уменьшает потенциально слышимый переход от несжатого к сжатому и особенно применимо для более высоких настроек соотношения, где переключение на пороге было бы более заметным. Пиковый компрессор реагирует на пиковый уровень входного сигнала. Обеспечивая более жесткий контроль пикового уровня, восприятие пикового уровня не обязательно связано с человеческим восприятием громкости. Некоторые компрессоры применяют функцию измерения мощности (обычно среднеквадратичную) к входному сигналу перед сравнением его уровня с порогом. Это производит более расслабленное сжатие, которое более тесно связано с человеческим восприятием громкости. Компрессор в режиме стерео компоновки применяет одинаковое снижение коэффициента усиления как к левому, так и к правому каналам. Это делается для предотвращения смещения, которое может произойти, если каждый канал сжимается индивидуально. Поскольку нисходящий компрессор только снижает уровень сигнала, обычно обеспечивается возможность добавления фиксированного количества усиления подпитки на выходе, чтобы получить оптимальный уровень выходного сигнала.
Глава 2 Сжатие звука
2.1 Сжатие с потерями
Цель сжатия звука — уменьшить количество битов, необходимых для точного воспроизведения аналогового звука. Первый процесс, который мы рассмотрим, называется «с потерями». Сжатие с потерями — это односторонний метод, при котором некритические данные удаляются для экономии места. Эти методы являются наиболее распространенными методами сжатия аудиофайлов, которые одинаково отображаются в файлах MP3, AAC и WMA. Есть два основных критерия, которые учитывают кодеки с потерями для сохранения битов: битрейт и психоакустика. Битрейт измеряет количество битов, используемых для кодирования одной секунды звука. Например, если используется низкокачественное кодирование со скоростью 8 килобит в секунду (кбит/с), алгоритм ограничивается использованием только 8 килобит данных для описания каждой секунды звука. Это похоже на описание полноцветной фотографии всего несколькими сотнями пикселей. Можно получить правильные контуры очертания в виде широких мазков, но в целом качество и детализация изображения сильно пострадают. Если используется более высокая скорость передачи данных, например 192 кбит/с, появляется возможность для сохранения и передачи деталей. Высокий битрейт сам по
себе не определяет качество записи, но низкий битрейт может серьезно ограничить качество вывода. Психоакустика — это наука о том, как мозг понимает звуки. Манипулируя известными фактами восприятия звука людьми, алгоритмы сжатия могут умело удалять детали, которые не воспринимает большинство людей. Цель состоит в том, чтобы сохранить информацию, которая не изменит воспринимаемое качество звуковой дорожки, разумно удаляя только неважную информацию [2].Типичный диапазон человеческого слуха составляет от 20 Гц до 20 кГц. Очевидно, что звуки за пределами этого диапазона можно удалить. Более того, наиболее детализированный диапазон человеческого слуха находится между 100 Гц и 4 кГц, и удаление тихих звуков за пределами этих частотных диапазонов минимально влияет на качество записи. Тоже касается и очень контрастных звуков. Если очень громкий звук и очень тихий звук играют одновременно, тихий звук гораздо труднее воспринимать. Кодеры используют преимущества этой «звуковой маскировки», чтобы удалить тихий звук, экономя биты в этом процессе [2]. Частота также может влиять на то, насколько хорошо воспринимаются звуки. Например, постоянный низкочастотный барабанный бой имеет тенденцию заглушать более тонкие, высокочастотные гармоники мелодических инструментов. И звуковая маскировка особенно эффективна выше 15 кГц, где человеческий слух обычно менее чувствителен.
2.2 Сжатие без потерь
Распространенные схемы сжатия аудио, такие как MP3, используют весь спектр возможностей сжатия, стараясь при этом сохранить оригинальную запись, воспринимаемую человеком. Конечно, некоторые люди чувствуют, что удаление этих частот наносит серьезный ущерб записи. Поэтому существуют стандарты сжатия без потерь. Цель сжатия звука без потерь — уменьшить размер файла, оставив исходный звук нетронутым. Эти кодеки не используют ни один из описанных выше методов постоянного сжатия, сосредоточившись вместо этого на полностью обратимых методах сжатия данных. Они используют методы сжатия без потерь, заимствованные из алгоритмов сжатия файлов, таких как ZIP, чтобы удалить избыточные данные, сохраняя при этом целостность основной информации. Два популярных аудиокодека без потерь- FLAC и Apple Lossless (ALAC) – оба используют схемы, основанные на сжатии ZIP [6].Сосредоточение внимания на сжатии данных без потерь означает только сохранение многих деталей, которые MP3 и другие стандарты с потерями могли бы стереть. При наличии острого слуха и качественной настройки прослушивания, разница может быть ощутимой [6]. Сжатие без потерь также используется для хранения аудиоинформации. Так как это гарантированно позволяет не потерять ту или иную часть информации. Кроме того эти форматы гораздо удобнее для обработки, так как из материалов более высокого качества можно получить более высококачественный продукт.
ЗАКЛЮЧЕНИЕ
Сжатие аудиоданных, потенциально может снизить пропускную способность передачи и требования к хранению аудиоданных. Алгоритмы сжатия звука реализуются в программном обеспечении в виде аудиокодеков. Как при сжатии с потерями, так и без потерь избыточность информации уменьшается с помощью таких методов, как кодирование, квантование, дискретное косинусное преобразование и линейное предсказание, чтобы уменьшить объем информации, используемой для представления несжатых данных. Алгоритмы сжатия звука с потерями обеспечивают более высокое сжатие и используются во многих аудиоприложениях. Эти алгоритмы почти все полагаются на психоакустику, чтобы устранить или уменьшить точность менее слышимых звуков, тем самым уменьшая пространство, необходимое для их хранения или передачи. Приемлемый компромисс между потерей качества звука и размером передачи или хранения зависит от конкретного приложения. Сжатие звука без потерь обеспечивает представление цифровых данных, которые могут быть декодированы в точную цифровую копию оригинала. Коэффициенты сжатия составляют около 50-60% от исходного размера. Кодеки без потерь используют подгонку кривой или линейное предсказание в качестве основы для оценки сигнала. Аудиоформаты без потерь позволяют лучше звучать записи. Но иногда различия между высококачественным MP3 и файлом без потерь почти незаметны, особенно для нетренированного уха. Если вы хотите проверить, достаточно ли остры ваши наушники (и уши), чтобы определить разницу, NPR предлагает забавный тест; просто имейте в виду, что дешевые наушники и динамики ноутбуков не смогут воспроизвести тонкие различия между аудио без потерь и MP3.
СПИСОК ЛИТЕРАТУРЫ
-
Гусева Е. Н., Черемных С. А. Кодирование звуковой информации //Инновационное развитие современной науки: проблемы, закономерности, перспективы. – 2018 – С. 281-283. -
Заболотов В. А., Стефанова И. А. Сжатие аудиоданных на основе психоакустических свойств слуха человека //Естественные и математические науки в современном мире. – 2016 – №. 6 (41). -
Каргин Р. И., Стаценко Л. Г. Форматы сжатия аудиоданных. Анализ и сравнение //Известия СПбГЭТУ ЛЭТИ. – 2019 – №. 9 – С. 31-37. -
Макаров А. В., Афанасьев Г. И. Нюансы использования форматов звуковых файлов //Аллея науки. – 2018 – Т. 4 – №. -
Стефанова И. А., Стефанов М. А., Заболотов В. А. Исследование параметров эффективности сжатия аудиоданных С. 934-941. //Инфокоммуникационные технологии. – 2018 – Т. 16 – №. 3 – С. 328 -
Телятников Л. С. Сжатие информации без потерь //Межвузовская научно-техническая конференция студентов, аспирантов и молодых специалистов имени ЕВ Арменского. – 2019 – С. 104 -
Ярмухаметова А. К. Кодирование и обработка звуковой информации– метод проблемного изложения //Студенческая наука XXI века. – 2016 – №. 2-1. – С. 283-287.