Файл: Системы сжатия цифровых аудиоданных.pdf

ВУЗ: Не указан

Категория: Реферат

Дисциплина: Не указана

Добавлен: 08.07.2023

Просмотров: 106

Скачиваний: 3

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Особенности сжатия цифрового звука

Сегодня большинство из нас имеет дело преимущественно с цифровыми системами воспроизведения звука. В этих системах звук хранится в цифровом виде – то есть – в виде последовательностей нулей и единиц, которые после раскодирования их с помощью специального программного и аппаратного обеспечения, превращаются в звук. В мире цифровой музыки идет борьба, с одной стороны, за качество воспроизведения, а с другой – за объем хранимых данных. Это два противоборствующих понятия – чем выше качество звука, тем, обычно, больше места требуется для его хранения. Для того, чтобы сохранить цифровой звук с как можно более высоким качеством в как можно меньшем объеме информации, были разработаны алгоритмы сжатия звука.

Существует два различных подхода к сжатию аудиоинформации. Первый называется сжатием без потерь (lossless) – в ходе такого сжатия звук, записанный в цифровом виде, сохраняется полностью, без потерь. Другой подход к сжатию аудиоданных называется сжатием с потерями (lossy) – звук особым образом обрабатывается, из него удаляется все, по заключению алгоритма сжатия, лишнее, а то, что остается, сжимается. Такое сжатие, в сравнении со сжатием без потерь, позволяет добиться гораздо более высоких уровней сжатия, то есть – уменьшить размеры звуковых файлов, в то время как качество звучания, если не стараться сжать файл слишком сильно, страдает не особенно заметно.

Музыкальные записи можно сжимать и обычными архиваторами, однако они не могут работать в режиме реального времени, к тому же, уровень сжатия несжатых музыкальных записей редко когда превышает 50%. Другой, используемый на практике, способ сжатия аудиоинформации заключается в применении специальных программ – так называемых кодеков, с помощью которых можно сжимать и "на лету" заниматься раскодированием и воспроизведением сжатых композиций.

Говоря о кодеках для сжатия аудиоинформации, следует различать понятия кодек и контейнер медиаданных. Контейнер – это, упрощенно говоря, некая стандартная оболочка, в которой хранятся аудиоданные, сжатые тем или иным кодеком. Например, в MP4-контейнере могут храниться данные, сжатые различными кодеками – в частности – кодеком сжатия с потерями AAC, кодеком сжатия без потерь ALAС и другими. Обычно для различных типов данных, которые хранятся в MP4-контейнере, применяются различные расширения файла. Точно так же, в WAV-файле могут храниться различные данные – например, сжатые в популярном формате MP3 или несжатая информация в формате PCM – в случае с WAV-файлами расширение имени файла остается неизменным (.wav), а различаются эти файлы лишь по своей внутренней структуре.


Перечень программ

В табл. 3.1. приведены программы, описанные в данной теме. Это, в основном, универсальные программы, вы можете выбрать для кодирования тех или иных файлов любую из них. Входным форматом файлов по умолчанию является WAV, однако практически все программы умеют кодировать музыку между форматами и "разжимать" исходные файлы в стандартные WAV.

Таблица 3.1. Программы и форматы файлов

Программы и форматы

MP3

OGG

WMA

AAC

VQF

FLAC

WAV PACK

APE

ALAC

Lame

+

Winlame

+

+

+

RazorLame

+

Windows Media Encoder

+

aoTuV

+

iTunes

+

ImToo WMA MP3 Converter*

+

+

MP4 Converter**

ImToo Audio Encoder

+

+

+

+

+

+

+

Flac Frontend

+

Cue Splitter***

WavPack Frontend

+

Monkey’s Audio

+

dBpoweramp

+

+

+

+

+

+

+

+

*Программа ImToo WMA MP3 Converter поддерживает большое количество входных форматов файлов, на выходе же могут быть лишь MP3 и WMA.

**Программа MP4 Converter конвертирует видеофайлы различных форматов в формат, понятный плеерам Apple iPod.

***Программа для разбиения больших аудиофайлов в соответствии с индексными картами.


Сжатие с потерями

Среди существующих форматов сжатия аудиоданных с потерями можно отметить "большую четверку" - MP3, WMA, Ogg Vorbis и AAC. Ваш MP3-плеер с практически 100% вероятностью будет поддерживать один из этих форматов, а скорее всего – несколько. Знания о некоторых особенностях форматов будут особенно полезны при практической работе с аудиоинформацией. Например, в следующих лекциях мы рассмотрим ПО для работы со звуком, в частности, подробно остановимся на конверсии звука из одного формата в другой, и если вы будете знать о формате сжатия данных немного больше, чем его название, это может вам неплохо помочь. Итак, начнем с самого популярного формата.

MP3

Полное название MP3 – MPEG 1 Audio Layer 3. MP3 – это формат сжатия аудиоданных с потерями, который добился невероятной популярности по всему миру. В настоящее время существуют варианты стандарта - MPEG-2 Layer 3 и MPEG-2.5 Layer 3.

История MP3 начинается в конце 1980-х годов, когда рабочая группа инженеров института Фраунгофера (Fraunhofer Society) начала работать над проектом DAB (Digital Audio Broadcast). Проект был частью исследовательской программы EUREKA и в ее рамках был известен как EU-147. MP3 стал результатом переработки стандартов сжатия аудиоинформации Musicam и ASPEC, добавления к идеям, используемых в этих стандартах, новых оригинальных концепций. Непосредственное отношение к стандарту имеет так же компания Thomson.

Стандарт развивался в начале 1990-х, в 1995 году была опубликована окончательная версия стандарта, однако еще в 1994 году был создан первый программный MP3-кодировщик, который назывался l3enc. Тогда же было выбрано расширение .mp3 для файлов, закодированных в данном формате, а в 1995 году появился первый программный MP3-проигрыватель Winplay3, доступный широкой общественности. Благодаря высокому качеству музыки при небольшом размере файлов, а так же из-за появления простого и качественного программного обеспечения для проигрывания и создания MP3-файлов (например, широко известного и ныне здравствующего WinAmp’a, который появился еще в середине 1990-х годов), стандарт обрел огромную популярность и пользуется ей до сих пор.

Возможности MP3

Говоря о возможностях формата MP3, пожалуй, надо начать с формата, в котором хранят музыку на обычных музыкальных CD-дисках, на так называемых Audio CD. Звук, записанный на такие диски, имеет вполне определенные характеристики, а именно, это 44.1kHz 16Bit Stereo (44,1 кГц, 16-битный стереозвук). В переводе на нормальный человеческий язык это означает, что каждая секунда звучания состоит из 44100 образцов (этот параметр называют частотой дискретизации), каждый из которых имеет размер 16 бит (то есть – два байта), причем, информация записывается для двух каналов – для правого и для левого. В итоге получается, что для хранения одной секунды музыки в формате Audio CD потребуется 44100*16*2=1411200 бит, или 176400 байт, или 172,2 Кб. Таким образом, пятиминутная композиция займет 176400*5*60=52920000 байт, то есть – почти 50 мегабайт дискового пространства. Даже сегодня, учитывая десятки, а чаще – сотни гигабайт жестких дисков, которые есть в распоряжении обычных пользователей, довольно сложно представить себе музыкальную коллекцию, состоящую исключительно из звука, записанного в таком неэкономном формате. Что и говорить о жестких дисках на пару гигабайт, которые были пределом мечтаний многих лет десять назад.


Файлы, сжатые в MP3 практически без потери первоначального качества, занимают в 6-10 раз меньше места, чем оригинал. То есть из огромного 50-мегабайтного файла получается вполне пристойный 5-мегабайтный. Причем, если сжать такой файл с помощью обычных алгоритмов сжатия (RAR или ZIP, например), которые используются для простых файлов, мы получим, в лучшем случае, 50% выигрыш (то есть файл порядка 25 Мб). В чем же дело? Почему же MP3 способен так сильно сжимать файлы, практически не ухудшая их качества. Ответ на вопрос здесь кроется в слове "практически". Ведь обычное сжатие не изменяет качества композиций, оно полностью сохраняет его, а MP3 проводит некие манипуляции с файлом, которые могут сказаться на его качестве.

Как работает MP3

В основе MP3 лежит множество механизмов сжатия, в частности, так называемое адаптивное кодирование, основанное на психоакустических моделях, которые учитывают особенности восприятия звука человеком и удаляют из него все "лишнее" - все то, что среднестатистическому человеку невозможно услышать при прослушивании композиций. Как мы уже говорили, если не стремиться слишком сильно сжать композицию, применив наиболее качественный вариант MP3-кодирования, то ее размер будет примерно в 6-10 раз меньше оригинала с CD-качеством, а качество этих двух записей будет идентичным – вряд ли даже профессионал различит их. При более высоких уровнях сжатия потери (их еще называют артефактами сжатия) слышны гораздо сильнее, но тот, кто пользуется сильно сжатой MP3-музыкой, сознательно идет на такой шаг. Например, сильно сжатые MP3 чрезвычайно популярны в среде сотовых телефонов – часто встроенной памяти аппарата не хватает для того, чтобы закачать в него достаточное количество качественных MP3, в результате владелец жертвует качеством записи ради количества. Но вернемся к описанию принципов работы MP3, в частности, к психоакустическим моделям.

Адаптивное кодирование, основанное на психоакустических моделях, применяет различные знания об особенностях восприятия звуков человеком. Так, если одновременно воспроизводятся два звуковых сигнала, один из которых слабее, то более слабый сигнал заглушается (или, как говорят, маскируется) более сильным сигналом. В результате получается, что человек слышит более сильный звук, а более слабый – нет. В таком случае информация о более слабом звуке просто отбрасывается. Точно так же происходит, если сразу после громкого звука идет тихий – громкий звук вызывает временное понижение слуховой чувствительности, в результате – тихий звук оказывается не слышным – информацию о нем так же можно убрать. Так же при обработке музыкальных композиций учитывается то, что большинство людей не способны различить сигналы, мощность которых находится ниже определенного уровня для различных частотных диапазонов.


WMA

WMA, или Windows Media Audio – это закрытый стандарт, разработанный компанией Microsoft для хранения аудиоданных. На самом деле существует четыре различных стандарта, говоря о которых обычно употребляют наименование Windows Media Audio.

Наиболее часто под аббревиатурой WMA подразумевается кодек WMA Standard – изначально он разрабатывался как конкурент MP3. В результате немалых усилий со стороны Mirosoft WMA сегодня можно назвать одним из наиболее распространенных форматов после MP3. Например, WMA поддерживает огромное количество плееров. Однако, у WMA, вследствие его закрытости, плохо с поддержкой не-Windows систем. Фактически, лишь пользователи Windows могут комфортно пользоваться WMA.

Файлы формата WMA имеют расширение *.wma.

WMA 7 (его еще называют WMA Standard v1) появился в 1999 году. На сегодняшний день наиболее новая реализация кодека – это WMA 9.2., который входит в состав Windows Media Player 11. WMA поддерживает типы битрейта CBR, VBR и ABR (мы говорили о них выше), а сам битрейт может быть от 5 Кбит/с до 320 Кбит/с с поддержкой стереозвука.

Что касается качества сжатия, то WMA способен создавать файлы меньшего размера, но практически такого же качества, как сопоставимого MP3. По качеству он конкурирует с такими форматами, как OGG Vorbis и AAC, однако, говорить об однозначном преимуществе WMA над MP3 нельзя, так же как и об однозначно сильной конкуренции с другими схожими форматами. Говоря о WMA Standard, можно сказать, что он стоит на одном уровне с MP3, а чаще – даже выше, чем MP3, и, в то же время, составляет конкуренцию другим форматам. На высоких битрейтах WMA и MP3 практически идентичны, а вот на низких WMA выигрывает у MP3 в качестве. Поэтому, если у вас нет каких-либо особых требований к музыкальным композициям, и ваш плеер поддерживает WMA – этот стандарт будет отличным выбором.

Microsoft внедрила в WMA поддержку DRM – цифровой системы управления авторскими правами, что позволяет продавать защищенные композиции, используя специальные сервисы. Поддержка DRM, как мы уже говорили, неоднозначна. С одной стороны – это защита авторских прав, а с другой – мало кому нравится привязка композиции к конкретному компьютеру, группе компьютеров, или ограничение ее срока действия.

Как мы уже говорили, существует несколько вариантов WMA. Помимо наиболее распространенного и популярного WMA Standard, есть WMA Professional (WMA Pro). WMA Pro – это стандарт, который разрабатывался как конкурент для AAC, Dolby Digital и DTS. Он основан на совершенно других алгоритмах кодирования, нежели WMA Standard, что позволяет ему, в частности, добиваться более высокого качества даже на более низких битрейтах. Стандарт поддерживает частоту дискретизации 96 кГц при 24-битной разрядности для 8 каналов (аудиоконфигурация 7.1). В Windows Media Player 11 входит WMA Pro версии 10. WMA Pro поддерживают очень немногие MP3-плееры, например – Microsoft Zune.