Файл: Методы кодирования данных (Кодирование и методы кодирования ).pdf
Добавлен: 23.04.2023
Просмотров: 93
Скачиваний: 1
СОДЕРЖАНИЕ
ГЛАВА 1. КОДИРОВАНИЕ И МЕТОДЫ КОДИРОВАНИЯ
ГЛАВА 2. СУЩЕСТВУЮЩИЕ МЕТОДЫ КОДИРОВАНИЯ ИЗОБРАЖЕНИЙ И ВИДЕО ДАННЫХ
2.1.1. АЛГОРИТМЫ БЕЗ ПОТЕРИ ДАННЫХ
2.1.2. КОДИРОВАНИЕ ДЛИН СЕРИЙ RLE
2.1.3. КОДИРОВАНИЕ МЕТОДОМ LZW
2.1.4. МЕТОД КОДИРОВАНИЯ ХАФФМАНА
2.1.5. АРИФМЕТИЧЕСКОЕ КОДИРОВАНИЕ
2.1.7. АЛГОРИТМЫ С ПОТЕРЕЙ ДАННЫХ
2.1.11. ФРАКТАЛЬНОЕ КОДИРОВАНИЕ
ВВЕДЕНИЕ
Актуальность. В современном информационном мире одной из самых актуальных задач является сжатие фото и видео. Главная цель сжатия – уменьшение избыточности данных, то есть передача только основной, самой значимой части, по которой можно восстановить целиком исходную информацию. Для сжатия графической информации существуют алгоритмы сжатия без потери и с потерей информации. Алгоритмы кодирования без потери информации предоставляют максимально качественное изображение, но сжатие максимум в 2-3 раза. Алгоритмы с потерей информации дают пользо- вателю выбрать степень компрессии и позволяют достигнуть сжатия в сотни раз.
Объект исследования: графическая информация (фото- и видеоизображения)
Предмет исследования: методы их кодирования
Цель работы: изучить методы кодирования данных на примере кодирования изображений.
Задачи:
Рассмотреть существующие виды кодирования изображений и видеоданных;
Исследование искажений при кодировании.
В работе представлен обзор существующих методов сжатия графической информации, сравнение основных алгоритмов. Для исследования искажений кодирования статических изображений были взяты тестовое изображение «метла» и три сюжетных закодированных в формате без потери данных BMP, для видеоизображений – три файла в формате YUV422. Файлы были закодированы различными алгоритмами и сравнивались с оригиналом.
ГЛАВА 1. КОДИРОВАНИЕ И МЕТОДЫ КОДИРОВАНИЯ
Кодирование - это процесс перевода информации, выраженной одной системой знаков, в другую систему, то есть перевод записи на естественном языке в запись с помощью кодов.
Методы кодирования технико-экономической и социальной информации тесно взаимосвязаны с методами классификации. Каждому методу классификации соответствует один или несколько методов кодирования.
В процессе кодирования объектам классификации и их группировкам по определенным правилам присваиваются цифровые, буквенные и буквенно-цифровые коды. Код характеризуется алфавитом, то есть знаками, используемыми для его образования, основанием кода - числом знаков в алфавите кода и длиной кода. [19][1]
К методам кодирования ТЭСИ предъявляются определенные требования, соблюдение которых способствует повышению качества классификатора. Метод кодирования должен:
1. предусматривать использование в качестве алфавита кода десятичных цифр и букв;
2. обеспечивать по возможности минимальную длину кода и достаточный резерв незанятых позиций для кодирования новых объектов без нарушения структуры классификатора;
3. быть максимально ориентированным на автоматизированную обработку информации.
Методы кодирования могут носить самостоятельный характер - регистрационные методы кодирования, или быть основанными на предварительной классификации объектов - классификационные методы кодирования.
Регистрационные методы кодирования бывают двух видов: порядковый и серийно-порядковый.
Порядковый метод кодирования - это такой метод, при котором кодами служат числа натурального ряда. В этом случае каждый из объектов классифицируемого множества кодируется путем присвоения ему текущего порядкового номера. Данный метод кодирования обеспечивает довольно большую долговечность классификатора при незначительной избыточности кода. Этот метод обладает наибольшей простотой, использует наиболее короткие коды и лучше обеспечивает однозначность определения каждого объекта классификации. Кроме того, он обеспечивает наиболее простое присвоение кодов новым объектам, появляющимся в процессе ведения классификатора. Существенным недостатком порядкового метода кодирования является отсутствие в коде какой-либо конкретной информации о свойствах объекта, а также сложность машинной обработки информации при получении итогов по группе объектов классификации с одинаковыми признаками. Этот метод кодирования не обеспечивает возможности размещения вновь появившихся объектов классификации в необходимом месте классификатора, так как резервные коды располагаются в конце ряда. По этим причинам порядковый метод кодирования отдельно очень редко применяется при создании классификаторов ТЭСИ. Чаше всего он применяется в сочетании с другими методами кодирования. [12][2]
Серийно-порядковый метод кодирования - это такой метод, при котором кодами служат числа натурального ряда с закреплением отдельных серий этих чисел (интервалов натурального ряда) за объектами классификации с одинаковыми признаками. В каждой серии, кроме кодов имеющихся объектов классификации, предусматривается определенное количество кодов для резерва. Резерв кодов располагается в середине или в конце серии. Это является большим преимуществом данного метола по сравнению с порядковым методом кодирования. Серийно-порядковый метод кодирования целесообразно применять для объектов, имеющих два соподчиненных признака. Данный метод кодирования обладает всеми преимуществами и недостатками порядкового метода кодирования. Несмотря на наличие в кодах, построенных по этому методу кодирования, определенных элементов классификации, они чаще всего используются для идентификации объектов в сочетании с классификационными методами кодирования.
Классификационные методы кодирования бывают двух видов: последовательный и параллельный. [3][3]
1. Последовательный метод кодирования -это такой метод, при котором код классификационной группировки и (или) объекта классификации образуется с использованием кодов последовательно расположенных подчиненных группировок, полученных при иерархическом методе классификации. В этом случае код нижестоящей группировки образуется путем добавления соответствующего количества разрядов к коду вышестоящей группировки. Последовательный метод кодирования чаше всего используется при иерархическом методе классификации.
Преимуществами последовательного метода кодирования являются логичность построения кода и большая емкость. Вместе с тем он обладает всеми недостатками, присущими иерархическому методу классификации, а также ограниченными возможностями идентификации объектов. Использование последовательного метода кодирования связано с определенными трудностями, обусловленными тем, что в результате зависимости значений последующих разрядов кода от предыдущих применять этот код по частям нельзя, группировать объекты по различным сочетаниям имеющихся признаков сложно, практически невозможно вносить новые признаки и производить изменения в коде без коренной перестройки классификатора. Поэтому применять последовательный метод кодирования целесообразно в тех случаях, когда набор признаков классификации и их последовательность стабильны в течение длительного времени. [5][4]
2. Параллельный метод кодирования - это метод, при котором код классификационной группировки и (или) объекта классификации образуется с использованием кодов независимых группировок, полученных при фасетном методе классификации. При этом методе кодирования признаки объекта кодируются независимо друг от друга. Для параллельного метода кодирования возможны два варианта записи кодов объектов:
1. Каждый фасет и признак внутри фасета имеют свои коды, которые включаются в состав кода объекта. Такой способ записи удобно применять тогда, когда объекты характеризуются неодинаковым набором признаков и различным их числом. При формировании кода какого-либо объекта берутся только необходимые признаки;
2. Для определенных групп объектов выделяется фиксированный набор признаков и устанавливается стабильный порядок их следования, то есть устанавливается фасетная формула. В этом случае не надо каждый раз указывать, значение какого признака приведено в определенных разрядах кода объекта.
Параллельный метод кодирования имеет ряд преимуществ. К достоинствам рассматриваемого метода кодирования относится гибкость структуры кода, обусловленная независимостью признаков, из кодов которых строится код объекта классификации. Метод позволяет использовать при решении конкретных технико-экономических и социальных задач коды только тех признаков объектов, которые необходимы, что дает возможность работать в каждом отдельном случае с кодами небольшой длины. При этом методе кодирования можно осуществлять группировку объектов по любому сочетанию признаков. Параллельный метод кодирования хорошо приспособлен для машинной обработки информации. По конкретной кодовой комбинации легко указать, набором каких характеристик обладает рассматриваемый объект. При этом из небольшого числа признаков можно образовать большое число кодовых комбинаций. Набор признаков при необходимости может легко пополняться присоединением кода нового признака. Это свойство параллельного метода кодирования особенно важно при решении технико-экономических задач, состав которых часто меняется. [3][5]
Параллельный метод кодирования целесообразно использовать для кодирования однородных объектов, так как в противном случае реальной становится лишь незначительная часть сочетаний признаков, и емкость классификатора будет использоваться не полностью. Это является недостатком данного метода кодирования. К недостаткам метода можно отнести также и другие недостатки, присущие фасетному методу классификации.
Перечисленные классификационные методы кодирования характеризуются тем, что даже при глубокой классификации объектов код несет информацию о классификационной группировке, но не всегда идентифицирует конкретный объект, а коды, полученные на основе идентификационных методов, хорошо выполняя функцию идентификации объектов, практически не несут информацию об их свойствах. Поэтому идентификационные и классификационные методы кодирования чаше всего применяются в классификаторах в сочетании друг с другом.
Одним из наиболее узких мест во всей технологии использования классификаторов информации является кодирование и ввод данных. С целью устранения этого проводятся исследования по автоматизации процесса кодирования информации. Однако для реализации автоматизированного процесса кодирования требуются большие объемы памяти, так как вначале вся информация вводится на естественном языке, и связанные с этим большие трудозатраты. Другим направлением снижения трудозатрат в процессе кодирования и ускорения этого процесса является использование штриховых (линейных) кодов.
Преимущества штриховых кодов состоят в следующем:
1. резкое снижение числа ошибок при вводе информации в виде штриховых кодов по сравнению с вводом информации с клавиатуры на естественном языке;
2. легкость считывания штриховых кодов электронными оптическими системами по сравнению с буквенно-цифровыми символами;
3. высокая экономическая эффективность применения систем на основе штриховых кодов вследствие резкого снижения стоимости ввода данных в систему.
Штриховой (линейный) код представляет собой комбинацию вертикальных полосок разной ширины и пробелов между ними. При этом за базу принимается ширина узкого элемента (полоски) кода. Широкие полоски должны быть кратными им по ширине или находиться с ними в определенных соотношениях. В основе штрихового кода лежит цифровой код.
В разных странах используются различные виды штриховых кодов. В каждом из них установлено определенное соотношение между широкими и узкими полосками и между полосками и интервалами между ними. Так, в "Коде 39" каждому знаку цифрового кода соответствует комбинация из девяти элементов (три широких полоски и шесть узких) и из них пять штрихов и четыре интервала между ними.
Разработка штриховых кодов осуществляется Международной ассоциацией по нумерации (ЕАН), коды которой являются наиболее распространенными в Европе. Наша страна с 1987 года также стала членом ЕАН. В 1988 году Госстандарт СССР утвердил РД 50-666-88 "Методические указания. Присвоение цифровых кодов товарам народного потребления". Этим документом устанавливались правила присвоения товарам народного потребления цифровых (торговых) кодов. Эти цифровые коды служат основой для штриховых кодов, наносимых на ярлыки, упаковку и этикетки товаров. Такой цифровой (торговый) код строится в полном соответствии с кодом ЕАН-13. Он состоит из тринадцати разрядов и имеет следующую структуру:
1. 2 знака - идентификатор страны-изготовителя товара;
2. 5 знаков - идентификатор фирмы-изготовителя товара;
3. 5 знаков - идентификатор товара;
4. 1 знак - контрольное число.
В этом коде, например, США и Канада имеют идентификаторы с 00 до 09, Франция - с 30 до 37, ФРГ - с 40 до 43, СНГ - 46, Япония - 49, Италия -с 80 до 83, Корея -88 и так далее.
В штриховом коде, построенном на основе ЕАН-13, каждому знаку цифрового кода соответствует комбинация из семи элементов - штрихов и пробелов между ними.
Штриховые коды могут использоваться кроме торговли также в таких областях, как медицина, банковское дело, промышленность и других. При этом в качестве цифровых кодов для них могут использоваться коды классификаторов ТЭСИ. [10][6]