Файл: Методы кодирования данных (История кодирования).pdf

ВУЗ: Не указан

Категория: Курсовая работа

Дисциплина: Не указана

Добавлен: 29.06.2023

Просмотров: 79

Скачиваний: 3

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Рассмотрим на примере принцип кодирования текста. Пусть, необходимо закодировать слово «ЭВМ» в различных кодировках.

Даны таблицы кодировок[2], по которым и найдем ответ.

Рис.2.1.1.КОИ8-Р

Рис.2.1.2. CP1251

Рис.2.1.3. CP866

Рис.2.1.4. ISO 8859-5

Рис.2.1.5. ASCII

Решение: Находим в таблице необходимую букву и записываем её код.

Ответ:

КОИ8-Р

252 247 237

CP1251

221 194 204

CP866

157 130 140

ISO 8859-5

205 178 188

ASCII

-

Над отдельными знаками текста выполняется главная операция – сравнение, при котором рассматриваются условия, наиболее важные из коих:

  1. Уникальность кода для каждого знака;
  2. Длина кода.

2.2.Кодирование числовой информации

Кодировка чисел имеет схожесть с кодировкой текста, а именно – операция сравнение – любое число должно обладать уникальным кодом.

Также есть и отличие между кодированием чисел и текста, а именно – помимо операции сравнения выполняются и математические операции. Математические операции – сложение, логарифм, умножение и другие.

Представление числовой информации может быть в двух формах – либо целые, либо вещественные числа.

Целые числа хранятся и обрабатываются в формате вещественных чисел с фиксированной запятой. А именно, всякому разряду ячейки памяти постоянно соответствует один и тот же разряд числа, притом запятая располагается справа от младшего разряда (вне разрядной сетки).

Для кодирования целых чисел со знаком выделяется байтабитов. Один разряд (1 бит) выделяется под знак числа ( для положительных и для отрицательных чисел). Другие битов – под цифры двоичного представления числа (Рис.2.2.1).

Рис.2.2.1.Кодирование целого числа[3]


Вещественные же числа хранятся и обрабатываются в формате вещественных чисел с плавающей запятой. А именно, положение запятой незафиксировано (может меняться) в записи числа. Данный формат основан на экспоненциальной форме записи, в которой всякое число может быть представлено в двоичной с.с.:

(2.2.1)

Здесь - мантисса числа; - порядок числа.

Пример:

Для хранения вещественных чисел выделяется байта бита. Притом первый бит выделяется под знак числа, последующие бита – под цифры мантиссы, а оставшиеся 8 битов – под порядок числа.

2.3.Кодирование графической информации

Впервые кодирование графики было применено в середине 50-х годов. Интенсивнее данное кодирование стало развиваться уже в 80–х годах.

Графическую информацию (ГИ) можно представить в двух видах:

  1. аналоговый;
  2. дискретный.

Картина, изменение цвета которой непрерывно – аналоговое представление. Дискретное же представление – это точечное изображение.

Разбивая графическое изображение на точки (дискритизация), аналоговая ГИ трансформируется в дискретную. Притом совершается кодирование ГИ.

При кодировке ГИ совершается пространственная дискретизация. Данная дискретизация подобна мозаике, изображение создаётся из маленьких разноцветных фрагментов. Притом всё изображение делится на индивидуальные точки, и всякому компоненту устанавливается личный код цвета. Причем качество кодирования ГИ определяется двумя параметрами:

    1. размер точки;
    2. число используемых цветов.

Зависимость следующая: чем меньше размер точки, тем больше число точек, а, значит, и качество изображения будет наиболее выше. Качество кодирования ГИ имеет следующую зависимость: при использовании большего числа цветов, увеличивается количество информации, которую несёт всякая точка, а, значит и качество кодирования возрастает.

Графические объекты могут существовать в нескольких видах:

  1. растровый;
  2. векторный;
  3. фрактальный;
  4. трёхмерная графика.

Изображение на экране представлено в растровом виде. Рисунок разбивается на точки, затем с левого угла передвигаясь построчно, последовательно кодируется цвет у каждой точки. Индивидуальная точка именуется пикселем. Произведение информационного числа точки на число пикселей определяет объём изображения. Разрешающая способность монитора определяет качество изображения. Зависимость прямая: чем разрешающая способность, тем качество.


Примеры разрешающей способности: и другие.

При кодировании ГИ: цвет пикселя есть его код. Для кодирования чёрно-белой иллюстрации достаточно одного бита памяти, соответственно – чёрный, а - белый. В случае изображений в виде комбинации точек с 256 градациями серого цвета (который общеприняты сегодня), вполне достаточно восьмиразрядного двоичного числа для кодировки.

Для кодирования цветного изображения используют соответствующие кодировки (Табл.2.3.1):

  1. HSB – удобна для человека;
  2. RGB – удобна для компьютера;
  3. CMYK – удобна для типографий.

Применение данных цветовых моделей поясняется тем, что световой поток может формироваться излучениями, представляющими собой комбинацию " чистых" спектральных цветов : красного, зеленого, синего или их производных. Различают аддитивное цветовоспроизведение (характерно для излучающих объектов) и субтрактивное цветовоспроизведение (характерно для отражающих объектов). В качестве примера объекта первого типа можно привести электронно-лучевую трубку монитора, второго типа - полиграфический отпечаток.

Название

Описание

HSB

Характеризуется тремя элементами: оттенок цвета (Hue), насыщенность цвета (Saturation) и яркость цвета (Brightness). Можно получить большое число произвольных цветов, регулируя данные элементы. Данную модель лучше использовать в таких графических редакторах, в которых иллюстрации создают сами, а не обрабатывают уже готовые. Далее созданное свое творение можно преобразовать в RGB, в случае её применения в качестве экранной иллюстрации, или CMYK, в качестве печатной.

Значение цвета выбирается как вектор, выходящий из центра окружности. Направление вектора задается в угловых градусах и определяет цветовой оттенок. Насыщенность цвета определяется длиной вектора, а яркость цвета задается на отдельной оси, нулевая точка которой имеет черный цвет. Точка в центре соответствует белому (нейтральному) цвету, а точки по периметру - чистым цветам.

RGB

Известно, что всякий цвет можно представить в виде комбинации трех цветов: красного (Red, R), зеленого (Green, G), синего (Blue, B). Иные цвета и их оттенки получаются за счет наличия или отсутствия данных составляющих. По первым буквам основных цветов система и получила свое название - RGB. Данная модель - аддитивная, а именно, сочетая основные цвета в разных пропорциях, можно получить необходимый цвет. При наложении одного компонента основного цвета на другой яркость суммарного излучения возрастает. В случае совмещения всех трёх компонент, выходит ахроматический серый цвет, при увеличении яркости которого происходит приближение к белому цвету.

При градациях тона (всякая точка кодируется байтами) минимальные значения RGB соответствуют черному цвету, а белому - максимальные с координатами . Чем выше величина байта цветовой составляющей, тем ярче данный цвет. Например, тёмно-синий кодируется тремя байтами , а ярко-синий

CMYK

Применяется при подготовке публикаций к печати. Всякому из основных цветов ставится в соответствие дополнительный цвет (дополняющий основной до белого). Получают дополнительный цвет за счёт суммирования пары остальных основных цветов. Следовательно, дополнительными цветами для красного является голубой (Cyan,C) = зеленый + синий = белый - красный, для зеленого - пурпурный (Magenta, M) = красный + синий = белый - зеленый, для синего - желтый (Yellow, Y) = красный + зеленый = белый - синий. При этом принцип декомпозиции произвольного цвета на составляющие можно использовать как для основных, так и для дополнительных. А именно, всякий цвет можно представить или в виде суммы красной, зеленой, синей составляющей или же в виде суммы голубой, пурупурной, желтой составляющей. Обычно данный метод применяется в полиграфии. Однако там ещё используют черный цвет (BlacК, поскольку буква В занята синим цветом, то обозначают буквой K). Причина этого в том, что наложение друг на друга дополнительных цветов не даёт чистого черного цвета.

Таблица 2.3.1.Цветовые модели


Существует следующие режимы демонстрации цветной графики:

  1. полноцветный (True Color);
  2. High Color;
  3. индексный.

Для кодирования яркости составляющих при полноцветном режиме применяют по значений (восемь двоичных разрядов), а именно, на кодирование цвета пикселя (в RGB) необходимо затратить разряда. Это позволяет однозначно определять цветов. А это довольно близко к чувствительности человеческого глаза. При кодировании с помощью CMYK для демонстрации цветной графики нужно иметь двоичных разряда.

Режим High Color - это кодирование при помощи двоичных чисел, а именно, уменьшается число двоичных разрядов при кодировке всякой точки. Однако при этом значительно понижается диапазон кодируемых цветов.

При индексном кодировании цвета можно передать лишь цветовых оттенков. Всякий цвет кодируется с помощью восьми бит данных. Однако, поскольку значений не передают весь диапазон цветов, доступный человеческому глазу, то подразумевается, что к ГИ прилагается палитра (или же справочная таблица). Без неё демонстрация будет непонятная: море - красное, а листья - фиолетовые. Притом код точки растра в таком случае означает не сам цвет, а лишь его номер/индекс в палитре. Отсюда и вытекает название режима - индексный.

Соответствие между числом отображаемых цветов () и числом бит для кодировки () вычисляется по формуле 2.3.1.:

(2.3.1)

Двоичный код выводимого на экран изображения хранится в видеопамяти. Видеопамять - это электронное энергозависимое запоминающее устройство. Размер видеопамяти зависит от разрешающей способности дисплея и количества цветов. Однако её наименьший объём вычисляется так, чтобы влез один кадр/одна страница изображения, а именно, как результат произведения разрешающей способности на размер кода пикселя.

(2.3.2)

Векторное изображение - графический объект, состоящий из элементарных отрезков и дуг.

Базовым компонентом иллюстрации является линия, имеющая следующие свойства:

  1. форма (прямая, кривая);
  2. толщина;
  3. цвет;
  4. начертание (пунктирное, сплошное).

Замкнутые линии обладают свойством заполнения.

Линия – единый объект, поэтому в векторной графике объём данных для демонстрации объекта достаточно меньше, чем в растровой графике. ГИ о векторном изображении кодируется как обычная буквенно-цифровая и обрабатывается специальными программами: Adobe Illustrator, CorelDraw, трассировщики.


Фрактальная графика основывается также на математических вычислениях. Однако по сравнению с векторной её базовым компонентом является сама математическая формула. Потому в памяти ПК не хранится никаких объектов и изображение строится только по уравнениям. Используя данный способ можно создавать простейшие регулярные структуры, сложные иллюстрации, имитирующие ландшафты.

2.4.Кодирование Звуковой информации

Компьютер функционирует с цифровой информацией (ЦИ). Её можно вообразить в виде серии электрических импульсов - логических нулей и единиц. Однако человек слышит непрерывный звук. Данная звуковая волна, имеющая изменяющейся амплитуду и частоту, есть аналоговый сигнал. Для записи данного звука на ПК необходима его оцифровка. Это деятельность аналого-цифрового преобразователя (АЦП). АЦП для воспроизведения цифрового звука преобразует его в аналоговый.

Непрерывная звуковая волна разделяется на отдельные участки по времени, для каждого устанавливается своя величина амплитуды. Притом всякой ступеньке задаётся свой уровень громкости звука, который можно рассматривать как набор возможных состояний.

Звук обладает следующими характеристиками:

  1. Глубина кодирования звука - число бит на один звуковой сигнал. Современные звуковые карты обеспечивают глубину кодирования звука. Число уровней можно вычислить по формуле 2.4.1:

(2.4.1)

  1. Частота дискретизации – число измерений уровней сигнала за секунду. Одно измерение в секунду соответствует частоте . Например, при записи на CD применяются значения, а частота дискретизации равна .

Данные параметры обеспечивают достаточно высокое качество звучания и речи, и музыки. Для стереозвука отдельно записывают данные и для левого, и для правого канала.

В случае преобразования звука в электрический сигнал, будет видно плавно изменяющееся с течением времени напряжение. Для ПК-обработки данный аналоговый сигнал необходимо каким-то образом преобразовать в последовательность двоичных чисел. Сначала измеряется напряжение через равные промежутки времени, затем заносятся полученные величины в память ПК. Данный процесс и есть дискретизация/оцифровка. Соответственно, устройство, реализующее процесс – АЦП.

Есть следующая взаимосвязь: чем больше частота дискретизации (число отсчетов за секунду) и чем больше разрядов выделяется для всякого отсчёта, тем качественнее получится звук. Однако при этом возрастает и размер звукового файла. Потому ориентируясь на характер звука, требования, предъявляемые к его качеству и объёму занимаемой памяти, выбираются некоторые компромиссные величины.