Файл: Анализ методов кодирования данных (Основы теории кодирования данных).pdf
Добавлен: 31.03.2023
Просмотров: 79
Скачиваний: 2
Введение
Важнейшей частью такой науки как информатики является теория информации, что занимается изучением принципов информации как таковой, появлением ее, развитием и уничтожением. Для этой науке очень близко примыкает и теория кодирования, в задачи которой входит изучение разных форм представления информации в ее передаче по самым различным каналам связи.
Тема, рассматриваемая в данном курсовом исследовании – актуальна, поскольку кодирование информации – это одна из самых первых обязанностей программистов для обеспечения надежной работы проектируемой информационной системы.
На первый взгляд понятие кодирования информации – это очень сложное дело, с которым далеко не всем справиться.
Но все это может рассматриваться как увлекательный и захватывающий процесс.
Разные учащиеся с удовольствием рассматривают, изучают методы расшифровки текстов, создают собственные шифры, изучают и рассматривают шифрующие устройства по кодированию и декодированию информации, получившие свое последующее развитие еще в эпоху Возрождения.
Целью работы является описание принципов и методов кодирования данных.
Исходя из цели в работе необходимо выполнить задачи:
– выполнить обработку литературы по теории кодирования;
– рассмотреть основные определения, а также классификацию методов кодирования;
– дать характеристику процессу кодирования информации разных видов информации
- рассмотреть основные системы для выполнения кодирования;
- описать особенности развития систем кодирования.
Объектом исследования является теория цифрового кодирования информации.
Предмет исследования – анализ методов кодирования информации и сообщений.
По мере развития современной вычислительной техники возникали также разные методики кодирования, которые исследовались разными учеными: Динман М.И. [6], Р. Лафоре, [13], Харви Дейтел [10].
Глава 1. Основы теории кодирования данных
Основные определения
Информация – сведения об объектах или явлениях окружающей среды, а также их параметрах, свойствах, состояниях, которые уменьшают уже имеющуюся степень неопределенности или неполноты знаний.[5]
В процессе обработки данных информация может менять структуру или форму. Признаком такой структуры являются элементы специальной информации, а также их взаимосвязь.
Все формы представления информации также могут быть различны. Главными из них являются следующие:[5]
– символьная;
– жестов и мимики;
– текстовая;
– световых и звуковых сигналов;
– графическая;
– электрических или нервных импульсов;
– радиоволн;
– магнитных записей;
– запахов или вкусовых ощущений и т.п.
В нынешней повседневной практике такие основные понятия, как информация или данные, часто рассматриваются в качестве синонимов. На самом деле имеются между ними существенные различия.
Данными является информация, представленная в самом удобном для их обработки виде. Все данные могут быть также представлены в виде текстов, графики, аудиовизуального ряда. [10]
Любое представление данных называется специальным языком информатики, что представляются совокупностью символов, соглашений и определенных правил, используемых для тесного общения, отображения, а также передачи информации в цифровом виде.
Стоит отметить, что информация имеет несколько основных свойств (рисунок 1):
Рисунок 1 – Свойства информации
Информация может классифицироваться по следующим признакам (рисунок 2):
Рисунок 2 – Классификация информации
Все люди имеют дело с многими видами информации. Когда услышав прогноз погоды, можно также записать его в персональный компьютер (ПК), чтобы затем им воспользоваться.
В ПК можно поместить и фотографию своего друга и видеосъемку о проведенных каникулах. Но ввести в ПК вкус мороженого или же мягкость покрывала – нельзя.
Компьютером является электронная машина, которая выполняет работу с сигналами. Компьютер также может работать лишь с такой информацией, что можно превратить в некоторые сигналы. Если бы все люди умели превращать в специальные сигналы вкус и запах, то ПК мог бы работать с такой информацией. [4]
Для компьютера очень хорошо может получаться работать с числами и символами. Он может делать все, что угодно с ними. Все числа в ПК закодированы "двоичным кодом", представлены с помощью двух символов 1 или 0, которые легко представлены сигналами.
Вся информация для которой работает КП кодируется числами. Независимо от этого, графическая, текстовая, звуковая ли эта информация, что ее мог бы обрабатывать центральный процессор ПК она должна тем и иным образом может быть представлена числами.
Для преобразования числовой, графической, текстовой, звуковой информации в бинарную необходимо применить принцип кодирования
Кодирование – преобразование данных с одного типа через информацию другого типа.
В ПК применяется система для двоичного кодирования, основанная на принципах представления данных последовательностью 2-х знаков: 1 или 0, которые называются еще двоичными цифрами.
На рисунке 3 показан пример кодирования элементарной информации:
Рисунок 3 – Пример кодирования информации
1.2. Кодирование основных типов информации
Множество символов, что используются при записи текста, называют алфавитом. Количество таких символов в алфавите называют его мощностью.
Для такого представления информации на ПК в виде текстов чаще всего используется специальный алфавит мощностью в 256 символа.
Один символ с такого алфавита несет сразу 8 бит информации, поскольку 28 = 256.
Но также 8 бит составляют и один байт, следовательно, бинарный код каждого символа будет занимать только 1 байт памяти ПК. Все символы этого алфавита пронумерованы с 0 до 255, каждому номеру соответствует свой 8-разрядный двоичный код с 00000000 до 11111111. [8]
Такой код является порядковым значением символа в бинарной системе счисления.
Для самых разных типов ПК и операционных систем (ОС) используются различные таблицы для кодировки, отличающиеся порядком размещения всех символов алфавита в таблице. Международным стандартом в ПК является таблица ASCII (рисунок 4).
Рисунок 4 – Пример таблицы ASCII
Принцип последовательного процесса кодирования алфавита заключается также в том, что в приведенной кодовой таблице ASCII все латинские буквы (и прописные, и строчные) располагаются только в алфавитном порядке.
Непосредственное расположение цифр также может быть упорядочено в направлении возрастания значений.[12]
Стандартными в такой таблице являются лишь первые 128 символов, поскольку символы с номерами с нуля (бинарный код 00000000) и до 127 (01111111).
Входят сюда буквы латинского алфавита, знаки препинания, цифры, скобки и некоторые иные символы. Остальные 128 символов, начиная с 128 (код 10000000) и кончая значением 255 (11111111), используются только для кодировки букв для национальных алфавитов, символов из псевдографики и разных научных символов.
Сейчас есть несколько различных таблиц для кодировки русских букв (СР-1251, СР-866, КОИ-8, Mac, ISO), причем все тексты, созданные также в одной из кодировок, могут неправильно отображаться также в другой. Решается и такая проблема с использованием специальных программ перевода текстов из одной кодировки сразу в другую.
В ОС Windows пришлось передвинуть также русские буквы в таблицах на место псевдографики, получили кодировку Win-1251.
В течение многого времени термины «байт» и «символ» стали почти синонимами. Но, в конце концов, было ясно, что сразу 256 различных символов – не очень много.
Математикам надо использовать в формулах также специальные математические знаки, а переводчикам необходимо создавать иногда тексты, где могут встречаться символы из самых различных алфавитов, экономистам надобны символы валют (£, $, ¥). [3]
Для решения такой проблемы была разработана универсальная система для кодирования текстовой информации под названием Unicode. В данной кодировке для каждого символа будет отводится не один, сразу два байта, то есть шестнадцать бит.
Графический формат – способ записи графических данных. Графические форматы файлов также предназначены для хранения разных изображений, таких как рисунки и фотографии.
Почти все создаваемые, а также обрабатываемые или просматриваемые при использовании компьютера изображения можно также разделить на 2 большие части, а именно векторную и растровую графику.
Для представления графических данных растровым способом используется точечный подход. На самом первом этапе горизонтальными и вертикальными линиями делят изображение. Чем больше получилось элементов (пикселей) при этом, тем точнее будет передаваться информация об изображении.
На рисунке 5 показаны различия в принципах кодирования графической информации:
Рисунок 5 – Примеры векторной и растровой графики
Любой цвет может представляться в виде суммы самой различной яркости красного, синего и зеленого цветов. Поэтому надо кодировать информацию о яркостях каждого из 3-х цветов для отображения пикселя. В видеопамяти будет находиться двоичная информация на изображении, выводимом на дисплей.[6]
Таким образом, все растровые изображения представляются однослойной сеткой точек, называемых пикселями, а код пикселя может содержать информацию о цвете.[3]
Для черно-белого изображения пиксель может принимать лишь два значения: черный и белый (не светится и светится), а для его закодирования достаточно только одного бита.
Пиксель на цветном дисплее имеет различную окраску, поэтому только одного бита на пиксель будет недостаточно. Для кодирования, к примеру, 4-цветного изображения нужны два бита на один пиксель, поскольку 2 бита могут принимать 4 различных состояния.
На RGB-мониторах разнообразие всех цветов получается сочетанием основных цветов: красного, зеленого, синего, из которых можно получать 8 основных комбинаций.
Из курса физики уже известно, что звук – колебание частиц воздуха, а также непрерывный сигнал с изменчивой амплитудой.
При кодировании звуковой информации этот сигнал надо представлять в виде последовательности единиц и нулей.
Через равные промежутки по времени, очень часто измеряется амплитуда колебаний. Все измерения производится с точностью и записывается с помощью двоичного вида. Частоту, с которой и записывается амплитуда, называются частотой дискретизации. Полученный сигнал сначала сглаживается с помощью аналогового фильтра, а потом преобразуется в звук усилителями и динамиками.[9]
На качество воспроизведения кодированного звука в главном влияют 2 параметра: частота дискретизации – это количество измерений амплитуды в секунду в герцах, а также глубина кодирования звука – это размер в битах, что отводится под запись значений амплитуды.
К примеру, при записи на CD-диски используются 16-разрядные их значения, а частота для дискретизации равна 44030 Гц. Такие параметры обеспечивают отличное качество звучания музыки и речи. Для стереозвука отдельно также записывают данные с левого и правого канала.
Если преобразовывать звук в электрические сигналы (к примеру, с помощью микрофона), будет выполнено плавно изменяющееся с течением некоторого времени напряжение. Для обработки такой сигнал нужно преобразовать каким-то образом в последовательность бинарных чисел.
Для того чтобы воспроизводить закодированный звук, нужно выполнять обратное преобразование, а затем сглаживая получившийся ступенчатый сигнал.
Чем частота дискретизации выше (количество отсчетов в секунду) и чем больше таких разрядов отводится для отсчета, тем точнее представлен звук. Также при этом увеличивается размер звукового файла. Поэтому для хранения характера звука, требований, что предъявляются к его качеству или объему занимаемой памяти, могут выбирать некоторые компромиссные значения параметров.
Описанный способ для кодирования звуковой информации универсален, он позволяет представлять любой звук и его преобразовывать самыми разными методами (рисунок 6).[2]
Рисунок 6 – Принцип кодирования звуковой информации
В результате написания первого раздела курсовой работы подробно рассмотрены все основные определения теории кодирования, представлены методы классификации для самых популярных видов информации.