Файл: Способы представления данных в информационных системах(Представление и кодирование числовой информации).pdf

ВУЗ: Не указан

Категория: Курсовая работа

Дисциплина: Не указана

Добавлен: 17.05.2023

Просмотров: 94

Скачиваний: 3

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

ВВЕДЕНИЕ

Вычислительная техника первоначально возникла как средство автоматизации вычислений. Следующим типом обрабатываемой информации был текст. Сначала тексты просто объясняли труднодоступные столбцы чисел, но затем машины начали преобразовывать текстовую информацию все более и более значительными способами [7].

Естественно, оформление текстов достаточно быстро вызывает у людей желание дополнить их графиками и рисунками. Предпринимались попытки частично решить эти проблемы в рамках символического подхода: вводились специальные символы для рисования таблиц и диаграмм (их называли псевдографическими). Но практические потребности людей в графике сделали ее появление среди видов компьютерной информации неизбежным. Цифры, тексты и графика составляли относительно замкнутый набор, достаточный для решения многих компьютерных задач [9]. Наконец, относительно недавно постоянное увеличение скорости компьютерной техники создало широкие технические возможности для обработки аудиоинформации, а также для быстрого изменения изображений (видео) - компьютер стал мультимедийным [11]. Все это привело к разработке способов представления и кодирования различных видов информации в компьютере. Представление информации происходит в различных формах в процессе восприятия окружающей среды живыми организмами и человеком, в процессах обмена информацией между человеком и человеком, человеком и компьютером, компьютером и компьютером и так далее. Преобразование информации из одной формы представления (знаковой системы) в другую называется кодированием. Много информации, которую человек получает, надо как - то запомнить или сохранить. На помощь приходит персональный компьютер. Никто не задумывается о том, как информация размещается на небольших и удобных флеш - картах, и, конечно же, на жестком диске компьютера.

Концептуальные вопросы, касающиеся информации и информационных технологий, рассматривались такими зарубежными учеными как Хонекамп Д., Вилькен П. Буч Г., Чаудхури С., Дайал У., Ганти В. и другими. В нашей стране данная проблематика получила свое развитие в трудах таких ученых как П.А. Гудков, А.А. Сахаров, А.С. Рыков, Пархоменко А. В., Кузовенкова Н. А., Шинкарук О. В. и других. Многочисленные исследования упомянутых авторов, безусловно, существенно упрощают поиск решений проблем в сфере представления данных в информационных системах, и доказывают значимость решения проблемных вопросов, которые свойственны современной прикладной информатике.


Объектом изучения, представленным в теоретической части являются данные в компьютере. Предметом исследования является информация и данные

Цель курсовой работы - рассмотреть представление и кодирование информации в компьютере.

Для достижения поставленной цели необходимо решить следующие задачи:

  • рассмотреть представление и кодирование числовой информации;
  • рассмотреть представление и кодирование текстовой информации;
  • рассмотреть представление цветной и графической информации;
  • рассмотреть представление и кодирование звуковой информации;
  • изучить информационную модель и ее описание;
  • изучить используемые классификаторы и системы кодирования;
  • изучить уровни проблем передачи информации;
  • изучить меры и качество информации;
  • рассмотреть представление информации в информационных системах;
  • решить задачу представления информации;
  • составить компьютерную модель решения задачи.

Работа состоит из двух глав, введения, заключения и списка использованных источников.

1 ПРЕДСТАВЛЕНИЕ И КОДИРОВАНИЕ ИНФОРМАЦИИ

1.1 Представление и кодирование числовой информации

Представление чисел в памяти компьютера имеет специфическую осо­бенность, связанную с тем, что в памяти компьютера числа должны рас­полагаться в байтах - минимальных по размеру адресуемых ячейках па­мяти. Адресом числа считают адрес первого байта. В байте может содер­жаться произвольный код из восьми двоичных разрядов [4].

Целые числа представляются в памяти компьютера с фиксирован­ной запятой. В этом случае каждому разряду ячейки памяти компьютера соответствует один и тот же разряд числа, запятая находится справа после младшего разряда (то есть вне разрядной сетки). Для кодирования целых чисел от 0 до 255 достаточно иметь 8 разрядов двоичного кода (8 бит) [6].

Таблица 1

Системы счисления

Система счисления

Основание

Алфавит цифр

Десятичная

10

0, 1, 2, 3, 4, 5, 6, 7, 8, 9

Двоичная

2

0, 1

Источник: Вирт Никлаус Алгоритмы и структуры данных (+ CD - ROM) / Никлаус Вирт. - М.: ДМК Пресс, 2015. - 272 c


Если для представления целого числа в памяти компьютера отведено N бит, то количество различных значений будет равно 2N. Максимальное значение целого неотрицательного числа достигается в случае, когда во всех ячейках стоят единицы [12]. Если под представление целого положительного числа отведено N бит, то максимальное значение будет равно 2N - 1. Прямой код целого числа может быть получен следующим образом: число переводится в двоичную систему счисления, а затем его двоичную запись слева дополняют необходимым количеством незначащих нулей, соответствующим количеству незаполненных разрядов, отведённых для хранения числа.

Для представления целых чисел со знаком старший (левый) разряд отводится под знак числа. Если число положительное, то в знаковый раз­ряд записывается 0, если число отрицательное, то – 1 [9]. Максимальное значение целого числа со знаком достигается в случае, когда в старшем разряде стоит 0, а во всех остальных ячейках стоят еди­ницы. Если под представление целого числа со знаком отведено N бит, то максимальное значение будет равно 2N - 1 - 1. Поскольку количество возможных значений в N битах равно 2N - 1, то в случае представления целых чисел со знаком количество отрицательных значений на единицу больше количества положительных значений.

Такая ситуация связана с тем, что для представления нуля во всех ячейках стоят нули. Если же в знаковом разряде стоит единица, а во всех остальных разрядах нули, то это представление соответствует отрицательному (как правило, наимень­шему) числу [11].

Другой способ представления целых чисел - дополнительный код. Дополнительный код целого отрицательного числа может быть полу­чен по следующему алгоритму: записываем прямой код модуля числа; инвертируем его (заменяем единицы нулями, нули единицами); прибавляем к инверсному коду единицу. При получении числа по его дополнительному коду необходимо определить его знак. Если число окажется положительным, то переводим его код в десятичную систему счисления. В случае отрицательного числа необходимо выполнить следующий ал­горитм: вычитаем из кода числа 1; инвертируем код; переводим в десятичную систему счисления; полученное число записываем со знаком минус [7].

Таким образом, для кодирования целых чисел от 0 до 65 535 требуется шестнадцать бит. Двадцать четыре бита позволяют закодировать более 16,5 миллионов разных значе­ний.


1.2 Представление и кодирование текстовой информации

В настоящее время основная доля персональных компьютеров занята обработкой именно текстовой информации.

Для кодирования одного символа используется количество информации, равное одному байту, т.е. I = 1 байт = 8 бит [5]. Если рассматривать символы как возможное событие, то можно вычислить, какое количество различных символов можно закодировать:

N = 2I = 28 = 256.

Такое количество символов достаточно для представления текстовой информации, включая прописные и заглавные буквы русского и латинского алфавита, цифры, знаки, графические символы и т.д. Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111 [3].

Таким образом, человек различает символы по их начертанию, а компьютер по их коду.

При вводе в компьютер текстовой информации изображение символа преобразуется в его двоичный код. Пользователь нажимает на клавиатуре клавишу с символом – и в компьютер поступает определенная последовательность из восьми электрических импульсов (двоичный код символа). Код символа хранится в оперативной памяти компьютера, где занимает одну ячейку [7].

В процессе вывода символа на экран происходит обратный процесс – преобразование кода символа в его изображение. Важно, что присваивание символу конкретного кода – это вопрос соглашения, которое фиксируется в кодовой таблице. Первые 33 кода (с 0 по 32) этой таблицы соответствуют не символам, а операциям (перевод строки, ввод пробела и т.д.) [7]. Коды с 33 по 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания. Коды с 128 по 255 являются национальными, т.е. в национальных кодировках одному и тому же коду соответствуют различные символы. Существуют пять однобайтовых кодовых таблиц для русских букв (Windows, MS - DOS, КОИ - 8, Mac, ISO), поэтому тексты, созданные в одной кодировке, не будут правильно отображаться в другой [9]. Существует соглашение, которое фиксируется в кодовой таблице (ASCII - American Standard Code for Information Interchange - Американский стандартный код для обмена информацией) [11]. В настоящее время широкое распространение получил новый международный стандарт Unicode, который отводит на каждый символ не один байт, а два, и поэтому с его помощью можно закодировать не 256 символов, а N = 216 = 65 536 различных символов [9].

Таким образом, 65535 символов должно быть остаточно, чтобы закодировать и русский и латинский алфавиты, цифры, знаки и математические символы, а также греческий, арабский и другие алфавиты.


1.3 Представление цветной и графической информации

Последовательностями нулей и единиц можно закодиро­вать и графическую информацию. Различают три вида ком­пьютерной графики: растровую, векторную и фрактальную. Рассмотрим наиболее часто используемую при разработке электронных (мультимедийных) и полиграфических изданий растровую графику [2]. Основным элементом растрового изобра­жения является точка, или пиксель. Для кодирования любого изображения нужно разбить его на точки и цвет каждой точки закодировать. Например, черно - белую картинку можно закодировать, используя два бита: 11 - белый цвет, 10 - светло - серый, 01 - темно - серый и 00 – черный [6]. Для кодирования 256 различных цветов требуется 8 бит. Одна­ко этого недостаточно для кодирования полноцветных изображе­ний живой природы. Человеческий глаз может различать десят­ки миллионов цветовых оттенков. В современных компьютерах для кодирования цвета одной точки используется три байта. Каждый цвет представляет собой комбинацию трех основ­ных цветов: красного, зеленого и синего. Первый байт опреде­ляет интенсивность красной составляющей, второй - зеленой, третий - синей. Белый цвет кодируется полными и тремя байтами (255,255,255, или - в двоичной системе - 111111111, 11111111, 11111111) [15]. Черный цвет - отсутствие всех цветов (0, 0, 0). Красный цвет может быть темным (120,0,0) или ярко - красным (255,0,0) [10]. Та­кая система кодирования цветной графической информации называется системой RGB (Red, Green, Blue) и обеспечивает однозначное определение 16,5 млн. (224) различных цветов и от­тенков [4].

Расчет объема графической информации сводится к вычис­лению произведения количества точек на изображении на ко­личество разрядов, необходимых для кодирования цвета одной точки. Например, для цветной картинки, составленной из 256 цве­тов в графическом режиме монитора 640 × 480, требуется объем видеопамяти, равный 8 × 640 × 480 = 2 457 600 бит = 307 200 байт = 300 Кбайт [22].

Таким образом, качество графического изображения зависит от количества точек (пикселей) на единице площади. Этот параметр называ­ется разрешением и измеряется в точках на дюйм - dpi.