Файл: Способы представления данных в информационных системах(Общие понятия представления данных)..pdf
Добавлен: 05.04.2023
Просмотров: 81
Скачиваний: 4
Введение
На сегодняшний день информация является очень важным аспектом общественной жизни. Компьютеры и другие устройства, использующие информацию, воспринимают ее по-своему, часто отлично от человеческого восприятия. Информация может существовать во множестве различных вариантов, и для интерпретации ее в компьютерные системы необходимо использовать разнообразные преобразования. Преобразованная информация является представленной в удобном виде для информационной системы. Преобразования используются в двух случаях: для представления компьютерной информации в удобной для человека форме и для представления информации от человека в форме, удобной для компьютера. В данной работе будут рассмотрены различные способы представления информации от человека в форме, удобной для компьютера.
Целью данной работы является повышение информационной грамотности путем разбора различных вариантов преобразований информации для использования в информационных системах и других компьютерных усройствах.
Актуальность данной работы заключается в том, что непосвященному человеку сложно ориентироваться во всем многообразии информации, но при корректной структуризации данных имеется возможность правильно интерпретировать работу информационных систем.
Объектом исследования в данной работе являются общие понятия представления данных, предметом – представление данных в различных сферах.
Задачами данной работы являются:
- изучение понятия представления данных;
- рассмотрение кодирования информации;
- разбор представления данных в различных сферах с примерами.
В основу данной работы легли книги таких авторов, как Грэхем и Семакин.
1. Общие понятия представления данных
1.1. Принципы представления данных в компьютере
Информация в компьютере представлена в виде кода, который состоит из нулей и единиц в разной последовательности.
Код является набором условных обозначений, предназначенных для представления информации. Кодирование является процессом представления информации в виде кода[1] [1].
Схема приема информации и ее передачи представлена на рисунке 1.
Рис. 1. Схема приема и передачи информации
1.2. Кодирование информации
Кодирование является переходом от одной формы представления информации к другой, которая более удобна для обработки, восприятия, передачи или хранения в зависимости от целей. Обязательным условием кодирования является изменение формы представления без изменения содержания[2] [8].
1.2.1. Кодирование текстовой информации
Кодовая таблица является внутренним представлением символов в компьютере. Всемирно в качестве стандарта является принятой таблица ASCII, которая расшифровывается как American Standard Code for Information Interchange, что обозначает Американский стандартный код для обмена информацией. С целью хранения одного символа двоичного кода выделен байт, равный 8 битам. С учетом приема каждым битом значения 0 или1, можно рассчитать количество возможных сочетаний в байте, которое равно 28 = 256. Таким образом, с помощью 1 байта можно получить 256 различных двоичных кодовых комбинаций и отобразить с их помощью 256 разных символов. Данные комбинации и составляют таблицу ASCII[3].
С целью сокращения записей и удобства использования кодов символов используют шестнадцатеричную систему счисления, которая состоит из 16 символов, которые представляют собой 10 цифр и 6 латинских букв от A до F. К примеру, буква T будет представлена в шестнадцатеричной системе более компактным по сравнению с двоичной системой кодом 54. Стандартом ASCII определяются первые 128 символов от 0 до 127: управляющие символы, буквы латинского алфавита и цифры. Первые 32 символа являются управляющими, предназначенными, в основном, для передачи команд управления. Вторая половина таблицы от 128 до 255 представляет собой национальный алфавит[4] [1, 4].
1.2.2. Кодирование чисел
Двоичная система счисления обладает аналогичными свойствами, как и десятичная, но использует не 10 цифр для представления чисел, а всего две. Соответственно и разряд числа называют двоичным, а не десятичным.
Для кодирования числа, которое учувствует в вычислениях, используется специальная система правил перевода в двоичную систему исчисления из десятичной. В результате использования данного метода число будет записано двоичным кодом, то есть представлено различным сочетанием всего двух цифр - 1 и 0[5] [8].
1.2.3. Кодирование графической информации
Хранить и создавать в компьютере графические объекты можно двумя способами, такими как в виде растрового изображения или в виде векторного изображения. Для каждого вида изображений используется собственный способ кодирования.
Векторное изображение является графическим объектом, который состоит из элементарных дуг и отрезков. Положение указанных элементарных объектов определяется длиной радиуса и координатами точек. Для каждой линии указывается ее цвет, толщина и тип, такой как, например, сплошная, пунктирная, штрих-пунктирная. Информация о векторном изображении кодируется в обычном буквенно-цифровом виде и обрабатывается специальными программами[6] [4].
1.2.4. Кодирование звуковой информации
Звуковая информация обычно представляется последовательностью элементарных звуков и пауз между ними. Каждый отдельный звук хранится и кодируется в памяти. Из компьютера вывод звуков осуществляется синтезатором речи, считывающим из памяти хранящийся код звука[7] [1].
По итогам данной главы можно сделать вывод, о том, что представление данных является довольно обширным понятием, котором может охватывать различные виды информации в различных сферах.
2. Представление данных в различных средах
2.1. Представление данных в математике
Любое десятичное число можно представить в любой позиционной системе счисления, для целых чисел это можно сделать единственным способом. На основании этого можно утверждать, что любое число может быть записано в виде суммы степеней числа P, где Р – натуральное число больше 1. В качестве базиса позиционной системы берется возрастающая последовательность степеней числа Р и тем самым однозначно определяется Р-ичная система счисления. Разложение числа по степеням Р является представлением данного числа в Р-ичной системе счисления. Представление числа в Р-ичной системе счисления называют развернутой формой записи числа. Другим способом записи является последовательное перечисление значащих цифр, начиная со старшей[8].
Во всех позиционных системах счисления арифметические операции выполняются по одинаковым правилам, согласно действующим таблицам умножения и сложения. Для всех систем счисления справедливы одинаковые законы арифметики; дистрибутивный, ассоциативный и коммутативный, а также правила вычитания, сложения, деления и умножения столбиком.
В Р-ичной системе счисления таблица сложения является результатом сложения каждой цифры алфавита из Р-ичной системы с любой другой цифрой в этой же системы. В случае, когда результат сложения двух цифр в Р-ичной системе больше Р – 1, то к следующему разряду добавляется 1[9].
Вычитание из большего числа меньшего в Р-ичной системе счисления можно производить столбиком аналогично вычитанию в десятичной системе. Для выполнения этой операции используется та же таблица сложения, что и в операции сложения Р-ичной системы счисления. Если вычитаемое число больше уменьшаемого, то из старшего разряда вычитается 1.
Для выполнения умножения двух многозначных чисел в Р-ичной системе надо иметь таблицы умножении и сложения в этой системе. Действия производятся по правилам умножения столбиком, при этом используется соответствующие таблицы умножения и сложения. Возможен также и подход с переводом каждого сомножителя в десятичную систему счисления, вычисление требуемого действия в этой системе и перевод результата в Р-ичную систему. Аналогичным способом можно поступать и при выполнении операций сложения и вычитания[10].
В случае деления столбиком в Р-ичной системе счисления в качестве промежуточных вычислений выполняются действия вычитания и умножения в соответствии с таблицами умножения и сложения. Тем не менее, результат деления не всегда является целым числом или конечной Р-ичной дробью. В таком случае при осуществлении операции деления обычно выделяют непериодическую часть дроби и ее период[11].
Для получения значения числа Р-ичной системы счисления в десятичной необходимо число и его коэффициенты при степенях Р записать в виде десятичных чисел и провести вычисления в десятичной системе. Данный способ можно сформулировать в виде следующего алгоритма.
- Каждая цифра Р-ичного числа переводится в десятичную систему счисления.
- Полученные числа нумеруются начиная с нуля справа налево.
- Число Р переводится в десятичную систему.
- Соответствующее каждой Р-ичной цифре десятичное число умножается на Pk, где k – номер этого числа.
- Результаты складываются в десятичной системе[12].
Для того, чтобы перевести число из двоичной в десятичную систему счисления, надо в десятичной системе счисления сложить все степени двоек, которые соответствуют единицам в записи исходного двоичного числа. Нумерация степеней ведется справа налево, начиная с нулевой[13] [1, 4, 8].
2.2. Представление данных в памяти ЭВМ
Современные электронные вычислительные машины реализованы на электронных элементах, называемых триггерами, которые имеют два устойчивых состояния типа выключен или включен. Данные состояния кодируются, так что одно обозначается нулем, а другое – единицей. Таким образом, язык электронных вычислительных машин содержит только два символа, также, как и телеграфная азбука Морзе. Данный метод, в свою очередь, вынуждает использовать специальные коды с целью представления данных в электронных вычислительных машинах. Данные по типу делятся на четыре группы[14].
Символьные данные используются для обозначения объектов, понятий и формирования текстов по правилам определенного языка сообщений.
Числовые данные используются для обозначения количество в различных системах счисления, таких как двоичная, восьмеричная, десятичная и шестнадцатеричная, и различных формах[15].
Данные дат используется для представления дат в различных формах, таких как американская, германская, европейская и другие подобные.
Логические данные используются для обозначения отсутствия или наличия какого-либо признака, имея только два значения: истины и лжи[16].
Основным элементом кодированного представления данных в электронных вычислительных машинах является байт. Байт представляет собой код из восьми позиций, каждая из которых содержит либо ноль, либо единицу. Например, 01001000 или 01000101 и другие подобные записи. Каждая позиция называется битом или разрядом. В зависимости от типа представляемых байтом данных, его содержимое может интерпретироваться по-разному.
В случае представлении символьных данных один байт является кодированным представлением одного символа, например, 01001101 является кодом буквы M, а 01000110 является кодом буквы F[17].
Байтом имеется представлять собой 256 различных символов. При использовании такого представления используется стандартная таблица ASCII, в которой первые 128 кодовых комбинаций являются общими для всех стран, а последние 128 кодов символов используются в различных языках, например, в русском. Каждому символу таблицы ASCII соответствует только свой и ничей другой код[18].