Файл: Различные способы представления данных в информационных системах.pdf
Добавлен: 03.07.2023
Просмотров: 36
Скачиваний: 3
СОДЕРЖАНИЕ
1. Общие понятия представления данных
1.1. Принципы представления данных в компьютере
1.2.1. Кодирование текстовой информации
1.2.3. Кодирование графической информации
1.2.4. Кодирование звуковой информации
2. Представление данных в различных средах
2.1. Представление данных в математике
2.2. Представление данных в памяти ЭВМ
2.3. Представление в базах данных
Введение
На сегодняшний день информация является очень важным аспектом общественной жизни. Информация может существовать во множестве различных вариантов, и для интерпретации ее в компьютерные системы необходимо использовать разнообразные преобразования. Преобразованная информация является представленной в удобном виде для информационной системы. В данной работе будут рассмотрены различные способы представления информации.
Актуальность данной работы заключается в том, что непосвящённому человеку сложно ориентироваться во всем многообразии информации, но при корректной структуризации данных имеется возможность правильно интерпретировать работу информационных систем.
Объектом исследования в данной работе являются общие понятия представления данных, предметом – представление данных в различных сферах.
Задачами данной работы являются:
- изучение понятия представления данных;
- рассмотрение кодирования информации;
- разбор представления данных в различных сферах с примерами.
В основу данной работы легли книги таких авторов, как Грэхем и Семакин.
1. Общие понятия представления данных
1.1. Принципы представления данных в компьютере
Данные в компьютере представляются в виде кода, который состоит из единиц и нулей в разной последовательности.
Код - набор условных обозначений для представления информации. Кодирование - процесс представления информации в виде кода[1] [1].
Схема приема информации и ее передачи представлена на рисунке 1.
Рис. 1. Схема приема и передачи информации
1.2. Кодирование информации
Кодирование является переходом от одной формы представления информации к другой, более удобной для восприятия, обработки, хранения или передачи в зависимости от цели. Обязательным условием кодирования является изменение формы представления без изменения содержания[2] [8].
1.2.1. Кодирование текстовой информации
Кодовая таблица - это внутреннее представление символов в компьютере. Во всем мире в качестве стандарта принята таблица ASCII (American Standard Code for Information Interchange - Американский стандартный код для обмена информацией). Для хранения двоичного кода одного символа выделен 1 байт = 8 бит. Учитывая, что каждый бит принимает значение 0 или 1, количество их возможных сочетаний в байте равно 28 = 256. Значит, с помощью 1 байта можно получить 256 разных двоичных кодовых комбинаций и отобразить с их помощью 256 различных символов. Эти комбинации и составляют таблицу ASCII[3].
Для сокращения записей и удобства пользования кодами символов используют шестнадцатеричную систему счисления, состоящую из 16 символов - 10 цифр и 6 латинских букв: A, B, C, D, E, F. Так, буква S будет представлена в шестнадцатеричной системе, по сравнению с двоичной, более компактным кодом 53. Стандарт ASCII определяет первые 128 символов от 0 до 127: цифры, буквы латинского алфавита, управляющие символы. Первые 32 символа являются управляющими и предназначены в основном для передачи команд управления. Вторая половина таблицы от 128 до 255 – национальный алфавит[4] [1, 4].
1.2.2. Кодирование чисел
Двоичная система счисления обладает такими же свойствами, что и десятичная, только для представления чисел используется не 10 цифр, а всего две. Соответственно и разряд числа называют не десятичным, а двоичным.
Для кодирования числа, участвующего в вычислениях, используется специальная система правил перевода из десятичной системы исчисления в двоичную. В результате число будет записано двоичным кодом, т.е. представлено различным сочетанием всего двух цифр - 0 и 1[5] [8].
1.2.3. Кодирование графической информации
Создавать и хранить графические объекты в компьютере можно двумя способами - как растровое изображение или как векторное изображение. Для каждого типа изображения используется свой способ кодирования.
Векторное изображение представляет собой графический объект, состоящий из элементарных отрезков и дуг. Положение этих элементарных объектов определяется координатами точек и длиной радиуса. Для каждой линии указывается ее тип (сплошная, пунктирная, штрих - пунктирная), толщина и цвет. Информация о векторном изображении кодируется как обычная буквенно-цифровая и обрабатывается специальными программами[6] [4].
1.2.4. Кодирование звуковой информации
Звуковая информация может быть представлена последовательностью элементарных звуков (фонем) и пауз между ними. Каждый звук кодируется и хранится в памяти. Вывод звуков из компьютера осуществляется синтезатором речи, который считывает из памяти хранящийся код звука[7] [1].
По итогам данной главы можно сделать вывод, о том, что представление данных является довольно обширным понятием, котором может охватывать различные виды информации в различных сферах.
2. Представление данных в различных средах
2.1. Представление данных в математике
Любое десятичное число можно представить в любой позиционной системе счисления, для целых чисел это можно сделать единственным способом. На основании этого можно утверждать, что любое число может быть записано в виде суммы степеней числа P, где Р – натуральное число больше 1. В качестве базиса позиционной системы берется возрастающая последовательность степеней числа Р и тем самым однозначно определяется Р-ичная система счисления. Разложение числа по степеням Р является представлением данного числа в Р-ичной системе счисления. Представление числа в Р-ичной системе счисления называется развернутой формой записи числа. Другим способом записи является последовательное перечисление значащих цифр, начиная со старшей[8].
Во всех позиционных системах счисления арифметические операции выполняются по одним и тем же правилам, согласно действующим таблицам сложения и умножения. Для всех систем счисления справедливы одни и те же законы арифметики; коммутативный, ассоциативный, дистрибутивный, а также правила сложения, вычитания, умножения и деления столбиком.
В Р-ичной системе счисления таблица сложения представляет собой результаты сложения каждой цифры алфавита Р-ичной системы с любой другой цифрой этой же системы. Если результат сложения двух цифр в Р-ичной системе больше Р – 1, то к следующему разряду добавляется 1[9].
Вычитание из большего числа меньшего в Р-ичной системе счисления можно производить столбиком аналогично вычитанию в десятичной системе. Для выполнения этой операции используется та же таблица сложения, что и в операции сложения Р-ичной системы счисления. Если вычитаемое число больше уменьшаемого, то из старшего разряда вычитается 1.
Для выполнения умножения двух многозначных чисел в Р-ичной системе надо иметь таблицы умножении и сложения в этой системе. Действия производятся по правилам умножения столбиком, при этом используется соответствующие таблицы умножения и сложения. Возможен также и подход с переводом каждого сомножителя в десятичную систему счисления, вычисление требуемого действия в этой системе и перевод результата в Р-ичную систему. Аналогичным способом можно поступать и при выполнении операций сложения и вычитания[10].
При делении столбиком в Р-ичной системе счисления приходится в качестве промежуточных вычислений выполнять действия умножения и вычитания, следовательно, использовать таблицы умножения и сложения. Тем не менее, результат деления не всегда является конечной Р-ичной дробью (или целым числом). Тогда при осуществлении операции деления обычно выделяют непериодическую часть дроби и ее период[11].
Для получения значения числа Р-ичной системы счисления в десятичной необходимо число и его коэффициенты при степенях Р записать в виде десятичных чисел и провести вычисления в десятичной системе. Данный способ можно сформулировать в виде следующего алгоритма.
- Каждая цифра Р-ичного числа переводится в десятичную систему счисления.
- Полученные числа нумеруются справа налево, начиная с нуля.
- Число Р переводится в десятичную систему.
- Десятичное число, соответствующее каждой Р-ичной цифре умножается на Pk, где k – номер этого числа.
- Результаты складываются в десятичной системе[12].
Для того, чтобы перевести число из двоичной системы счисления в десятичную, надо в десятичной системе счисления сложить все степени двоек, которые соответствуют единицам в записи исходного двоичного числа. Нумерация степеней ведется справа налево, начиная с нулевой[13] [1, 4, 8].
2.2. Представление данных в памяти ЭВМ
Современные ЭВМ реализованы на электронных элементах (триггерах), имеющих два устойчивых состояния (типа включен/выключен). Эти состояния кодируются – одно обозначается “0”(ноль), другое – “1” (единица). Таким образом, язык ЭВМ содержит как и азбука Морзе (телеграфная азбука) только два символа. Это в свою очередь, вынуждает для представления данных в ЭВМ использовать специальные коды. Данные по типу можно разделить на четыре группы[14].
Символьные данные используются для обозначения понятий, объектов и формирования текстов по правилам того или иного языка сообщений.
Числовые данные используются для обозначения количество в различных формах и различных системах счисления (двоичной, восьмеричной, десятичной и шестнадцатеричной) [15].
Данные дат используется для представления дат в различных формах (американской, германской, европейской и других).
Логические данные используются для обозначения наличия или отсутствия какого-либо признака и имеют только два значения: истины и лжи[16].
Основным элементом кодированного представления данных в ЭВМ является байт. Это код из восьми позиций, в каждой из которых может находиться либо 0, либо 1. Например: 01001000 или 01000101 и т.п. Каждая позиция называется разрядом или битом. В зависимости от того, какой тип данных представляет байт, его содержимое интерпретируется по-разному.
При представлении символьных данных один байт представляет собой кодированное представление одного символа, например: 01001110 - код буквы N, а 01000101 - код буквы Е[17].
Байтом можно представить 256 различных символов. Для такого представления используется стандартная таблица ASCII (читается аски). В этой таблице первые 128 кодовых комбинаций являются общими для всех стран, а последние 128 кодов символов используются в различных языках, в частности русском. Каждому символу таблицы ASCII соответствует свой и только свой код[18].
При представлении числовых данных один байт интерпретируется как целое число в пределах от -127 до 128. Поскольку это очень узкий диапазон, то для представления любого как дробного, так и целого числа используется несколько байт (чаще всего четыре байта). Таким образом, если рассматривать коды букв N и E как числовые данные, то это 78 и 69 соответственно. Если же рассматривать оба байта как одно число 0100111001000101, то оно соответствует 12037. В настоящее время принят стандарт, при котором целое число занимает два байта, а дробное число четыре байта[19].
Данные типа дата представляются всегда восьмью байтами.
При представлении логических данных для одного значения достаточно одного бита (0 - .F., 1 - .T.), однако чаще для представления одного значения используется один байт[20] [2,3, 5, 7].