Файл: Способы представления данных в информационных системах (Представление и преобразование информации в ЭВМ).pdf
Добавлен: 03.07.2023
Просмотров: 166
Скачиваний: 2
СОДЕРЖАНИЕ
Глава 1. Представление и преобразование информации в ЭВМ
Глава 2. Представление числовой информации в компьютерных системах
Глава 3. Представление символьной информации в ЭВМ
3.1. Символьная информация в ЭВМ
3.2. Графическая информация в ЭВМ
Введение
Информатика – это отрасль знаний, изучающая общие свойства и структуру научной информации, а также закономерности и принципы ее создания, преобразования, накопления, передачи и использование в различных областях человеческой деятельности, в том числе с помощью компьютеров и программ обработки информации.
Задачи накопления, обработки и передачи информации стояли перед человечеством на всех этапах его развития. Каждому этапу соответствовал определенный уровень развития средств информационного труда, прогресс развития которых всякий раз придавал человеческому обществу новое качество. Ранее были выделены основные этапы обращения с информацией, и они являются общими для всех наук при обработке информации с помощью ЭВМ. Научным фундаментом для их решения стала такая наука, как информатика.
Люди имеют дело со многими видами информации. Услышав прогноз погоды, можно записать его в компьютер, чтобы позже воспользоваться им. В компьютер можно загрузить фотографию своего друга или видеосъемку о том, как вы провели отпуск. Но все же ввести в компьютер вкус пирожного или мягкость нового свитера не получится.
Компьютер - это электронная машина, которая работает с сигналами. Компьютер может работать только с такой информацией, которую можно преобразовать в сигналы. Если бы люди умели превращать в сигналы вкус или запах, то компьютер мог бы работать и с такой информацией. У компьютера отлично получается работать с числами. Он может делать с ними все, что угодно. Все числа в компьютере закодированы "двоичным кодом", то есть представлены с помощью всего двух символов 1 и 0, которые легко представляются сигналами.
Вся информация, с которой работает компьютер, кодируется числами. Независимо от того, графическая, текстовая или звуковая эта информация, чтобы ее мог обрабатывать центральный процессор, она должна тем или иным образом быть представлена числовым значением.
Глава 1. Представление и преобразование информации в ЭВМ
В связи с информационной обработкой, будем делать четкое различие между информацией, то есть абстрактным содержанием значения, и ее представлением (внешней формой). В связи с выяснением понятия информации особенно выявляется своеобразие представления информации: без соответствующего соглашения об установлении значения все представления информации не имеют определенного смысла, то есть содержания. Только указание определенного значения переводит представление в информацию. Это становится особенно понятным при рассмотрении древних надписей и рисунков, смысл которых пока неизвестен.
Многие формы представления информации допускают различное толкование. Так, слово "green", рассматриваемое как последовательность литер, является последовательностью четырех литер: «g», «r», «e», «n». Литеры мы можем интерпретировать акустически и тем самым заменить эту последовательность литер произнесенным словом. Это возможно, если мы знаем фонетическое значение букв - даже в том случае, когда значение самого слова нам неизвестно. В английском языке со словом "green" в качестве его значения связывают цвет. Если это слово связывается со светофором, то оно сразу получает новое толкование, а в других обстоятельствах - совсем другое. Как показывает этот пример, с одной и той же последовательностью литер люди в зависимости от обстоятельств связывают различные значения. И наоборот, одно и то же смысловое содержание может быть представлено различными способами.
Понятийное разделение внешней формы и абстрактного информационного содержания какого-либо высказывания или сообщения является фундаментальным для информатики. Итак, мы различаем в связи с информацией:
1. Ее представление или изображение (внешняя форма);
2. Ее значение (собственно "абстрактная" информация);
3. Ее отношение к реальному миру (связь абстрактной информации с действительностью).
Информатика включает в себя науку о машинной обработке информации. Это охватывает вопросы:
Схематизированного представления (изображения информационной структуры объектов и данных, а также их взаимосвязи);
Правил и предписаний для обработки информации (алгоритмы, вычислительные предписания) и их представления, включая описание протекания работы (процессы, взаимодействующие системы).
Оба пункта тесно связаны между собой. Программа, например, в качестве своей внешней формы имеет текстовую (или графическую) структуру. Текстовая структура, в свою очередь, представляет собой объект для информационной обработки. Но программа представляет также предписание для обработки. При ее выполнении в компьютере протекает процесс действий, который преобразует определенные исходные данные в определенные выходные данные (результаты). Таким образом, программа описывает и реализует некоторую функцию. При разработке программных систем перед информатикой стоит задача представления, моделирования и использования самых различных видов информации. Так как машинная, "схематичная" обработка информации, соответственно ее представления, требует точно установленных форм представления и преобразования, информатика пользуется формальными методами. Этим она обнаруживает связь с математикой, особенно с математической логикой. Но поскольку методы информатики должны вести к практически применимым продуктам ("программам", "системам"), которые должны решать поставленные задачи на имеющихся вычислительных машинах, то есть на физических объектах, при дополнительных экономических условиях, то информатика имеет и сильно выраженные инженерно-научные черты.
Для машинной обработки информации всегда необходимы формы ее представления. Это представление может принимать разнообразные виды. От условных знаков ("сигнал"), от произносимых слов ("акустическое представление") до рисунков (графическое представление, "пиктограмма", "иконки") или последовательностей символов (написанного "слова", "текста") находится большое число возможностей для выбора способа представления. Однако всегда важно установление способа выявления значения представления. Представление интерпретируется, чтобы получить информацию. Переход (часто только воображаемый, мысленный) от представления к абстрактной информации, то есть к значению представления, называют интерпретацией.
Информация, находящаяся в какой-либо информационной системе, воспринимается как некоторая математическая структура. Переход от представления к элементам этой математической структуры называется интерпретацией. Установление отношений к реальному миру, то есть толкование значения информации в смысле окружающего нас мира, мы называем пониманием. Существует тонкая разница между интерпретацией и пониманием. Отдельно от этого ставится вопрос о том, соответствует ли информация действительности, передает ли она реальные обстоятельства. Об этом можно судить в лучшем случае субъективно.
Различные системы представления информации по-разному эффективны. Если должна представляться сложная информация, то должна выбираться подходящая система ее представления. В применениях информатики обычно рассматривается точно описанное множество R представлений с интерпретацией I в множестве A элементов (информаций). Интерпретация I данному представлению r (сообщению) ставит в соответствие некоторое абстрактное информационное содержание I[r]. Таким образом, интерпретации соответствует отображение I: R A.
Через (A, R, I) мы будем обозначать информационную систему. Таким образом, информационная система соответствует понятию отображения из математики. Впрочем, к системе представления R обычно предъявляют прагматические требования - например, чтобы все представления были конечны. R называют также системой представления, а A - семантической моделью.
Пример (система представления для натуральных чисел). Пусть N - множество натуральных чисел (включая и число "нуль"), представляемых числом штрихов, то есть с помощью последовательностей штрихов:
e, |, ||, |||, …
где через e обозначена пустая последовательность. Обычным представлением натуральных чисел являются десятичные числа, то есть последовательности с символами из множества цифр {0, 1, …, 9}. Интерпретацией I здесь является отображение десятичного представления в последовательность штрихов (здесь запись {0, 1, …, 9}+ обозначает множество непустых конечных последовательностей десятичных цифр)
I: {0, 1, …, 9}+ N
с I[0]= e, I[1]= |, I[2]=||, …
Этот пример проясняет фундаментальную проблему информационной обработки: информация в ее абстрактном виде не может быть записана непосредственно, а потому всегда может быть только как-то изображена. Представление натуральных чисел с помощью штрихов снова является только их изображением. Понятие же числа в математике есть абстракция, которая понимается совершенно независимо от конкретного изображения. Законы математики справедливы для чисел в их римской записи так же, как и при их представлении с помощью штрихов, в двоичной или десятичной записи. Впрочем, различные способы представления чисел существенно различаются с точки зрения удобства их использования для определенных процессов обработки. Достаточно лишь попытаться выполнить сложение, а тем более умножение чисел в их римской записи.
Часто в какой-либо системе представления имеется много различных изображений для той же самой информации. Эти изображения называются тогда эквивалентными. Точнее говоря, в информационной системе (A, R, I) справедливо: два изображения r1, r2 R называются семантически эквивалентными, если они несут одинаковую информацию, то есть если справедливо
I[r1] = I[r2].
Информация - сведения, которыми располагает активная система (общество, человек, компьютер и т. п.) о том или ином объекте, которые могут храниться, передаваться и подвергаться преобразованиям.
Информация всегда представляется в виде сообщения. Совокупность сообщений составляет данные об объекте.
Единица количества информации - бит - информация, которую может нести сообщение, состоящее из одного двоичного знака. Информационное сообщение может быть представлено в виде функции x(t), характеризующей изменение во времени какой - либо величины, описывающей состояние приемника.
Непрерывная (аналоговая) информация - функция x(t) может принимать любые вещественные значения в диапазоне изменения аргумента t.
Дискретная информация - функция x(t) может принимать набор фиксированных дискретных значений в заданные моменты времени.
Аналоговая и дискретная информация
Рис. 1
Информация может быть по своей физической природе: числовой, текстовой, графической, звуковой, видео и др. Она также может быть постоянной (неменяющейся), переменной, случайной, вероятностной. Наибольший интерес представляет переменная информация, так как она позволяет выявлять причинно-следственные связи в процессах и явлениях. Существуют различные способы оценки количества информации. Классическим является подход, использующий формулу К. Шеннона. Применительно к двоичной системе она имеет вид:
H=log2N,
где H – количество информации, несущей представление о состоянии, в котором находится объект; N – количество равновероятных альтернативных состояний объекта.
Любая информация, обрабатываемая в ЭВМ, должна быть представлена двоичными цифрами (0,1), т. е. должна быть закодирована комбинацией этих цифр. Различные виды информации (числа, тексты, графика, звук) имеют собственные правила кодирования. Коды отдельных значений, относящиеся к различным видам информации, могут совпадать. Поэтому расшифровка кодированных данных осуществляется по контексту при выполнении команд программы .
Глава 2. Представление числовой информации в компьютерных системах
Представление чисел в памяти компьютера имеет специфическую особенность, связанную с тем, что в памяти компьютера числа должны располагаться в байтах — минимальных по размеру адресуемых ячейках памяти. Адресом числа считают адрес первого байта. В байте может содержаться произвольный код из восьми двоичных разрядов.
1. Целые числа представляются в памяти компьютера с фиксированной запятой. В этом случае каждому разряду ячейки памяти компьютера соответствует один и тот же разряд числа, запятая расположена справа после младшего разряда (то есть вне разрядной сетки).
Для кодирования целых чисел от 0 до 255 достаточно иметь 8 разрядов двоичного кода (8 бит).
Десятичное число |
Двоичный код |
0 |
0000 0000 |
1 |
0000 0001 |
2 … |
0000 0010 … |
254 |
1111 1110 |
255 |
11111111 |
Для кодирования целых чисел от 0 до 65 535 требуется 16 бит; 24 бита позволяют закодировать больше 16,5 миллионов разных значений.
Если для представления целого числа в памяти компьютера отведено N бит, то количество различных значений будет равно 2N.
Максимальное значение целого неотрицательного числа достигается в случае, когда во всех ячейках стоят единицы. Если под представление целого положительного числа отведено N бит, то максимальное значение будет равно 2N -1.
Прямой код целого числа может быть получен следующим образом: число переводится в двоичную систему счисления, а затем его двоичную запись слева дополняют необходимым количеством незначащих нулей, соответствующим количеству незаполненных разрядов, отведённых для хранения числа.