ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 10.01.2024
Просмотров: 1129
Скачиваний: 1
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Обработка информации – получение одних информационных объектов из других информационных объектов путем выполнения некоторых алгоритмов и является одной из основных операций, осуществляемых над информацией, и главным средством увеличения ее объема и разнообразия.
На самом верхнем уровне можно выделить числовую и нечисловую обработку. При числовой обработке используются такие объекты, как переменные, векторы, матрицы, многомерные массивы, константы и т.д. При нечисловой обработке объектами могут быть файлы, записи, поля, иерархии, сети, отношения и т.д. Другое отличие заключается в том, что при числовой обработке содержание данных не имеет большого значения, в то время как при нечисловой обработке нас интересуют непосредственные сведения об объектах, а не их совокупность в целом.
С точки зрения реализации на основе современных достижений вычислительной техники выделяют следующие виды обработки информации:
-
последовательная обработка, применяемая в традиционной фон-неймановской архитектуре ЭВМ, располагающей одним процессором; -
параллельная обработка, применяемая при наличии нескольких процессоров в ЭВМ; -
конвейерная обработка, связанная с использованием в архитектуре ЭВМ одних и тех же ресурсов для решения разных задач, Причем если эти задачи тождественны, то это последовательный конвейер, если задачи одинаковые – векторный конвейер.
Хранение информации – это способ распространения информации в пространстве и времени. Хранение информации (данных) не является самостоятельной фазой в информационном процессе, а входит в состав фазы обработки.
Различают структурированные данные, в которых отражаются отдельные факты предметной области и неструктурированные, произвольные по форме, включающие и тексты, и графику, и прочие данные.
Организация того или иного вида хранения данных (структурированных или неструктурированных) связана с обеспечением доступа к самим данным. Под доступом понимается возможность выделения элемента данных (или множества элементов) среди других элементов по каким-либо признакам с целью выполнения некоторых действий над элементом. При этом под элементом понимается как запись файла (в случае структурированных данных), так и сам файл (в случае неструктурированных данных).
Для данных любого вида доступ осуществляется с помощью специальных данных, которые называются ключевыми (ключами). Для структурированных данных такие ключи входят в состав записей файлов в качестве отдельных полей записей. Для неструктурированных поисковые слова или выражения входят, как правило, в искомый текст. С помощью ключей выполняется идентификация требуемых элементов в информационном массиве (массиве хранения данных).
2. Кодирование информации
Представление информации происходит в различных формах в процессе восприятия окружающей среды живыми организмами и человеком, в процессах обмена информацией между человеком и человеком, человеком и компьютером и так далее. Преобразование информации из одной формы представления (знаковой системы) в другую называется кодированием. Средством кодирования служит таблица соответствия знаковых систем, которая устанавливает взаимно однозначное соответствие между знаками или группами знаков двух различных знаковых систем. В более узком смысле под термином «кодирование» часто понимают переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки. При вводе знака алфавита в компьютер путем нажатия соответствующей клавиши на клавиатуре происходит кодирование знака, то есть преобразование его в компьютерный код. При выводе знака на экран монитора или принтер происходит обратный процесс – декодирование, когда из компьютерного кода знак преобразуется в его графическое изображение.
Само по себе понятие кодирования информации может быть отнесено к области абстрактных категорий подобно математическим формулам, что позволяет строить формальные правила кодообразования.
Задачи кодирования информации решались задолго до появления компьютеров. Коды, как средство тайнописи появились в глубокой древности. Да и сами древние алфавиты по сути – средства кодирования.
При любых видах работы с информацией всегда идет речь о ее представлении в виде определенных символьных структур. Наиболее распространены одномерные представления информации, при которых сообщения имеют вид последовательностей символов. Так информация представляется в письменных текстах, при передаче по каналам связи, в памяти ЭВМ. Однако широко используются и многомерные представления информации, причем под многомерностью понимают расположение элементов информации на плоскости или в пространстве (в виде рисунков, схем, графов, объемных макетов и т.д.). Например, информацию могут нести не только значения букв и цифр, но и их цвет, размер, вид шрифта.
Компьютер может обрабатывать только информацию, представленную в числовой форме. Вся другая информация (звуки, изображения, показания приборов и т. д.) для обработки на компьютере должна быть преобразована в числовую форму. Например, чтобы перевести в числовую форму музыкальный звук, можно через небольшие промежутки времени измерять интенсивность звука на определенных частотах, представляя результаты каждого измерения в числовой форме. Аналогично на компьютере можно обрабатывать текстовую информацию. При вводе в компьютер каждая буква кодируется определенным числом, а при выводе на внешние устройства (экран или печать) для восприятия человеком по этим числам строятся изображения букв. Соответствие между набором букв и числами называется кодировкой символов.
Как правило, все числа в компьютере представляются с помощью нулей и единиц. Иными словами, компьютеры обычно работают в двоичной системе счисления, поскольку при этом устройства для их обработки получаются значительно более простыми.
Любой способ кодирования характеризуется наличием основы (алфавит, спектр цветности, система координат, основание системы счисления и т.д.) и правил конструирования информационных образов на этой основе.
Кодирование числовой информации осуществляется с помощью системы счисления. Под системой счисления будем понимать совокупность символов и правил для обозначения чисел. Разделяют системы счисления позиционные и непозиционные.
В позиционных системах счисления один и тот же числовой знак (цифра) в записи числа имеет различные значения в зависимости от того места (разряда), где он расположен. Изобретение позиционной нумерации, основанной на поместном значении цифр, приписывается шумерам и вавилонянам; развита была такая нумерация индусами и имела неоценимые последствия в истории человеческой цивилизации. К числу таких систем относится современная десятичная система счисления, возникновение которой связано со счетом на пальцах. В средневековой Европе она появилась через итальянских купцов, в свою очередь заимствовавших ее у мусульман.
Позиционная система счисления характеризуется основанием и тем, что числа, как правило, представляются несколькими разрядами (являются многоразрядными), а вес любого разряда определяется его позицией в числе. Основание позиционной системы счисления определяет количество различных цифр (символов), допустимое в системе счисления. Это же число определяет, во сколько раз вес цифры данного разряда меньше веса цифры соседнего старшего разряда. Так двоичная система счисления имеет основание 2, и, следовательно, две разных цифры – 0 и 1; восьмеричная – восемь разных цифр – 0, 1, 2, 3, 4, 5, 6, 7; десятичная – десять цифр – 0, 1, 2, 3, 4, 5, 6, 7, 8, 9; шестнадцатеричная – шестнадцать цифр – десять арабских цифр от 0 до 9 и еще шесть символов – А (цифра десять), В (цифра одиннадцать), С (цифра двенадцать), D (цифра тринадцать), E (цифра четырнадцать), F (цифра пятнадцать).
В непозиционных системах счисления величина, которую обозначает цифра, не зависит от положения в числе. При этом система может накладывать ограничения на положение цифр, например, чтобы они были расположены в порядке убывания.
Примером непозиционной системы является римская система счисления. В ней для записи чисел используются буквы латинского алфавита. При этом буква I всегда означает единицу, буква - V пять, X - десять, L - пятьдесят, C - сто, D - пятьсот, M - тысячу и т.д. Например, число 264 записывается в виде CCLXIV. При записи чисел в римской системе счисления значением числа является алгебраическая сумма цифр, в него входящих. При этом цифры в записи числа следуют, как правило, в порядке убывания их значений, и не разрешается записывать рядом более трех одинаковых цифр. В том случае, когда за цифрой с большим значением следует цифра с меньшим, ее вклад в значение числа в целом является отрицательным. Недостатком римской системы является отсутствие формальных правил записи чисел и, соответственно, арифметических действий с многозначными числами. По причине неудобства и большой сложности в настоящее время римская система счисления используется там, где это действительно удобно: в литературе (нумерация глав), в оформлении документов (серия паспорта, ценных бумаг и др.), в декоративных целях на циферблате часов и в ряде других случаев.
Для того чтобы лучше понять процесс хранения, обработки и отображения числовой информация в компьютере, необходимо уметь переводить числа из произвольной системы счисления в двоичную и наоборот, т.е. кодировать и декодировать числовую информацию.
Например, пусть необходимо получить двоичный код десятичного числа 18810 (здесь и в дальнейшем нижний индекс у числа обозначает основание системы счисления). Процедура получения двоичного кода этого числа заключается в последовательном делении на 2 этого числа, a затем всех частных от его деления:
1. Делим число 188 на 2. Остатком является 0. Это будет первая справа цифра (младший разряд) искомогодвоичного числа.
2. Полученное частное 94 снова разделим на 2. Получаем снова остаток 0. Это будет вторая справа цифра искомогодвоичного числа, и т.д.,
3. Наконец, предпоследнее частное, равное 1, разделим на 2, получим остаток 1. На этом процесс деления прекращаем, т.к. получили частное, равное нулю.
4 . Последний остаток, равный 1, будет первой слева цифрой (старшим разрядом) искомого двоичного числа.
188 | 2 | | | | | | | | |
188 | 94 | 2 | | | | | | | |
0 | 94 | 47 | 2 | | | | | | |
| 0 | 46 | 23 | 2 | | | | | |
| | 1 | 22 | 11 | 2 | | | | |
| | | 1 | 10 | 5 | 2 | | | |
| | | | 1 | 4 | 2 | 2 | | |
| | | | | 1 | 2 | 1 | 2 | |
| | | | | | 0 | 0 | 0 | |
| | | | | | | 1 | (старший разряд) | |
188 (10) = 10111100 (2) | | | | | | |
Рис. 3. Процедура перевода десятичного числа в двоичный код