ВУЗ: Пермский национальный исследовательский политехнический университет
Категория: Учебное пособие
Дисциплина: Информатика
Добавлен: 19.10.2018
Просмотров: 12679
Скачиваний: 132
6
защита информации (обобщение приемов, разработка
методов и средств защиты данных);
автоматизация (функционирование программно-аппарат-
ных средств без участия человека);
стандартизация (обеспечение совместимости между ап-
паратными и программными средствами, а также форматами
представления данных, относящихся к различным типам вычис-
лительных систем).
1.2. Понятие информации. Свойства информации
Информация – это продукт взаимодействия данных и адек-
ватных им методов.
Для определения количества информации в случае различ-
ных вероятностей событий используется формула, предложен-
ная в 1948 г. американским инженером и математиком К. Шен-
ноном, в виде
2
1
log
N
i
i
i
I
p
p
,
где I – количество информации; N – количество возможных со-
бытий; p
i
– вероятность i-го события.
С точки зрения информатики наиболее важными являются
следующие свойства информации:
объективность (более объективной принято считать ту
информацию, в которую методы вносят меньший субъективный
элемент);
полнота (означает, что информация содержит мини-
мальный, но достаточный для принятия правильного решения
набор показателей);
достоверность;
адекватность (определенный уровень соответствия соз-
даваемого с помощью полученной информации образа реально-
му объекту, процессу, явлению и т.п.);
7
доступность;
актуальность (степень соответствия информации теку-
щему моменту времени).
1.3. Данные. Операции с данными
Данные – составная часть информации, представляющая
собой зарегистрированные сигналы. При этом физический метод
регистрации может быть любым (изменение электрических,
магнитных, оптических характеристик). В соответствии с мето-
дом регистрации данные могут храниться и транспортироваться
на носителях различных видов (бумага, магнитные и оптические
диски и т.п.) [1].
Характеристиками носителей являются параметр разре-
шающей способности (количество данных, записанных в приня-
той для носителя единице измерения) и динамический диапазон
(логарифмическое отношение интенсивности амплитуд макси-
мального и минимального регистрируемых сигналов). От этих
свойств носителя зависят такие свойства информации, как пол-
нота, доступность и достоверность.
В ходе информационного процесса данные преобразуются
из одного вида в другой с помощью методов. Обработка данных
включает в себя следующие операции:
сбор данных;
формализация данных (приведение данных, поступаю-
щих из разных источников, к одинаковой форме, чтобы сделать
их сопоставимыми между собой, т.е. повысить уровень их дос-
тупности);
фильтрация данных (отсеивание данных, в которых нет
необходимости для принятия решения);
сортировка данных (упорядочение данных по заданному
признаку для удобства их использования);
архивация данных (организация хранения данных в удоб-
ной и доступной форме);
защита данных;
8
транспортировка данных;
преобразование данных (перевод данных из одной фор-
мы в другую или из одной структуры в другую).
1.4. Основные структуры данных
Работа с большими наборами данных автоматизируется
проще, когда данные упорядочены, т.е. образуют заданную
структуру. Существует три основных типа структур данных:
– линейная – список данных – это упорядоченная структура,
в которой адрес элемента однозначно определяется его номером;
– табличная – матрица – это упорядоченная структура,
в которой адрес элемента определяется номером строки и номе-
ром столбца, на пересечении которых находится ячейка, содер-
жащая искомый элемент;
– иерархическая – это структура, в которой адрес каждого
элемента определяется путем доступа (маршрутом), ведущим от
вершины структуры к данному элементу.
В качестве единицы хранения данных принят объект пере-
менной длины, называемый файлом. Файл – это последователь-
ность произвольного числа байтов, обладающая уникальным
собственным именем (тип данных определяет тип файла). Сово-
купность файлов образует файловую структуру, которая, как
правило, относится к иерархическому типу.
1.5. Системы счисления
Система счисления – способ наименования и обозначения
чисел.
Различают два типа систем счисления: непозиционные
(римская система счисления) и позиционные (десятичная, двоич-
ная, восьмеричная, шестнадцатеричная системы счисления).
В позиционных системах счисления один и тот же числовой знак
(цифра) в записи числа имеет различные значения в зависимости
от того места (разряда), где он расположен.
9
Для записи числа в позиционной системе счисления с осно-
ванием p используется p различных символов, которые обозна-
чают числа от 0 до p–1 включительно. Два соседних разряда от-
личаются друг от друга в p раз. Так, в восьмеричной системе
счисления используются цифры 0–7, в шестнадцатеричной –
цифры 0–9 и латинские буквы A, B, C, D, E, F.
1.6. Кодирование данных двоичным кодом
Для автоматизации работы с данными, относящимися к раз-
личным типам, необходимо унифицировать их форму представ-
ления. С этой целью используется прием кодирования, т.е. выра-
жение данных одного типа через данные другого типа [1].
Двоичное кодирование, используемое в вычислительной
технике, основано на представлении данных последовательно-
стью всего двух знаков: 0 и 1. Эти знаки называются двоичными
цифрами, по-английски – binary digit или сокращенно bit (бит).
Одним битом могут быть выражены два понятия: 0 и 1 (да
или нет, истина или ложь и т.п.). Если количество битов увели-
чить до двух, то уже можно выразить четыре различных понятия:
00 01 10 11
Тремя битами можно закодировать восемь различных зна-
чений:
000 001 010 011 100 101 110
111
Увеличивая на единицу количество разрядов в системе дво-
ичного кодирования, мы увеличиваем в два раза количество зна-
чений, которое может быть выражено в данной системе, т.е. об-
щая формула имеет вид
2
m
N
,
где N – количество независимых кодируемых значений; m – раз-
рядность двоичного кодирования, принятая в данной системе.
Наименьшей единицей измерения данных является байт –
минимально адресуемая последовательность фиксированного
числа битов. Производные единицы измерения данных:
10
1 килобайт (Кбайт) = 1024 байт = 2
10
байт;
1 мегабайт (Мбайт) = 1024 Кбайт = 2
20
байт;
1 гигабайт (Гбайт) = 1024 Мбайт = 2
30
байт;
1 терабайт (Тбайт) = 1024 Гбайт = 2
40
байт;
1 петабайт (Пбайт) = 1024 Тбайт = 2
50
байт.
Кодирование числовых данных
Кодирование целых чисел осуществляется следующим об-
разом: число делится пополам до тех пор, пока в остатке не об-
разуется ноль или единица. Совокупность частного и всех остат-
ков от каждого деления, записанная в обратном порядке, и обра-
зует двоичный аналог десятичного числа.
Пример. Перевести 14
10
Х
2
.
14 : 2 = 7 (остаток 0), 7 : 2 = 3 (остаток 1), 3 : 2 = 1 (остаток 1).
Таким образом, 14
10
1110
2
.
Для перевода из двоичной системы счисления в десятичную
нужно представить число в виде многочлена и вычислить его
значение.
Пример. Перевести 1110
2
Х
10
.
1110
2
12
3
+ 1
2
2
+ 1
2
1
+ 0
2
0
= 8 + 4 + 2 = 14.
Таким образом, 1110
2
14
10
.
8 разрядов двоичного кода (8 бит) позволяют закодировать
целые числа от 0 до 255; 16 бит – целые числа от 0 до 65535,
а 24 бита – более 16,5 миллионов различных значений.
Для кодирования действительных чисел используют 64-раз-
рядное кодирование. При этом число предварительно преобразует-
ся в нормализованную форму: 1,2534671 = 0,12534671
10
1
.
Первая часть числа называется мантиссой, а вторая – харак-
теристикой.
Кодирование текстовых данных
При кодировании текстовых данных каждому символу ал-
фавита сопоставляется определенное целое число (например,
порядковый номер). Восьми двоичных разрядов достаточно для