Файл: Диалектическое единство данных и методов в информационном процессе.pdf
Добавлен: 06.04.2023
Просмотров: 62
Скачиваний: 1
С этой целью институт стандартизации США (ANSI – American National Standard Institute) ввёл в действие систему кодирования ASCII (American Standard Code for Information Interchange – стандартный код информационного обмена США). В системе ASCII закреплены две таблицы кодирования – базовая и расширенная. Базовая таблица закрепляет значения кодов от 0 до 127, а расширенная относится к символам с номерами от 128 по 255.
Первые 32 кода (от 0 до 31) базовой таблицы выделены производителям аппаратных средств (в первую очередь компьютеров и печатающих устройств). Это управляющие коды, которым не соответствуют никакие символы, ими можно управлять работой технических устройств.
Коды от 32 по 127 предназначены для кодирования символов английского алфавита, знаков препинания, цифр, арифметических действий и некоторых вспомогательных символов. Символы русского алфавита и другие специальные символы кодируются кодами расширенной таблицы от 128 по 255.
Однако, рассмотренная выше система кодирования ASCII, не обеспечивает кодирование алфавитов многих других языков планеты. С целью устранения этого недостатка в настоящее время создана универсальная система – UNICODE, основанная на 16 – разрядном кодировании символов. Эта система позволяет обеспечить уникальные коды для 65536 различных символов. Этого количества достаточно для размещения в одной таблице символов большинства различных алфавитов планеты.
Если графическое изображение рассматривать как комбинацию мельчайших точек, образующих определённый узор, называемый растром. То с помощью линейных координат и индивидуальных свойств каждой точки, выраженных с помощью целых чисел, можно применить систему двоичного кодирования и для графических данных. К индивидуальным свойствам точки относятся яркость и цвет.
Чёрно – белые иллюстрации представляются в виде комбинации точек с 256 градациями серого цвета. Таким образом, для кодирования яркости любой точки достаточно 8 разрядов двоичного числа.
Кодирование цветных графических изображений осуществляется на принципе декомпозиции произвольного цвета на основные составляющие. В качестве таких составляющих используются три цвета: красный (Red, R), зелёный (Green, G) и синий (Blue, B). Такое кодирование называется системой RGB. При этом если для кодирования яркости каждой из основных составляющих использовать по 256 значений (8 двоичных разрядов), то на кодирование цвета одной точки требуется 24 разряда. Такая система кодирования обеспечивает 16,5 миллионов цветов. Эта система является полноцветной и называется True Color. Если уменьшить количество двоичных разрядов, используемых для кодирования цвета каждой точки, то можно сократить объём данных, но при этом заметно сократится диапазон кодируемых цветов. Кодирование цветной графики двоичными числами, содержащими 16 разрядов, называется High Color.
На практике применяется индексный метод кодирования информации о цвете. При этом код каждой точки растра выражает не цвет сам по себе, а только его номер (индекс) в справочной таблице, называемой палитрой, которая прилагается к графическим данным.
Для кодирования звуковой информации применяется метод таблично – волнового синтеза (Wave– Table). Сущность этого метода состоит в том, что используются заранее подготовленные таблицы образцов звуков. В технике такие образцы называют сэмплами. Числовые коды звуковой информации выражают: тип инструмента и номер его модели, высоту тона, продолжительность, интенсивность звука и динамику его изменения. А также некоторые параметры среды, в которой происходит звучание, и прочие параметры, характеризующие особенности звука.
Работа с большими наборами данных автоматизируется проще, когда данные упорядочены, то есть образуют заданную структуру. Существует три основных типа структур данных: линейная, табличная и иерархическая. При создании любой структуры данных необходимо обеспечить решение двух задач: как разделять элементы данных между собой и как разыскивать нужные элементы.
Линейные структуры – это хорошо знакомые списки. Список – это простейшая структура данных, отличающаяся тем, что каждый элемент данных однозначно определяется своим уникальным номером в массиве (списке).
Табличные структуры данных подразделяются на двумерные и многомерные.
Двумерные табличные структуры данных (матрицы) – это упорядоченные структуры, в которых адрес элемента определяется номером столбца и номером строки, на пересечении которых находится ячейка, содержащая искомый элемент.
Многомерные таблицы – это упорядоченные структуры данных, в которых адрес элемента определяется тремя и более измерениями. Для отыскания нужного элемента в таких таблицах необходимо знать параметры всех измерений (размерностей).
Линейные и табличные структуры являются простыми. Ими легко пользоваться, поскольку адрес каждого элемента задаётся числом (для списка), двумя числами (для двумерной таблицы) или несколькими числами для многомерной таблицы. Они также легко упорядочиваются. Основным методом упорядочения таких данных является сортировка. Недостатком простых структур данных является трудность их обновления. При добавлении, например, произвольного элемента в упорядоченную структуру возникает необходимость изменения адресных данных у других элементов.
Иерархические структуры – это структуры, объединяющие нерегулярные данные, которые трудно представить в виде списка или таблицы. В иерархической структуре адрес каждого элемента определяется маршрутом, ведущим от вершины структуры к данному элементу. Эти структуры по форме сложнее, чем линейные и табличные, но они не создают проблем с обновлением данных. Их легко развивать путём создания новых уровней. Недостатком иерархических структур является относительная трудоёмкость записи адреса элемента данных и сложность упорядочения. Поэтому для упорядочения в таких структурах применяется метод предварительной индексации. При этом каждому элементу данных присваивается свой уникальный индекс, который используется при поиске, сортировке и тому подобное. В качестве примера иерархической структуры может служить система почтовых адресов.
Одной из систем представления данных, принятых в информатике и вычислительной технике является система двоичного кодирования. Наименьшей единицей такого представления является бит (двоичный разряд).
Совокупность двоичных разрядов, выражающих числовые или иные данные, образует некий битовый рисунок. С битовым представлением удобнее работать, если этот рисунок имеет регулярную форму. В качестве таких форм используются группы из 8 битов, каждая из которых называются байтом. Однако во многих случаях целесообразно использовать 16 – разрядное, 24 – разрядное, 32 – разрядное, 64 – разрядное кодирование.
Байт является наименьшей единицей измерения количества данных (информации).
Более крупные единицы измерения данных образуются добавлением префиксов кило-, мега-, гига-, тера-.
1 Килобайт (Кбайт) = 1024 байт = 210 байт.
1 Мегабайт (Мбайт) = 1024 Кбайт = 220 байт.
1 Гигабайт (Гбайт) = 1024 Мбайт = 230 байт.
1 Терабайт (Тбайт) = 1024 Гбайт = 240 байт.
В более крупных единицах пока нет практической надобности.
В качестве единицы хранения данных (информации) принят объект переменной величины, называемый файлом
Файл – это последовательность произвольного числа байтов, обладающая уникальным собственным именем.
Заключение
Поскольку в определении файла нет ограничений на его размер, то можно представить себе файл, имеющий 0 байтов (пустой файл), и файл, имеющий любое число байтов. В определении файла особое внимание уделяется имени. Имя файла фактически несёт в себе адресные данные, без которых, данные, хранящиеся в файле, не станут информацией из-за отсутствия методов доступа к ним. Кроме адресных функций, имя файла может хранить сведения о типе данных, заключённых в нём.
Требование уникальности имени файла в вычислительной технике обеспечивается автоматически – создать файл с именем, тождественным уже существующему, не может ни пользователь, ни автоматика. Уникальность имени файла обеспечивается тем, что полным именем файла считается собственное имя файла вместе с путём доступа к нему.
Хранение файлов организуется в иерархической структуре, которая называется файловой структурой, В качестве вершины структуры служит имя носителя, на котором сохраняются файлы. Далее файлы группируются в каталоги (папки), внутри которых могут быть созданы вложенные каталоги (папки). Путь доступа к файлу начинается с имени устройства и включает все имена каталогов (папок), через которые проходит. В качестве разделителя используется символ “\“ (обратная косая черта).