Файл: Способы представления данных в информационных системах (Представление данных в системах обработки данных).pdf
Добавлен: 04.07.2023
Просмотров: 78
Скачиваний: 2
Существует три уровня представления данных: логический, уровень хранения и физический.
На логическом уровне работают с логическими структурами данных, отражающими реальные отношения между объектами и их характеристиками. Единицей информации на этом уровне является логическая запись. Каждый объект, описываемый соответствующей логической записью, характеризуется определенными признаками, являющимися атрибутами записи. На логическом уровне устанавливается перечень признаков, полностью характеризующий описываемый класс объектов. Совокупность признаков и их взаимосвязь определяют внутреннюю структуры логической записи.
Логическая структура данных должна исчерпывающе характеризовать объекты, сведения о которых обрабатываются СОД, адекватно отражать реальные отношения между объектами и их характеристика, обеспечивать удовлетворение информационных потребностей пользователей системы.
На уровне хранения оперируют со структурами хранения – представление логической структуры данных в памяти ЭВМ. Структура хранения должна полностью отображать логическую структуру данных и поддерживать её в процессе функционирования СОД. Единице информации на этом уровне также является логическая запись. При разработке или выборе структуры хранения должны учитываться особенности организации памяти ЭВМ. При этом устанавливается тип и формат данных, определяется способ поддержания логической структуры.
Каждая структура хранения предоставляет определенный способ доступа к данным и определенные возможности манипулирования данными. От выбора структуры хранения непосредственно зависит эффективность обработки данных. Поддержание структуры хранения осуществляется программными средствами. Для реализации этой структуры требуются определенные языки программирования, возможности которых, следует учитывать при разработке или выборе структуры хранения.
На физическом уровне представления данных оперируют с физическими структурами данных. На этом уровне решается задача реализации структуры хранения непосредственно в конкретной памяти ЭВМ. Единицей информации является физическая запись, представляющая конкретный участок носителя, на котором размешается одна или несколько логических записей. При разработке структур памяти анализируются: тип и объем памяти, способ адресации, методы и время доступа. На этом уровне решаются задачи по организации обмена данными между оперативной и внешней памяти ЭВМ.
При разработке структур данных всех уровней должен обеспечиваться принцип независимости данных. Физическая независимость данных означает, что изменения в физическом расположении данных и в техническом обеспечении системы не должны отражаться на логических структурах и прикладных программ. Логическая независимость данных означает, что изменения в структурах хранения не ложны вызывать изменений в логических структурах данных и в прикладных программах. Изменения, вносимые в логические структуры данных в связи с появление новых пользователей и новых запросов, не должны отражаться на прикладных программах других пользователей системы.
Соблюдение принципа независимости данных позволяет использовать особые виды данных: виртуальные и прозрачные.
Виртуальные данные существуют только на логическом уровне. Для программиста это как бы реально существующие данные, которыми он оперирует в программах. Каждый раз, при обращении к этим данным, операционная система определенным образом их генерирует на основании других данных, физически существующих в системе. Объявление некоторых данных виртуальными позволяет экономить машинную память.
Прозрачные данные представляются несуществующими на логическом уровне. Это позволяет скрыть от пользователя многие сложные механизмы, используемые при преобразовании логических структур данных в физические.
СОД имеют многоуровневую структуру данных состоящих из пяти уровней. Элементы каждого уровня имеют определенное название. Формирование элементов более высокого уровня осуществляется из элементов нижнего уровня в соответствии с определенными правилами.
Первый, самый нижний уровень составляют элементарные данные: числа, символы, логические данные, знаки. Эти данные не являются непосредственным объектом информационного поиска, но в ряде случаев к ним должен быть обеспечен доступ. Например, в процессе поиска может возникнуть необходимость сравнения отдельных символов в строках. Элементарные данные имеют определенную форму представления в оперативной памяти ЭВМ, для их хранения выделяется строго определенный объем памяти. Знание форматов хранения элементарных данных позволяет рассчитать объем памяти, необходимый для размещения массивов данных и программ.
Элементами второго уровня является поле записи. Это последовательность элементарных данных, имеющая определенный смысл, но не имеющая смысловой завершенности. Данные, образующие отдельное поле записи, описывают соответствующий признак объекта. Каждый признак объекта имеет наименование и значение. Так, для студентов, записи о которых хранятся в СОД, в качестве признаков могут использоваться: номер студенческого билета, ФИО, средний балл успеваемости. Каждый конкретный студент характеризуется определенными значениями этих признаков, например, наименование признака – средний бал, а значение признака – 4,7. Отдельные студенты отличаются значениями одноименных признаков. Отдельные студенты отличаются значениями одноименных признаков.
Число признаков, характеризующих объект, определяет количество полей в записи. В каждом поле помещается значение соответствующего признака. Поля записи именуются, причем имя поля может совпадать с наименованием признака.
Признак, используемый для идентификации записи в процессе обработки или поиска, называется ключевым или ключом записи. Поле записи, содержащее ключ, называется ключевым полем. Если каждое из возможных значений ключа идентифицирует единственную запись, то такой ключ называется уникальным. Так, номер студенческого билета является уникальным ключом каждой записи массива сведений о студентах данного вуза. В записи могут предусматриваться дополнительные поля для хранения служебной информации: меток, ссылок, указателей.
Поле записи может быть объектом информационного поиска в различных приложениях, а также в тех случаях, когда это поле ключевое. Однако поле записи само по себе не имеет смысловой завершенности. Например, поле средний балл может явиться объектом поиска, но информационную ценность значение этого поля будет иметь лишь в том случае, когда станут известными фамилия, имя и отчество студента.
Понятие поля записи не следует отождествлять с понятием поля машинной памяти. Эти понятия относятся к разным уровням представления данных. Для хранения поля записи могут использоваться единицы машинной памяти как фиксированной, так и переменной длины.
Поля записи объединяются в группу данных. Группа данных – элемент третьего уровня внутренней структуры записи – представляет собой поименованную совокупность элементов данных, рассматриваемую как единое целое. Например, группа данных, имеющая наименование адрес, состоит из элементов данных город, улица, номер дома, номер квартиры. В качестве элемента, группа может содержать в себе другую группу данных. Группа данных имеет определенный смысл и может быть объектом поиска, но не имеет смысловой завершенности. Например, адрес полезно знать лишь в том случае, если известно, кому он принадлежит.
Логическая запись представляет четвертый уровень структуры данных – это поименованная совокупность полей или групп данных. Запись является отдельной логической единицей и имеет смысловую завершенность. Каждая запись описывает индивидуальный объект или класс объектов. Логическая запись является непосредственным объектом информационного поиска и основной единицей обработки информации в СОД.
Перечень полей, последовательность их расположения и взаимосвязь между ними составляют внутреннюю структуру записи, которая в конечном итоге определяет тип записи. Поля записи могут располагаться последовательно друг за другом, в этом случае запись будет называться неструктурированной. Запись может быть структурированной, со сложными нелинейными связями между полями. Структуризация записи составляет одну из основных концепций баз данных.