Файл: Распределенные системы обработки информации (Понятие информации и данных ).pdf
Добавлен: 29.06.2023
Просмотров: 76
Скачиваний: 3
СОДЕРЖАНИЕ
ГЛАВА 1. ПОНЯТИЕ ДАННЫХ И ИНФОРМАЦИОННЫХ СИСТЕМ
1.1 Понятие информации и данных
1.2 Понятие и сущность информационной системы
ГЛАВА 2. МОДЕЛИ ПРЕДСТАВЛЕНИЯ ДАННЫХ В ИНФОРМАЦИОННЫХ СИСТЕМАХ
2.1 Абстрактная модель представления данных
2.2 Реляционная модель представления данных
2.3 Иерархическая модель представления данных
2.4 Сетевая модель представления данных
2.5 Постреляционная модель представления данных
2.6 Многомерная модель представления данных
Таблица 1
Отношение R
А1 |
А2 |
А3 |
А4 |
224596 |
Иванов |
11.03.2001 |
АБ-11-02к |
327845 |
Петров |
25.11.2000 |
ВБ-14-01а |
623212 |
Сидоров |
13.01.2001 |
АБ-11-02к |
… |
… |
… |
|
112536 |
Васин |
14.07.2002 |
ВБ-14-01а |
К достоинствам реляционной модели относятся простота и наглядность представления данных; наличие теоретического обоснования, так как модель основана на хорошо проработанной теории отношений; наличие математического аппарата – реляционной алгебры. К недостаткам модели относится сложность реализации связей 1 : М и М : М, которая ведет к дублированию данных.
Примеры СУБД для реляционной модели: dBase, DB2, R:Base, FoxBase, FoxPro, Visual Foxpro, Clarion, Paradox, Access, Ingress, Oracle, ПАЛЬМА (ИК АН УССР), HyTech (МИФИ) и др.
2.3 Иерархическая модель представления данных
Рассмотрим, как можно представить данные, подлежащие хранению в БД, с помощью иерархической модели (рис. 1).
Рисунок 1 - Представление данных в виде иерархической модели [7, с. 61]
В иерархической модели связь между данными является иерархической с четко установленными уровнями вложенности. Данные представляются в виде поле – сегмент – запись. С помощью сегментов описываются объекты предметной области. Сегмент состоит из множества полей, которые описывают свойства объектов. Запись представляет собой полную совокупность иерархически упорядоченных сегментов на всем иерархическом пути. Всегда имеется один корневой сегмент.
Между сегментами существует связь «исходный - порожденный», которая может быть взаимосвязью 1 : 1 или 1: М. В иерархической модели представление данных подчиняется следующим правилам:
1) каждая запись содержит только один корневой сегмент;
2) корневой сегмент может иметь произвольное число порожденных сегментов;
3) каждый порожденный сегмент имеет только один исходный сегмент и множество порожденных сегментов (на практике до 15 уровней вложенности и до 255 типов сегментов в одной записи).
В качестве примера рассмотрим базу данных «Обучение», в которой будет представлено 5 сегментов: «курс», «предварительный курс», «цикл занятий», «преподаватель», «студент». Структура БД для иерархической модели представлена на рисунке 2. Экземпляр одной записи для этой БД представлен на рисунке 3. Практически запись представляется в виде дерева.
Рисунок 2 - Структура БД «Обучение» для иерархической модели [7, 63]
Рисунок 3 - Экземпляр записи для иерархической модели [7, с. 63]
Иерархическая база данных представляет собой упорядоченную совокупность экземпляров данных типа «дерево», содержащих экземпляры типа «запись». Часто отношения родства между типами переносятся на отношения между самими записями. Обход всех элементов иерархической БД обычно производится сверху вниз и слева направо. Команды ЯОД для иерархической модели включают операторы по описанию базы данных, сегментов и полей. Команды ЯМД для иерархической модели содержат операторы, организующие поиск (например, «дать уникальный» - специфицирует путь от экземпляра корневого сегмента до искомого сегмента, «дать следующий», «дать следующий под исходным»), включение нового сегмента, удаление сегмента, замену сегмента и др.
При выполнении ряда операций, таких как включение и удаление, возникают трудности. При удалении, например, будут удалены экземпляры всех подчиненных сегментов. К достоинствам иерархической модели относятся простота понимания и использования, наличие хорошо зарекомендовавших себя СУБД, простота оценки операционных характеристик благодаря заранее заданным взаимосвязям. К недостаткам модели относится трудность организации выполнения таких операций как включение, добавление и удаление данных, возможность доступа к любому сегменту только через все предшествующие сегменты включая обязательно корневой сегмент и другие проблемы, связанные со спецификой модели.
Примеры СУБД для иерархической модели: IMS, PC/FOCUS, Team-Up, Data Edge, Adabas, ОКА, ИНЭС, МИРИС и др.
2.4 Сетевая модель представления данных
Рассмотрим, как можно представить данные, подлежащие хранению в БД, с помощью сетевой модели (рис. 4).
Рисунок 4 - Представление данных в виде сетевой модели [7, с. 85]
В сетевой модели используются понятия элемент – запись – набор и успешно реализуется взаимосвязь М : М. Объект описывается в виде записи, а его свойства – в виде совокупности элементов, составляющих запись. Набор служит для организации связей между записями. Каждая порожденная запись может иметь более одной исходной записи. Сетевая структура бывает простой или сложной в зависимости от того, какова связь «исходный – порожденный», может содержать циклы. Сеть по сравнению с иерархией является более общей структурой.
Введем понятие набора. Если m – отображение вида М : 1 записей типа R в записи типа S, то с каждой записью r типа R можно ассоциировать множество Sr записей s типа S таким образом, что m(s)=r . Тогда каждое множество Sr вместе с записью r называется экземпляром набора. Запись r называется владельцем набора, а каждая запись s такая, что m(s)=r – членом этого набора.
Приведем пример набора (рис. 5). Между записью типа R и записью типа S имеется взаимосвязь 1: М. В экземпляр набора для записи-владельца r1 как члены набора входят записи-члены s1 и s2 (множество Sr1). В экземпляр набора для записи-владельца r2 как члены набора входят записи-члены s1, s5 и s11 (множество Sr2)
Рисунок 5 - Пример набора [7, с. 89]
Рассмотрим в качестве примера БД «Поставляемые изделия». Имеются три записи: 1) запись P «поставщик» с элементами «Номер поставщика», «Фамилия», «Город»; 2) запись IZ «Изделие» с элементами «Номер изделия», «Название», «Цвет», «Завод»; 3) запись PC «Поставка» с элементами «Номер поставщика», «Номер изделия», «Количество». Для реализации взаимосвязей создано два набора: набор P-PC – «Поставщик - Поставка»; набор IZ-PC – «Изделие - Поставка». Структура этой базы данных в виде сетевой модели представлена на рисуноке 6.
Рисунок 6 - Структура БД «Поставляемые изделия» [7, с. 90]
К достоинствам сетевой модели относится простота реализации взаимосвязи М : М, разделение данных и связей, легкость выполнения операций включения и удаления. К недостаткам относится сложность представления данных как на логическом, так и на физическом уровне, сложность программ при реализации СУБД для сетевой модели.
Примеры СУБД для сетевой модели: IDMS, СЕТЬ, db-Vista, СЕТОР, КОМПАС и др.
2.5 Постреляционная модель представления данных
Постреляционная модель представления данных является расширенной реляционной моделью, в которой снято ограничение неделимости данных, хранящихся в записях таблиц БД. В постреляционной модели допускаются многозначные поля, значения в которых являются множеством. Набор значений многозначных полей является самостоятельной таблицей, встроенной в основную таблицу. В таблице 2 приведен пример представления данных в виде постреляционной модели.
Таблица 2
Пример данных в виде постреляционной модели
Код заказа |
Фамилия клиента |
Наименование товара |
Стоимость за единицу товара |
Количество товара |
95 |
Иванов |
стул стол |
2000 7000 |
2 1 |
96 |
Петров |
шкаф-купе |
37000 |
1 |
97 |
Сидоров |
прикроватная тумба |
9700 |
2 |
В постреляционной модели данные хранятся более эффективно по сравнению с реляционной моделью. При обработке не требуется выполнять операцию «соединение» для двух таблиц. Кроме того, в постреляционной модели поддерживаются ассоциированные многозначные поля (множественные группы). Совокупность ассоциированных полей называется ассоциацией. В строке таблицы первое значение одного столбца ассоциации соответствует первым значениям всех других столбцов ассоциации. В постреляционной модели на длину и количество полей в записях таблицы не накладывается требование постоянства, что делает структуру данных и таблиц более гибкой.
В постреляционной модели допускается хранение в таблицах БД ненормализованных данных, вследствие чего возникает проблема обеспечения целостности и непротиворечивости данных. Эта проблема решается путем включения в СУБД на основе постреляционной модели инструментов, подобных хранимым процедурам в клиент-серверных системах. Для поддержки функций контроля значений в полях таблиц БД создаются специальные процедуры – коды конверсии и коды корреляции, которые автоматически запускаются на обработку как до, так и после обращения к данным. При этом коды корреляции выполняются сразу после чтения данных, перед их обработкой, а коды конверсии выполняются сразу после обработки данных [12, с. 65].
Достоинства постреляционной модели: возможность представления совокупности связанных реляционных таблиц в виде одной постреляционной таблицы; высокая наглядность представления информации; повышение эффективности обработки данных в БД. Недостатки постреляционной модели: сложность решения проблемы обеспечения целостности и непротиворечивости данных.
Примеры СУБД на основе постреляционной модели: uniVers, Bubba, Dasdb и др.
2.6 Многомерная модель представления данных
Многомерная модель представления данных появилась почти одновременно с реляционной моделью, но интерес к этой модели возрос только с середины 90-ых годов прошлого столетия. Codd E. опубликовал статью (1993 г.), в которой сформулировал 12 основных принципов к системам класса OLAP (OnLine Analytical Processing – оперативная аналитическая обработка), важнейшие из которых связаны с возможностями концептуального представления и обработки многомерных данных. Системы с использованием многомерной модели позволяют оперативно обрабатывать информацию для проведения анализа и принятия решений.
Многомерность модели данных означает не многомерность визуализации цифровых данных, а многомерное логическое представление структуры информации при описании и в операциях манипулирования данными. По сравнению с реляционной моделью многомерная модель обладает более высокой наглядностью и информативностью. В таблицах 3 и 4 приведены соответственно реляционное и многомерное представления одних и тех же данных.
Таблица 3
Данные в виде реляционной модели
Модель телефона |
Месяц |
Объем продаж |
Samsung Galaxy J5 |
июнь |
70 |
Samsung Galaxy J5 |
июль |
60 |
Samsung Galaxy J5 |
август |
50 |
Microsoft Lumia 650 |
июнь |
20 |
Microsoft Lumia 650 |
июль |
35 |
LG K10 K430n |
июль |
45 |
Таблица 4
Данные в виде многомерной модели
Модель телефона |
июнь |
июль |
август |
Samsung Galaxy J5 |
70 |
60 |
50 |
Microsoft Lumia 650 |
20 |
35 |
- |
LG K10 K430n |
- |
45 |
- |
В развитии концепции информационных систем можно выделить два направления:
- системы оперативной (транзакционной) обработки – такие ИС создаются на основе баз данных, построенных на реляционной модели;
- системы аналитической обработки (системы поддержки принятия решений) – такие ИС создаются на основе баз данных, построенных на многомерной модели, которая обеспечивает более эффективную обработку данных [8, с. 122].
СУБД на основе многомерной модели данных предназначены для интерактивной аналитической обработки информации. Здесь используют такие основные понятия, как агрегируемость, историчность и прогнозируемость данных.
Агрегируемость данных означает рассмотрение информации на различных уровнях ее обобщения. В ИС степень детальности представления информации для пользователя зависит от его уровня: аналитик, пользовательоператор, менеджер, руководитель.