Файл: Тема концепция управления данными в современных информационных системах Цель лекции.docx
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 24.11.2023
Просмотров: 234
Скачиваний: 1
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Главное назначение трехуровневой архитектуры – обеспечение независимости от данных, т.е. любые изменения на нижних уровнях БД не должны влиять на верхние уровни. Независимость от данных бывает двух типов:
-
логическая – полная защищенность внешних схем от изменений, которые вносятся в концептуальную схему;
физическая – защищенность концептуальной схемы от изменений, которые вносятся во внутреннюю схему.
4. Выбор СУБД
Проблема выбора СУБД возникает чаще всего перед ее приобретением и при переходе на новые аппаратно-программные средства.
Основным принципом выбора СУБД следует считать определение программного продукта, в наибольшей мере соответствующего предъявляемым требованиям. Эту задачу решить не очень просто. Во-первых, к СУБД предъявляется большое число требований, которые с течением времени изменяются, во-вторых, СУБД имеют большое число параметров, что затрудняет их сравнение. Кроме того, информация о СУБД часто носит рекламный характер, не позволяющий сделать правильное суждение.
Процедуру выбора СУБД следует проводить в три этапа:
1.На качественном уровне оценить предлагаемые программные продукты на предмет пригодности.
2.Оценка технических характеристик отобранных систем.
3.Оценка производительности программных продуктов.
К числу основных показателей пригодности программных продуктов относятся:
-
вид программного продукта; -
категории пользователей (профессиональные программисты, администраторы БД, квалифицированные пользователи, разрабатывающие приложения, конечные пользователи, различные комбинации перечисленных категорий);
- удобство и простота использования (понятные процедуры установки программных продуктов, удобный и унифицированный интерфейс конечного пользователя, простота выполнения обычных операций: создания БД, навигации, модификации, подготовки данных, выполнения запросов и отчетов и ряда других; наличие интеллектуальных подсистем подсказок, помощи в процессе работы и обучения, включая примеры);
-
модель представления данных. Наиболее распространенной является реляционная модель данных. Перспективными являются модели с объектной ориентацией, поскольку они обладают большими возможностями отражения семантики предметной области; -
качество средств разработки. При оценке качества средств разработки учитывается следующее: возможности создания пользовательских интерфейсов, мощность языка создания программ, автоматизация разработки различных объектов: экранных форм, отчетов, запросов. Предпочтение отдается системам, имеющим полнофункциональные генераторы и обеспечивающим удобство работы пользователя; -
качество средств защиты и контроля корректности базы данных. Доступ к функциям защиты должен предусматриваться на уровне средств разработки программ и на уровне пользователя. К важнейшим функциям контроля корректности относятся: обеспечение уникальности записей БД по первичному ключу, автоматический контроль целостности связей между таблицами во время выполнения операций обновления, вставки и удаления записей, проверка корректности значений в БД; -
качество коммуникационных средств. При оценке качества коммуникационных средств обращают внимание на следующие свойства программных продуктов:
-
поддержку сетевых протоколов, -
поддержку стандартных интерфейсов с БД, -
наличие средств групповой работы с информацией БД, -
способность использовать и модифицировать БД других форматов без импортирования или преобразования;
-
фирма – разработчик. Солидность фирмы-разработчика пакета, как правило, дает следующие преимущества:
-
высокое качество продукта, -
наличие документации и методических материалов, -
наличие «горячей линии» для консультаций по возникающим проблемам.
При выборе продукта следует обратить внимание на дату его появления. В качестве показателей «благополучия» можно использовать: твердое финансовое положение, перспективная динамика развития аппаратно-программных средств, годовой оборот, численность состава, объем продаж и т.д.
- стоимость. На стоимость программных продуктов в основном влияют вид программного продукта и фирма – разработчик. Стоимость полнофункциональных СУБД обычно колеблется в пределах $ 500 - $ 1000. Общая стоимость включает в себя стоимость прикладного инструментария, средств настройки конфигурации системы, администрирования БД и сопровождения. Иногда общая стоимость крупных систем, построенных на базе реляционных БД, достигает миллионов долларов. Основным фактором, определяющим общую стоимость системы, чаще всего является число поддерживаемых пользователей.
На уровне технических характеристик разнообразие СУБД еще больше, чем на качественном уровне. К техническим характеристикам относятся:
-
общие параметры (операционная среда, потребность в оперативной памяти, ограничения на максимальный объем БД и др.); -
ограничения на операции над данными; -
типы данных; -
возможности средств формулировки и выполнения запросов; -
работа в многопользовательских средах; -
инструментальные средства разработки приложений; -
импорт и экспорт.
Оценка производительности производится методом тестирования с помощью эталонных тестов из набора AS3AP (ANSI SQL Standard Scalable and Portable). В них контролируется широкий спектр часто встречающихся операций БД и моделируются однопользовательские и многопользовательские среды.
ТЕМА 3. Модели данных
Цель лекции: ознакомиться с моделями данных.
Ключевые слова: модель данных, предметная область, категории, запись, иерархическая модель, сетевая модель, реляционная модель, таблица, дерево, связь, отношение, атрибут, кортеж, ключ.
План лекции
-
Классификация моделей данных. -
Иерархическая и сетевая модели данных.
3. Реляционная модель данных
1.Система баз данных поддерживает в памяти ЭВМ модель предметной области.
Однако результат моделирования зависит не только от предметной области, но и от используемой СУБД, поскольку каждая система представляет собой инструментарий для отображения предметной области.
Этот инструментарий принято называть моделью данных. В то же время результат отражения предметной области в терминах модели данных называется моделью базы данных.
Модель данных определяется следующими компонентами:
-
допустимой организацией данных. Допустимая организация данных определяется разнообразием и количеством типов объектов модели данных, ограничениями на структуру данных. Каждая модель характеризуется определенными свойствами и методами структуризации. -
ограничениями целостности с целью сохранения непротиворечивости данных и обеспечения достоверного отображения предметной области в базе данных.
В настоящее время описано много разнообразных моделей, построение которых преследует разные цели. Из множества опубликованных моделей данных можно выделить три категории:
-
объектные модели данных; -
модели данных на основе записей; -
физические модели данных.
Применительно к трехуровневой архитектуре баз данных следует отметить, что первые две категории используются для описания данных на внешнем и концептуальном уровнях, а последняя категория — на внутреннем уровне.
Среди объектных моделей следует выделить ER-модель, которая наиболее часто используется в методологии проектирования баз данных, а также объектно-ориентированную модель, последнее время широко используемую в технологиях баз данных.
В модели данных на основе записей база данных состоит из нескольких записей фиксированного формата, которые могут иметь разные типы.
В большинстве коммерческих СУБД используются ставшие классическими два типа такого рода моделей данных: теоретико-графовые (ТГ) и теоретико-множественные (ТМ) модели данных.
К теоретико – графовым моделям относятся две разновидности:
-
сетевые модели; -
иерархические модели.
В таких моделях данных предусматриваются характерные для подобного рода структур операции навигации и манипулирования данными. Принципиальное значение при этом имеет то обстоятельство, что предусматривается одновременная обработка только одиночных объектов данных из БД — записей, сегментов или полей записей.
Теоретико-множественные модели используют математический аппарат, реляционную алгебру (знаковая обработка множеств), реляционное исчисление. К моделям данного типа относятся реляционные модели.
В соответствии с реляционной моделью данных БД представляется в виде совокупности таблиц, над которыми могут выполняться операции, формируемые в терминах реляционной алгебры и реляционного исчисления. Тот факт, что в этой модели данных, в отличие от ТГ - моделей, операции над объектами БД имеют теоретико-множественный характер, дает возможность формулировать запросы более компактно, в терминах более крупных агрегатов данных.
Физические модели данных описывают то, как данные хранятся в компьютере, представляя информацию о структуре записей, их упорядоченности и существующих путях доступа. Наиболее распространены из них следующие: обобщающая модель и модель памяти кадров.
2.Иерархическая модель
Первыми появились иерархические модели баз данных. В иерархической модели связи между данными представляют собой упорядоченный граф (или дерево).
Для описания структуры (схемы) иерархической БД на некотором языке программирования используется тип данных «дерево».
Тип «дерево» схож с типами данных «структура» языков программирования ПЛ/1 и Си и «запись» языка Паскаль. В них допускается вложенность типов, каждый из которых находится на некотором уровне.
Тип «дерево» является составным. Он включает в себя подтипы («поддеревья»), каждый из которых, в свою очередь, является типом «дерево». Каждый из типов «дерево» состоит из одного «корневого» типа и упорядоченного набора (возможно пустого) подчиненных типов. Каждый из элементарных типов
, включенных в тип «дерево», является простым или составным типом «запись». Простая «запись» состоит из одного типа, например, числового, а составная «запись» объединяет некоторую совокупность типов, например, целое, строку символов и указатель (ссылку).
Корневым называется тип, который имеет подчиненные типы и сам не является подтипом. Подчиненный тип (подтип) является потомком по отношению к типу, который выступает для него в роли предка (родителя). Потомки одного и того же типа являются близнецами по отношению друг к другу.
В целом тип «дерево» представляет собой иерархически организованный набор типов «запись».
Иерархическая БД представляет собой упорядоченную совокупность экземпляров данных типа «дерево» (деревьев), содержащих экземпляры типа «запись» (записи). Часто отношения родства между типами переносят на отношения между самими записями. Поля записей хранят собственно числовые или символьные значения, составляющие основное содержание БД. Обход всех элементов иерархической БД обычно производится сверху вниз и слева направо.
Базы данных иерархической модели удобны для описания объектов, имеющих древовидную структуру. Например, структуру некоторого предприятия можно представить в следующем виде (Рис.3.1.)
Рис. 3.1. Иерархическая структура предприятия
Запись, из которой идет ссылка на другую запись, называется «предком» или подчиняющей записью. Запись, на которую ссылаются, называется «потомком» или подчиненной записью. В иерархической модели каждый потомок имеет только одного предка, т.е. на один и тот же потомок не могут ссылаться два и более предков. Для указания ссылки запись-предок должен иметь поле, куда записывается физический адрес записи-потомка на носителе. Этот физический адрес на носителе, где хранится запись-потомок, называется указателем. Пример связывания записей (Рис. 3.2.):
Рис. 3.2. Связывание записей
Таким образом, для организации связи между данными в иерархической модели используются указатели физических адресов.
К достоинствам иерархической модели данных относятся эффективное: использование памяти ЭВМ и неплохие показатели времени выполнения основных операций над данными. Иерархическая модель данных удобна для работы с иерархически упорядоченной информацией.