Файл: Тема концепция управления данными в современных информационных системах Цель лекции.docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 24.11.2023

Просмотров: 237

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.


Недостатком иерархической модели является ее громоздкость для обработки информации с достаточно сложными логическими связя­ми, а также сложность понимания для обычного пользователя.

Сетевая модель

В сетевых моделях взаимосвязи между данными имеют вид произ­вольного графа, где каждый потомок может иметь два и более предков.

База данных сетевой модели состоит из набора записей и набора связей. Набор связей содержит поле с физическими указателями.

Таким образом, для описания схемы сетевой БД используется две группы типов: «запись» и «связь». Тип «связь» определяется для двух типов «запись»: предка и потомка. Переменные типа «связь» являют­ся экземплярами связей.

Сетевая БД состоит из набора записей и набора соответствую­щих связей. На формирование связи особых ограничений не накладывается. Если в иерархических структурах запись-потомок могла иметь только одну запись-предка, то в сетевой модели дан­ных запись-потомок может иметь произвольное число записей-предков (сводных родителей).

На следующем рисунке (Рис. 3.3) на запись, соответствующей должности инженера, ссылаются две записи.

Рис.3.3. Связывание записей в сетевой модели
Иерархическую модель можно рассматривать как частный случай сетевой модели.

Достоинством сетевой модели данных является возможность эф­фективной реализации по показателям затрат памяти и оперативнос­ти. В сравнении с иерархической моделью сетевая модель предо­ставляет большие возможности в смысле допустимости образования произвольных связей.

Недостатком сетевой модели данных является высокая сложность и жесткость схемы БД, построенной на ее основе, а также сложность для понимания и выполнения обработки информации в БД обычным пользователем. Кроме того, в сетевой модели данных ослаблен конт­роль целостности связей вследствие допустимости установления про­извольных связей между записями.

Использование физических указателей в иерархических и сетевых моделях баз данных значительно повысили скорость обработки дан­ных. В месте с тем в этих моделях очень скоро выявились серьезных недостатки, вызванные с поддержанием целостностей связей между данными. Контроль соблюдения целостности связей состоит в соблюдении принципа: нет потомков без предка. При изменении в базах данных возникает необходимость переопределения связей, физичес­ких указателей, что связано с большими трудностями, затратами вре­мени и усилий пользователей.


3.Использование в иерархических и сетевых моделях физических указателей для связывания записей значительно ограничивает воз­можности манипулирования данными и обработки баз данных этих моделей и является сложным и трудоемким процессом.

1970 году сотрудник фирмы IBM Эдгар Кодд опубликовал ряд ра­бот, в которых предложил новую модель баз данных, названную ре­ляционной моделью. Для обработки реляционных баз данных Кодд создал также языки обработки данных - реляционную алгебру и ре­ляционное исчисление, которые позволяют обрабатывать одной ко­мандой целиком всю базу данных, в то время как в иерархических и сетевых моделях за один раз обрабатывается только одна запись. Вместо физических указателей Кодд выдвинул идею связывать дан­ные в соответствие с их внутренними логическими взаимоотношени­ями, независимо от их физического размещения на носителе.

Суть реляционной модели состоит в том, что она организует и пред­ставляет данные в виде двумерных таблиц, называемых реляциями или отношениями. Одна таблица описывает одно объектное множество, на­пример, клиентов торговой фирмы. Столбцы таблицы соответствуют полям базы данных и называются атрибутами. Тем самым атрибут ха­рактеризует отдельное свойство объекта. Строки таблицы соответствуют записям и называются кортежами. Таким образом, кортеж представляет собой совокупность значений атрибутов для одного элемента объекта, а отношение - это множество кортежей. При разработке и описании струк­туры базы данных атрибуты в каждой таблице получают имена и опреде­ляются их типы, например, имя Name, тип CHAR или имя Amount, а тип REAL. Могут быть также типы INTEGER, DATA и другие.

Таблице также присваивается имя. Одна база данных может состоять из нескольких таблиц и описывает некоторый составной объект. Базе данных также присваивается имя. Например, учебная база данных Orion, описывающая некоторую торговую фирму, состоит из трех таблиц: Salespeople, Customers, Orders.

Если элемент таблицы еще не определен или не должен иметь ни­какого значения, то ему присваивается Null - значение.

Логическая связь между данными осуществляется с помощью пер­вичных и внешних ключей. Первичным ключом называется мини­мальный набор атрибутов в таблице, которые однозначно определяют каждую строку таблицы. Например, в таблице Salespeople первич­ным ключом является столбец Snum, а в таблице Customers - столбец Cnum. Таким образом, комбинация значений атрибутов, составляющие первичный ключ, для каждой записи является уникальным, неповто­ряющимся. Внешним ключом называется набор атрибутов таблицы, комбинация значений которых для некоторой записи соответствует не­которому значению первичного ключа. Внешние ключи обеспечивают необходимые связи между данными в таблицах одной базы данных.



Например, в базе данных Orion внешними ключами являются столбы Cnum и Snum таблицы Orders. Связи между данными можно представить в виде следующего рисунка (Рис. 3.4.)

Таким образом, из определения реляционных таблиц следует, что:

- атрибуты первичного ключа и соответствующего ему внешнего ключа необязательно должны иметь одинаковые имена, но зато должны быть одного типа;

- каждая таблица базы данных может иметь несколько внешних ключей, а первичный ключ может быть только один;

- в общем случае в таблице не должны быть два и более одинако­вых кортежей;

- кортежи в таблице следуют в произвольном порядке, неупо­рядочено;

-атрибуты также следуют в произвольном порядке, неупорядочено.


Рис.3.4. Связывание записей в реляционной модели

Достоинство реляционной модели данных заключается в про­стоте, понятности и удобстве физической реализации на ЭВМ. Именно простота и понятность для пользователя явились основ­ной причиной их широкого использования. Проблемы же эффек­тивности обработки данных этого типа оказались технически вполне разрешимыми.

Основными недостатками реляционной модели являются: отсутствие стандартных средств идентификации отдельных записей; сложность описания иерархических и сетевых связей.

ТЕМА 4. Реляционный подход к организации баз данных
Цель лекции: рассмотреть основные понятия реляционных баз данных, фундаментальные свойства отношений, реляционную модель данных, компоненты реляционной модели данных.

Ключевые слова: модель данных, база данных, домен, отношение, кортеж, типы данных, реляционная модель данных, связь, ключ, атрибут, целостность, сущность, ссылки, ограничение, реляционная алгебра, реляционное исчисление.
План лекции

1. Базовые понятия реляционных баз данных

2. Фундаментальные свойства отношений

3. Реляционная модель данных

4. Базисные средства манипулирования реляционными данными

1. Базовые понятия реляционных баз данных.

Основными понятиями реляционных баз данных являются тип данных, домен, атрибут, кортеж, первичный ключ и отношение.

Эти понятия рассматриваются на примере базы данных по сотрудникам некоторой организации (рис.4.1).



Рис.4.1. Пример отношения СОТРУДНИКИ
Тип данных. Понятие тип данных в реляционной модели данных полностью адекватно понятию типа данных в языках программирования. В современных реляционных БД могут использоваться следующие типы данных:

  • символьные фиксированной длины

  • символьные переменной длины, предназначенные для хранения текстовой информации большой длины, например, документа

  • числовые (целые, с фиксированной точкой, с плавающей точкой)

  • специализированных числовых данных (таких как "деньги")

  • временные и дата-временные, предназначенные для хранения информации о времени и/или дате

  • двоичные, предназначенные для хранения графических объектов, аудио- и видеоинформации, пространственной, хронологической и другой специальной информации

  • гиперссылки, предназначенные для хранения ссылок на различные ресурсы (узлы, файлы, документы и т.д.), находящиеся вне базы данных, например, в сети Internet, корпоративной сети Intranet или на жестком диске компьютера.

Домен. Понятие домена более специфично для баз данных, хотя и имеет некоторые аналогии с подтипами в некоторых языках программирования. В самом общем виде домен определяется заданием некоторого базового типа данных, к которому относятся элементы домена, и произвольного логического выражения, применяемого к элементу типа данных.

Если вычисление этого логического выражения дает результат "истина", то элемент данных является элементом домена. Наиболее правильной интуитивной трактовкой понятия домена является понимание домена как допустимого потенциального множества значений данного типа. Например, домен "Имена" определен на базовом типе строк символов, но в число его значений могут входить только те строки, которые могут изображать имя (в частности, такие строки не могут начинаться с мягкого знака).

Следует отметить также семантическую нагрузку понятия домена: данные считаются сравнимыми только в том случае, когда они относятся к одному домену. Например, значения доменов "Номера пропусков" и "Номера групп" относятся к типу целых чисел, но не являются сравнимыми.

В ряде реляционных СУБД понятие домена не используется, хотя в Oracle V.7 оно уже поддерживается.

Атрибут. Атрибут представляет собой элемент данных. Для элемента данных используются также термины “колонка”, “столбец”, “поле”. Столбцы обязательно именуются уникальными именами. Если все атрибуты одного отношения определены на разных доменах, осмысленно использовать для именования атрибутов имена соответствующих доменов.


Схема отношения, схема базы данных. Схема отношения — это именованное множество пар {имя атрибута, имя домена (или типа, если понятие домена не поддерживается}. Степень или "арность" схемы отношения определяет мощность этого множества.

Например, степень схемы отношения СОТРУДНИКИ равна четырем, то есть множество является 4-арным.

Схема БД (в структурном смысле) — это набор именованных схем отношений.

Кортеж. Кортеж (применяются также термины строка, запись), соответствующий данной схеме отношения, — это множество пар {имя атрибута, значение}, которое содержит одно вхождение каждого имени атрибута, принадлежащего схеме отношения. "Значение" является допустимым значением домена данного атрибута (или типа данных, если понятие домена не поддерживается). Тем самым, степень или "арность" кортежа, т.е. число элементов в нем, совпадает с "арностью" соответствующей схемы отношения.

Попросту говоря, кортеж — это набор именованных значений заданного типа.

Отношение. Отношение (таблица) — это множество кортежей, соответствующих одной схеме отношения. Иногда, чтобы не путаться, говорят "отношение-схема" и "отношение-экземпляр", иногда схему отношения называют заголовком отношения, а отношение как набор кортежей — телом отношения.

Понятие схемы отношения ближе всего к понятию структурного типа данных в языках программирования. Было бы вполне логично разрешать отдельно определять схему отношения, а затем одно или несколько отношений с данной схемой. Однако в реляционных базах данных это не принято. Имя схемы отношения в таких базах данных всегда совпадает с именем соответствующего отношения-экземпляра.

В классических реляционных базах данных после определения схемы базы данных изменяются только отношения-экземпляры. В них могут появляться новые и удаляться или модифицироваться существующие кортежи. Однако во многих реализациях допускается и изменение схемы базы данных: определение новых и изменение существующих схем отношения. Это принято называть эволюцией схемы базы данных.

Обычным житейским представлением отношения является таблица, заголовком которой является схема отношения, а строками — кортежи отношения-экземпляра; в этом случае имена атрибутов именуют столбцы этой таблицы. Элементы реляционной модели данных и формы их представления приведены в таблице:


Элемент

реляционной модели

Форма представления

Отношение

Таблица

Схема отношения

Строка заголовков столбцов таблицы (заголовок таблицы)

Кортеж

Строка таблицы

Сущность

Описание свойств объекта

Атрибут

Заголовок столбца таблицы

Домен

Множество допустимых значений атрибута

Значение атрибута

Значение поля в записи

Первичный ключ

Один или несколько атрибутов

Тип данных

Тип значений элементов таблицы