Файл: Теория баз данных в экономических системы.doc

Добавлен: 15.11.2018

Просмотров: 2792

Скачиваний: 8

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.


1.2.2 Иерархические модели БД.


Иерархическая модель данных (ИМД) основана на понятии деревьев, состоящих из вершин и ребер. Вершина дерева ставится в соответствие совокупности атрибутов данных, характеризующих некоторый объект. Вершины и ребра дерева как бы образуют иерархическую древовидную структуру, состоящую из n уровней.

Первую вершину называют корневой вершиной. Она удовлетворяет условиям:

1. Иерархия начинается с корневой вершины.

2. Каждая вершина соответствует одному или нескольким атрибутам.

3. Hа уровнях с большим номером находятся зависимые вершины. Вершина предшествующего уровня является начальной для новых зависимых вершин.

4. Каждая вершина, находящаяся на уровне i, соединена с одной и только одной вершиной уровня i-1, за исключением корневой вершины.

5. Корневая вершина может быть связана с одной или несколькими зависимыми вершинами.

6. Доступ к каждой вершине происходит через корневую вершину по единственному пути.

7. Существует произвольное количество вершин каждого уровня.

Иерархическая модель данных состоит из нескольких деревьев, т. е. является лесом. Каждая корневая вершина образует начало записи логической базы данных. В ИМД вершины, находящиеся на уровне i, называют порожденными вершинами на уровне i-1.

Операции в ИМД имеют аналогичный СМД «позаписный» характер. Аппарат перемещения по структуре в графовых моделях служит для установки тех объектов данных, к которым будет применяться очередная операция манипулирования данными. Такие объекты называются текущими. Механизмы доступа к данным и перемещения по структуре данных в таких моделях достаточно сложны и существенным образом опираются на концепцию текущего состояния механизма доступа.

Основные достоинства ИМД: простота построения и использования, обеспечение определенного уровня независимости данных, простота оценки операционных характеристик. Основные недостатки: отношение «многие ко многим» реализуется очень сложно, дает громоздкую структуру и требует хранения избыточных данных, что особенно нежелательно на физическом уровне, иерархическая упорядоченность усложняет операции удаления и включения, доступ к любой вершине возможен только через корневую, что увеличивает время доступа.



1.2.3 Реляционные модели БД.


Сетевые и иерархические модели в настоящее время считаются устаревшими, но существует множество баз данных созданных на их основе и требующих поддержания их работы.

Одним из крупнейших достижений в этой области является создание реляционной модели данных и базирующейся на ней теории реляционных баз данных, которая позволила получить важные результаты для развития теории баз данных. Как отмечают многие исследователи, своим успехом реляционная модель данных во многом обязана, в первую очередь тому, что опиралась на строгий математический аппарат теории множеств, отношений и логики первого порядка. Разработчики любой конкретной реляционной системы считали своим долгом показать соответствие своей конкретной модели данных общей реляционной модели, которая выступала в качестве меры "реляционности" системы. Существует широкий спектр реляционных СУБД для приложений различного масштаба. Разработан международный стандарт языка запросов SQL, ставший универсальным интерфейсом коммерческих реляционных СУБД. По оценкам специалистов, примерно 99% мирового рынка баз данных занимают в настоящий момент реляционные СУБД. Несмотря на то, что подавляющее большинство приложений базируется на реляционной технологии, их роль начинает ослабевать.


В основе реляционной модели лежит математическое понятие теоретико-множественного отношения, которое представляет собой подмножество декартова произведения списка доменов. Домен- это просто множество значений. Рассмотрим пример реляционной базы данных.

Для решения сложных задач одного файла с данными оказывается недостаточно. Например, если необходимо составить заявку на товары, в которой должны присутствовать наименования товаров и имена поставщиков, и все это хранить в одной таблице, то в каждой записи наряду с наименованием товара следовало бы предусмотреть поле для адреса поставщика. Если один и тот же поставщик имеет несколько видов товаров, то многие записи будут хранить дублирующую информацию. Запись – это строка в таблице БД, а поле – столбец. Пример организации базы данных такого типа показан в таблице 1.


Таблица 1. Заявка на товары.


Товар

Цена, $

Адрес поставщика

Компьютер

900

Санкт - Петербург

Принтер

300

Санкт - Петербург

Факс

600

Москва


Данный способ организации базы данных имеет следующие недостатки:

  1. При добавлении в базу данных информации о новом товаре уже известного поставщика придется опять вводить его адрес в создаваемую запись.

  2. Если адрес поставщика изменится, необходимо будет проверить и обновить все записи, хранящие данный адрес.

  3. При хранении в каждой записи полного адреса поставщика увеличивается объем используемой памяти и затраты времени на управление данными, а поиск записей, соответственно, замедляется.

  4. Повышается вероятность появления ошибки при вводе и обработке данных.

Поэтому все современные системы основаны на реляционной модели управления базами данных. В такой базе данных каждая запись содержит информацию, относящуюся только к одному конкретному объекту, кроме того, с данными двух типов, например, со сведениями о товарах и поставщиках можно работать как с единым целым, основываясь на значениях, связанных между собой данных. Таким образом, преимущество ее заключается в том, что для каждого самостоятельного набора данных создается своя собственная таблица. В выше приведенном примере это была бы отдельная таблица наименований товаров и отдельная таблица поставщиков. В таблице наименований товаров адрес поставщика указывается в виде ссылки, номера записи таблицы поставщиков, содержащей реальный адрес. Эта взаимосвязь отражена в таблице 2.


Таблица 2. Взаимосвязь таблиц в реляционной базе данных.


Наименование товара

Цена

Кол - во

Адрес поставщика

1



2

2…




3…



2




Наименование поставщика

Адрес

ФИО руководителя

1



2



3…





Преимущества реляционной модели:

  1. Централизованное хранение информации о поставщиках.

  2. Меньшие затраты на ввод данных.

  3. Высокая скорость доступа к информации вследствие меньших затрат памяти.

  4. Высокая устойчивость к ошибкам.


1.2.4 Объектные модели БД.


Вместе с тем в последние годы четко обозначилась тенденция развития СУБД в объектном направлении.     Объектная      (объектно-ориентированная) модель не противоречит реляционной модели данных, а дополняет и развивает последнюю (точнее сказать — реляционная модель является частным случаем объектной формы представления данных). Однако, трудности развитого математического аппарата, на который могла бы опираться общая объектная модель данных, не существует, как нет и признанной базовой объектной модели. С другой стороны, некоторые авторы утверждают, что общая объектная модель данных в классическом смысле и не может быть определена по причине непригодности классического понятия модели данных к парадигме объектной ориентированности.

Парадигма - это пространство идей и законы движения в этом пространстве. В рамках парадигмы определены аксиомы, на которых выстраивается своя логика. Решения, вырабатываемые в рамках парадигмы, непротиворечивы и логичны.

Преимуществами объектных СУБД можно считать:

- объектные СУБД – открытые системы. Несложно добавить новый тип данных;

- объектные СУБД быстрее, чем реляционные, если в программе многократно осуществляется переход от объекта к объекту по ссылке. Поскольку ссылка на объект есть идентификатор, однозначно определяющий его расположение в базе, то переход по такой ссылке происходит быстрее, чем ссылка в реляционной модели. Объектные СУБД (ОСУБД) устраняют необходимость в языке запросов

Традиционные области применения ОСУБД – системы автоматизированного проектирования, моделирование, мультимедиа. ОСУБД широко используются в телекоммуникациях, различных аспектах автоматизации предприятия, издательском деле.


1.3 Интеграция неоднородных информационных ресурсов.


Информационная неоднородность ресурсов заключается в разнообразии понятий, словарей; отображаемых реальных объектов; правил, определяющих адекватность моделируемых объектов реальности; видов данных, способов их сбора и обработки; интерфейсов пользователей и т.д.

Реализационная неоднородность источников проявляется в использовании разнообразных компьютерных платформ, средств управления базами данных, моделей данных и знаний, средств программирования, операционных систем, и т.п. Системы, обеспечивающие совместимость различных компонентов называются интероперабельными системами.

Традиционные системы баз данных, используемые в информационных системах для сопровождения бизнес - процессов поддерживают большие объемы информации с помощью технологий оперативной обработки транзакций – OLTP. В OLTP-технологии обрабатывается детализированные данные, главные свойства данных здесь, их полнота и актуальность.


Под транзакцией понимается неделимая с точки зрения воздействия на БД последовательность операторов манипулирования данными (чтения, удаления, вставки, модификации) такая, что либо результаты всех операторов, входящих в транзакцию, отображаются в БД, либо воздействие всех этих операторов полностью отсутствует. Лозунг транзакции – «Все или ничего». Поддержание механизма транзакций - показатель уровня развитости СУБД. Корректный механизм поддержания транзакций одновременно является основой обеспечения целостности баз данных.

Для поддержки принятия решений нужны другие технологии. Необходимо объединять данные из различных источников (как из корпоративной информационной системы, так и из внешней среды), накапливать данные, делая их срезы во времени. Анализ таких данных позволяет оценивать состояние и динамику развития организации, делать обоснованные прогнозы и принимать обоснованные решения. Программные продукты, необходимые для обеспечения управленческих решений, должны обеспечивать хранение больших объемов данных, эффективный доступ к ним, а так же располагать развитыми средствами анализа данных и представления результатов в удобной для специалистов и руководства форме. Информационная технология, которая предоставляет руководителям различного уровня возможность получения необходимой информации для принятия управленческих, финансовых и кадровых решений называется OLAP (On-Line Analytical Processing- оперативной аналитической обработкой) - технологией.

OLAP – технологии базируются на технологиях хранилищ данных (Data warehouses). Хранилище данных обеспечивает накопление с течением времени данных для содействия в принятии решений. Хранилище - это репозитарий (склад) информации содержащий объединенные, проверенные данные, отражающие работу организации за длительный период. Объемы данных в хранилищах в несколько раз превосходят объемы данных в OLTP-системах.

Хранилища данных отличаются от баз данных или систем оперативной обработки транзакций (OLTP-систем) своим назначением и устройством:

- хранилище содержит данные, позволяющие проводить анализ деловых операций;

- хранилища обычно представляют собой системы, доступные только для чтения;

- в хранилищах накапливаются данные, не меняющиеся со временем и избавленные от ошибок.

Различия между OLAP и OLTP системами представлено в таблице 3.

Из-за большого объема данных в хранилищах, одной из основных проблем создания хранилищ является обеспечение высокой производительности обработки запросов. Запросы в хранилище отличаются высоким уровнем сложности.

Создание хранилищ данных – трудоемкий и длительный процесс. Наряду с хранилищами данных существуют и часто используются компаниями витрины данных (Data Mart), называемые также киосками данных. Такие системы создаются для отдельных подразделений компаний или для обеспечения отдельных видов деятельности. Объемы данных и требования к вычислительным ресурсам в витринах данных существенно меньше по сравнению с хранилищами. Витрины данных могут строиться как независимо, так и на основе хранилищ данных компании. Хранилища данных имеют двухуровневую или трехуровневую архитектуру. В двухуровневых хранилищах на верхнем уровне поддерживается объединенная информация. На нижнем уровне - различные источники баз данных. В трехуровневой архитектуре предусматривается поддержка витрин данных для отдельных подразделений компании над ее единым хранилищем.



1.4 Распределенная обработка данных в СУБД.


В современном бизнесе очень часто возникает необходимость предоставить доступ к одним и тем же данным группам пользователей, территориально удаленным друг от друга. В качестве примера можно привести банк, имеющий несколько отделений. Эти отделения могут находиться в разных городах, странах или даже на разных континентах, тем не менее необходимо организовать обработку финансовых транзакций (перемещение денег по счетам) между отделениями. Результаты финансовых операций должны быть видны одновременно во всех отделениях.


Таблица 3. Различие между OLAP и OLTP системами.

Характеристика

База данных ОLТР

База данных OLAP

базы данных

(оперативная обработка транзакций)

(хранилище данных, деловой анализ)

Содержимое

Текущие данные

Данные, накопленные за долгий период




времени

Структура данных

Структура таблиц соответствует

Структура таблиц понятна и удобна для


структуре транзакций

написания запросов (кубы фактов - схема




"звезда")

Типичный размер

Тысячи строк


Миллионы строк

таблиц




Схема доступа

Предопределена для каждого типа

Произвольная; зависит от того, какая именно


обрабатываемых транзакций

задача стоит перед пользователем в данный




момент и какие сведения нужны для ее




решения

Количество строк, к

Десятки


от тысяч до миллионов

которым обращается




один запрос




С какими данными

С отдельными строками

С группами строк (итоговые запросы)

работает приложение




Интенсивность

Большое количество бизнес -

На выполнение запросов требуется время:

обращений к базе

транзакций в минуту или в секунду

минуты или даже часы

данных




Тип доступа

Выборка, вставка и обновление

Выборка данных (почти 100 % операций)

Чем определяется

Время выполнения транзакции

Время выполнения запроса

производительность





Существуют два подхода к организации обработки распределенных данных:

- технология распределенной базы данных. Такая база включает фрагменты данных, расположенные на различных узлах сети. С точки зрения пользователей она выглядит так, как будто все данные хранятся в одном месте. Естественно, такая схема предъявляет жесткие требования к производительности и надежности каналов связи;