Файл: Управление данными (пособие).pdf

Скачать файл (5,17Мб)

Заказать решение

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 31.03.2021

Просмотров: 1580

Скачиваний: 23

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

146

не

изменяется

во

все

время

существования

записи

Эти

записи

могут

просматриваться

помощью

диспетчера

файлов

При

выполнении

запроса

данным

СУБД

обращается

файловой

системе

которая

является

компонентом

операционной

системы

обеспечивает

доступ

соответствующим

записям

файлов

свою

очередь

точки

зрения

файловой

системы

хранимая

на

внешней

памяти

считываемая

оперативную

память

база

данных

выглядит

как

набор

страниц

данных

Дело

том

что

современные

запоминающие

устройства

устроены

таким

образом

что

минимальной

порцией

данных

операции

ввода

вывода

является

страница

содержащая

определенное

фиксированное

число

записей

Обычно

каждый

картеж

хранится

во

внешней

памяти

целиком

на

одной

странице

Отсюда

возникает

кстати

ограничение

СУБД

на

максимальную

длину

кортежа

Как

правило

также

одной

странице

хранят

кортежи

одного

отношения

хотя

возможны

решения

когда

одной

странице

размещают

кортежи

разных

логически

связанных

отношений

(

см

ниже

про

кластеризацию

данных

Реально

страницы

данных

могут

размещаться

на

дисках

или

дублироваться

(

кэшироваться

)

оперативной

памяти

Диспетчер

файлов

определяет

страницу

на

которой

находится

искомая

запись

формирует

запрос

для

доступа

соответствующей

странице

хранимых

данных

подсистеме

диспетчера

дисков

Диспетчер

дисков

осуществляет

все

дисковые

операции

ввода

вывода

Он

работает

непосредственно

хранимыми

на

дисках

данными

–

определяет

физическое

расположение

искомой

страницы

на

дисковом

носителе

(

цилиндры

дорожки

секторы

)

обеспечивает

соответствующее

управление

аппаратными

средствами

для

реализации

процесса

ввода

вывода

данных

конкретной

страницы

этой

многоступенчатой

процедуре

доступа

хранимым

данным

наиболее

медленными

являются

операции

по

непосредственному

чтению

записи

данных

на

физическом

носителе

так

как

они

связаны

механическими

операциями

позиционирования

головок

чтения

записи

на

соответствующие

цилиндры

дорожки

секторы

дисковой

подсистемы

При

реальной

работе

информационных

систем

базами

данных

запросах

данным

обычно

фигурируют

не

одна

множество

записей

данных

Поэтому

существенное

влияние

на

время

доступа

такому

множеству

данных

оказывает

близость

их

взаимного

расположения

на

физическом

носителе

их

размещение

одной

или

разных

физических

страницах

так

как

от

этого

существенно

зависит

время

затрачиваемое

дисковой

подсистемой

на

изменение

позиционирования

головок

при

переходе

от

одной

записи

другой

связи

со

сказанным

следует

упомянуть

один

из

используемых

промышленных

СУБД

методов

повышения

скорости

доступа

хранимым

данным

известный

как

кластеризация

данных

Идея

кластеризации

данных

состоит

том

чтобы

хранить

логически

связанные

записи

базы

данных

на

147

физическом

носителе

таким

образом

чтобы

минимизировать

время

требуемое

для

перемещения

головок

чтения

записи

при

переходе

от

одной

записи

другой

При

этом

может

рассматриваться

как

внутрифайловая

кластеризация

когда

речь

идет

записях

одной

реляционной

таблицы

базы

данных

межфайловая

кластеризация

когда

непосредственной

близости

на

одной

странице

размещаются

например

записи

нескольких

таблиц

связанных

помощью

внешних

ключей

11.2.

Индексирование

Очевидно

что

физическое

размещение

записей

базы

данных

соответствие

их

логической

взаимосвязью

целью

минимизации

времени

доступа

данным

на

практике

далеко

не

всегда

осуществимо

особенности

когда

речь

идет

данных

динамически

изменяющихся

во

времени

Кроме

того

при

поиске

данных

по

каким

либо

условиям

касающихся

значений

атрибутов

требования

оптимальному

размещению

записей

таблицы

для

разных

атрибутов

могут

оказаться

(

как

правило

оказываются

)

противоречивыми

Например

нельзя

упорядочить

записи

таблицы

алфавитном

порядке

одновременно

по

двум

более

атрибутам

Эффективным

методом

повышения

скорости

доступа

данным

без

использования

их

физического

упорядочивания

близкого

размещения

на

дисковом

носителе

является

индексирование

Рассмотрим

качестве

примера

таблицу

данными

студентах

запрос

выборе

всех

студентов

из

некоторого

города

Если

не

использовать

никаких

специальных

ухищрений

если

записи

отношения

не

упорядочены

соответствии

алфавитным

порядком

значений

поля

Город

то

для

решения

данной

задачи

должны

быть

последовательно

просмотрены

все

записи

таблицы

из

них

отобраны

те

которых

значения

атрибута

Город

равны

заданному

условии

выборки

значению

».

При

этом

реальное

количество

отобранных

записей

может

быть

существенно

меньше

общего

числа

просмотренных

при

выполнении

запроса

записей

Выполнение

описанной

задачи

может

быть

значительно

ускорено

если

создать

как

это

показано

на

рис

.11.2

дополнительную

структуру

данных

так

называемый

индексный

файл

городов

или

просто

индекс

(

index

–

указатель

этом

файле

представлены

все

значения

поля

Город

файла

соответствующего

таблице

Студент

но

уже

физически

упорядоченные

по

алфавиту

указателями

на

соответствующие

записи

файла

таблицы

Студент

Поиск

нужного

города

индексном

файле

может

быть

осуществлен

существенно

быстрее

чем

исходной

таблице

Во

первых

из

за

упорядоченного

по

148

алфавиту

расположения

наименований

городов

благодаря

чему

не

нужно

просматривать

все

до

одной

записи

файла

Во

вторых

физические

размеры

индексного

файла

существенно

меньше

файла

таблицы

Студент

для

его

размещения

требуется

меньше

физических

страниц

чтение

его

записи

диска

будет

происходить

существенно

быстрее

Индексы

приведенные

на

рис

.11.2

иногда

называют

инвертированными

списками

Если

обычный

файл

отношения

это

список

указателей

кортежа

со

значениями

соответствующих

полей

то

индексный

файл

представляет

собой

список

упорядоченных

значений

атрибута

указателями

соответствующих

записей

кортежей

Воронеж

Москва

Липецк

Иванов

Петров

Сидоров

Кузнецов

Попов

...

Город

RowID

Код

студ

Имя

студ

Город

Индексный

файл

городов

Файл

данных

отношения

СТУДЕНТ

Рис

.11.2.

Использование

индексирования

для

ускорения

доступа

записям

отношения

студент

Для

одного

файла

представляющего

отношение

базы

данных

могут

формироваться

одновременно

несколько

индексных

файлов

для

разных

его

полей

Например

для

приведенного

выше

на

рис

.11.2.

файла

отношения

студент

могут

быть

сформированы

индексные

файлы

для

полей

Код

студ

Имя

студ

Более

того

может

быть

сформирован

индексный

файл

по

составному

атрибуту

то

есть

по

комбинации

полей

Комбинированный

индекс

по

полю

Город

полю

Имя

студ

будет

представлять

собой

список

пар

значений

этих

атрибутов

упорядоченный

по

значениям

городов

при

одинаковых

значениях

поля

Город

упорядоченный

по

именам

студентов

149

11.3.

Использование

при

индексировании

структур

типа

деревьев

Недостатком

рассмотренной

выше

представленной

на

рис

.11.2

структуры

индекса

является

то

что

эффективность

такого

индекса

будет

падать

ростом

числа

записей

индексируемого

файла

частности

из

за

того

что

размер

индексного

файла

также

будет

увеличиваться

конце

концов

занимать

не

одну

большее

число

страниц

связи

этим

настоящее

время

для

построения

индексных

файлов

используется

более

сложная

но

более

эффективная

иерархическая

структура

типа

дерева

(

tree

) («

от

англ

Binary

Причиной

использования

для

индексирования

иерархических

структур

типа

дерева

заключается

желании

избежать

при

поиске

обязательного

просмотра

всех

страниц

индексного

файла

согласно

его

физической

структуры

Этого

можно

достичь

если

создать

индекс

следующего

уровня

уже

для

самого

индексного

файла

Учитывая

что

индексном

файле

список

значений

физически

упорядочен

следующие

последовательно

значения

сгруппированы

по

страницам

индексном

файле

следующего

уровня

нет

необходимости

ссылаться

на

каждую

запись

индекса

нижнего

уровня

Достаточно

организовать

ссылки

на

соответствующие

страницы

индекса

нижнего

уровня

Как

мы

знаем

страницы

данных

всегда

считываются

диска

оперативную

память

целиком

хотя

оперативной

памяти

нам

все

равно

придется

последовательно

просматривать

записи

считанной

страницы

это

будет

происходить

гораздо

быстрее

чем

при

поиске

нужных

записей

на

диске

Очевидно

что

индекс

следующего

уровня

будет

содержать

гораздо

меньше

записей

чем

индекс

первого

уровня

что

также

способствует

ускорению

поиска

Вследствие

этого

такой

индекс

называют

неплотным

индексом

отличие

от

плотного

которого

число

записей

равно

числу

записей

индексируемого

файла

Рассмотренная

идея

может

быть

развита

дальше

направлении

создания

многоуровневой

древовидной

индексной

структуры

Пример

такой

структуры

называемой

деревом

приведен

на

рис

.11.3.

точки

зрения

внешнего

логического

представления

дерево

–

это

сбалансированное

сильно

ветвистое

дерево

во

внешней

памяти

Сбалансированность

означает

что

длина

пути

от

корня

дерева

любому

его

листу

одна

та

же

Ветвистость

дерева

–

это

свойство

каждого

узла

дерева

ссылаться

на

большое

число

узлов

потомков

Физическая

организация

дерева

представляется

как

мультисписочная

структура

страниц

внешней

памяти

каждому

узлу

дерева

соответствует

страница

внешней

памяти

Индекс

построенный

на

основе

дерева

состоит

из

двух

частей

Первая

–

это

набор

страниц

последовательностями

значений

(

ключей

)

150

указателями

на

записи

индексируемого

файла

реальными

данными

(

нижний

ряд

на

рис

.13.3).

вторая

набор

неплотных

индексов

обеспечивающих

быстрый

доступ

страницам

набора

последовательностей

Комбинация

набора

последовательностей

набора

индексов

называется

плюс

деревом

или

деревом

На

самом

верхнем

уровне

дерева

находится

единственный

элемент

так

называемая

корневая

(

root

)

страница

на

самом

нижнем

уровне

дерева

набор

последовательностей

указанием

на

записи

индексируемого

файла

которые

являются

листьями

дерева

Смотрите также файлы

Уорд. Композиция кадра.pdf

приказ 5 августа.pdf

Отчет.docx

Лекция 10.docx

Лекция 07.docx

Файл: Управление данными (пособие).pdf

Смотрите также файлы

Информация

Списки файлов

Дополнительно