Файл: Сущность оперативной аналитической обработки данных (OLAP).pdf

ВУЗ: Не указан

Категория: Курсовая работа

Дисциплина: Не указана

Добавлен: 02.07.2023

Просмотров: 281

Скачиваний: 6

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Глава 2. OLAP-клиент - OLAP-сервер, реализации OLAP

2.1 OLAP – клиент – OLAP- сервер

При построении информационной системы OLAP-функциональность может быть реализована как серверными, так и клиентскими OLAP-средствами. На практике выбор является результатом компромисса эксплуатационных показателей и стоимости программного обеспечения.

Объем обрабатываемых данных

Размер данных обусловливается совокупностью следующих данных: количество записей, элементов измерений, измерений, фактов и протяженность измерений. Установлено, что OLAP-сервер способен подвергать обработке крупные размеры данных, чем OLAP-клиент при одинаковой мощности ПК. Это объясняется тем, что OLAP-сервер хранит на жестких дисках многомерную базу данных, включающую заранее вычисленные кубы.

Клиентские программы в момент выполнения OLAP-действий выполняют к ней требования на SQL-подобном языке, получая не весь куб, а его отображаемые части. OLAP-клиент в период деятельность обязан иметь в оперативной памяти полный куб. В случае ROLAP-архитектуры, следует заранее погрузить в память полный используемый для вычисления куба массив данных. Помимо этого, при повышении количества измерений, фактов либо элементов измерений число агрегатов увеличивается в геометрической прогрессии. Подобным образом, размер данных, обрабатываемых OLAP-клиентом, располагается в непосредственной связи с размером оперативной памяти ПК пользователя.

Но отметим, то что большая часть OLAP-клиентов гарантируют выполнение расчисленных вычислений. По этой причине под количеством обрабатываемых записей, что ограничивает службу абонентного OLAP-ресурсы, подразумевается никак не размер основных данных корпоративной БД, а объем агрегированной выборки из нее. OLAP-клиент производит запрос к СУБД, котором описываются требование фильтрации и алгоритм предварительной группировки основных данных. Сервер обретает, группирует записи и отдаёт компактную выборку для последующих OLAP-вычислений. Объем этой выборки способен быть в 10-ки и сотни раз меньше размера основных, не агрегированных записей. Таким образом, необходимость такого OLAP-клиента в ресурсах ПК значительно уменьшается.

Помимо этого, на число измерений накладывают ограничения возможности человеческого восприятия. Установлено, что средний человек способен одновременно оперировать 3-4, максимум 8 измерениями. При огромном числе измерений в динамической таблице восприятие данных значительно усложняется. Этот фактор необходимо принимать во внимание при предварительном расчете своевременной памяти, которая может понадобиться OLAP-клиенту.


Длина измерений также оказывает большое влияние на объем адресного пространства OLAP-средства, занимающегося при вычислении OLAP-куба. Чем длиннее измерения, тем больше ресурсов необходимо для выполнения предварительной сортировки многомерного массива, и наоборот. Только лишь короткие измерения в начальных данных – ещё один довод в пользу OLAP-клиента.

Производительность системы

Данная оценка обусловливается двумя рассмотренными ранее условиями: объемом обрабатываемых данных и мощностью ПК. При возрастании числа, к примеру, измерений, производительность абсолютно всех OLAP-средств уменьшается за счет существенного повышения числа агрегатов, однако при этом темпы уменьшения различные. (Приложение А)

Скоростные свойства OLAP-сервера менее восприимчивы к увеличению объема данных. Это объясняется разными технологиями обработки запросов пользователей OLAP-сервером и OLAP-клиентом. К примеру, при операции детализации OLAP-сервер обращается к хранимым данным и вытягивает данные этой ветки. OLAP-клиент же вычисляет полный комплект агрегатов в период загрузки.

Однако до определенного объема данных производительность серверных и клиентских средств является сопоставимой. Для OLAP-клиентов, поддерживающих распределенные вычисления, область сопоставимости производительности может распространяться на объемы данных, покрывающие потребности в OLAP-анализе огромного количества пользователей. Это подтверждают результаты внутреннего тестирования MS OLAP Server и OLAP-клиента "Контур Стандарт". Тест выполнен на ПК IBM PC Pentium Celeron 400 МГц, 256 Mb для выборки в 1 миллион уникальных (т.е. агрегированных) записей с 7 измерениями, содержащими от 10 до 70 членов. Время загрузки куба в обоих случаях не превышает 1 секунды, а выполнение различных OLAP-операций выполняется за сотые доли секунды.

Когда размер выборки превысит объем оперативной памяти, начинается обмен с диском и производительность OLAP-клиента резко падает. Только с этого момента можно говорить о преимуществе OLAP-сервера.

Следует помнить, что точка "перелома" определяет границу резкого удорожания OLAP-решения. Для задач каждого конкретного пользователя эта точка легко определяется по тестам производительности OLAP-клиента. Такие тесты можно получить у компании-разработчика.

Помимо этого, стоимость серверного OLAP-решения увеличивается при повышении числа пользователей. Проблема в том, что OLAP-сервер осуществляет расчеты для всех пользователей на одном ПК. Соответственно, чем больше число пользователей, тем больше оперативной памяти и процессорной мощности необходимо ПК.


Таким образом, если объемы обрабатываемых данных лежат в сфере сопоставимой производительности серверных и клиентских систем, то при других одинаковых условиях, применение OLAP-клиента станет выгоднее.

Организация архитектур с прямым доступом к первичным данным

Применение OLAP-сервера в "классической" идеологии предусмат-ривает выгрузку данных реляционных СУБД в многомерную БД. Выгрузка производится за конкретный промежуток, поэтому данные OLAP-сервера не отражают состояние на текущий период. Этого недостатка лишены только те OLAP-серверы, которые поддерживают ROLAP-режим деятельность.

Аналогичным образом, целый ряд OLAP-клиентов дает возможность реализо-вать ROLAP- и Desktop-архитектуру с прямым доступом к БД. Это гарантирует анализ начальных данных в режиме online.

Мощность ПК пользователей

OLAP-сервер предъявляет минимальные требования к мощности клиентских терминалов. Объективно, требования OLAP-клиента выше, т.к. он совершает вычисления в своевременной памяти ПК пользователя. Состояние парка аппаратных средств конкретной организации - важнейший коэффициент, который обязан быть предусмотрен при выборе OLAP-средства. Однако и здесь есть свои "плюсы" и "минусы". OLAP-сервер не использует большую вычислительную мощность современных персональных ПК. В случае, если предприятие уже содержит парк современных ПК, неэффективно использовать их только в свойстве отображающих терминалов и в тоже время выполнять вспомогательные затраты на центральный сервер. Если мощность компьютеров пользователей "оставляет желать лучшего", OLAP-клиент будет работать медленно или не сможет работать вовсе. Покупка одного мощного сервера может оказаться дешевле модернизации всех ПК.

Здесь целесообразно принять во внимание тенденции в развитии аппаратного предоставления. Поскольку объемы данных для анализа являются практически константой, то стабильный рост мощности ПК будет приводить к расширению возможностей OLAP-клиентов и вытеснению ими OLAP-серверов в сегмент очень больших баз данных.

Сетевой трафик

При применении OLAP-сервера по сети на ПК клиента передаются только данные для отображения, в то время как OLAP-клиент получает весь объем данных первичной выборки. Поэтому там, где используется OLAP-клиент, сетевой трафик будет выше.

Но, при применении OLAP-сервера операции пользователя, к примеру, детализация, порождают новые требования к многомерной основе, а, следовательно, новую передачу данных. Выполнение же OLAP-операций OLAP-клиентом производится в оперативной памяти и, соответственно, не вызывает новых потоков данных в сети.


Также необходимо выделить, что современное сетевое аппаратное обеспечение обеспечивает высокий уровень пропускной способности.

Поэтому в подавляющем большинстве случаев анализ БД "средних" объемов с поддержкой OLAP-клиента не будет тормозить работу пользователя.

Затраты на внедрение и сопровождение

Стоимость OLAP-сервера довольно возвышенна. Сюда же следует плюсовать стоимость назначенного ПК и постоянные расходы на администрирование многомерной базы. Кроме того, внедрение и сопровождение OLAP-сервера требует от персонала достаточно высокой квалификации.

Стоимость OLAP-клиента на порядок ниже стоимости OLAP-сервера. Администрирования и вспомогательного технического оборудования под сервер не требуется. К квалификации персонала при внедрении OLAP-клиента высоких условий не предъявляется. OLAP-клиент может быть внедрен значительно быстрее OLAP-сервера.

Принципы работы OLAP-клиентов

Создание аналитических приложений с помощью клиентских OLAP-средств - процесс стремительный и не требующий специальной подготовки исполнителя. Пользователь, знающий физиологическую реализацию базы данных, способен создать аналитическое приложение самостоятельно, без привлечения ИТ-специалиста.

При использовании OLAP-сервера необходимо изучить 2 разные концепции, иногда от разных поставщиков, - для формирования кубов на сервере, и для исследования клиентского приложения. OLAP-клиент дает общий визуальный интерфейс с целью описания кубов и настройки к ним пользовательских интерфейсов.

Рассмотрим процесс создания OLAP-приложения с помощью клиентского инструментального средства. (Приложение Б)

Принцип работы ROLAP-клиентов - предварительное описание семантического слоя, за которым скрывается физическая структура исходных данных. При этом источниками данных могут быть: локальные таблицы, РСУБД. Список поддерживаемых источников данных определяется конкретным программным продуктом. После этого пользователь может самостоятельно манипулировать понятными ему объектами в терминах предметной области для создания кубов и аналитических интерфейсов.

Принцип работы клиента OLAP-сервера иной. В OLAP-сервере при создании кубов пользователь манипулирует физическими описаниями БД.

При этом в самом кубе создаются пользовательские описания. Клиент OLAP-сервера настраивается только на куб.

Поясним принцип работы ROLAP-клиента на примере создания динамического отчета о продажах (Приложение Б). Пусть исходные данные для анализа хранятся в двух таблицах: Sales и Deal.


При создании семантического слоя источники данных - таблицы Sales и Deal - описываются понятными конечному пользователю терминами и превращаются в "Продукты" и "Сделки". Поле "ID" из таблицы "Продукты" переименовывается в "Код", а "Name" - в "Товар" и т.д.

Затем создается бизнес-объект "Продажи". Бизнес-объект - это плоская таблица, на основе которой формируется многомерный куб. При создании бизнес-объекта таблицы "Продукты" и "Сделки" объединяются по полю "Код" товара. Поскольку для отображения в отчете не потребуются все поля таблиц - бизнес-объект использует только поля "Товар", "Дата" и "Сумма".

Далее на базе бизнес-объекта создается OLAP-отчет. Пользователь выбирает бизнес-объект и перетаскивает его атрибуты в области колонок или строк таблицы отчета.

В нашем примере на базе бизнес-объекта "Продажи" создан отчет по продажам товаров по месяцам.

При работе с диалоговым отчетом пользователь способен задавать условия фильтрации и группировки такими же элементарными движениями "мы-шью". В этот период ROLAP-клиент обращается к сведениям в кэше. Клиент же OLAP-сервера генерирует новый запрос к многомерной базе данных. К примеру, использовав в отчете о продажах специальный фильтр по товарам, можно получить отчет о продажах интересующих нас продуктов.

Все опции OLAP-приложения могут храниться в назначенном репозитории метаданных, в приложении либо в системном репозитории многомерной базы данных. Реализация зависит от определенного программного продукта.

2.2 Реализации OLAP

Известные OLAP-продукты[4]

Первым продуктом, выполняющим OLAP-запросы, был Express (компания IRI). Однако, сам термин OLAP был предложен Эдгаром Коддом, «отцом реляционных БД». А работа Кодда финансировалась Arbor, компанией, выпустившей свой собственный OLAP-продукт — Essbase (позже купленный Hyperion, которая в 2007 г. была поглощена компанией Oracle) — годом ранее. Другие хорошо известные OLAP-продукты включают Microsoft Analysis Services (ранее называвшиеся OLAP Services, часть SQL Server), Oracle OLAP Option, DB2 OLAP Server от IBM (фактически, EssBase с дополнениями от IBM), SAP BW, продукты Brio, BusinessObjects, Cognos, MicroStrategy и других производителей.

C технической точки зрения, представленные на рынке продукты делятся на "физический OLAP" и "виртуальный". В первом случае наличествует программа, выполняющая предварительный расчет агрегатов, которые затем сохраняются в специальную многомерную БД, обеспечивающую быстрое извлечение. Примеры таких продуктов - Microsoft Analysis Services, Oracle OLAP Option, Oracle/Hyperion EssBase, Cognos PowerPlay. Во втором случае данные хранятся в реляционных СУБД, а агрегаты могут не существовать вообще или создаваться по первому запросу в СУБД или кэше аналитического ПО. Примеры таких продуктов - SAP BW, BusinessObjects, Microstrategy. Системы, имеющие в своей основе "физический OLAP" обеспечивают стабильно лучшее время отклика на запросы, чем системы "виртуальный OLAP". Поставщики систем "виртуальный OLAP" заявляют о большей масштабируемости их продуктов в плане поддержки очень больших объемов данных.