Файл: Сущность оперативной аналитической обработки данных (OLAP).pdf
Добавлен: 02.07.2023
Просмотров: 279
Скачиваний: 6
Введение
OLAP (online analytical processing) - представляет собой инструмент для анализа больших объёмов данных. В базе OLAP-технологий находятся понимание данные в виде OLAP-кубов. OLAP-кубы включают в себя бизнес - показатели, применяемые с целью рассмотрения и принятия управленческих решений, например: собственные средства, совокупные средства (активы), заёмные средства, рентабельность продукции, прибыль и т.д.
Бизнес - показатели хранятся в кубах не в виде простых таблиц как в обычных системах учета или бухгалтерских программах, а в разрезах представляющих собой основные бизнес - категории деятельности организации: товары, магазины, клиенты, время продаж и т. д. OLAP-кубы содержат бизнес - показатели, используемые для анализа и принятия управленческих решений, например: прибыль, рентабельность продукции, совокупные средства (активы), собственные средства, заемные средства и т.д.
Благодаря структурированию данных OLAP-кубы дают возможность незамедлительно осуществлять анализ данных и создавать отчёты в разных разрезах и с произвольной глубиной детализации. Отчёты могут формироваться специалистами, менеджерами, финансистами, начальниками подразделений в интерактивном режиме с целью быстро получить ответы на возникающие вопросы и принять решение. При этом работникам, для формирования отчётов не нужно обращаться к разработчикам программного обеспечения.
Актуальность темы в данной курсовой работе заключается в рассмотрении теоретических основ применения технологии OLAP;
Целью курсовой работы – является рассмотрение особенности технологии OLAP.
Предметом курсовой работы – является совокупность теоретических и практических аспектов технологии OLAP.
Объектом курсовой работы является технология OLAP.
Глава 1. Теоретические основы использования OLAP технологии
1.1. Понятие технологии OLAP
OLAP (оперативный анализ данных) — представляет собой инструмент для анализа больших объёмов данных. Взаимодействуя с OLAP-системой, пользователь сможет осуществлять гибкий просмотр информации, получать произвольные срезы данных и выполнять аналитические операции детализации, свёртки, сквозного распределения, сравнения во времени. Вся работа с OLAP-системой происходит в терминах предметной области[1].
OLAP-системы являются часть более общего определения Business Intelligence, что включает в себя кроме классического OLAP-сервиса средства компании общего применения документов, возникающих в процессе деятельности пользователей хранилища. Методика Business Intelligence гарантирует электронный обмен отчётными документами, разделение прав пользователей, доступ к аналитической информации из Internet/Intranet.
В основе концепции OLAP лежит принцип многомерного представления данных. По измерениям в многомерной модели выделяют факторы, влияющие на деятельность предприятия (например, время, продукты, отделения компании и т.п.) и получают гиперкуб, который затем наполняется показателями деятельности предприятия (цены, продажи, план, прибыли, убытки и т.п.). Наполнение это может вестись как реальными данными оперативных систем, так и прогнозируемыми на основе исторических данных, то есть данных, накопленных за определённый период времени.
Измерения гиперкуба могут носить непростой характер, быть иерархическими, между ними могут быть определены взаимоотношения. В ходе рассмотрения пользователь способен изменять точку зрения на данные тем самым, просматривая данные в различных сегментах и решая определенные задачи. Над кубами могут реализоваться различные операции, в том числе прогнозирование и относительное планирование.
Своевременные данные составляются из различных источников, очищаются, интегрируются и формируются в реляционное хранилище. При этом они уже доступны для рассмотрения при помощи разных средств возведения отчетов. Затем данные подготавливаются для OLAP-анализа. Они могут быть загружены в особенную БД OLAP или оставлены в реляционном хранилище. Важным его компонентом являются метаданные, в таком случае имеется информация о структуре, размещении и трансформации данных. Благодаря им обеспечивается результативное взаимодействие различных частей хранилища.
В 1993 г. Е.Ф. Коддом — создателем концепции реляционных СУБД и, по совместительству, OLAP — были сформулированы критерии OLAP. Они заключаются в недочетах реляционной модели и, в главную очередь, свидетельствуют на невозможность «объединять, смотреть и анализировать данные с точки зрения множественности измерений, то есть самым понятным для корпоративных специалистов способом». Единые условия к системам OLAP, расширяют работоспособность реляционных СУБД и содержат трехмерный анализ как одну из собственных характеристик.
Кодд определил 12 правил, которым должен удовлетворять программный продукт класса OLAP:
Многомерное концептуальное представление данных. Концептуальное представление модели данных в OLAP должно быть многомерным согласно своей природе, то есть позволять специалистам реализовывать подсознательные процедуры «анализа вдоль и поперёк», вращения и размещения направлений консолидации.
Прозрачность. Пользователь не должен знать о том, какие определенные средства используются с целью сбережения и обрабатывания данных, как данные сформированы и откуда берутся. Доступность. Специалист обязан обладать возможностью осуществлять исследование в рамках единой концептуальной схемы, однако при этом сведения могут быть под управлением оставшихся от старого наследства СУБД, находясь при этом привязанными к единой аналитической модели. То есть, инструмент OLAP обязан прикладывать собственную логическую схему на физические массивы данных, исполняя все без исключения преобразования, требующиеся с целью предоставления общего, согласованного и целостного мнения пользователя на информацию.
Устойчивая производительность. С повышением количества измерений и объемов основы данных специалисты не должны столкнуться, с каким бы то ни было сокращением производительности. Устойчивая производительность нужна для укрепления простоты применения и независимости от усложнений, которые требуются для доведения OLAP вплоть до конечного пользователя.
Клиент – серверная структура. Основная концепция работы в сфере клиент – сервер — это то, что серверный элемент инструмента OLAP обязан быть довольно интеллектуальным и обладать способностью, строить общую концептуальную схему на базе обобщения и консолидации разных закономерных и физиологических методик корпоративных баз данных для обеспечения результата прозрачности.
Равноправие измерений. Все измерения данных должны являться равноправными. Вспомогательные свойства могут быть предоставлены отдельным измерениям. Однако все они симметричны, эта вспомогательная функциональность может быть предоставлена каждому измерению. Базовая структура данных, формулы и форматы отчётов никак не обязаны опираться на какое-то одно измерение.
Динамическая обработка разреженных матриц. Инструмент OLAP должен обеспечивать оптимальную обработку разреженных матриц. Скорость доступа должна сохраняться вне зависимости от расположения ячеек данных и быть постоянной величиной для моделей, имеющих разное число измерений и различную разреженность данных.
Поддержка многопользовательского режима. Зачастую несколько аналитиков имеют необходимость работать одновременно с одной аналитической моделью или создавать различные модели на основе одних корпоративных данных. Инструмент OLAP должен предоставлять им конкурентный доступ, обеспечивать целостность и защиту данных.
Неограниченная поддержка кроссмерных операций. Вычисления и манипуляция данными по любому числу измерений не должны запрещать или ограничивать любые отношения между ячейками данных. Преобразования, требующие произвольного определения, должны задаваться на функционально полном формульном языке.
Интуитивное манипулирование данными. Конкретизация данных в колонках и строках, объединение и прочие манипуляции, характерные структуре иерархии, обязаны осуществляться в максимально подходящем, натуральном и удобном пользовательском интерфейсе.
Гибкий механизм генерации отчётов. Должны поддерживаться разнообразные методы визуализации данных, то есть отчёты обязаны отображаться в любой возможности ориентации.
Неограниченное количество измерений и уровней агрегации. Настоятельно рекомендуется допущение в каждом серьёзном OLAP инструменте как минимум пятнадцати измерений в аналитической модели. Более того, каждое из этих измерений должно допускать практически неограниченное количество определённых пользователем уровней агрегации.
Комплект этих требований, послуживших фактическим определением OLAP, следует рассматривать равно как рекомендательный, а конкретные продукты оценивать по степени приближения к идеально полному соответствию абсолютно всем требованиям. Позднее все эти требования были переработаны в так называемый тест FASMI, который также определяет требования к продуктам OLAP. FASMI — это аббревиатура от названия каждого пункта теста[2]:
Fast (Быстрый). Система OLAP должна обеспечивать минимальное время доступа к аналитическим данным — в среднем порядка 5 секунд;
Analysis (Анализ). Система OLAP должна давать пользователю возможность осуществлять числовой и статистический анализ;
Shared (Разделяемый доступ). Система OLAP должна предоставлять возможность работы с информацией многим пользователям одновременно;
Multidimensional (Многомерность). Система OLAP должна обеспечивать многомерное концептуальное представление данных, включая полную поддержку для иерархий.
Information (Информация). Система OLAP должна давать пользователю возможность получать нужную информацию, в каком бы электронном хранилище данных она не находилась.
Данные могут храниться в реляционных или в многомерных структурах. Поэтому в настоящее время применяются три способа хранения данных:
MOLAP – начальные и агрегатные данные хранятся в многомерной базе данных. Сохранение данных в многомерных текстурах дает возможность манипулировать сведениями как многомерным массивом, благодаря чему темп вычисления агрегатных значений схожа для любого из измерений. Однако в этом случае многомерная база данных оказывается излишней, таким образом как многомерные данные целиком содержат исходные реляционные данные.
ROLAP – начальные данные остаются в той же реляционной базе данных, где они первоначально и были. Агрегатные же данные помещают в специально основанные для их хранения служебные таблицы в той же базе данных.
HOLAP – начальные сведения остаются в той же реляционной базе данных, где они первоначально были, а агрегатные данные хранятся в многомерной базе данных.
Определенные OLAP – средства поддерживают хранение данных только лишь в реляционных структурах. Определенные – только лишь в многомерных. Но большая часть современных серверных OLAP-средств поддерживают все 3 метода хранения данных. Подбор метода хранения зависит от размера и структуры начальных данных, условий к скорости выполнения запросов и частоты обновления OLAP-кубов.
Отметим также, что подавляющее большая часть нынешних OLAP-средств не хранит свободных значений.
Одним из популярных средств исследования OLAP-систем считается семейство программных продуктов Oracle Express OLAP фирмы Oracle. Программное предоставление Oracle Express предоставляет обширные способности для формирования аналитических концепций на основе сервера многомерных баз данных — Oracle Express Server. В состав инструментальных средств Oracle Express входят ресурсы администрирования и формирования многомерных баз данных — Express Administrator, способ визуального формирования облегченных клиентских демонстраций и дополнений — Express Analyzer, профессиональная инструментальная среда объектно-ориентированной разработки OLAP-приложений — Express Objects, позволяющая формировать непростые встроенные клиентские дополнения, и прочие средства, сопряженные с публикацией данных в Сети интернет.
Концептуальное многомерное представление двенадцать правил Кодда[3]:
1. Многомерность — OLAP-система на концептуальном уровне обязана демонстрировать данные в виде многомерной модели, так как это очень упрощает процессы восприятия и рассмотрения данных.
2. Прозрачность — OLAP-система должна скрывать от пользователя реальную реализацию многомерной модели, способ организации, источники, средства обработки и хранения.
3. Доступность — OLAP-система должна предоставлять пользователю единую, согласованную и целостную модель данных, обеспечивая доступ к данным независимо от места и способа их хранения.
4. Постоянная производительность при разработке отчетов — производительность OLAP-систем не должна значительно уменьшаться при увеличении количества измерений, по которым выполняется анализ.
5. Клиент-серверная архитектура — OLAP-система должна быть способна работать в среде "клиент-сервер", т. к. большинство данных, которые требуется подвергать оперативной аналитической обработке, хранятся распределено. Главной идеей является то, что серверный компонент инструмента OLAP должен быть достаточно интеллектуальным и позволять строить общую концептуальную схему на основе консолидации и обобщения различных физических и логических схем корпоративных БД для обеспечения эффекта прозрачности.