Файл: Механизм работы OLAP-технологий.pdf

ВУЗ: Не указан

Категория: Реферат

Дисциплина: Не указана

Добавлен: 06.07.2023

Просмотров: 23

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Введение

В современном мире невозможно переоценить роль компьютерных технологий, они проникли во все сферы жизни общества и помогают решать множество задач. Применение компьютерных технологий разительно облегчает информационные процессы: процессы поиска, хранения, передачи и обработки информации. Информационно-коммуникационные технологии применяются повсеместно: для развлечения, в начальном, среднем и высшем образовании, для самообразования, в государственных учреждениях и, безусловно, в сфере бизнеса. Вследствие многообразия программного и аппаратного обеспечения потенциальные возможности компьютерных технологий безграничны. В этой сфере также ведется постоянное развитие и усовершенствование. На любом предприятии сегодня используются хранилища данных, базы данных, и системы управления базами данных. Эти технологии позволяют сохранять информацию и обеспечивают быстрый доступ к ней. Вместе с усовершенствованием информационно-коммуникационных технологий в целом, совершенствуются и базы данных. Их структура становится сложнее, а объем решаемых задач больше.

Например, реляционные базы данных позволяют представлять данные о предметной области с помощью двумерных таблиц, между которыми устанавливается связь. Они позволяют отобразить информацию в наиболее доступной для понимания пользователя форме. Однако проблема реляционной базы данных заключается в том, что процесс ее разработки является трудоемким, а доступ к данным осуществляется на низкой скорости. Кроме этого, использование двумерных таблиц не предполагает работу с многомерными данными. Решением может являться применение отдельных таблиц для каждого типа данных (измерения), однако анализ такого набора таблиц массивен и требует много времени. Реляционные базы данных способны безупречно обрабатывать массивы данных, имеющие небольшое число измерений, но они не отвечают требованиям более глубокого анализа данных. Именно поэтому становится актуальна проблема применения OLAP-технологий (предполагающих использование многомерных кубов) в бизнесе.

Целью работы является исследование OLAP-технологий их применения в бизнесе.

Глава 1. Механизм работы OLAP-технологий

В ходе принятия управленческих решений менеджер генерирует некие гипотезы. Чтобы принять решение окончательно или понять, что оно будет неэффективным, необходимо понимать, как изменение одного фактора повлияет на остальные, как устанавливается зависимость между этими факторами. Например, какова зависимость объема продаж от места и времени сбыта и т.п.


Многомерная система управления базами данных – это такой тип управления базами данных, который основан на многомерном представлении баз данных. Многомерные базы данных часто создаются с использованием входных данных уже существующих реляционных баз данных. Многомерная база данных способна отвечать на вопросы вроде «сколько товаров было продано в определенном регионе в такой-то месяц» и аналогичные вопросы, связанные с обобщением и анализом бизнес-операций и тенденций, тогда как реляционная база данных обычно получает ответ с использованием языка структурированных запросов (SQL).

Многомерная база данных (или многомерная система управления базами данных) подразумевает способность быстро обрабатывать данные в базе данных так, чтобы ответ мог быть сгенерирован моментально.

OLAP (от англ. «online analytical processing»- онлайн аналитическая обработка) – это технология компьютерной обработки, которая позволяет пользователю легко и выборочно извлекать и просматривать данные по разным параметрам, с разных точек зрения. Набор технологий OLAPвключает в себя такие функции как построение динамических отчетов по различным аспектам, анализ имеющихся данных, наблюдение, оценивание и прогнозирование основных показателей бизнеса.

Для облегчения такого анализа данные OLAP хранятся в многомерной базе данных. Приложение OLAP, которое обращается к данным из многомерной базы данных, также называется MOLAP (multidimensional OLAP – многомерная OLAP-технология).

В то время как реляционная база данных может рассматриваться как двумерная, многомерная база данных рассматривает каждый атрибут данных (например, продукт, географический регион продаж и временной период) как отдельную величину, отдельное «измерение». Программное обеспечение OLAP может определять пересечение величин (все продукты, проданные в определенном регионе, выше определенной цены в течение определенного периода времени) и отображать их. Атрибуты, такие как временные периоды, могут быть разбиты на субатрибуты. Атрибут (в общем понимании) — это свойство или характеристика. В области компьютерного программирования атрибут — это переменное свойство или характеристика какого-либо компонента программы, который может принимать различные значения.

Многомерная база данных осуществляет возможность моментальной обработки информации в базе данных, это позволяет получить ответ быстро. Интерфейс многомерной базы данных может варьировать в зависимости от того, как расположены данные. С точки зрения концепции, многомерная база данных использует идею информационных кубов, чтобы представление измерений данных было доступно пользователю. Например, управленец (пользователь) может рассмотреть зависимость такого измерения как «объем продаж» от каких-либо факторов (географическое положение, время или какое-либо другое измерение). В таком случае «объем продаж» будет являться измерительным атрибутом куба данных, а другие величины будут рассматриваться как атрибут функции.


OLAP может использоваться для интеллектуального анализа данных или обнаружения ранее не выявленных связей между элементами данных. База данных OLAP не обязательно должна быть столь же большой, как хранилище данных, поскольку не все транзакционные данные необходимы для анализа тенденций. Также данные могут быть импортированы из существующих реляционных баз данных для создания многомерной базы данных для OLAP с помощью специального программного интерфейса ODBC (от англ. «OpenDatabaseConnectivity» – открытый интерфейс доступа к базам данных).

Реляционные базы данных и базы данных OLAP по способу организации данных. Если же в реляционных базах данных информация представлена в виде взаимосвязанных таблиц, то в базах данных OLAP информация представлена в виде так называемых OLAP-кубов. В OLAP-кубах хранятся сведения о взаимосвязях и об иерархии данных, что значительно упрощает процедуру извлечения необходимой информации и создания отчетов, так как местонахождение необходимых данных и их взаимосвязь с другими данными известно заранее. Кубы данных содержат информацию, отображенную в заранее разработанном виде. Это значит, что группировка, фильтрация, сортировка информации осуществляется до введения данных. Именно поэтому вывод и извлечение информации, запрашиваемой пользователем, становится простым и быстрым действием.

Существует набор свойств OLAP-данных:

1)Концепция данных многомерна, при этом количество измерений не ограничено.

2) OLAP-технологии наиболее доступны и понятны пользователю, так как представляют собой единую логическую систему иерархий и взаимосвязей данных.

3) Скорость обработки запросов постоянна и не падает при увеличении количества измерений.

4) Настройке конечных запросов свойственна гибкость. Пользователь видит только запрашиваемые им данные.

Основоположник термина OLAPЭдгар Кодд сформулировал «12 правил аналитической обработки в реальном времени», однако позднее они были переформулированы Найджелом Пендсом: FASMI (Fast Multidimensional Information – быстрая многомерная информация). Согласно этому утверждению OLAP-системы должны быть:

  1. Fast – быстрой, практически мгновенно обеспечивать отклик на запрос пользователя.
  2. Shared – многопользовательской, должно быть обеспечение контроля доступа к данным и возможность одновременного использования несколькими «юзерами».
  3. Multidimensional – многомерной, данные должны быть представлены в виде OLAP-кубов.
  4. Information – набор данных должен быть полным, в отчете должна содержаться вся необходимая информация.

Глава 2. Применение OLAP-технологий в бизнесе

OLAP-кубы содержат бизнес-показатели, используемые для анализа и принятия управленческих решений, например, прибыль, рентабельность продукции, совокупные средства (активы), собственные средства, заемные средства и т.д.

В сфере бизнеса существуют три основных цели применения OLAP-технологий: анализ данных, планирование бюджета, финансовая консолидация. Многомерная модель данных, возможность проводить анализ большого объема данных, и быстрая обработка запросов делают OLAP-технологии безальтернативным механизмом для анализа продаж, маркетинговых кампаний и других задач с большим количеством исходных данных. Примеры программ, выполняющих решение такого рода задач: Microsoft Excel Pivot Tables, Microsoft Analysis Services, SAP BW, Oracle Essbase, Oracle OLAP, Cognos PowerPlay, MicroStrategy, Business Objects.Еще одна важная функция – многомерный обратный расчет (back-solve). Она помогает рассчитать изменения детальных ячеек, которые требуются для изменения агрегированного значения. Это механизм для анализа «что если», т.е. для понимания, как изменение тех или иных факторов повлияет на конечный результат, проигрываются различные варианты событий при планировании. Примеры продуктов, выполняющих такого рода задачи: MicrosoftPerformancePint, OracleEPB, OracleOFA, OracleHyperionPlanning, SAPSEM, CognosEnterprisePlanning, Geac. OLAP-технологии также помогают выполнить расчет консолидированных отчетов и повысить прозрачность всего процесса. Связи данных при применении OLAP-технологий становятся очевидными, а процесс быстрым. Так, например, задачи, связанные с финансовой консолидацией, могут решить такие продукты: Oracle FCH, Oracle Hyperion FM, Cognos Controller.

Рассмотрим для наглядности конкретный пример применения OLAP-технологий в бизнесе.

Бизнес-показатели в OLAP-системах хранятся, как уже было отмечено выше, не в двумерных таблицах, а в разрезах гиперкубов. Эти разрезы представляют собой основные бизнес-аспекты деятельности того или иного предприятия: товары, места продажи, время продажи и прочее. Рассмотрим простой пример трехмерного OLAP-куба (Рисунок 1.). Информация сортируется по трем параметрам: месяц продажи, город продажи и проданные товары. Эти аспекты называются измерениями. У каждого из этих измерений есть варианты выборки: у измерения «город» - Москва, Пермь, Казань, у измерения «время» - август, сентябрь, октябрь, у измерения «товары» бананы, груши, яблоки. Эти варианты называются набором мер. При этом структура OLAP-куба может быть более сложной. Например, измерение «Время» может содержать не только месяц, но и год, неделю, число, при этом будет выстроена специальная иерархия: Год-Месяц-Неделя-Число.


Важное свойство иерархий по уровням– возможность создания порядка внутри каждого уровня. Например, расставить месяца в хронологической последовательности или города по численности населения. Большая часть современных алгоритмов пренебрегают этим свойством, сознательно отказываясь от потенциально полезных связей модели.

Рисунок 1.

Безусловно, информацию, заложенную в гиперкубе, можно представить в виде таблицы. Однако для составления отчета потребуется больше времени из-за необходимости проведения дополнительного анализа таблицы, информация будет так же наглядна, но не для любого запроса. В такой таблице измерения (в данном случае бизнес-показатели) будут столбцами и строками (см. Рисунок 2).

Рисунок 2

Глава 3. Виды OLAP-систем

OLAP системы классифицируются в зависимости от способа хранения и обработки данных на три основных вида: ROLAP, MOLAP, HOLAP.

ROLAP – реляционные OLAP технологии (RelationalOLAP). Этот вид OLAP системы взаимодействует с реляционными базами данных. Данные хранятся в реляционных таблицах, однако менеджеры, будучи пользователями программы, могут выполнять многомерный анализ, как в традиционной OLAP системе. Это представляется возможными благодаря применению SQL механизмов и специальных запросов. При применении такого вида OLAP системы можно эффективно обрабатывать большое количество данных, при том как числовых, так и текстовых. Однако отмечается низкая скорость обрабатывания запросов и составления отчетов.

MOLAP – многомерные OLAP технологии (MultidimensionalOLAP). Это так называемая традиционная система. Ее главная особенность – заблаговременное планирование и разработка структуры расположения данных с целью оптимизации системы. Данные в этой системе хранятся в OLAP кубах, которые, как было сказано в первой главе, представляют собой многомерные массивы. Стоит отметить, что количество измерений не ограничено, трехмерное измерение во второй главе в примере было выбрано лишь для наглядности. Традиционная система OLAP позволяет отвечать на различные по своей структуре запросы пользователя, поэтому они считаются наиболее эффективными. В рамках использования этого вида системы возможно производить сложные аналитические расчеты. При этом отмечается высокая скорость обработки запросов. Это преимущество достигается благодаря предварительному формированию кубов данных.