Файл: Учебник Рекомендовано Федеральным государственным учреждением.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 08.11.2023

Просмотров: 776

Скачиваний: 16

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Архитектура OLAP-приложений. Многомерность в OLAP- приложениях может быть разделена на три уровня, из которых два в обязательном порядке присутствуют во всех OLAP-средствах.
1. Многомерное представление данных — средства конечного пользователя, обеспечивающие многомерную визуализацию и манипулирование данными. Многомерная обработка — средство
(язык) формулирования многомерных запросов (традиционный реляционный язык SQL здесь оказывается непригодным) и про­
цессор, умеющий обработать и выполнить такой запрос.
2. Многомерное хранение — средства физической организации данных, обеспечивающие эффективное выполнение многомерных запросов.
Третий уровень, хотя и является широко распространенным, не обязателен, так как данные для многомерного представления могут извлекаться и из обычных реляционных структур; процессор многомерных запросов в этом случае транслирует многомерные запросы в SQL-запросы, которые выполняются реляционной
СУБД.
172

Конкретные OLAP-продукты, как правило, представляют собой либо средство многомерного представления данных — например,
Pivot Tables в Excel 2000 фирмы Microsoft или ProClarity фирмы
Knosys, либо многомерную серверную СУБД — например, Oracle
Express Server или Microsoft OLAP Services.
Слой многомерной обработки обычно бывает встроен в OLAP- клиент и/или в OLAP-сервер, но может быть выделен в чистом виде, как, например, компонент Pivot Table Service фирмы Microsoft.
Технические аспекты многомерного хранения данных. Как уже говорилось выше, средства OLAP-анализа могут извлекать данные и непосредственно из реляционных систем. Такой подход был более привлекательным в те времена, когда OLAP-серверы еще не существовали. Но сегодня и Oracle, и Informix, и Microsoft предлагают полноценные OLAP-серверы.
OLAP-серверы, или серверы многомерных БД, могут хранить свои многомерные данные по-разному. Прежде чем рассмотреть способы хранения, нам нужно поговорить о таком важном аспек­
те, как хранение агрегатов. Дело в том, что в любом хранилище данных (и в обычном, и в многомерном) наряду с детальными данными, извлекаемыми из оперативных систем, хранятся и сум­
марные (агрегированные) показатели — суммы объемов продаж по месяцам, категориям товаров и т. п. Агрегаты хранятся в явном виде с единственной целью — ускорить выполнение запросов.
Ведь с одной стороны, в хранилище накапливается, как правило, очень большой объем данных, а с другой, — аналитиков в боль­
шинстве случаев интересуют не детальные, а обобщенные пока­
затели. И если каждый раз для вычисления суммы продаж за год пришлось бы суммировать миллионы индивидуальных продаж, скорость была бы неприемлемой. Поэтому при загрузке данных в многомерную БД вычисляются и сохраняются все суммарные по­
казатели или их часть.
Однако за скорость обработки запросов к суммарным данным приходится платить увеличением объемов данных и времени на их загрузку. Причем увеличение объема может стать буквально катастрофическим. Степень увеличения количества данных при вычислении агрегированных показателей зависит от количества измерений куба и структуры этих измерений. Для решения про­
блемы хранения агрегатов применяются подчас сложные схемы, позволяющие при вычислении далеко не всех возможных агреги­
рованных показателей достигать значительного повышения про­
изводительности выполнения запросов.
Существуют три способа хранения данных по технологии
OLAP.
Теперь о различных вариантах хранения информации. Как детальные данные, так и агрегированные могут храниться либо в
173

реляционных, либо в многомерных структурах. Многомерное хранение позволяет обращаться с данными как с многомерным массивом, благодаря чему обеспечиваются одинаково быстрые вычисления суммарных показателей и различные многомерные преобразования по любому из измерений. Некоторое время назад
OLAP-продукты поддерживали либо реляционное, либо много­
мерное хранение. Сегодня, как правило, один и тот же продукт обеспечивает оба этих вида хранения, а также третий вид — сме­
шанный. Применяются следующие термины.
1. Детальные и агрегированные данные хранятся в многомерной
БД. В этом случае создается избыточность, так как многомерные данные полностью содержат реляционные MOLAP — (Multidimen­
sional OLAP).
2. Детальные данные остаются там, где они «жили» изначаль­
но — в реляционной БД; агрегированная информация собрана в той же базе данных в специально созданных служебных таблицах
ROLAP - (Relational OLAP).
3. Детальные данные остаются на месте (в реляционной базе данны х), а агрегаты хранятся в м ногомерной базе данных
HOLAP - (Hybrid OLAP).
Каждый из этих способов имеет свои преимущества и недо­
статки и должен применяться в зависимости от условий — объема данных, мощности реляционной СУБД и т.д.
При хранении данных в многомерных структурах возникает потенциальная проблема «разбухания» за счет хранения пустых значений. Ведь если в многомерном массиве зарезервировано место под всевозможные комбинации меток измерений, а реаль­
но заполнена лишь меньшая часть (например, ряд продуктов продается только в небольшом числе регионов), то большая часть куба будет пустовать, хотя место будет занято. Современные
OLAP-продукты умеют справляться с этой проблемой.
5.6.2. Технологии интеллектуальной обработки данных
Интеллектуальный анализ данных (НАД) — это процесс под­
держки принятия решений, основанный на поиске в данных скрытых закономерностей. Большинство методов ИАД было первоначально разработано в рамках теории искусственного ин­
теллекта в 1970— 1980-х гг., но получило распространение только в последние годы, когда возникла проблема обработки быстрора­
стущих объемов корпоративных данных. Сырьем для интеллекту­
ального анализа данных могут быть таблицы реляционных СУБД.
Именно с них и начиналась история интеллектуального анализа
174
данных. Во многих случаях более эффективным является при­
менение НАД к данным, полученным после обработки с помощью
OLAP-технологий.
Задачи интеллектуального анализа данных классифицируют­
ся прежде всего по типам извлекаемой информации, т.е. по видам находимых закономерностей. Единого мнения относи­
тельно того, какие задачи следует относить к интеллектуальному анализу данных, нет. Большинство авторитетных источников от­
носят к интеллектуальной обработке классификацию, кластери­
зацию, выявление ассоциаций, поиск последовательностей, про­
гнозирование.
Классификация —
наиболее простая и распространенная за­
дача интеллектуального анализа. В результате решения задачи классификации обнаруживаются признаки, которые характери­
зуют группы объектов исследуемого набора данных — классы; по этим признакам новый объект можно отнести к тому или иному классу. Классификация позволяет выявить признаки, характери­
зующие однотипные группы объектов. Предполагается, что харак­
теристики классов заранее (до анализа) известны. В качестве методов решения задачи классификации применяют индукцию деревьев решений, нейронные сети и т.д.
Кластеризация
распространяет идеи классификации на более сложный случай, когда сами классы не предопределены. Задача кластеризации значительно сложнее задачи классификации.
В результате выполнения процедуры кластеризации исходные данные разбиваются на однородные группы (кластеры). Это по­
зволяет выработать по отношению к каждой из групп (например, к группам покупателей) определенную политику. Кластеризация является описательной процедурой, она не делает никаких стати­
стических выводов, но дает возможность провести разведочный анализ и изучить «структуру данных». Само понятие «кластер» определено неоднозначно: в каждом исследовании свои «класте­
ры». Переводится понятие кластер (cluster) как «скопление»,
«гроздь». Кластер можно охарактеризовать как группу объектов, имеющих общие свойства. Характеристиками кластера можно назвать два признака: внутреннюю однородность и внешнюю изолированность. Наибольшее применение кластеризация перво­
начально получила в таких науках, как биология, антропология, психология. Для решения экономических задач кластеризация длительное время мало использовалась из-за специфики эконо­
мических данных и явлений.
Выявление ассоциаций —
это поиск закономерностей в данных, фиксирующих одновременное наступление двух (или более) со­
бытий. Типичный пример ассоциации исследуется в задаче опре­
деления пар одновременно покупаемых продуктов (телевизоры и
175

видеомагнитофоны, зубные пасгы и зубные щетки и т.д.). Ассо­
циативные правила могут применяться в розничной торговле
(определение товаров, которые стоит продвигать совместно), для сегментации клиентов (выявление общих характеристик клиентов компании, выявление групп покупателей) и т.д.
Поиск последовательностей
— выявление закономерностей в данных, при происхождении событий с некоторым определен­
ным разрывом во времени. Последовательность позволяет найти временные закономерности между транзакциями (множеством событий, которые произошли одновременно). Другими словами, последовательность определяется высокой вероятностью цепочки связанных во времени событий. Фактически ассоциация являет­
ся частным случаем последовательности с временным лагом, равным нулю. Правило последовательности: после события X через определенное время произойдет событие Y. Так, если ви­
деомагнитофон не был куплен вместе с телевизором, то в течение месяца после покупки нового телевизора покупка видеомагнито­
фона производится в 60 % случаев.
Прогнозирование
— формализованная процедура предсказа­
ния, которая на основе исследования текущих и прошлых данных позволяет оценить будущие значения числовых показателей.
В задачах подобного типа наиболее часто используют традицион­
ные методы математической статистики, а также нейронные сети.
Прогнозирование (от гр. prognosis) в широком понимании этого слова определяется как опережающее отражение будущего. Про­
гнозирование направлено на определение тенденций динамики конкретного объекта или события на основе ретроспективных данных, т. е. анализа его состояния в прошлом и настоящем. Таким образом, решение задачи прогнозирования требует некоторой обучающей выборки данных. Прогнозирование можно также определить как установление функциональной зависимости между зависимыми и независимыми переменными. Прогнозиро­
вание является распространенной и востребованной задачей во многих областях человеческой деятельности. В результате про­
гнозирования уменьшается риск принятия неверных, необосно­
ванных или субъективных решений.
В самых общих чертах решение задачи прогнозирования сво­
дится к решению таких подзадач: — выбор модели прогнозирова­
ния, анализ адекватности и точности построенного прогноза.
Примеры задач прогнозирования: движение денежных средств, урожайность агрокультуры, финансовая устойчивость предприя­
тия. Типичной в сфере маркетинга является задача прогнозиро­
вания рынков (market forecasting). В результате решения данной задачи оцениваются перспективы развития конъюнктуры опреде­
ленного рынка, изменения рыночных условий на будущие перио­
176

ды, определяются тенденции рынка (структурные изменения, потребности покупателей, изменения цен).
Помимо экономической и финансовой сферы задачи прогно­
зирования ставятся в самых разнообразных областях: медицине, фармакологии; популярным сейчас становится политическое про­
гнозирование.
5.7. В недрение корпоративны х инф орм ационны х систем
Под бизнес-процессом принято понимать цепь логически свя­
занных повторяющихся действий, которые совместно реализуют некую бизнес-задачу или цель предприятия. В то же время бизнес- процесс — это поток работ (событий), протекающий от одного рабочего места к другому, совершающийся в течение какого-либо периода и обладающий результатом (рис. 5.10).
Современная процессно-ориентированная организация — это совокупность специализированных функциональных отделов, с одной стороны, и совокупность бизнес-процессов, с другой.
В каждом из отделов реализуются отдельные функции бизнес- процессов, а сотрудники таких организаций, помимо классиче­
ского функционального подчинения, подчиняются в рамках вы­
полняемых бизнес-процессов соответствующим владельцам этих процессов.
В настоящее время многие отечественные предприятия явля­
ются функционально-ориентированными организациями, струк­
тура которых в отличие от процессных организаций имеет верти­
кальную топологию, построенную в соответствии с выполняемы-
Топ-менеджер\ ^ Ответственный
с=.Ц=»
за БП
Purchasing
Manufacturing
Marketing
Suppliers
Рис. 5.10. Пример бизнес-процесса
177
ми функциями, и строгую иерархическую подчиненность сверху вниз.
Недостатки такой организации — это и отсутствие владельцев процессов, ответственных за конечный результат, и наличие не­
произвольной разрушительной конкуренции между подразделе­
ниями, и оторванность сотрудников от конечного результата.
Бизнес-процессы таких предприятий сегментированы, т.е. суще­
ствуют в рамках отдельно взятых функциональных подразделений, а эффективность функций, выполняемых отдельными структура­
ми, зачастую достигается в ущерб эффективности всего процесса.
В такой организации чрезвычайно усложнены взаимодействие и обмен информацией между подразделениями, попытка внедрить на подобных предприятиях информационную систему путем по­
следовательной автоматизации отдельных функций приводит в лучшем случае к невозможности интегрировать внедренную функ­
циональность, а в худшем — к провалу проекта. Затратив значи­
тельные средства, предприятие не получает ожидаемой отдачи от инвестиций.
При внедрении информационных систем в функционально­
ориентированных организациях весьма острой оказывается про­
блема перестройки деятельности предприятия в контексте осмыс­
ления и совершенствования бизнес-процессов. Изменить ситуа­
цию призван процессный подход, т.е. применение в организации системы процессов наряду с их идентификацией и взаимодействи­
ем. Преимущества этого подхода становятся очевидны при срав­
нении процессной и функциональной организации, а дополни­
тельным аргументом в его пользу является ориентация на при­
менение процессного подхода в системе менеджмента качества.
Функциональными или процессными могут быть и подходы к внедрению информационных систем. При этом существенные различия двух разных подходов хорошо заметны уже на стадии подготовки проекта внедрения.
Если предприятие собирается автоматизировать деятельность отдельных сотрудников или служб предприятия, то налицо функ­
циональный подход: стремление автоматизировать отдельные функции предприятия. Наилучший из возможных результатов такой автоматизации — сокращение времени выполнения и по­
вышение качества этих функций. При этом от системы обычно требуется обеспечить пользователям максимум удобства при вы­
полнении соответствующих функций, а вопросы дальнейшего использования возникающей информации отодвигаются на вто­
рой план.
Гораздо большего эффекта можно добиться, применив про­
цессный подход и осуществив процессное внедрение. Объектом автоматизации в этом случае служат сквозные бизнес-процессы.
178


При постановке задачи очень важно правильно идентифицировать те из них, которые должны быть реализованы с использованием информационной системы. Разумеется, выбор автоматизируемых процессов должен соответствовать корпоративной стратегии по­
вышения эффективности. Выбранные бизнес-процессы подвер­
гаются анализу и затем проектируются с точки зрения реализации в информационной системе. При таком подходе достигается си­
нергетический эффект от автоматизации отдельных функций, поскольку в системе организована совместная деятельность со­
трудников и служб предприятия. На основании спроектированных процессов определяется объем внедряемой функциональности
(конфигурация рабочих мест), которая покрывает потребности процессов, и только после этого происходит реализация выбран­
ных процессов в системе.
Деятельность, предшествующая реализации, относится к стадии подготовки проекта внедрения. В случае функционального вне­
дрения подготовка занимает непродолжительное время: на на­
чальных этапах функциональный подход может принести быстрый результат. Подготовка процессного внедрения требует довольно продолжительного времени и более существенных затрат, но это внедрение обеспечивает результаты принципиально иного уровня, многократно превосходящие все возможные преимущества перво­
го варианта.
Говоря о процессном внедрении, нельзя не упомянуть об ин­
струментарии, применяемом для моделирования бизнес-про­
цессов. Сам по себе процессный подход не предъявляет особых требований к инструментам описания и проектирования бизнес- процессов, однако использование специализированных инстру­
ментов вместо стандартных офисных программ имеет массу нео­
споримых преимуществ, например:
— представление бизнес-процессов в виде графических моде­
лей;
— наличие единого стандарта моделирования;
— ориентация на процессный подход;
— наличие единой информационной базы, позволяющей ис­
пользовать в разных диаграммах одни и те же объекты, совмещая различные точки зрения на организацию;
— возможность генерации разнообразных отчетов по разрабо­
танной модели — в том числе и отчетов, специально разработан­
ных пользователем;
— возможность организации совместной работы в сетях Интер­
нет и Интранет и т.д.
Что же дает внедрение информационной системы в случае при­
менения процессного подхода и совершенствования бизнес- процессов?
179