Файл: Сущность оперативной аналитической обработки данных (OLAP).pdf

ВУЗ: Не указан

Категория: Курсовая работа

Дисциплина: Не указана

Добавлен: 02.07.2023

Просмотров: 278

Скачиваний: 6

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Deductor

В настоящей работе мне хотелось бы подробнее рассмотреть продукт компании BaseGroup Labs – Deductor.

Deductor является аналитической платформой, т.е. основой для создания законченных прикладных решений. Реализованные в Deductor технологии позволяют на базе единой архитектуры пройти все этапы построения аналитической системы: от создания хранилища данных до автоматического подбора моделей и визуализации полученных результатов.

Состав системы:

1. Studio

Deductor Studio – аналитическое ядро платформы Deductor. В Deductor Studio введен целый комплект элементов, позволяющий получить данные из свободного источника данных, осуществить полный оборот обработки (очищение, преобразование данных, создание моделей), показать полученные результаты более комфортным способом (OLAP, таблицы, диаграммы, деревья решений...) и экспортировать результаты.

2. Viewer

Deductor Viewer является рабочим местом окончательного пользователя. Проект дает возможность уменьшить условия к персоналу, т.к. все необходимые процедуры выполняются автоматически при поддержки подготовленных ранее сценариев обработки, нет необходимости думать о способе извлечения данных и механизмах их обрабатывания. Пользователю Deduсtor Viewer следует только выбрать интересующий отчет.

3 Warehouse

Deductor Warehouse – многомерное кросс-платформенное хранилище данных, аккумулирующее всю необходимую для рассмотрения предметной области информацию. Применение общего хранилища дает возможность обеспечить комфортный доступ, высокую скорость обработки, согласованность данных, централизованное хранение и автоматическую поддержку всего процесса анализа данных.

4. Client-Server

Deductor Server предназначен для удаленной аналитической обработки. Он предоставляет возможность как автоматически 'прогонять' данные через имеющиеся сценарии на сервере, так и переобучать существующие модели. Применение Deductor Server дает возможность осуществить полную трехзвенную архитектуру, в которой он выполняет функцию сервера приложений. Доступ к серверу обеспечивается при помощи Deductor Client.

Принципы работы[5]:

1. Импорт данных

Исследование каждой информации начинается с импорта данных. В следствии импорта данные приводятся к типу, пригодному для дальнейшего анализа при поддержки абсолютно всех существующих в плану элементов. Сущность данных, параметры, СУБД и многое другое не имеют значения, т.к. механизмы работы со всеми унифицированы.

2. Экспорт данных

Присутствие элементов экспорта дает возможность посылать приобретенные результаты в сторонние приложения, к примеру, передавать прогноз продаж в систему с целью развития заказа на поставку либо расположить разработанный отчет на корпоративном web-сайте.


3. Обработка данных

Под обработкой предполагается любое действие, связанное с определенным преобразованием данных, к примеру, фильтрование, создание модели, очистка и многое другое. Непосредственно в данном блоке и выполняются наиболее значимые с точки зрения анализа действия. Более существенной особенностью элементов обработки, реализованных в Deductor, считается то, что приобретенные в следствии обработки данные возможно вновь подвергать обработке любым из общедоступных системе способов. Подобным способом, можно создавать сколько нужно сложных сценариев обработки.

4. Визуализация

Визуализировать данные возможно на каждом этапе обработки. Система без помощи других устанавливает, каким методом она может это совершить, к примеру, если станет обучена нейронная сеть, то кроме таблиц и диаграмм, возможно просмотреть граф нейросети. Пользователю следует выбрать необходимый вариант из списка и настроить ряд характеристик.

5. Механизмы интеграции

В Deductor не предусмотрено средств ввода данных – платформа нацелена только на аналитическую обработку. Для применения данных, хранящейся в разнородных системах, предусмотрены гибкие механизмы импорта-экспорта. Взаимодействие может быть организовано при помощи пакетного выполнения, работы в режиме OLE сервера и обращения к Deductor Server.

6.Тиражирование знаний

Дает возможность осуществить одну из более важных функций каждой аналитической системы - поддержку процесса тиражирования знаний, т.е. обеспечение возможности сотрудникам, не понимающим в методиках анализа и способах получения того или иного результата, получать результат на основе моделей подготовленных специалистом.

Заключение

Таким образом, в процессе рассматриваемой темы я выяснил, что концепциями поддержки принятия решений может быть создана в подсистеме оперативного анализа. С целью которой и используется методика оперативной аналитической обработки данных OLAP (Online analytical processing), использующая теорию многомерного представления данных.

Узнали, то что множество измерений подразумевает представление данных в виде многомерной модели. Измерение – это последовательность значений одного из рассматриваемого параметра. Согласно измерениям в многомерной модели откладывают параметры, принадлежащие к рассматриваемой предметной области.

По Кодду, многомерное концептуальное представление — это множественная перспектива, заключающаяся в нескольких самостоятельных измерений, вдоль которых могут быть проанализированы определенные совокупности данных.


Список использованных источников

  1. Альперович М. Введение в OLAP и многомерные базы данных. – М.: Вильямс. 2012.
  2. Архипенков С. Я., Голубев Д. В., Максименко О. Б. Хранилища данных. - Издательство: Диалог-МИФИ, 2012.
  3. Барсегян А. А., Куприянов М. С., Степаненко В. В., Холод И. И. Методы и модели анализа данных OLAP - Издательство: БХВ-Петербург, 2013.
  4. Бергер А. OLAP и многомерный анализ данных / — СПб: БХВ-Петербург, 2013.
  5. Дегтярев Ю.И. Системный анализ и исследования операций. -- М.: Высш. ш., .2012.
  6. Елманова Н.В., Федоров А.А. Введение в OLAP-технологии Microsoft. – М.: Диалог-МИФИ, 2014.
  7. Заботнев М.С.Методы представления информации в разреженных гиперкубах данных [Электронный ресурс]. — Режим доступа: http://www.olap.ru/basic/theory.asp
  8. Коровкин С. Д., Левенец И. А., Ратманова И. Д., Старых В. А., Щавелёв Л. В. Решение проблемы комплексного оперативного анализа информации хранилищ данных. // СУБД. – 2012.
  9. Кречетов Н., Иванов П. Продукты для интеллектуального анализа данных. // ComputerWeek-Москва. – 2013.
  10. Федоров А., Елманова Н. Основы OLAP // КомпьютерПресс. – 2014.

Приложение А

Зависимость производительности клиентских и серверных OLAP-средств от увеличения объема данных


Приложение Б

Создание OLAP-приложения с помощью клиентского ROLAP-средства


  1. Альперович М. Введение в OLAP и многомерные базы данных. – М.: Вильямс. 2012.

  2. Федоров А., Елманова Н. Основы OLAP // КомпьютерПресс. – 2014.

  3. Барсегян А. А., Куприянов М. С., Степаненко В. В., Холод И. И. Методы и модели анализа данных: OLAP - Издательство: БХВ-Петербург, 2013.

  4. Альперович М. Введение в OLAP и многомерные базы данных. – М.: Вильямс. 2012.

  5. Коровкин С. Д., Левенец И. А., Ратманова И. Д., Старых В. А., Щавелёв Л. В. Решение проблемы комплексного оперативного анализа информации хранилищ данных. // СУБД. – 2012.