Файл: Информационные технологии поддержки принятия решений на основе хранилищ данных.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 12.01.2024

Просмотров: 49

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Информационные технологии поддержки принятия решений на основе хранилищ данных
«Информационные и математические технологии в науке и управлении» 2016 № 3 87 87
ляционной СУБД, предназначенной для хранилища данных, были сформулированы Red
Brick Systems. Плюсом данного подхода является то, что все данные хранятся в одном формате внутри одной СУБД. Минусами являются чрезмерное увеличение объема таблицы данных для куба и сложность пересчета агрегированных значений при изменении начальных данных [2].

HOLAP (Hybrid OLAP)

исходные данные остаются в той же реляционной базе данных, где они изначально находились, а агрегатные данные хранятся в многомерной базе данных. Технология HOLAP пытается совместить преимущества MOLAP и ROLAP, но при этом не достигаются скорость обработки данных, характерная для MOLAP, и целостность хранения данных, а также возрастают затраты на поддержку и определение типа хранения для подкубов [2].
Существуют три основных схемы ХД: «Звезда», «Снежинка» и «Созвездие». Модель данных «Звезда» является наиболее простой структурой данных, состоящей из одной таблицы фактов и нескольких таблиц измерений. Структура модели «Звезда» приведена на рис. 5. Модель содержит шесть измерений (сущностей, классов, таблиц): «Кафедра»;
«Руководитель»; «Ученая степень»; «Научная специальность»; «Аспирант»; «Показатель».
Сущность (таблица) «Запись» соответствует фактам, характеризующим деятельность аспирантов в определенный период времени. Сущность «Показатель» отражает сведения о показателях, по которым оценивается деятельность аспирантов.
Рис. 5. Структура модели данных «Звезда»
Таблица фактов содержит сведения о произошедших событиях в деятельности аспирантов, которые могут быть проанализированы при принятии решений. Таблица измерений содержит атрибуты событий, сохраняемых в таблице фактов, представляющие собой текстовые или иные описания. При этом таблицы измерений имеют первичные ключи
k, r, d, s, a, р, таблица фактов

n, t [4].
Схема «Снежинка» также состоит из таблицы фактов и нескольких таблиц измерений.
Отличием является то, что в схеме «Снежинка» таблицы измерений нормализованы, в то время как для схемы «Звезда» характерны полностью денормализованные таблицы измерений. Обобщенная модель данных «Снежинка», содержащая измерения и факты, приведена на рис. 6.
Выбор схемы ХД является актуальной проблемой. Решение в пользу применения схемы «Звезда» или же схемы «Снежинка» обусловливается относительной мощностью платформы БД и инструментария для реализации запросов. Схема «Звезда» подходит для реализации хранилищ данных, использование которых предполагает выполнение простых запросов. Схема «Снежинка» более подходит для обработки запросов сложной структуры.


Шубенин А.А., Прокина Н.В., Мухин В.Н., Поздняков С.Ю.
88 «Information and mathematical technologies in science and management» 2016 № 3 88
Также необходимо принимать во внимание используемый инструментарий, который может накладывать ограничения при реализации. При этом, как правило, хранилища, использующие схему «Звезда», выполняют запросы быстрее.
Рис. 6. Структура модели данных «Снежинка»
Таким образом, отличия между ХД и базами данных OLTP-систем определяются областями их применения. Отличия между базами данных OLTP-систем и хранилищами данных, характерными для OLAP-систем, приведены в табл. 1.
Таблица 1. Сравнение особенностей баз данных OLTP и хранилищ данных
База данных OLTP
Хранилище данных
Содержит текущие данные
Содержит исторические данные
Хранит подробные сведения
Хранит подробные сведения, а также частично и полностью обобщенные данные
Данные являются динамическими
Данные в основном являются статическими
Повторяющийся способ обработки
Нерегламентированный, неструктурированный и эвристический способы обработки данных
Предсказуемый способ использования данных Средняя и низкая интенсивность обработки транзакций
Предназначена для обработки транзакций
Непредсказуемый способ использования данных
Высокая интенсивность обработки транзакций Предназначено для проведения анализа
Предсказуемый способ использования данных Ориентировано на предметные области
Ориентирована на прикладные области
Поддержка принятия стратегических решений
Обслуживает большое количество работников исполнительного звена
Обслуживает относительно малое количество работников руководящего звена
Несмотря на появление новых разработок в области хранилищ данных, актуальным остается ряд характерных проблем:

Информационные технологии поддержки принятия решений на основе хранилищ данных
«Информационные и математические технологии в науке и управлении» 2016 № 3 89 89

проблема качества данных, вызванная отсутствием или неточностью данных, необходимых для наполнения хранилища данных;

проблема выбора источников данных, обусловленная тем, что необходимые данные, как правило, хранятся в различных источниках, имеющих отличающуюся структуру и формат данных;

проблема производительности и масштабируемости, связанная с выбором методики проектирования и средств реализации хранилища данных.
Для решения проблемы очистки «грязных данных» и преобразования данных из различных источников к виду, определяемому структурой хранилища данных, в СППР реализуют процесс подготовки данных, известный в англоязычной литературе как ETL- процесс (Extract, Transform, Load). Процесс подготовки данных включает в себя извлечение данных из разных источников, очистку данных, преобразование, консолидирование и загрузку данных в хранилище данных. Каждый из названных этапов выполнения процесса подготовки данных включает в себя ряд подпроцессов, требующих выполнения определенных действий. Проблема производительности и масштабируемости решается, как правило, за счет модернизации программного и аппаратного обеспечения. Несмотря на то, что выбор структуры хранилища данных во многом способен повлиять на производительность системы OLAP, разработчик ХД полагается в основном на свой опыт и рекомендации ведущих специалистов в данной области, что определяет высокую степень зависимости производительности системы OLAP от квалификации разработчика
Заключение. Таким образом, в статье рассмотрены архитектуры наиболее популярных типов СППР на основе хранилищ данных, проанализированы преимущества и недостатки, а также описаны технологии обработки данных в реальном масштабе времени.
Данный материал будет полезен не только для разработчиков информационных систем и баз данных, но и руководителей предприятий и организаций при планировании развития собственных информационных ресурсов.
СПИСОК ЛИТЕРАТУРЫ
1. Барсегян А. А., Куприянов М. С., Степаненко В. В., Холод И. И.. Методы и модели анализа данных: OLAP и Data Mining.

СПб. БХВ-Петербург, 2004. 336 с.
2. Барсегян А. А., Куприянов М. С., Степаненко В. В., Холод И. И. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP/ 2-е изд., перераб. и доп.

СПб.
БХВ-Петербург, 2007. 384 с.
3. Исаев Д.В, Родионов А.С. OLAP-система как инструмент современного экономиста //
Финансовая газета. 2002. №44. С.14–15 4. Паклин Н. Б., Орешков В. И., Бизнес-аналитика: от данных к знаниям.

СПб. Питер,
2009.

724 с.
5.
Спирли, Э., "Корпоративные хранилища данных. Планирование, разработка и реализация. Т.1". Издательство: Вильямс (2001). 400 стр.
6. Codd E.F., Codd S.B. and Salley C.T. Providing OLAP (on-line analytical processing) to user-analysts: An IT mandate Technical report, 1993 7. Devlin B. Data warehouse: from architecture to implementation. Addison Wesley Longman,
Inc. (1997). ISBN 0-201-96425-2.


Шубенин А.А., Прокина Н.В., Мухин В.Н., Поздняков С.Ю.
90 «Information and mathematical technologies in science and management» 2016 № 3 90 8. IBM. «Business Intelligence Architecture on S/390. Presentation Guide». SG24-5747-00,
IBM Corporation (2000).
9. Inmon W Building the Data Warehouse New York: John Willey & Sons, 1992 10. Kimbell R., Ross M. The Data Warehouse Toolkit: The Complete Guide to Dimensional Data
Warehouses J. Willey & Sons. Second Edition, 2002 – 447 p
УДК 519.816
INFORMATION TECHNOLOGIES OF SUPPORT DECISION
BASED ON DATA WAREHOUSING
Aleksey A. Shubenin
PhD, chief research laboratory, Federal state budgetary institution «3 Central Research Institute» of the Ministry of defense of the Russian Federation,
Pogonnij tr., 10, Moscow, Russia, 107564, e-mail: ashubenin@yandex.ru
Natalia V. Prokina
PhD, senior researcher, Federal state budgetary institution «3 Central Research Institute» of the Ministry of defense of the Russian Federation,
Pogonnij tr., 10, Moscow, Russia, 107564, e-mail: nataly_pr@mail.ru
Vladimir N. Muhin
Deputy head of scientific-technical center, Joint stock Company "Scientific-production enterprise
"Rubin" Baidukov str., 2, Penza, Russia, 440000, e-mail: bob12121@mail.ru
Sergey Y. Pozdnyakov
Head of division, Joint stock Company "Scientific-production enterprise "Rubin"
Baidukov str., 2, Penza, Russia, 440000, e-mail: pozdnyakov-sergey@yandex.ru
Abstract. The main feature of informational support of decision-making is a qualitatively new organization of interaction between man and computer. Developing of solutions is the main goal of this technology. Decision making occurs as a result of the iterative process, which involves a system of decision support and management specifying the input data and evaluates the result. The end of the iterative process happens by the will of man. Information technology of decision support can be used at any level of management. Decisions made at various levels of management, as a rule, should be coordinated. Therefore, an important function of DSS is to coordinate the decision-makers at different management levels. The article describes the system architecture of the decision support and online analytical processing data. The content of the article is devoted to the description of the most popular types of DSS architectures with advantages and disadvantages, as well as the processing technologies in real time.
Keywords: decision making, data storage, information technologies, analysis of data, system analysis.

Информационные технологии поддержки принятия решений на основе хранилищ данных
«Информационные и математические технологии в науке и управлении» 2016 № 3 91 91
R
eferences
1. Barsegyan A., Kupriyanov M., V. Stepanenko, Holod I.. Metodi i modeli analiza dannih:
OLAP и Data Mining [Methods and models of the analysis of data: OLAP and Data Mining].
St. Petersburg, 2004. 336 p. (in Russian).
2. Barsegyan A., Kupriyanov M., Stepanenko V., Holod I.. Tehnologii analiza dannih: Data
Mining, Visual Mining, Text Mining, OLAP [Holod Technologies of the analysis of data:
Data Mining, Visual Mining, Text Mining, OLAP]. 2-ye izd. pererab. I dop. - SPb. BHV-St.
Peterburg, 2007. 384 p. (in Russian).
3. Isaev D.V., Rodionov A.S. OLAP-sistema kak instrument sovremennogo ekonomista.
[OLAP-system as a tool of the modern economist]. Finansovaya gazeta = Financial newspaper. 2002. № 44. pp.14–15 (in Russian).
4. Paklin N., Oreshkov V. Biznes-analitika: ot dannih k znanijam [Business analyst: from data to knowledge]. St. Peterburg, 2009. 724 p. (in Russian).
5. Spirli E. Corporativnye hranilisha dannyh. Planirovanie, razrabotka i realizaciya. [Corporate data warehouse. Planning, development and implementation]. № 1, 2001. 400 p. (in Russian).
6. Codd E.F., Codd S.B. and Salley C.T. Providing OLAP (on-line analytical processing) to user-analysts: An IT mandate. Technical report, 1993.
7. Devlin B. Data warehouse: from architecture to implementation. Addison Wesley Longman,
Inc. (1997). ISBN 0-201-96425-2.
8. IBM. «Business Intelligence Architecture on S/390. Presentation Guide». SG24-5747-00,
IBM Corporation (2000).
9. Inmon W. Building the Data Warehouse New York: John Willey & Sons, 1992.
10. Kimbell R., Ross M. The Data Warehouse Toolkit: The Complete Guide to Dimensional Data
Warehouses J. Willey & Sons. Second Edition, 2002. 447 p.