Файл: Информационные технологии для бизнесанализа в коммерческой организации.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.12.2023

Просмотров: 93

Скачиваний: 3

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Министерство образования и науки Российской Федерации
ФГБОУ ВО «Уральский государственный педагогический университет»
Институт математики, физики, информатики и технологий
Кафедра физики и математического моделирования
Информационные технологии для бизнес-анализа в
коммерческой организации
Выпускная квалификационная работа
Квалификационная работа допущена к защите
Зав.кафедрой ФиММ д.ф-м.н., профессор
Сидоров Валерий Евгеньевич
_______ __________________ дата подпись
Исполнитель:
Семенова Екатерина Витальевна обучающийся БЭ-51zгруппы
____________ подпись
Руководитель:
Кощеева Елена Сергеевна, к.п.н., доцент кафедры ФиММ
___________ подпись
Екатеринбург 2017

2
Оглавление
Введение ............................................................................................................... 3
Глава 1. Основные концепции бизнес анализа ................................................... 5 1.1.
Современный бизнес анализ ................................................................... 5 1.2.
Современные аналитические платформы обработки данных ............. 16
Глава 2. Информационные технологии для бизнес-анализа ............................ 33 2.1. Возможности аналитической платформы Deductor
............................... 33 2.2.
Бизнес-анализ деятельности торговой компании в аналитической платформе Deductor ........................................................................................ 43 2.3. Ассоциативные правила в стимулировании розничных продаж ........... 58
Заключение ......................................................................................................... 67
Список литературы ............................................................................................ 68

3
Введение
В условиях современной экономики для каждого предприятия становится актуальным повысить конкурентоспособность и сохранять ее на должном уровне. С этой задачей помогут справиться системы бизнес- аналитики, которые позволяют руководителям принимать обоснованные управленческие решения при существенной экономии времени на поиск и анализ необходимой информации.
Целью дипломной работы является обзор популярных систем бизнес- аналитики, выбор наиболее подходящей BI (Business intelligence) для организации и разработки готовых сценариев для проведения бизнес-анализа.
Для достижения цели в рамках дипломной работы необходимо решить основные задачи:
- изучить основные концепции бизнес анализа
;
- изучить современный рынок систем бизнес-анализа;
- выбрать аналитическую платформу, которая учитывает специфику отрасли торговли;
- разработать сценарии для проведения бизнес-анализа на предприятии.
Практическая значимость работы заключается в том, что результаты, полученные в ней, могут быть реализованы в деятельности компании ООО
«Автолидер».
Выпускная квалификационная работа состоит из введения, двух глав и заключения.
Во введении рассматривается актуальность темы исследования, определена цель и сформулированы задачи дипломной работы.
В первой главе описываются основные концепции современного бизнес-анализа, рассматриваются наиболее часто используемые технологии интеллектуального анализа, современные аналитические платформы обработки данных.


4
Во второй главе детально описываются возможности аналитической платформы Deductor, ее назначение, организационная структура, состав и назначение основных модулей платформы. Так же проводится бизнес-анализ деятельности торговой компании в системе Deductor.
В заключении изложены основные результаты работ, обеспечившие достижение цели выпускной квалификационной работы и решение поставленных задач.

5
Глава 1. Основные концепции бизнес анализа
1.1. Современный бизнес анализ
Современный бизнес анализ считается одним из самых эффективных инструментов для управления компанией, при помощи которого можно получить реальное представление об общем положении в компании и оценить перспективу развития в долгосрочном периоде.
Бизнес-анализ, это набор задач и техник, используемых как связующее между участниками и заинтересованными лицами для понимания структуры, правил и операций в рамках организации, так и для рекомендации решений, позволяющих данной организации достичь ее целей [27].
Есть несколько вариантов определения понятия «бизнес-анализ». В узких областях знаний и в различных отраслях этот термин может интерпретироваться по-разному.
В менеджменте и экономических дисциплинах категория «бизнес- анализ» определяется как совокупность механизмов и путей выявления
«узких мест» в компаниях, точек роста, определения проблем организации и поиска решений этих вопросов путем последующей перестройки некоторых процессов [21]. В такой трактовке анализ нужен бизнесу для:

создания общей картины состояния бизнес-процессов в организации;

привлечения специалистов для совместного поиска путей выхода из проблемных ситуаций;

реинжиниринга бизнес-процессов с целью достижения эффективности деятельности;

формирования универсальных подходов к выполнению определенных задач в организации;

6

анализа эффективности и других показателей работы над группой взаимосвязанных задач;

ввода инновационных технологий, компьютерных программ и прочего.
Бизнес-анализ объединяет:

рыночные условия;

материально-производственную базу;

инновационные производственные, компьютерные, рекламные и другие механизмы;

задействованные основные и оборотные средства, денежные гарантии и риски;

занимаемую нишу фирмы в рыночном окружении и возможные шаги конкурентов;

общественную, финансовую и политическую среду, в которой существует фирма.
Результатом должна являться разработка эффективной стратегии, направленной на максимизацию прибыли в краткосрочной и долгосрочной перспективе и, в конечном итоге, на исполнение миссии организации [23].
Технологии бизнес-анализа
Data mining
Развитие методов записи и хранения данных привело к бурному росту объемов собираемой и анализируемой информации. Объемы данных настолько внушительны, что человеку просто не по силам проанализировать их самостоятельно, хотя необходимость проведения такого анализа вполне очевидна, ведь в этих "сырых" данных заключены знания, которые могут быть использованы при принятии решений. Для того чтобы провести автоматический анализ данных, используется Data Mining.


7
Data Mining – это процесс обнаружения в "сырых" данных ранее неизвестных нетривиальных практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности [16]. Data Mining является одним из шагов
Knowledge Discovery in Databases.
Информация, найденная в процессе применения методов Data Mining, должна быть нетривиальной и ранее неизвестной, например, средние продажи не являются таковыми. Знания должны описывать новые связи между свойствами, предсказывать значения одних признаков на основе других и т.д. Найденные знания должны быть применимы и на новых данных с некоторой степенью достоверности [8]. Полезность заключается в том, что эти знания могут приносить определенную выгоду при их применении.
Например, проще всего воспринимаются человеком логические конструкции "если … то …". Более того, такие правила могут быть использованы в различных СУБД в качестве SQL-запросов. В случае, когда извлеченные знания непрозрачны для пользователя, должны существовать методы постобработки, позволяющие привести их к интерпретируемому виду.
Алгоритмы, используемые в Data Mining, требуют большого количества вычислений. Раньше это являлось сдерживающим фактором широкого практического применения Data Mining, однако сегодняшний рост производительности современных процессоров снял остроту этой проблемы.
Теперь за приемлемое время можно провести качественный анализ сотен тысяч и миллионов записей.
Задачи, решаемые методами Data Mining, делятся на следующие категории:
Классификация – это наиболее распространенная задача, заключающаяся в разбиении объектов на заранее известные классы. Каждый класс обладает определенным набором признаков и по этим признакам любой объект может быть отнесен к одному из существующих классов [12].

8
Регрессия – заключается в поиске функции задаваемых параметров, которая определяла бы спектр значений искомой величины (предсказание погоды исходя из имеющихся исторических наборов данных).
Кластеризация – это группировка объектов (наблюдений, событий) на основе данных (свойств), описывающих сущность этих объектов. Объекты внутри кластера должны быть "похожими" друг на друга и отличаться от объектов, вошедших в другие кластеры. Чем больше похожи объекты внутри кластера и чем больше отличий между кластерами, тем точнее кластеризация.
Ассоциация – выявление закономерностей между связанными событиями. Примером такой закономерности служит правило, указывающее, что из события X следует событие Y. Такие правила называются ассоциативными. Анализ совершаемых покупок и выявление товаров, часто продаваемых вместе – типичный пример задачи. Иногда ее так и называют анализом рыночной корзины (market basket analysis).
Последовательность – нахождение временной закономерности между событиями, т.е. обнаружение зависимости, что если произойдет событие X, то спустя заданное время произойдет событие Y (например, после покупки автомобиля, автовладелец оформляет страховку, приобретает аптечку, огнетушитель и аварийный знак).
Анализ отклонений – обнаружение в наборе данных наиболее отличающиеся, нехарактерные значения.
Решение большинства проблем бизнес-анализа сводится к той или иной задаче Data Mining или к их комбинации. Например, оценка рисков – это решение задачи регрессии или классификации, сегментация рынка – кластеризация, стимулирование спроса – ассоциативные правила.
Фактически, задачи Data Mining являются элементами, из которых можно собрать решение подавляющего большинства реальных бизнес задач.


9
Для решения вышеописанных задач используются различные методы и алгоритмы Data Mining. Ввиду того, что Data Mining развивалась и развивается на стыке таких дисциплин, как статистика, теория информации, машинное обучение, теория баз данных, вполне закономерно, что большинство алгоритмов и методов Data Mining были разработаны на основе различных методов из этих дисциплин [2]. Большую популярность получили следующие алгоритмы Data Mining: деревья решений; алгоритмы кластеризации; нейронные сети; алгоритмы обнаружения ассоциативных связей между событиями.
KDD
Knowledge Discovery in Databases (KDD) – это процесс поиска полезных знаний в "сырых" данных. KDD включает в себя вопросы: подготовки данных, выбора информативных признаков, очистки данных, применения методов Data
Mining (DM), постобработки данных и интерпретации полученных результатов [4]. Безусловно, "сердцем" всего этого процесса являются методы DM, позволяющие обнаруживать знания.
Этими знаниями могут быть правила, описывающие связи между свойствами данных (деревья решений), часто встречающиеся шаблоны
(ассоциативные правила), а также результаты классификации (нейронные сети) и кластеризации данных (карты Кохонена) и т.д.
Процесс Knowledge Discovery in Databases, состоит из следующих шагов:
1.
Подготовка исходного набора данных. Этот этап заключается в создании набора данных, в том числе из различных источников, выбора обучающей выборки и т.д. Для этого должны существовать развитые инструменты доступа к различным источникам данных. Желательно иметь поддержку работы с хранилищами данных и наличие семантического слоя, позволяющего использовать для

10 подготовки исходных данных не технические термины, а бизнес понятия.
2.
Предобработка данных. Для того чтобы эффективно применять методы Data Mining, следует обратить внимание на вопросы предобработки данных. Данные могут содержать пропуски, шумы, аномальные значения и т.д. Кроме того, данные могут быть избыточны, недостаточны и т.д [30]. В некоторых задачах требуется дополнить данные некоторой априорной информацией. Не верно полагать, что если подать данные на вход системы в существующем виде, то на выходе получим полезные знания. Данные должны быть качественны и корректны с точки зрения используемого метода DM. Поэтому первый этап KDD заключается в предобработке данных. Более того, иногда размерность исходного пространства может быть очень большой, и тогда желательно применять специальные алгоритмы понижения размерности. Это как отбор значимых признаков, так и отображение данных в пространство меньшей размерности.
3.
Трансформация, нормализация данных. Этот шаг необходим для приведения информации к пригодному для последующего анализа виду. Для чего нужно проделать такие операции, как приведение типов, квантование, приведение к "скользящему окну" и прочее. Кроме того, некоторые методы анализа, которые требуют, чтобы исходные данные были в каком-то определенном виде. Нейронные сети, скажем, работают только с числовыми данными, причем они должны быть нормализованы.
4.
Data Mining. На этом шаге применяются различные алгоритмы для нахождения знаний. Это нейронные сети, деревья решений, алгоритмы кластеризации, установления ассоциаций и т.д.
5.
Постобработка данных. Интерпретация результатов и применение полученных знаний в бизнес приложениях.


11
Рис. 1. Процесс Knowledge Discovery in Databases
Knowledge Discovery in Databases не задает набор методов обработки или пригодные для анализа алгоритмы, он определяет последовательность действий, которую необходимо выполнить для того, чтобы из исходных данных получить знания [13]. Данный подход универсальный и не зависит от предметной области, что является его несомненным достоинством.
OLAP
Механизм OLAP является на сегодня одним из популярных методов анализа данных. Есть два основных подхода к решению этой задачи. Первый из них называется Multidimensional OLAP (MOLAP) – реализация механизма при помощи многомерной базы данных на стороне сервера, а второй
Relational OLAP (ROLAP) – построение кубов "на лету" на основе SQL запросов к реляционной СУБД [5]. Каждый из этих подходов имеет свои плюсы и минусы. Здесь описана реализация ядра настольного ROLAP модуля.
Такая задача возникла после применения ROLAP системы, построенной на основе компонентов Decision Cube, входящих в состав
Borland Delphi [11]. К сожалению, использование этого набора компонент показало низкую производительность на больших объемах данных. Остроту

12 этой проблемы можно снизить, стараясь отсечь как можно больше данных перед подачей их для построения кубов. Но этого не всегда бывает достаточно.
Схема работы
Общую схему работы настольной OLAP системы можно представить следующим образом:
Рис. 2. Общая схема OLAP
Алгоритм работы следующий:

Получение данных в виде плоской таблицы или результата выполнения SQL запроса.

Кэширование данных и преобразование их к многомерному кубу.

Отображение построенного куба при помощи кросс-таблицы или диаграммы и т.п. В общем случае, к одному кубу может быть подключено произвольное количество отображений [33].
Рассмотрим, как подобная система может быть устроена внутри.
Отображения, используемые в OLAP системах, чаще всего бывают двух видов – кросс-таблицы и диаграммы. Рассмотрим кросс-таблицу, которая является основным и наиболее распространенным способом отображения куба.
Кросс-таблица
На приведенном ниже рисунке, желтым цветом отображены строки и столбцы, содержащие агрегированные результаты, светло-серым цветом

13 отмечены ячейки, в которые попадают факты и красным ячейки, содержащие данные размерностей.
Рис. 3. Кросс-таблица
Таким образом, таблицу можно разделить на следующие элементы:
Рис. 4. Фрагмент кросс-таблицы
Заполняя матрицу с фактами, необходимо действовать следующим образом:
1.
На основании данных об измерениях определить координаты добавляемого элемента в матрице.
2.
Определить координаты столбцов и строк итогов, на которые влияет добавляемый элемент.