Файл: Практикум по дисциплине Технологии и продукты цифровой экономики Методические указания к лабораторным работам для студентов.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 10.11.2023
Просмотров: 300
Скачиваний: 22
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Министерство науки и высшего образования РФ
Ульяновский государственный университет
Форма
Ф-Методические указания
Рис.2. Диаграмма данных
Как видно, не каждый аналитик сможет судить о сезонности по этим данным, поэтому необходимо воспользоваться автокорреляцией. Для этого откроем мастер обработки, выберем в качестве обработки автокорреляцию и перейдем на второй шаг мастера. В нем необходимо настроить параметры столбцов (рис.3). Укажем поле «Дата (Год + Месяц)» неиспользуемым, а поле «КОЛИЧЕСТВО» используемым (ведь необходимо определить сезонность количества продаж).
Предположим, что сезонность, если она имеет место, не больше года. В связи с этим зададим количество отсчетов равным 15 (тогда будет искаться зависимость от месяца назад, двух, ..., пятнадцати месяцев назад). Также должен стоять флажок «Включить поле отсчетов набор данных». Он необходим для более удобной интерпретации автокорреляционного анализа.
Рис.3. Мастер обработки
Перейдем на следующий шаг мастера и запустим процесс обработки.
По окончанию, результаты удобно анализировать как в виде таблицы, так и в виде диаграммы (рис.4). После обработки были получены два столбца – «Лаг» (благодаря установленному флажку в мастере) и «КОЛИЧЕСТВО» - результат автокорреляции.
Министерство науки и высшего образования РФ
Ульяновский государственный университет
Форма
Ф-Методические указания
Рис.4. Итоговая диаграмма
Видно, что вначале корреляция равна единице – то как значение зависит само от себя.
Далее зависимость убывает и затем виден пик зависимости от данных 12 месяцев назад. Это как раз и говорит о наличии годовой сезонности.
После импорта данных воспользуемся диаграммой для их просмотра. На ней видно, что данные содержат аномалии (выбросы) и шумы, за которыми трудно разглядеть тенденцию.
Рис.5 Диаграмма данных
Поэтому перед прогнозированием необходимо удалить аномалии и сгладить данные.
Сделать это можно при помощи парциальной обработки.
Запустим мастер обработки, выберем в качестве обработки данных парциальную обработку и перейдем на следующий шаг мастера. Как известно, второй шаг мастера отвечает за обработку пропущенных значений, которых в исходных данных нет. Поэтому здесь ничего не настраиваем. Следующий шаг отвечает за удаление аномалий из исходного набора.
Министерство науки и высшего образования РФ
Ульяновский государственный университет
Форма
Ф-Методические указания
Выберем поле для обработки «КОЛИЧЕСТВО» и укажем для него обработку аномальных явлений (степень подавления – малая).
Четвертый шаг мастера позволяет провести спектральную обработку. Из исходных данных необходимо исключить шумы, поэтому выбираем столбец «КОЛИЧЕСТВО» и указываем способ обработки «вычитание шума» (степень вычитания – малая). На следующем шаге запустим обработку, нажав на «пуск». После обработки просмотрим полученный результат на диаграмме.
Рис.6. Диаграмма результата
Видно, что данные сгладились, аномалии и шумы исчезли. Также видна тенденция.
Теперь перед аналитиком встает вопрос, а как, собственно, прогнозировать временной ряд. В данном случае столбец один. Строить прогноз на будущее необходимо, основываясь на данных прошлых периодов. Т.е. предполагается, что количество продаж на следующий месяц зависит от количества продаж за предыдущие месяцы. Т.е. входными факторами для модели могут быть продажи за текущий месяц, продажи за месяц ранее и т.д., а результатом должны быть продажи за следующий месяц. Т.е. здесь явно необходимо трансформировать данные к скользящему окну.
Запустим мастер обработки (рис.7), выберем в качестве обработчика скользящее окно и перейдем на следующий шаг. Аналитик провел также авторегрессионый анализ и выяснил наличие годовой сезонности (см. пример с авторегрессией). В связи с этим было решено строить прогноз на неделю вперед, основываясь на данных за 12, 11 месяцев назад, два месяца назад и месяц назад. Поэтому необходимо, назначив поле «КОЛИЧЕСТВО» используемым, выбрать глубину погружения 12. Тогда данные трансформируются к скользящему окну так, что аналитику будут доступны все требуемые факторы для построения прогноза.
Министерство науки и высшего образования РФ
Ульяновский государственный университет
Форма
Ф-Методические указания
Рис.7. Окно мастера обработки
Просмотреть полученные данные можно в виде таблицы:
Рис.8 Таблица полученных данных
Как видно, теперь в качестве входных факторов можно использовать «КОЛИЧЕСТВО
- 12», «КОЛИЧЕСТВО - 11» - данные по количеству 12 и 11 месяцев назад (относительно прогнозируемого месяца) и остальные необходимые факторы. В качестве результата прогноза буден указан столбец «КОЛИЧЕСТВО».
Перейдем непосредственно к самому построению модели прогноза. Откроем, мастер обработки и выберем в нем нейронную сеть. На втором шаге мастера, согласно с принятым ранее решением, установим в качестве входных поля «КОЛИЧЕСТВО - 12», «КОЛИЧЕСТВО
- 11», «КОЛИЧЕСТВО - 2» и «КОЛИЧЕСТВО - 1», а в качестве выходного -
«КОЛИЧЕСТВО» (рис.9). Остальные поля сделаем информационными.
Рис.9. Окно мастера обработки
Министерство науки и высшего образования РФ
Ульяновский государственный университет
Форма
Ф-Методические указания
Оставив все остальные параметры построения модели по умолчанию, обучим нейросеть. После построения модели для просмотра качества обучения представим полученные данные в виде диаграммы и диаграммы рассеяния. В мастере настройки диаграммы
(рис.10) выберем для отображения поля
«КОЛИЧЕСТВО» и
«КОЛИЧЕСТВО_OUT» - реальное и спрогнозированное значение.
Рис.10. Окно мастера настройки диаграммы
Результатом будет два графика:
Рис.11. Диаграмма качества обучения
Министерство науки и высшего образования РФ
Ульяновский государственный университет
Форма
Ф-Методические указания
Диаграмма рассеяния более наглядно показывает качество обучения:
Рис.12. Диаграмма рассеяния
Нейросеть обучена, теперь осталось самое главное – построить требуемый прогноз.
Для этого открываем мастер обработки и выбираем появившийся теперь обработчик
«Прогнозирование» (рис13). На втором шаге мастера предлагается настроить связи столбцов для прогнозирования временного ряда – откуда брать данные для столбца при очередном шаге прогноза. Мастер сам верно настроил все переходы, поэтому остается только указать горизонт прогноза (на сколько вперед будем прогнозировать) равным трем, а также, для наглядности, необходимо добавить к прогнозу исходные данные, установив в мастере соответствующий флажок.
Рис.13. Окно мастера обработки
После этого необходимо в качестве визуализатора выбрать диаграмму прогноза, которая появляется только после прогнозирования временного ряда.
Министерство науки и высшего образования РФ
Ульяновский государственный университет
Форма
Ф-Методические указания
В мастере настройки столбцов диаграммы прогноза необходимо указать в качестве отображаемого столбец «КОЛИЧЕСТВО», а в качестве подписей по оси Х указать столбец
«ШАГ ПРОГНОЗА».
Теперь аналитик может дать ответ на вопрос, какое количество товаров будет продано в следующем месяце и даже два месяца спустя.
Рис.14. Диаграмма прогноза
Содержание отчета
Отчет по лабораторной работе представляется в виде документа Word. В состав документа входят:
1. Название работы
2. Цель работы
3. Копии экрана, иллюстрирующие выполнения задания лабораторной работы
4. Выводы по работе
Контрольные вопросы:
1. Что такое сезонность?
2. Для чего используется автокорреляционный анализ?
3. Как определить существует зависимость между данными или нет?
4. Для чего нужен прогноз временного ряда?
5. Какой инструмент в системе Deductor используется для прогнозирования временных рядов?
6. Какого назначение обработчика «Нейросеть» системы Deductor?
7. Как обработчик «Нейросеть» можно использовать при прогнозировании?
Список рекомендуемой литературы
1. Барсегян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. Методы и модели анализа данных: OLAP и Data Mining. – Спб.: БХВ-Петербург, 2004. – 336 с.: ил
2. Загоруйко Н.Г. Прикладные методы анализа данных и знаний. – Новосибирск: Изд-во
Ин-та математики, 1999. – 270 с.
3. Тюрин Ю.Н., Макаров А.А. Статистический анализ данных на компьютере / Под ред. В.
Э. Фигурнова – М.: ИНФРА-М, 1998. – 528 с., ил.