ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 03.12.2020
Просмотров: 535
Скачиваний: 4
36
Рис. 3.5. Диаграмма «Что-если»
Обработчик «Автокорреляция»
Целью автокорреляционного анализа является выяснение степени
статистической зависимости между различными значениями (отсчетами)
случайной последовательности, которую образует поле выборки данных. В
процессе
автокорреляционного
анализа
рассчитываются
коэффициенты
корреляции (мера взаимной зависимости) для двух значений выборки, отстоящих
друг от друга на определенное количество отсчетов, называемые также лагом.
Применительно к анализу временных рядов автокорреляция позволяет
выделить месячную и годовую сезонность в данных (рис. 4.1). Видно, что пик
зависимости на данных приходится на 12 месяц, что свидетельствует о годовой
сезонности. Поэтому величину продаж годовой давности необходимо обязательно
учитывать при построении модели (если используется нейронная сеть – то
подавать на вход).
Рис. 4.1. Автокорреляция
Обработчик «Парциальная предобработка»
Позволяет удалить аномалии и шумы в исходных данных. Шумы в данных (в
данном случае временной ряд истории продаж) не только скрывают общую
37
тенденцию, но и проявляют себя при построении модели прогноза. Из-за них
модель может получиться плохого качества. Аналогичная ситуация с аномалиями,
т.е. резкими отклонениями величины от ее ожидаемого значения.
Однако следует понимать, что решение о сглаживании, удалении шумов и
аномалий целиком зависит от специфики решаемой задачи, бизнес-правил
предметной области и т.д. Иными словами, при сглаживании временного ряда
выдвигается гипотеза о зашумленности исходных данных. Аномалии, или
случайные всплески в отгрузке товаров могут быть вызваны такими факторами,
как задержка транспорта в пути и другими форс-мажорами. Кроме того, при
агрегации продаж по месяцам уже происходит частичное сглаживание данных, и,
может быть, дополнительное удаление шумов не требуется. В любом случае,
необходимо строить несколько моделей.
В обработчике «Парциальная обработка» предусмотрен выбор степени
подавления аномалий и вычитания шумов: малая, средняя, большая. Кроме того, в
обработчике предусмотрена возможность заполнения пропусков, а также
сглаживание данных, в том числе вейвлет-преобразованием. Выбор того или
иного алгоритма определяется спецификой конкретной задачи.
На рис. 4.2. приведен пример временного ряда после удаления аномалий и
шумов.
Рис. 4.2. Исходные и сглаженные данные
Обработчик «Скользящее окно»
При прогнозировании временных рядов при помощи обучающихся
алгоритмов (в том числе искусственной нейронной сети), требуется подавать на
вход анализатора значения нескольких, смежных, отсчетов из исходного набора
данных. Например, в случае когда необходимо подавать на вход значения сумм
продаж за последние 3 месяца и сумму продаж год назад. При этом
эффективность реализации заметно повышается, если не выбирать данные
каждый раз из нескольких последовательных записей, а последовательно
расположить данные, относящиеся к конкретной позиции окна, в одной записи.
Значения в одном из полей записи будут относиться к текущему отсчету, а в
других – смещены от текущего отсчета «в будущее» или «в прошлое».
Следовательно, преобразование скользящего окна имеет два параметра: «глубина
38
погружения» -количество «прошлых» отсчетов (включая текущий отсчет),
попадающих в окно, и «горизонт прогнозирования» – количество «будущих»
отсчетов. Такой метод отбора данных называется скользящим окном (поскольку
это окно «перемещается» по всему набору).
Обработчик «Нейросеть»
Обработчик предназначен для решения задач регрессии и прогнозирования.
В данном случае нейросеть строится для прогнозирования будущих значений
временного ряда. Для проверки обобщающей способности нейросети
рекомендуется разбить имеющееся множество данных на две части: обучающее и
тестовое. Как правило, при прогнозировании временных рядов, доля тестового
множества составляет не более 10-20%.
С помощью визуализатора «Диаграмма» оценивается способность
построенной нейросетевой модели к обобщению. Для этого в одном окне
выводятся графики исходного и спрогнозированного временных рядов. На рис.
4.3 изображен пример таких графиков. Видно, что построенная модель
обеспечивает приемлемую точность.
Рис. 4.3. Оценка качества построенной модели
Обработчик «Прогнозирование»и визуализатор «Диаграмма прогноза»
Прогнозирование позволяет получать предсказание значений временного
ряда на число отсчетов, соответствующее заданному горизонту прогнозирования.
Алгоритм прогнозирования работает следующим образом. Пусть в результате
преобразования методом скользящего окна была получена последовательность
временных отсчетов:
X(-n),..., X(-2), X-(-1), X0, X(+1)
где X+1 прогнозируемое значение, полученное с помощью предыдущего этапа
обработки (например нейронной сети) на основе n предыдущих значений. Тогда,
чтобы построить прогноз для значения X(+2) нужно сдвинуть всю
последовательность на один отсчет влево, чтобы ранее сделанный прогноз X(+1)
тоже вошел в число исходных значений. Затем снова будет запущен алгоритм
расчета прогнозируемого значения - X(+2) будет рассчитан с учетом X(+1) и так
далее в соответствии с заданным горизонтом прогноза.
39
Диаграмма прогноза становится доступной в списке способов представления
только для тех ветвей сценария, которые содержат прогноз временного ряда.
Основное отличие диаграммы прогноза от обычной диаграммы в том, что на ней,
кроме исходных данных отображаются результаты прогноза, при этом исходные
данные и прогноз отличаются по цвету (рис. 4.4).
Рис. 4.4 Диаграмма прогноза
Обработчик «Разгруппировка»
Применительно к задаче прогнозирования объема продаж разгруппировка
позволяет распределить прогнозные значения, рассчитанные моделью (например,
нейросетью) для определенной группы товара, по каждой товарной позиции в
данной группе. Основой для такого попозиционного распределения служит
гипотеза о том, что каждый товар в группе
Просмотр результатов попозиционного прогноза удобно реализовать в
многомерном виде, особенно если прогноз осуществляется более чем на один
период (рис. 4.5)
Рис. 4.5. Прогноз по каждой товарной позиции после разгруппировки
Таким образом, типичный сценарий построения модели объема продаж в
Deductor выглядит следующим образом (рис. 2.6).
40
Рис. 4.6. Типичный сценарий построения прогноза продаж