ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 23.11.2023
Просмотров: 26
Скачиваний: 2
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ
ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ
ВЫСШЕГО ОБРАЗОВАНИЯ
НОВОСИБИРСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
ФАКУЛЬТЕТ АВТОМАТИКИ И ВЫЧИСЛИТЕЛЬНОЙ ТЕХНИКИ
КАФЕДРА АВТОМАТИЗИРОВАННЫХ СИСТЕМ УПРАВЛЕНИЯ
РГЗ
По дисциплине: «Теория случайных процессов»
Группа: ВИ-01 Преподаватель: Ганелина Н.Д.
Выполнили: Федоров К. Е.
Новосибирск 2023
-
Цель работы. Изучить методологию анализа временного ряда. Построить модели на основе авторегрессии, скользящего среднего или экспоненциального сглаживания. Сделать прогноз по имеющимся данным и оценить качество полученной модели.
-
Описание исходных данных
В качестве исходных данных взял статистику о числе зараженных COVID-19 на различные даты.
Фрагмент данных:
Дата | Заражено на дату |
27.03.2020 | 986 |
28.03.2020 | 1211 |
29.03.2020 | 1462 |
30.03.2020 | 1761 |
31.03.2020 | 2199 |
01.04.2020 | 2563 |
02.04.2020 | 3283 |
03.04.2020 | 3834 |
04.04.2020 | 4355 |
05.04.2020 | 4989 |
,,,, | ,,,, |
19.05.2021 | 266924 |
20.05.2021 | 265777 |
21.05.2021 | 264986 |
22.05.2021 | 263964 |
23.05.2021 | 265261 |
24.05.2021 | 266898 |
25.05.2021 | 265646 |
26.05.2021 | 264478 |
27.05.2021 | 263356 |
Все исходные данные находятся в приложении 1.
Описание данных:
Исходные данные представляют статистику о числе зараженных COVID-19 на различные даты, начиная с 27 марта 2020 года и заканчивая 27 мая 2021 года.
В данных отсутствуют пропущенные значения, то есть для каждой даты имеется запись о количестве зараженных. Отсутствие пропусков позволяет использовать данные для анализа и моделирования.
Примечаний к данным нет указано. Они представляют собой простой список дат и соответствующих им значений количества зараженных COVID-19.
Рисунок 1- График исходных данных (27.03.2020 – 27.05.2021 гг.)
Визуальный анализ:
-
Тренд
Исходя из графика, можно заметить, что в начале данных количество зараженных росло довольно медленно, однако затем наблюдался резкий рост заражений, достигая пика в середине апреля 2020 года. После пика тренд стал снижаться, и в последующие периоды колеблется на относительно стабильном уровне, с небольшими всплесками в некоторых интервалах.
-
Сезонность
На основании предоставленных данных не наблюдается явной сезонности, то есть повторяющихся циклов внутри одного года.
-
Выбросы
На графике можно обратить внимание на несколько выбросов, где количество зараженных сильно отличается от общего тренда. Эти выбросы могут быть связаны с особыми событиями или ошибками в данных.
-
Постоянство дисперсии данных
Дисперсия данных, основываясь на предоставленных значениях, кажется не постоянной, так как размах значений меняется со временем.
Метод Ирвина.
Поиск аномальных значений, или выбросов. Я выбрал метод Ирвина, чтобы найти выбросы в временном ряду.
После проверки значений, я не обнаружил выбросы.
Коррелограмма временного ряда
Коррелограмма имеет максимум при Lag=1, следовательно временной ряд содержит только тренд
, значит, сезонности нет.
Для данного временного ряда хорошо подходят методы скользящего среднего и экспоненциального сглаживания с учётом тренда(метод Хольта). Эти две модели позволять довольно эффективно проводить анализ и прогноз в условиях наличия тренда.
Метод Хольта
При расчете методом Хольта используется 3 формулы.
Экспоненциально сглаженный ряд или оценка текущего уровня
Оценка тренда
Прогноз на p периодов вперед
Использовал следующие исходные значения:
Для первого периода , .
.
Как и при обычном экспоненциальном сглаживании, постоянные и выбираются по усмотрению или путем минимизации ошибки прогнозирования.
Мат ожидание = -710,552
Средне квадратичное отклонение= 3499,719
По графику видно, что линия сглаживания почти полностью совпадает с графиком заражено на дату, что показывает правильность проведённых расчётов. Серым графиком отмечены остатки, которые нормально распределены.
Для оценки точности модели, а так-же поиск величины ошибки прогноза, были использованы три модели
В результате проведённых расчётов были получены следующие значения:
MSE | 12635462,59 |
MAE | 2686,66609 |
MAPE | 1,439076274 |
| 98,56092373 |
Чтобы найти процентную точность прогноза, нужно вычесть MAPE из 100. Получившееся значение является точностью прогноза.
В ходе расчётов была получена точность расчётов равная 98,56092373.
Метод скользящего среднего
Расчеты методом скользящего среднего.
Мат ожидание = 206,2449139
Средне квадратичное отклонение= 4323,013612
Для оценки точности модели, а так-же поиск величины ошибки прогноза, были использованы три модели
MSE | 18556434,94 |
MAE | 798,4462617 |
MAPE | 0,495957143 |
В ходе расчётов была получена точность расчётов равная 99,50404286
Вывод
После проведённого прогноза с помощью моделей Хольта и скользящего среднего, можно сделать вывод, что обе эти модели довольно точны, и хорошо подходят для описания заболевших людей ковидом. Можно сказать, что модель скользящего среднего более проста в построении, и имеет мало расчётных коэфициентов, в отличие от моделей авторегрессии и Хольта. Однако модель Хольта оказалось более точна по моделям MSE, MAE, MAPE.
Приложение 1
Дата | Заражено на дату |
27.03.2020 | 986 |
28.03.2020 | 1211 |
29.03.2020 | 1462 |
30.03.2020 | 1761 |
31.03.2020 | 2199 |
01.04.2020 | 2563 |
02.04.2020 | 3283 |
03.04.2020 | 3834 |
04.04.2020 | 4355 |
05.04.2020 | 4989 |
06.04.2020 | 9401 |
07.04.2020 | 6945 |
08.04.2020 | 8029 |
09.04.2020 | 9357 |
10.04.2020 | 11028 |
11.04.2020 | 12433 |
12.04.2020 | 14349 |
13.04.2020 | 16710 |
14.04.2020 | 19238 |
15.04.2020 | 22306 |
16.04.2020 | 25402 |
17.04.2020 | 29145 |
18.04.2020 | 33423 |
19.04.2020 | 39201 |
20.04.2020 | 43270 |
21.04.2020 | 48434 |
22.04.2020 | 53066 |
23.04.2020 | 57327 |
24.04.2020 | 62439 |
25.04.2020 | 67657 |
26.04.2020 | 73435 |
27.04.2020 | 79006 |
28.04.2020 | 84235 |
29.04.2020 | 88141 |
30.04.2020 | 93806 |
01.05.2020 | 100042 |
02.05.2020 | 107819 |
03.05.2020 | 116768 |
04.05.2020 | 125817 |
05.05.2020 | 134054 |
06.05.2020 | 143065 |
07.05.2020 | 151732 |
08.05.2020 | 159528 |
09.05.2020 | 164933 |
10.05.2020 | 173467 |
11.05.2020 | 179534 |
12.05.2020 | 186615 |
13.05.2020 | 192056 |
14.05.2020 | 196410 |
15.05.2020 | 202199 |
16.05.2020 | 206341 |
17.05.2020 | 211748 |
18.05.2020 | 217747 |
19.05.2020 | 220974 |
20.05.2020 | 220341 |
21.05.2020 | 221774 |
22.05.2020 | 223374 |
23.05.2020 | 224558 |
24.05.2020 | 227641 |
25.05.2020 | 230996 |
26.05.2020 | 227406 |
27.05.2020 | 224504 |
28.05.2020 | 223916 |
29.05.2020 | 223992 |
30.05.2020 | 224551 |
31.05.2020 | 229267 |
01.06.2020 | 234146 |
02.06.2020 | 231719 |
03.06.2020 | 231105 |
04.06.2020 | 231101 |
05.06.2020 | 231626 |
06.06.2020 | 231576 |
07.06.2020 | 235083 |
08.06.2020 | 239999 |
09.06.2020 | 236715 |
10.06.2020 | 234516 |
11.06.2020 | 234754 |
12.06.2020 | 235338 |
13.06.2020 | 238659 |
14.06.2020 | 241966 |
15.06.2020 | 245580 |
16.06.2020 | 243868 |
17.06.2020 | 241481 |
18.06.2020 | 239468 |
19.06.2020 | 236816 |
20.06.2020 | 234358 |
21.06.2020 | 236858 |
22.06.2020 | 239658 |
23.06.2020 | 234917 |
24.06.2020 | 229546 |
25.06.2020 | 230225 |
26.06.2020 | 227861 |
27.06.2020 | 225325 |
28.06.2020 | 226277 |
29.06.2020 | 228560 |
30.06.2020 | 225879 |
01.07.2020 | 221938 |
02.07.2020 | 222504 |
03.07.2020 | 220131 |
04.07.2020 | 217609 |
05.07.2020 | 220340 |
06.07.2020 | 223237 |
07.07.2020 | 219856 |
08.07.2020 | 217614 |
09.07.2020 | 215142 |
10.07.2020 | 213851 |
11.07.2020 | 211896 |
12.07.2020 | 214766 |
13.07.2020 | 218239 |
14.07.2020 | 215508 |
15.07.2020 | 211350 |
16.07.2020 | 209168 |
17.07.2020 | 207707 |
18.07.2020 | 206327 |
19.07.2020 | 208860 |
20.07.2020 | 211457 |
21.07.2020 | 208364 |
22.07.2020 | 204392 |
23.07.2020 | 201816 |
24.07.2020 | 199029 |
25.07.2020 | 196388 |
26.07.2020 | 198966 |
27.07.2020 | 201437 |
28.07.2020 | 197794 |
29.07.2020 | 194984 |
30.07.2020 | 191042 |
31.07.2020 | 187608 |
01.08.2020 | 184861 |
02.08.2020 | 186569 |
03.08.2020 | 188464 |
04.08.2020 | 185601 |
05.08.2020 | 183111 |
06.08.2020 | 180931 |
07.08.2020 | 178818 |
08.08.2020 | 177286 |
09.08.2020 | 179183 |
10.08.2020 | 180972 |
11.08.2020 | 179293 |
12.08.2020 | 177143 |
13.08.2020 | 175978 |
14.08.2020 | 174361 |
15.08.2020 | 172856 |
16.08.2020 | 174200 |
17.08.2020 | 175904 |
18.08.2020 | 173993 |
19.08.2020 | 171909 |
20.08.2020 | 170494 |
21.08.2020 | 169457 |
22.08.2020 | 168110 |
23.08.2020 | 169727 |
24.08.2020 | 171950 |