Файл: Дата Заражено на дату.docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 23.11.2023

Просмотров: 29

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ

ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ

ВЫСШЕГО ОБРАЗОВАНИЯ
НОВОСИБИРСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ

ФАКУЛЬТЕТ АВТОМАТИКИ И ВЫЧИСЛИТЕЛЬНОЙ ТЕХНИКИ
КАФЕДРА АВТОМАТИЗИРОВАННЫХ СИСТЕМ УПРАВЛЕНИЯ



РГЗ

По дисциплине: «Теория случайных процессов»

Группа: ВИ-01 Преподаватель: Ганелина Н.Д.

Выполнили: Федоров К. Е.

Новосибирск 2023

  1. Цель работы. Изучить методологию анализа временного ряда. Построить модели на основе авторегрессии, скользящего среднего или экспоненциального сглаживания. Сделать прогноз по имеющимся данным и оценить качество полученной модели.



  1. Описание исходных данных

В качестве исходных данных взял статистику о числе зараженных COVID-19 на различные даты.

Фрагмент данных:

Дата

Заражено на дату

27.03.2020

986

28.03.2020

1211

29.03.2020

1462

30.03.2020

1761

31.03.2020

2199

01.04.2020

2563

02.04.2020

3283

03.04.2020

3834

04.04.2020

4355

05.04.2020

4989

,,,,

,,,,

19.05.2021

266924

20.05.2021

265777

21.05.2021

264986

22.05.2021

263964

23.05.2021

265261

24.05.2021

266898

25.05.2021

265646

26.05.2021

264478

27.05.2021

263356


Все исходные данные находятся в приложении 1.

Описание данных:

Исходные данные представляют статистику о числе зараженных COVID-19 на различные даты, начиная с 27 марта 2020 года и заканчивая 27 мая 2021 года.

В данных отсутствуют пропущенные значения, то есть для каждой даты имеется запись о количестве зараженных. Отсутствие пропусков позволяет использовать данные для анализа и моделирования.

Примечаний к данным нет указано. Они представляют собой простой список дат и соответствующих им значений количества зараженных COVID-19.



Рисунок 1- График исходных данных (27.03.2020 – 27.05.2021 гг.)

Визуальный анализ:

  1. Тренд

Исходя из графика, можно заметить, что в начале данных количество зараженных росло довольно медленно, однако затем наблюдался резкий рост заражений, достигая пика в середине апреля 2020 года. После пика тренд стал снижаться, и в последующие периоды колеблется на относительно стабильном уровне, с небольшими всплесками в некоторых интервалах.

  1. Сезонность

На основании предоставленных данных не наблюдается явной сезонности, то есть повторяющихся циклов внутри одного года.

  1. Выбросы

На графике можно обратить внимание на несколько выбросов, где количество зараженных сильно отличается от общего тренда. Эти выбросы могут быть связаны с особыми событиями или ошибками в данных.

  1. Постоянство дисперсии данных

Дисперсия данных, основываясь на предоставленных значениях, кажется не постоянной, так как размах значений меняется со временем.

Метод Ирвина.

Поиск аномальных значений, или выбросов. Я выбрал метод Ирвина, чтобы найти выбросы в временном ряду.



После проверки значений, я не обнаружил выбросы.

Коррелограмма временного ряда

Коррелограмма имеет максимум при Lag=1, следовательно временной ряд содержит только тренд

, значит, сезонности нет.

Для данного временного ряда хорошо подходят методы скользящего среднего и экспоненциального сглаживания с учётом тренда(метод Хольта). Эти две модели позволять довольно эффективно проводить анализ и прогноз в условиях наличия тренда.



Метод Хольта

При расчете методом Хольта используется 3 формулы.

Экспоненциально сглаженный ряд или оценка текущего уровня



Оценка тренда



Прогноз на p периодов вперед



Использовал следующие исходные значения:

Для первого периода , .

.

Как и при обычном экспоненциальном сглаживании, постоянные   и   выбираются по усмотрению или путем минимизации ошибки прогнозирования.





Мат ожидание = -710,552

Средне квадратичное отклонение= 3499,719

По графику видно, что линия сглаживания почти полностью совпадает с графиком заражено на дату, что показывает правильность проведённых расчётов. Серым графиком отмечены остатки, которые нормально распределены.


Для оценки точности модели, а так-же поиск величины ошибки прогноза, были использованы три модели








В результате проведённых расчётов были получены следующие значения:

MSE

12635462,59

MAE

2686,66609

MAPE

1,439076274




98,56092373

Чтобы найти процентную точность прогноза, нужно вычесть MAPE из 100. Получившееся значение является точностью прогноза.

В ходе расчётов была получена точность расчётов равная 98,56092373.

Метод скользящего среднего

Расчеты методом скользящего среднего.







Мат ожидание = 206,2449139

Средне квадратичное отклонение= 4323,013612

Для оценки точности модели, а так-же поиск величины ошибки прогноза, были использованы три модели

MSE

18556434,94

MAE

798,4462617

MAPE

0,495957143


В ходе расчётов была получена точность расчётов равная 99,50404286

Вывод

После проведённого прогноза с помощью моделей Хольта и скользящего среднего, можно сделать вывод, что обе эти модели довольно точны, и хорошо подходят для описания заболевших людей ковидом. Можно сказать, что модель скользящего среднего более проста в построении, и имеет мало расчётных коэфициентов, в отличие от моделей авторегрессии и Хольта. Однако модель Хольта оказалось более точна по моделям MSE, MAE, MAPE.

Приложение 1

Дата

Заражено на дату

27.03.2020

986

28.03.2020

1211

29.03.2020

1462

30.03.2020

1761

31.03.2020

2199

01.04.2020

2563

02.04.2020

3283

03.04.2020

3834

04.04.2020

4355

05.04.2020

4989

06.04.2020

9401

07.04.2020

6945

08.04.2020

8029

09.04.2020

9357

10.04.2020

11028

11.04.2020

12433

12.04.2020

14349

13.04.2020

16710

14.04.2020

19238

15.04.2020

22306

16.04.2020

25402

17.04.2020

29145

18.04.2020

33423

19.04.2020

39201

20.04.2020

43270

21.04.2020

48434

22.04.2020

53066

23.04.2020

57327

24.04.2020

62439

25.04.2020

67657

26.04.2020

73435

27.04.2020

79006

28.04.2020

84235

29.04.2020

88141

30.04.2020

93806

01.05.2020

100042

02.05.2020

107819

03.05.2020

116768

04.05.2020

125817

05.05.2020

134054

06.05.2020

143065

07.05.2020

151732

08.05.2020

159528

09.05.2020

164933

10.05.2020

173467

11.05.2020

179534

12.05.2020

186615

13.05.2020

192056

14.05.2020

196410

15.05.2020

202199

16.05.2020

206341

17.05.2020

211748

18.05.2020

217747

19.05.2020

220974

20.05.2020

220341

21.05.2020

221774

22.05.2020

223374

23.05.2020

224558

24.05.2020

227641

25.05.2020

230996

26.05.2020

227406

27.05.2020

224504

28.05.2020

223916

29.05.2020

223992

30.05.2020

224551

31.05.2020

229267

01.06.2020

234146

02.06.2020

231719

03.06.2020

231105

04.06.2020

231101

05.06.2020

231626

06.06.2020

231576

07.06.2020

235083

08.06.2020

239999

09.06.2020

236715

10.06.2020

234516

11.06.2020

234754

12.06.2020

235338

13.06.2020

238659

14.06.2020

241966

15.06.2020

245580

16.06.2020

243868

17.06.2020

241481

18.06.2020

239468

19.06.2020

236816

20.06.2020

234358

21.06.2020

236858

22.06.2020

239658

23.06.2020

234917

24.06.2020

229546

25.06.2020

230225

26.06.2020

227861

27.06.2020

225325

28.06.2020

226277

29.06.2020

228560

30.06.2020

225879

01.07.2020

221938

02.07.2020

222504

03.07.2020

220131

04.07.2020

217609

05.07.2020

220340

06.07.2020

223237

07.07.2020

219856

08.07.2020

217614

09.07.2020

215142

10.07.2020

213851

11.07.2020

211896

12.07.2020

214766

13.07.2020

218239

14.07.2020

215508

15.07.2020

211350

16.07.2020

209168

17.07.2020

207707

18.07.2020

206327

19.07.2020

208860

20.07.2020

211457

21.07.2020

208364

22.07.2020

204392

23.07.2020

201816

24.07.2020

199029

25.07.2020

196388

26.07.2020

198966

27.07.2020

201437

28.07.2020

197794

29.07.2020

194984

30.07.2020

191042

31.07.2020

187608

01.08.2020

184861

02.08.2020

186569

03.08.2020

188464

04.08.2020

185601

05.08.2020

183111

06.08.2020

180931

07.08.2020

178818

08.08.2020

177286

09.08.2020

179183

10.08.2020

180972

11.08.2020

179293

12.08.2020

177143

13.08.2020

175978

14.08.2020

174361

15.08.2020

172856

16.08.2020

174200

17.08.2020

175904

18.08.2020

173993

19.08.2020

171909

20.08.2020

170494

21.08.2020

169457

22.08.2020

168110

23.08.2020

169727

24.08.2020

171950