Файл: Создадим долгосрочные прогнозы показателей сельского хозяйства Курской области с применением линейной регрессии.docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 10.01.2024

Просмотров: 19

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Создадим долгосрочные прогнозы показателей сельского хозяйства Курской области с применением линейной регрессии.

Для анализа выберем следующие показатели: Растениеводство и животноводство.

На первом этапе сделаем прогноз по показателю Растениеводство, а именно пшеница озимая и посевные площади.

Данные взяты с источника Государственной службы Федеральной статистики.

Таблица 1 - Статистические данные по показателю Растениеводство

Показатели

Фактические данные из СТАТ.ДАННЫХ rosstat.gov.ru

2017

2018

2019

2020

2021

2022

Пшеница озимая тыс. ц

37548

21925

22491

27441

18668

25472

Посевные площади тыс. га

0,30

0,20

0,15

0,10

0,05

0,30

Построение модели линейной регрессии, оценивание значимости модели и параметров средствами Excel (инструмент Регрессия в пакете Анализ данных):

1. Выбор команды Сервис => Анализ данных (В Excel на вкладке Данные => команда Анализ данных).

2. В диалоговом окне Анализ данных выбор инструмента Регрессия, а затем кнопка ОК.

3. В диалоговом окне Регрессия в поле Входной интервал Y ввод адреса одного диапазона ячеек, который представляет зависимую переменную. В поле Входной интервал X ввод адреса диапазона, который содержит значения независимых переменных.

Таблица 2 - Оценивание значимости модели

i

Х(i)

y(i)

Линия регрессии ŷ(i)

1

37548

0,3

0,304

2

21925

0,2

0,146

3

22491

0,15

0,152

4

27441

0,1

0,202

5

18668

0,05

0,114

6

25472

0,3

0,182


Таблица 3 – Вывод результатов

ВЫВОД ИТОГОВ




















































Регрессионная статистика






















Множественный R

0,643822739






















R-квадрат

0,414507719






















Нормированный R-квадрат

0,268134649






















Стандартная ошибка

0,088354761






















Наблюдения

6





































Зависимость валового сбора пшеницы от посевных площадей

Дисперсионный анализ






















 

df

SS

MS

F

Значимость F










Регрессия

1

0,022107078

0,022107078

2,83185779

0,16770064










Остаток

4

0,031226255

0,007806564
















Итого

5

0,053333333

 

 

 





































 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

-0,074737275

0,157541674

-0,474396857

0,65995479

-0,51214308

0,36266853

-0,51214308

0,36266853

Переменная X 1

1,00845E-05

5,99266E-06

1,682812465

0,16770064

-6,5538E-06

2,6723E-05

-6,5538E-06

2,6723E-05





Рисунок 1- Линия регрессии

Одним из основных показателей является R-квадрат. В нем указывается качество модели. В нашем случае данный коэффициент равен 0,414 или около 41,4%. Это не приемлемый уровень качества. Зависимость менее 0,5 является плохой.

Ещё один важный показатель расположен в ячейке на пересечении строки «Y-пересечение» и столбца «Коэффициенты».

Тут указывается какое значение будет у Y, а в нашем случае, это площади посевные, при всех остальных факторах равных нулю. Значение равно -0,074.

Значение на пересечении граф «Переменная X1» и «Коэффициенты» показывает уровень зависимости Y от X. В нашем случае — это уровень зависимости количества пшеницы озимой от посевных площадей. Коэффициент 1,00845E-05 считается низким показателем влияния.

Спрогнозируем показатели пшеница озимая с помощью Ехсел с помощью функции Тенденция.

Далее спрогнозируем показатели посевные площади с помощью уравнения у= 1,00845E-05х-0,0747 подставляя значения пшеницы озимой.

Таблица 4 - Прогноз показателей растениеводство на 2023-2030 гг.

Показатели

Спрогнозируемые показатели

2023

2024

2025

2026

2027

2028

2029

2030

Пшеница озимая тыс. ц

30386

25041

24451

23485

19979

28414

30386

25041

Посевные площади тыс. га

0,23

0,18

0,17

0,16

0,13

0,21

0,23

0,18






Рисунок 2 - Прогноз показателя пшеница озимая до 2030 г.



Рисунок 3 - Прогноз показателя посевные площади до 2030 г.
На первом этапе сделаем прогноз по показателю Животноводство, а именно Произведено скота и птицы.

Данные взяты с источника Государственной службы Федеральной статистики.

Таблица 5 - Статистические данные по показателю Животноводство

Показатели

Фактические данные из СТАТ.ДАННЫХ rosstat.gov.ru

2017

2018

2019

2020

2021

2022

Сахарная свекла тыс. ц

55458

50041

52830

39121

36316

45323

Произведено скота и птицы тыс. т

534

523

539

632

644

642


Построение модели линейной регрессии, оценивание значимости модели и параметров средствами Excel (инструмент Регрессия в пакете Анализ данных):

1. Выбор команды Сервис => Анализ данных (В Excel на вкладке Данные => команда Анализ данных).

2. В диалоговом окне Анализ данных выбор инструмента Регрессия, а затем кнопка ОК.

3. В диалоговом окне Регрессия в поле Входной интервал Y ввод адреса одного диапазона ячеек, который представляет зависимую переменную. В поле Входной интервал X ввод адреса диапазона, который содержит значения независимых переменных.

Таблица 6 - Оценивание значимости модели

i

Х(i)

y(i)

Линия регрессии ŷ(i)

1

55458

534

524,856

2

50041

523

561,661

3

52830

539

542,712

4

39121

632

635,860

5

36316

644

654,923

6

45323

642

593,720


Таблица 7 – Вывод результатов

ВЫВОД ИТОГОВ




















































Регрессионная статистика






















Множественный R

0,876590396






















R-квадрат

0,768410722






















Нормированный R-квадрат

0,710513402






















Стандартная ошибка

31,89315973






















Наблюдения

6


































Зависимость произодства скота и птицы от сбора урожая свеклы

Дисперсионный анализ

























 

df

SS

MS

F

Значимость F










Регрессия

1

13499,88454

13499,88454

13,2719568

0,02190514










Остаток

4

4068,694551

1017,173638
















Итого

5

17568,57909

 

 

 





































 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

901,6841314

87,72868353

10,27809942

0,00050533

658,110257

1145,25801

658,110257

1145,25801

Переменная X 1

-0,006794848

0,001865144

-3,643069689

0,02190514

-0,01197332

-0,00161638

-0,01197332

-0,00161638