Файл: Создадим долгосрочные прогнозы показателей сельского хозяйства Курской области с применением линейной регрессии.docx
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 10.01.2024
Просмотров: 19
Скачиваний: 1
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Создадим долгосрочные прогнозы показателей сельского хозяйства Курской области с применением линейной регрессии.
Для анализа выберем следующие показатели: Растениеводство и животноводство.
На первом этапе сделаем прогноз по показателю Растениеводство, а именно пшеница озимая и посевные площади.
Данные взяты с источника Государственной службы Федеральной статистики.
Таблица 1 - Статистические данные по показателю Растениеводство
Показатели | Фактические данные из СТАТ.ДАННЫХ rosstat.gov.ru | |||||
2017 | 2018 | 2019 | 2020 | 2021 | 2022 | |
Пшеница озимая тыс. ц | 37548 | 21925 | 22491 | 27441 | 18668 | 25472 |
Посевные площади тыс. га | 0,30 | 0,20 | 0,15 | 0,10 | 0,05 | 0,30 |
Построение модели линейной регрессии, оценивание значимости модели и параметров средствами Excel (инструмент Регрессия в пакете Анализ данных):
1. Выбор команды Сервис => Анализ данных (В Excel на вкладке Данные => команда Анализ данных).
2. В диалоговом окне Анализ данных выбор инструмента Регрессия, а затем кнопка ОК.
3. В диалоговом окне Регрессия в поле Входной интервал Y ввод адреса одного диапазона ячеек, который представляет зависимую переменную. В поле Входной интервал X ввод адреса диапазона, который содержит значения независимых переменных.
Таблица 2 - Оценивание значимости модели
i | Х(i) | y(i) | Линия регрессии ŷ(i) |
1 | 37548 | 0,3 | 0,304 |
2 | 21925 | 0,2 | 0,146 |
3 | 22491 | 0,15 | 0,152 |
4 | 27441 | 0,1 | 0,202 |
5 | 18668 | 0,05 | 0,114 |
6 | 25472 | 0,3 | 0,182 |
Таблица 3 – Вывод результатов
ВЫВОД ИТОГОВ | | | | | | | | |
| | | | | | | | |
Регрессионная статистика | | | | | | | | |
Множественный R | 0,643822739 | | | | | | | |
R-квадрат | 0,414507719 | | | | | | | |
Нормированный R-квадрат | 0,268134649 | | | | | | | |
Стандартная ошибка | 0,088354761 | | | | | | | |
Наблюдения | 6 | | | | | | | |
| | | | | Зависимость валового сбора пшеницы от посевных площадей | |||
Дисперсионный анализ | | | | | | | | |
| df | SS | MS | F | Значимость F | | | |
Регрессия | 1 | 0,022107078 | 0,022107078 | 2,83185779 | 0,16770064 | | | |
Остаток | 4 | 0,031226255 | 0,007806564 | | | | | |
Итого | 5 | 0,053333333 | | | | | | |
| | | | | | | | |
| Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | Нижние 95,0% | Верхние 95,0% |
Y-пересечение | -0,074737275 | 0,157541674 | -0,474396857 | 0,65995479 | -0,51214308 | 0,36266853 | -0,51214308 | 0,36266853 |
Переменная X 1 | 1,00845E-05 | 5,99266E-06 | 1,682812465 | 0,16770064 | -6,5538E-06 | 2,6723E-05 | -6,5538E-06 | 2,6723E-05 |
Рисунок 1- Линия регрессии
Одним из основных показателей является R-квадрат. В нем указывается качество модели. В нашем случае данный коэффициент равен 0,414 или около 41,4%. Это не приемлемый уровень качества. Зависимость менее 0,5 является плохой.
Ещё один важный показатель расположен в ячейке на пересечении строки «Y-пересечение» и столбца «Коэффициенты».
Тут указывается какое значение будет у Y, а в нашем случае, это площади посевные, при всех остальных факторах равных нулю. Значение равно -0,074.
Значение на пересечении граф «Переменная X1» и «Коэффициенты» показывает уровень зависимости Y от X. В нашем случае — это уровень зависимости количества пшеницы озимой от посевных площадей. Коэффициент 1,00845E-05 считается низким показателем влияния.
Спрогнозируем показатели пшеница озимая с помощью Ехсел с помощью функции Тенденция.
Далее спрогнозируем показатели посевные площади с помощью уравнения у= 1,00845E-05х-0,0747 подставляя значения пшеницы озимой.
Таблица 4 - Прогноз показателей растениеводство на 2023-2030 гг.
Показатели | Спрогнозируемые показатели | |||||||
2023 | 2024 | 2025 | 2026 | 2027 | 2028 | 2029 | 2030 | |
Пшеница озимая тыс. ц | 30386 | 25041 | 24451 | 23485 | 19979 | 28414 | 30386 | 25041 |
Посевные площади тыс. га | 0,23 | 0,18 | 0,17 | 0,16 | 0,13 | 0,21 | 0,23 | 0,18 |
Рисунок 2 - Прогноз показателя пшеница озимая до 2030 г.
Рисунок 3 - Прогноз показателя посевные площади до 2030 г.
На первом этапе сделаем прогноз по показателю Животноводство, а именно Произведено скота и птицы.
Данные взяты с источника Государственной службы Федеральной статистики.
Таблица 5 - Статистические данные по показателю Животноводство
Показатели | Фактические данные из СТАТ.ДАННЫХ rosstat.gov.ru | |||||
2017 | 2018 | 2019 | 2020 | 2021 | 2022 | |
Сахарная свекла тыс. ц | 55458 | 50041 | 52830 | 39121 | 36316 | 45323 |
Произведено скота и птицы тыс. т | 534 | 523 | 539 | 632 | 644 | 642 |
Построение модели линейной регрессии, оценивание значимости модели и параметров средствами Excel (инструмент Регрессия в пакете Анализ данных):
1. Выбор команды Сервис => Анализ данных (В Excel на вкладке Данные => команда Анализ данных).
2. В диалоговом окне Анализ данных выбор инструмента Регрессия, а затем кнопка ОК.
3. В диалоговом окне Регрессия в поле Входной интервал Y ввод адреса одного диапазона ячеек, который представляет зависимую переменную. В поле Входной интервал X ввод адреса диапазона, который содержит значения независимых переменных.
Таблица 6 - Оценивание значимости модели
i | Х(i) | y(i) | Линия регрессии ŷ(i) |
1 | 55458 | 534 | 524,856 |
2 | 50041 | 523 | 561,661 |
3 | 52830 | 539 | 542,712 |
4 | 39121 | 632 | 635,860 |
5 | 36316 | 644 | 654,923 |
6 | 45323 | 642 | 593,720 |
Таблица 7 – Вывод результатов
ВЫВОД ИТОГОВ | | | | | | | | | |||||||
| | | | | | | | | |||||||
Регрессионная статистика | | | | | | | | ||||||||
Множественный R | 0,876590396 | | | | | | | | |||||||
R-квадрат | 0,768410722 | | | | | | | | |||||||
Нормированный R-квадрат | 0,710513402 | | | | | | | | |||||||
Стандартная ошибка | 31,89315973 | | | | | | | | |||||||
Наблюдения | 6 | | | | | | | | |||||||
| | | | Зависимость произодства скота и птицы от сбора урожая свеклы | |||||||||||
Дисперсионный анализ | | | | | | | | | |||||||
| df | SS | MS | F | Значимость F | | | | |||||||
Регрессия | 1 | 13499,88454 | 13499,88454 | 13,2719568 | 0,02190514 | | | | |||||||
Остаток | 4 | 4068,694551 | 1017,173638 | | | | | | |||||||
Итого | 5 | 17568,57909 | | | | | | | |||||||
| | | | | | | | | |||||||
| Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | Нижние 95,0% | Верхние 95,0% | |||||||
Y-пересечение | 901,6841314 | 87,72868353 | 10,27809942 | 0,00050533 | 658,110257 | 1145,25801 | 658,110257 | 1145,25801 | |||||||
Переменная X 1 | -0,006794848 | 0,001865144 | -3,643069689 | 0,02190514 | -0,01197332 | -0,00161638 | -0,01197332 | -0,00161638 |