Добавлен: 03.02.2024
Просмотров: 46
Скачиваний: 2
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
РОССИЙСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ИННОВАЦИОННЫХТЕХНОЛОГИЙ И ПРЕДПРИНИМАТЕЛЬСТВА
ПЕНЗЕНСКИЙ ФИЛИАЛ
ОТЧЕТ
о выполнении лабораторной работы №2
ДисциплинаЭконометрика
Тема: «Множественная линейная регрессия»
Выполнил: студент гр. 08э2 Макуев Тимур
Проверил: преподаватель И.Ю. Денисова
2011
Цели работы:
-
рассмотреть множественную линейную регрессию и ее характеристики; -
закрепить навыки решением типовой задачи на основе использованияIBMSPSSStatistics.
Ход работы:
Условие задачи (43)
Для изучения проблемы рассмотрите следующие показатели и их значения по территориям Центрального федерального округа за 2001 г.:
y1– численность безработных, тыс. чел.;
x1– годовой фонд заработной платы занятых в экономике региона, млрд руб.;
x2 – численность мигрантов за год, тыс. чел.;
x3 – численность безработных в расчете на одну заявленную вакансию, чел.;
x4 – число малых предприятий в регионе, тыс.
Задание:
Установить зависимость числа совершенных преступлений в регионе от социально-экономических факторов, оказывающих наибольшее воздействие на данный процесс. Выполните расчет прогнозного значения результата, предполагая, что прогнозные значения факторов составят 102,9% от их среднего уровня.
Необходимо:
1. Построить линейное уравнение множественной регрессии с полным перечнем заданных показателей и оценить его;
2. Провести исключение неинформативных переменных и получить модель только с информативными переменными для уровня значимости
α = 10%;
3. Построить матрицу парных коэффициентов корреляции. Установить, какие факторы мультиколлинеарны.Рассчитать множественный коэффициент корреляции;
4. Дать оценку полученного уравнения на основе коэффициента детерминации и общего F-критерия Фишера.
5. Выполнить анализ результатов, построить прогноз уровня результата, указав, при каких условиях он будет возрастать и при каких – снижаться.
Таблица 1. Исходные данные
Субъекты РФ | y1 | x1 | x2 | x3 | x4 |
Белгородская обл. | 48,3 | 38,30 | 11,09 | 1,3 | 4,6 |
Брянская обл. | 65,3 | 28,74 | -0,14 | 3,3 | 3,2 |
Владимирская обл. | 80,5 | 30,93 | 2,69 | 3,0 | 6,9 |
Воронежская обл. | 107,6 | 58,81 | 2,67 | 1,8 | 11,0 |
Ивановская обл. | 33,1 | 18,11 | 1,20 | 1,3 | 5,2 |
Калужская обл. | 33,1 | 21,58 | 0,96 | 0,9 | 5,9 |
Костромская обл. | 22,8 | 17,00 | 0,31 | 1,1 | 3,2 |
Курская обл. | 65,0 | 28,84 | -1,29 | 1,3 | 2,8 |
Липецкая обл. | 39,8 | 33,26 | 5,05 | 0,7 | 4,3 |
Орловская обл. | 34,3 | 20,45 | 1,51 | 1,5 | 2,6 |
Рязанская обл. | 66,7 | 27,89 | -0,38 | 0,7 | 6,4 |
Смоленская обл. | 55,1 | 29,99 | -1,44 | 1,3 | 2,4 |
Тамбовская обл. | 67,4 | 29,98 | -2,62 | 4,6 | 3,6 |
Тверская обл. | 60,4 | 30,39 | -0,31 | 0,9 | 5,7 |
Тульская обл. | 43,4 | 41,08 | -1,87 | 1,3 | 6,5 |
Ярославская обл. | 52,0 | 41,81 | 1,53 | 0,9 | 7,1 |
Решение задачи
1.Необходимо построить линейное уравнение множественной регрессии с полным перечнем заданных показателей и оценить его.
Так как у нас после вывода результатов остались 2 надежные модели, то мы получим 2 линейных уравнения множественной регрессии для соответствующих моделей.
Уравнение первой модели выглядит следующим образом:
y=11,149+1,401x1
Уравнение второй модели выглядит следующим образом:
y=-0,381+1,371x1+7,703x3
Коэффициентыa | ||||||
Модель | Нестандартизованные коэффициенты | Стандартизованные коэффициенты | t | Знч. | ||
B | Стд. Ошибка | Бета | ||||
1 | (Константа) | 11,149 | 12,922 | | ,863 | ,403 |
x1 | 1,401 | ,395 | ,687 | 3,542 | ,003 | |
2 | (Константа) | -,381 | 12,323 | | -,031 | ,976 |
x1 | 1,371 | ,345 | ,673 | 3,968 | ,002 | |
x3 | 7,703 | 3,320 | ,393 | 2,320 | ,037 | |
a. Зависимая переменная: y1 |
Величины a1=11,149 и a2=-0,381 оценивают агрегированное влияние прочих (кроме учтенных в моделях факторов x1 и x3) факторов на результат y.Величины b1 и b2 указывают, что с увеличением x1 и x2 на единицу их значений результат увеличивается соответственно на 1,401 и 1,371+7,703=9,074 соответственно. Сравнивать эти значения не следует, так как они зависят от единиц измерения каждого признака и потому несопоставимы между собой.
2. Необходимо провести исключение неинформативных переменных и получить модель только с информативными переменными для уровня значимости α = 10%.
В таблице 2 фиксируется процесс пошагового включения/исключения переменных в регрессионную модель.
Как видно из таблицы, очередность включения переменных такова: x1, x3. Переменные x2 и x4 не были включены, также не потребовалось исключать какую–либо переменную. Можно отметить следующие основания или критерии для такой приоритетности, хотя они и не являются полностью взаимно независимыми:
-
Статистическая значимость, связанная с принятием данной переменной в регрессию. Значение критерия Фишера для включения каждой из этих переменных <0,1, для исключения > 0,1. Другими словами, нулевая гипотеза, состоящая в том, что результат действия случаен и статистически незначим, отвергается в первом случае и не отвергается во втором;
Таблица 2. Выходная информация множественной регрессии
Введенные или удаленные переменныеa | |||
Модель | Включенные переменные | Исключенные переменные | Метод |
1 | x1 | . | Шаговый (критерий: вероятность F-включения <= ,050, F-исключения>= ,100). |
2 | x3 | . | Шаговый (критерий: вероятность F-включения <= ,050, F-исключения>= ,100). |
a. Зависимая переменная: y1 |
-
Модель 1 (только переменная x1) –таблица 3– объясняет почти 48% вариации зависимой переменной (R2= 0,473, скорректированныйR2 = 0,435, что несущественно). Модель 2, где добавляется переменная x3, поднимает R2, а значит, и уровень объяснения вариации до 0,627 (0,570) или чуть больше, чем на 15%. То есть основная доля вариации объясняется переменной x1.
Таблица 3. Сводка для моделей
Сводка для моделиc | ||||
Модель | R | R-квадрат | Скорректированный R-квадрат | Стд. ошибка оценки |
1 | ,687a | ,473 | ,435 | 15,98774 |
2 | ,792b | ,627 | ,570 | 13,95198 |
a. Предикторы: (конст) x1 b. Предикторы: (конст) x1, x3 c. Зависимая переменная: y1 |
3. Построить матрицу парных коэффициентов корреляции. Установить, какие факторы мультиколлинеарны.Рассчитать множественный коэффициент корреляции.
При построении уравнения множественной регрессии возникает проблема мультиколлинеарности факторов, их тесной линейной взаимозависимости. Мультиколлинеарность может проявляться в функциональной (явной) и стохастической (скрытой) формах.
Обычно считается, что две переменные явно коллинеарны или находятся между собой в линейной зависимости, если их коэффициент корреляции > 0,7. Однако по величине парных коэффициентов корреляции обнаруживаетсялишь явная коллинеарность факторов. Наибольшие трудности при использовании аппарата множественной регрессии возникают при наличии стохастической (скрытой) мультиколлинеарности: чем она сильнее, тем менее надежна
оценка распределения суммы объясненной вариации по отдельным факторам с использованием R2. Точных количественных критериев для определения наличия или отсутствия скрытой коллинеарности не существует – можно говорить лишь о некоторых эвристических подходах к ее выявлению.
Для оценки мультиколлинеарности факторов используется определитель матрицы парных коэффициентов корреляции между факторами: чем ближе он к нулю, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии, и наоборот.
Для уравнения регрессии (где в качестве зависимой переменной выступает y1), сравним различные варианты набора независимых переменных:
-
x1, x3; -
x1, x3, x2; -
x1, x2, x3, x4.
Для каждого из этих вариантов построим матрицу парных коэффициентов корреляции и рассчитаем ее определитель.
Откроем исходный файл и выполним последовательность команд Анализ ► Снижение размерности ► Факторный анализ. В диалоговом окне Факторный анализ зададим сначала переменные x1и x3, после чего нажмем кнопку Дескриптивные.
Затем в окне Факторный анализ: Дескриптивные активизируем позиции для корреляционной матрицы Коэффициенты и Детерминант. Снова скомандуем ОК. Повторим эту процедуру еще два раза, задавая последовательно в качестве переменных x1, x3, x2 и x1, x3, x2,x4.
В таблицах 4, 5, 6 показаны результаты – матрицы парных коэффициентов корреляции и значения детерминантов для каждого из перечисленных вариантов.
Таблица 4. Корреляционная матрица для двух переменных
Матрица корреляцийa | |||
| x1 | x3 | |
Корреляция | x1 | 1,000 | ,038 |
x3 | ,038 | 1,000 | |
a. Детерминант = ,999 |