Файл: Множественная линейная регрессия.doc

Скачать файл (0,23Мб)

Заказать решение

ВУЗ: Не указан

Категория: Отчет по практике

Дисциплина: Не указана

Добавлен: 03.02.2024

Просмотров: 28

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

РОССИЙСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

ИННОВАЦИОННЫХТЕХНОЛОГИЙ И ПРЕДПРИНИМАТЕЛЬСТВА

ПЕНЗЕНСКИЙ ФИЛИАЛ
ОТЧЕТ

о выполнении лабораторной работы №2

ДисциплинаЭконометрика

Тема: «Множественная линейная регрессия»

Выполнил: студент гр. 08э2 Макуев Тимур

Проверил: преподаватель И.Ю. Денисова

2011

Цели работы:

рассмотреть множественную линейную регрессию и ее характеристики;
закрепить навыки решением типовой задачи на основе использованияIBMSPSSStatistics.

Ход работы:

Условие задачи (43)

Для изучения проблемы рассмотрите следующие показатели и их значения по территориям Центрального федерального округа за 2001 г.:

y₁– численность безработных, тыс. чел.;

x₁– годовой фонд заработной платы занятых в экономике региона, млрд руб.;

x₂ – численность мигрантов за год, тыс. чел.;

x₃ – численность безработных в расчете на одну заявленную вакансию, чел.;

x₄ – число малых предприятий в регионе, тыс.

Задание:

Установить зависимость числа совершенных преступлений в регионе от социально-экономических факторов, оказывающих наибольшее воздействие на данный процесс. Выполните расчет прогнозного значения результата, предполагая, что прогнозные значения факторов составят 102,9% от их среднего уровня.

Необходимо:

1. Построить линейное уравнение множественной регрессии с полным перечнем заданных показателей и оценить его;

2. Провести исключение неинформативных переменных и получить модель только с информативными переменными для уровня значимости
α = 10%;

3. Построить матрицу парных коэффициентов корреляции. Установить, какие факторы мультиколлинеарны.Рассчитать множественный коэффициент корреляции;

4. Дать оценку полученного уравнения на основе коэффициента детерминации и общего F-критерия Фишера.

5. Выполнить анализ результатов, построить прогноз уровня результата, указав, при каких условиях он будет возрастать и при каких – снижаться.

Таблица 1. Исходные данные

Субъекты РФ	y₁	x₁	x₂	x₃	x₄
Белгородская обл.	48,3	38,30	11,09	1,3	4,6
Брянская обл.	65,3	28,74	-0,14	3,3	3,2
Владимирская обл.	80,5	30,93	2,69	3,0	6,9
Воронежская обл.	107,6	58,81	2,67	1,8	11,0
Ивановская обл.	33,1	18,11	1,20	1,3	5,2
Калужская обл.	33,1	21,58	0,96	0,9	5,9
Костромская обл.	22,8	17,00	0,31	1,1	3,2
Курская обл.	65,0	28,84	-1,29	1,3	2,8
Липецкая обл.	39,8	33,26	5,05	0,7	4,3
Орловская обл.	34,3	20,45	1,51	1,5	2,6
Рязанская обл.	66,7	27,89	-0,38	0,7	6,4
Смоленская обл.	55,1	29,99	-1,44	1,3	2,4
Тамбовская обл.	67,4	29,98	-2,62	4,6	3,6
Тверская обл.	60,4	30,39	-0,31	0,9	5,7
Тульская обл.	43,4	41,08	-1,87	1,3	6,5
Ярославская обл.	52,0	41,81	1,53	0,9	7,1

Решение задачи

1.Необходимо построить линейное уравнение множественной регрессии с полным перечнем заданных показателей и оценить его.

Так как у нас после вывода результатов остались 2 надежные модели, то мы получим 2 линейных уравнения множественной регрессии для соответствующих моделей.

Уравнение первой модели выглядит следующим образом:

y=11,149+1,401x₁

Уравнение второй модели выглядит следующим образом:

y=-0,381+1,371x₁+7,703x₃

Коэффициенты^a
Модель		Нестандартизованные коэффициенты		Стандартизованные коэффициенты	t	Знч.
Модель		B	Стд. Ошибка	Бета	t	Знч.
1	(Константа)	11,149	12,922		,863	,403
1	x1	1,401	,395	,687	3,542	,003
2	(Константа)	-,381	12,323		-,031	,976
	x1	1,371	,345	,673	3,968	,002
	x3	7,703	3,320	,393	2,320	,037
a. Зависимая переменная: y1

Величины a1=11,149 и a2=-0,381 оценивают агрегированное влияние прочих (кроме учтенных в моделях факторов x1 и x3) факторов на результат y.Величины b1 и b2 указывают, что с увеличением x1 и x2 на единицу их значений результат увеличивается соответственно на 1,401 и 1,371+7,703=9,074 соответственно. Сравнивать эти значения не следует, так как они зависят от единиц измерения каждого признака и потому несопоставимы между собой.

2. Необходимо провести исключение неинформативных переменных и получить модель только с информативными переменными для уровня значимости α = 10%.

В таблице 2 фиксируется процесс пошагового включения/исключения переменных в регрессионную модель.

Как видно из таблицы, очередность включения переменных такова: x1, x3. Переменные x2 и x4 не были включены, также не потребовалось исключать какую–либо переменную. Можно отметить следующие основания или критерии для такой приоритетности, хотя они и не являются полностью взаимно независимыми:

Статистическая значимость, связанная с принятием данной переменной в регрессию. Значение критерия Фишера для включения каждой из этих переменных <0,1, для исключения > 0,1. Другими словами, нулевая гипотеза, состоящая в том, что результат действия случаен и статистически незначим, отвергается в первом случае и не отвергается во втором;

Таблица 2. Выходная информация множественной регрессии

Введенные или удаленные переменные^a
Модель	Включенные переменные	Исключенные переменные	Метод
1	x1	.	Шаговый (критерий: вероятность F-включения <= ,050, F-исключения>= ,100).
2	x3	.	Шаговый (критерий: вероятность F-включения <= ,050, F-исключения>= ,100).
a. Зависимая переменная: y1

Модель 1 (только переменная x1) –таблица 3– объясняет почти 48% вариации зависимой переменной (R²= 0,473, скорректированныйR² = 0,435, что несущественно). Модель 2, где добавляется переменная x3, поднимает R², а значит, и уровень объяснения вариации до 0,627 (0,570) или чуть больше, чем на 15%. То есть основная доля вариации объясняется переменной x1.

Таблица 3. Сводка для моделей

Сводка для модели^c
Модель	R	R-квадрат	Скорректированный R-квадрат	Стд. ошибка оценки
1	,687^a	,473	,435	15,98774
2	,792^b	,627	,570	13,95198
a. Предикторы: (конст) x1 b. Предикторы: (конст) x1, x3 c. Зависимая переменная: y1

3. Построить матрицу парных коэффициентов корреляции. Установить, какие факторы мультиколлинеарны.Рассчитать множественный коэффициент корреляции.

При построении уравнения множественной регрессии возникает проблема мультиколлинеарности факторов, их тесной линейной взаимозависимости. Мультиколлинеарность может проявляться в функциональной (явной) и стохастической (скрытой) формах.

Обычно считается, что две переменные явно коллинеарны или находятся между собой в линейной зависимости, если их коэффициент корреляции > 0,7. Однако по величине парных коэффициентов корреляции обнаруживаетсялишь явная коллинеарность факторов. Наибольшие трудности при использовании аппарата множественной регрессии возникают при наличии стохастической (скрытой) мультиколлинеарности: чем она сильнее, тем менее надежна

оценка распределения суммы объясненной вариации по отдельным факторам с использованием R². Точных количественных критериев для определения наличия или отсутствия скрытой коллинеарности не существует – можно говорить лишь о некоторых эвристических подходах к ее выявлению.

Для оценки мультиколлинеарности факторов используется определитель матрицы парных коэффициентов корреляции между факторами: чем ближе он к нулю, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии, и наоборот.

Для уравнения регрессии (где в качестве зависимой переменной выступает y1), сравним различные варианты набора независимых переменных:

x1, x3;
x1, x3, x2;
x1, x2, x3, x4.

Для каждого из этих вариантов построим матрицу парных коэффициентов корреляции и рассчитаем ее определитель.

Откроем исходный файл и выполним последовательность команд Анализ ► Снижение размерности ► Факторный анализ. В диалоговом окне Факторный анализ зададим сначала переменные x1и x3, после чего нажмем кнопку Дескриптивные.

Затем в окне Факторный анализ: Дескриптивные активизируем позиции для корреляционной матрицы Коэффициенты и Детерминант. Снова скомандуем ОК. Повторим эту процедуру еще два раза, задавая последовательно в качестве переменных x1, x3, x2 и x1, x3, x2,x4.

В таблицах 4, 5, 6 показаны результаты – матрицы парных коэффициентов корреляции и значения детерминантов для каждого из перечисленных вариантов.

Таблица 4. Корреляционная матрица для двух переменных

Матрица корреляций^a
		x1	x3
Корреляция	x1	1,000	,038
	x3	,038	1,000
a. Детерминант = ,999

Смотрите также файлы

Агностицизм приобрел свою классическую форму в произведениях.docx

М. Кирова Институт леса и природопользования.docx

Справочник по психологии и психиатрии детского и подросткового возраста. Спб., 2000.docx

Определите тип структуры по описанию ниже.doc

Понятие, объект и субъект биржевых сделок.rtf

Файл: Множественная линейная регрессия.doc

2011

Смотрите также файлы

Информация

Списки файлов

Дополнительно