Файл: Множественная линейная регрессия.doc

ВУЗ: Не указан

Категория: Отчет по практике

Дисциплина: Не указана

Добавлен: 03.02.2024

Просмотров: 28

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.




РОССИЙСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

ИННОВАЦИОННЫХТЕХНОЛОГИЙ И ПРЕДПРИНИМАТЕЛЬСТВА

ПЕНЗЕНСКИЙ ФИЛИАЛ
ОТЧЕТ

о выполнении лабораторной работы №2

ДисциплинаЭконометрика

Тема: «Множественная линейная регрессия»

Выполнил: студент гр. 08э2 Макуев Тимур

Проверил: преподаватель И.Ю. Денисова


2011

Цели работы:

  • рассмотреть множественную линейную регрессию и ее характеристики;

  • закрепить навыки решением типовой задачи на основе использованияIBMSPSSStatistics.

Ход работы:

Условие задачи (43)

Для изучения проблемы рассмотрите следующие показатели и их значения по территориям Центрального федерального округа за 2001 г.:

y1– численность безработных, тыс. чел.;

x1– годовой фонд заработной платы занятых в экономике региона, млрд руб.;

x2 – численность мигрантов за год, тыс. чел.;

x3 – численность безработных в расчете на одну заявленную вакансию, чел.;

x4 – число малых предприятий в регионе, тыс.

Задание:

Установить зависимость числа совершенных преступлений в регионе от социально-экономических факторов, оказывающих наибольшее воздействие на данный процесс. Выполните расчет прогнозного значения результата, предполагая, что прогнозные значения факторов составят 102,9% от их среднего уровня.

Необходимо:

1. Построить линейное уравнение множественной регрессии с полным перечнем заданных показателей и оценить его;

2. Провести исключение неинформативных переменных и получить модель только с информативными переменными для уровня значимости
α = 10%;

3. Построить матрицу парных коэффициентов корреляции. Установить, какие факторы мультиколлинеарны.Рассчитать множественный коэффициент корреляции;

4. Дать оценку полученного уравнения на основе коэффициента детерминации и общего F-критерия Фишера.

5. Выполнить анализ результатов, построить прогноз уровня результата, указав, при каких условиях он будет возрастать и при каких – снижаться.

Таблица 1. Исходные данные

Субъекты РФ

y1

x1

x2

x3

x4

Белгородская обл.

48,3

38,30

11,09

1,3

4,6

Брянская обл.

65,3

28,74

-0,14

3,3

3,2

Владимирская обл.

80,5

30,93

2,69

3,0

6,9

Воронежская обл.

107,6

58,81

2,67

1,8

11,0

Ивановская обл.

33,1

18,11

1,20

1,3

5,2

Калужская обл.

33,1

21,58

0,96

0,9

5,9

Костромская обл.

22,8

17,00

0,31

1,1

3,2

Курская обл.

65,0

28,84

-1,29

1,3

2,8

Липецкая обл.

39,8

33,26

5,05

0,7

4,3

Орловская обл.

34,3

20,45

1,51

1,5

2,6

Рязанская обл.

66,7

27,89

-0,38

0,7

6,4

Смоленская обл.

55,1

29,99

-1,44

1,3

2,4

Тамбовская обл.

67,4

29,98

-2,62

4,6

3,6

Тверская обл.

60,4

30,39

-0,31

0,9

5,7

Тульская обл.

43,4

41,08

-1,87

1,3

6,5

Ярославская обл.

52,0

41,81

1,53

0,9

7,1



Решение задачи

1.Необходимо построить линейное уравнение множественной регрессии с полным перечнем заданных показателей и оценить его.

Так как у нас после вывода результатов остались 2 надежные модели, то мы получим 2 линейных уравнения множественной регрессии для соответствующих моделей.

Уравнение первой модели выглядит следующим образом:

y=11,149+1,401x1

Уравнение второй модели выглядит следующим образом:

y=-0,381+1,371x1+7,703x3

Коэффициентыa

Модель

Нестандартизованные коэффициенты

Стандартизованные коэффициенты

t

Знч.

B

Стд. Ошибка

Бета

1

(Константа)

11,149

12,922




,863

,403

x1

1,401

,395

,687

3,542

,003

2

(Константа)

-,381

12,323




-,031

,976

x1

1,371

,345

,673

3,968

,002

x3

7,703

3,320

,393

2,320

,037

a. Зависимая переменная: y1



Величины a1=11,149 и a2=-0,381 оценивают агрегированное влияние прочих (кроме учтенных в моделях факторов x1 и x3) факторов на результат y.Величины b1 и b2 указывают, что с увеличением x1 и x2 на единицу их значений результат увеличивается соответственно на 1,401 и 1,371+7,703=9,074 соответственно. Сравнивать эти значения не следует, так как они зависят от единиц измерения каждого признака и потому несопоставимы между собой.

2. Необходимо провести исключение неинформативных переменных и получить модель только с информативными переменными для уровня значимости α = 10%.

В таблице 2 фиксируется процесс пошагового вклю­чения/исключения переменных в регрессионную модель.

Как видно из таблицы, очередность включения переменных такова: x1, x3. Переменные x2 и x4 не были включены, также не потребовалось исключать какую–либо переменную. Можно отметить следу­ющие основания или критерии для такой приоритетности, хотя они и не явля­ются полностью взаимно независимыми:

  • Статистическая значимость, связанная с принятием данной переменной в регрессию. Значение критерия Фишера для включения каждой из этих переменных <0,1, для исключения > 0,1. Другими словами, нулевая ги­потеза, состоящая в том, что результат действия случаен и статистически незначим, отвергается в первом случае и не отвергается во втором;

Таблица 2. Выходная информация множественной регрессии

Введенные или удаленные переменныеa

Модель

Включенные переменные

Исключенные переменные

Метод

1

x1

.

Шаговый (критерий: вероятность F-включения <= ,050, F-исключения>= ,100).

2

x3

.

Шаговый (критерий: вероятность F-включения <= ,050, F-исключения>= ,100).

a. Зависимая переменная: y1



  • Модель 1 (только переменная x1) –таблица 3– объясняет почти 48% вариации зависимой переменной (R2= 0,473, скорректированныйR2 = 0,435, что несущественно). Модель 2, где добавляется переменная x3, поднимает R2, а значит, и уровень объяснения вариации до 0,627 (0,570) или чуть больше, чем на 15%. То есть основная доля вариации объясняется переменной x1.

Таблица 3. Сводка для моделей

Сводка для моделиc

Модель

R

R-квадрат

Скорректированный R-квадрат

Стд. ошибка оценки

1

,687a

,473

,435

15,98774

2

,792b

,627

,570

13,95198

a. Предикторы: (конст) x1

b. Предикторы: (конст) x1, x3

c. Зависимая переменная: y1


3. Построить матрицу парных коэффициентов корреляции. Установить, какие факторы мультиколлинеарны.Рассчитать множественный коэффициент корреляции.

При построении уравнения множественной регрессии возникает проблема мультиколлинеарности факторов, их тесной линейной взаимозависимо­сти. Мультиколлинеарность может проявляться в функциональной (явной) и стохастической (скрытой) формах.

Обычно считается, что две переменные явно коллинеарны или находятся между собой в линейной зависимости, если их коэффициент корреляции > 0,7. Однако по величине парных коэффициентов корреляции обнаруживаетсялишь явная коллинеарность факторов. Наибольшие трудности при использо­вании аппарата множественной регрессии возникают при наличии стохасти­ческой (скрытой) мультиколлинеарности: чем она сильнее, тем менее надежна
оценка распределения суммы объясненной вариации по отдельным факторам с использованием R2. Точных количественных критериев для определения на­личия или отсутствия скрытой коллинеарности не существует – можно гово­рить лишь о некоторых эвристических подходах к ее выявлению.

Для оценки мультиколлинеарности факторов используется определитель матрицы парных коэффициентов корреляции между факторами: чем ближе он к нулю, тем сильнее мультиколлинеарность факторов и ненадежнее результа­ты множественной регрессии, и наоборот.

Для уравнения регрессии (где в качестве зависимой переменной выступает y1), сравним различные варианты набора незави­симых переменных:

  • x1, x3;

  • x1, x3, x2;

  • x1, x2, x3, x4.

Для каждого из этих вариантов построим матрицу парных коэффициентов корреляции и рассчитаем ее определитель.

Откроем исходный файл и выполним последова­тельность команд Анализ ► Снижение размерности ► Факторный анализ. В диалоговом окне Факторный анализ зададим сначала переменные x1и x3, после чего нажмем кнопку Дескриптивные.

Затем в окне Факторный анализ: Дескриптивные активизируем позиции для корреляционной матрицы Коэффициенты и Детерминант. Снова скомандуем ОК. Повторим эту процедуру еще два раза, задавая последовательно в качестве переменных x1, x3, x2 и x1, x3, x2,x4.

В таблицах 4, 5, 6 показаны результаты – матрицы парных коэффициентов кор­реляции и значения детерминантов для каждого из перечисленных вариантов.

Таблица 4. Корреляционная матрица для двух переменных

Матрица корреляцийa




x1

x3

Корреляция

x1

1,000

,038

x3

,038

1,000

a. Детерминант = ,999