Файл: Практикум по эконометрике с применением ms excel линейные модели парной и множественной регрессии казань 2008.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 09.11.2023
Просмотров: 113
Скачиваний: 9
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
26
Для двухфакторной модели данная система будет иметь вид:
1 1
2 2
2 1
1 1
2 1 2 1
2 2
1 1 2 2
2 2
,
,
na
b
x
b
x
y
a
x
b
x
b
x x
yx
a
x
b
x x
b
x
yx
+
+
=
+
+
=
+
+
=
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
(3.3)
Так же можно воспользоваться готовыми формулами
, которые являются следствием из этой системы
:
1 2
1 2 1
1 2 1
2 1
yx
yx
x x
y
x
x x
r
r r
b
r
σ
σ
−
=
⋅
−
;
2 1
1 2 2
1 2 2
2 1
yx
yx
x x
y
x
x x
r
r r
b
r
σ
σ
−
=
⋅
−
;
(3.4)
1 1 2 2
a
y
b x
b x
= −
−
В
линейной множественной регрессии параметры при
x называются
коэффициентами
«
чистой
»
регрессии
Они характеризуют среднее изменение результата с
изменением соответствующего фактора на единицу при неизмененном значении других факторов
, закрепленных на среднем уровне
Метод наименьших квадратов применим и
к уравнению множественной регрессии в
стандартизированном
масштабе
:
1 2
1 2
,
m
y
x
x
m x
t
t
t
t
β
β
β
ε
=
+
+ +
+
(3.5) где
1
, , ...,
m
y
x
x
t
t
t –
стандартизированные
переменные
:
y
y
y
y
t
σ
−
=
,
i
i
i
i
x
x
x
x
t
σ
−
=
, для которых среднее значение равно нулю
:
0
i
y
x
t
t
= =
, а
среднее квадратическое отклонение равно единице
:
1
y
xi
t
t
σ
σ
=
=
;
i
β
–
стандартизированные
коэффициенты
регрессии
В
силу того
, что все переменные заданы как центрированные и
нормированные
, стандартизованные коэффициенты регрессии
i
β
можно
27 сравнивать между собой
Сравнивая их друг с
другом
, можно ранжировать факторы по силе их воздействия на результат
В
этом основное достоинство стандартизованных коэффициентов регрессии в
отличие от коэффициентов
«
чистой
» регрессии
, которые несравнимы между собой
Применяя
МНК
к уравнению множественной регрессии в
стандартизированном масштабе
, получим систему нормальных уравнений вида
1 1 2 1 3 1
2 1 2 1 3 1
1 2
3 1
2 3
1 2
3 1
2 3
,
,
,
m
m
m
m
m
m
yx
x x
x x
m x x
yx
x x
x x
m x x
yx
x x
x x
x x
m
r
r
r
r
r
r
r
r
r
r
r
r
β
β
β
β
β
β
β
β
β
β
β
β
=
+
+
+ +
=
+
+
+ +
=
+
+
+ +
(3.6) где
i
yx
r и
i j
x x
r
– коэффициенты парной и
межфакторной корреляции
Коэффициенты
«
чистой
» регрессии
i
b связаны со стандартизованными коэффициентами регрессии
i
β
следующим образом
:
i
y
i
i
x
b
σ
β
σ
=
i
x
i
i
y
b
σ
β
σ
=
(3.7)
Поэтому можно переходить от уравнения регрессии в
стандартизованном масштабе
(3.5) к
уравнению регрессии в
натуральном масштабе переменных
(3.1), при этом параметр
a определяется как
1 1 2 2
m
m
a
y
b x
b x
b x
= −
−
− −
Рассмотренный смысл стандартизованных коэффициентов регрессии позволяет их использовать при отсеве факторов
– из модели исключаются факторы с
наименьшим значением
i
β
Средние
коэффициенты
эластичности
для линейной регрессии рассчитываются по формуле
j
j
yx
j
x
Э
b
y
=
,
(3.8)
28 которые показывают на сколько процентов в
среднем изменится результат
, при изменении соответствующего фактора на
1%.
Средние показатели эластичности можно сравнивать друг с
другом и
соответственно ранжировать факторы по силе их воздействия на результат
Тесноту совместного влияния факторов на результат оценивает
индекс множественной корреляции: ост
1 2 2
2 1
m
y
yx x
x
y
R
σ
σ
=
−
(3.9)
Значение индекса множественной корреляции лежит в
пределах от
0 до
1 и
должно быть больше или равно максимальному парному индексу корреляции
:
(
)
1 2 1,
m
i
yx x
x
yx
R
r
i
m
≥
=
При линейной зависимости
коэффициент
множественной
корреляции можно определить через матрицы парных коэффициентов корреляции
:
1 2 11 1
m
yx x
x
r
R
r
∆
=
−
∆
,
(3.10) где
1 2
1 1 2 1
2 2 1 2
1 2
1 1
1 1
m
m
m
m
m
m
yx
yx
yx
yx
x x
x x
yx
x x
x x
yx
x x
x x
r
r
r
r
r
r
r
r
r
r
r
r
r
∆ =
– определитель матрицы парных коэффициентов корреляции
;
1 2 1
2 1 2
1 2
11 1
1 1
m
m
m
m
x x
x x
x x
x x
x x
x x
r
r
r
r
r
r
r
∆ =
29
– определитель матрицы межфакторной корреляции
Так же при линейной зависимости признаков формула коэффициента множественной корреляции может быть также представлена следующим выражением
:
1 2
m
i
yx x
x
i
yx
R
r
β
=
⋅
∑
,
(3.11) где
i
β
– стандартизованные коэффициенты регрессии
;
i
yx
r – парные коэффициенты корреляции результата с
каждым фактором
Качество построенной модели в
целом оценивает коэффициент
(
индекс
) детерминации
. Коэффициент множественной детерминации рассчитывается как квадрат индекса множественной корреляции
1 2 2
m
yx x
x
R
Для того чтобы не допустить преувеличения тесноты связи
, применяется
скорректированный индекс множественной детерминации, который содержит поправку на число степеней свободы и
рассчитывается по формуле
(
)
(
)
(
)
2 2
1
ˆ
1 1
1
n
R
R
n
m
−
= − −
− −
,
(3.12) где
n – число наблюдений
, m – число факторов
При небольшом числе наблюдений нескорректированная величина коэффициента множественной детерминации
2
R имеет тенденцию переоценивать долю вариации результативного признака
, связанную с
влиянием факторов
, включенных в
регрессионную модель
Частные коэффициенты (или индексы) корреляции, измеряющие влияние на
y фактора
i
x , при элиминировании
(
исключении влияния
) других факторов
, можно определить по формуле
1 2 1 2 1
1 1 2 1
1 2
2 1
1 1
i
m
i
i
i
m
i
i
m
yx x
x
x
yx x x
x
x
x
yx x
x
x
x
R
r
R
−
+
−
+
⋅
−
=
−
−
,
(3.13) или по рекуррентной формуле
:
30
(
)(
)
1 2 1
1 1
1 2 1
1 2 1
1 1
1 2 1
1 1
1 1 2 1
1 1
2 2
1 1
i
i
i
m
m
m
i m
i
i
m
i
i
i
m
m
m
m
i m
i
i
m
yx x x
x
x
x
yx
x x
x
x x
x x
x
x
x
yx x x
x
x
x
yx
x x
x
x x
x x
x
x
x
r
r
r
r
r
r
−
+
−
−
−
+
−
−
+
−
−
+
−
⋅
⋅
⋅
⋅
⋅
⋅
−
⋅
=
−
−
(3.14)
Рассчитанные по рекуррентной формуле частные коэффициенты корреляции изменяются в
пределах от
–1 до
+1, а
по формулам через множественные коэффициенты детерминации
– от
0 до
1.
Сравнение их друг с
другом позволяет ранжировать факторы по тесноте их связи с
результатом
Частные коэффициенты корреляции дают меру тесноты связи каждого фактора с
результатом в
чистом виде
При двух факторах формулы
(3.12) и
(3.13) примут вид
:
1 2 1
2 2
2 2
1 1
1
yx x
yx x
yx
R
r
r
⋅
−
=
−
−
;
1 2 2
1 1
2 2
1 1
1
yx x
yx x
yx
R
r
r
⋅
−
=
−
−
(
) (
)
1 2
1 2 1
2 2
1 2 2
2 1
1
yx
yx
x x
yx x
yx
x x
r
r
r
r
r
r
⋅
−
⋅
=
−
⋅ −
;
(
) (
)
2 1
1 2 2
1 1
1 2 2
2 1
1
yx
yx
x x
yx x
yx
x x
r
r
r
r
r
r
⋅
−
⋅
=
−
⋅ −
Значимость уравнения множественной регрессии в
целом оценивается с
помощью
F
- критерия
Фишера
:
2 2
1 1
R
n
m
F
R
m
− −
=
⋅
−
(3.15)
Частный
F
-
критерий
оценивает статистическую значимость присутствия каждого из факторов в уравнении. В общем виде для фактора
x частный
F
-критерий определится как
1 1
1 1
1 2
2 2
1 1
1
i
m
i
i
m
i
i
m
yx
x
x
yx
x
x
x
x
yx
x
x
R
R
n
m
F
R
−
+
−
− −
=
⋅
−
(3.16)
Фактическое значение частного
F
-критерия сравнивается с табличным при уровне значимости
α
и числе степеней свободы:
1 1
k
=
и
2 1
k
n
m
= − −
. Если фактическое значение
i
x
F превышает
(
)
табл
1 2
, ,
F
k
k
α
, то дополнительное включение фактора
i
x в модель статистически оправданно и коэффициент чистой регрессии
i
b при факторе
i
x статистически значим.
31
Если же фактическое значение
i
x
F меньше табличного, то дополнительное включение в модель фактора
i
x не увеличивает существенно долю объясненной вариации признака y , следовательно, нецелесообразно его включение в модель; коэффициент регрессии при данном факторе в этом случае статистически незначим.
Оценка значимости коэффициентов чистой регрессии проводится по
t -критерию Стьюдента. В этом случае, как и в парной регрессии, для каждого фактора используется формула
i
i
i
b
b
b
t
m
=
(3.17)
Для уравнения множественной регрессии
(3.1) средняя квадратическая ошибка коэффициента регрессии может быть определена по формуле:
1 1
2 2
1 1
1 1
m
i
i
i
m
y
yx
x
b
x
x x
x
R
m
n
m
R
σ
σ
⋅
−
=
⋅
− −
⋅
−
,
(3.18) где
1 2
i
m
x x
x
R
– коэффициент детерминации для зависимости фактора
i
x со всеми другими факторами уравнения множественной регрессии. Для двухфакторной модели (
2
m
=
) имеем:
1 2 1
1 1 2 2
2 1
1 3
1
y
yx x
b
x
x x
R
m
n
r
σ
σ
⋅
−
=
⋅
−
⋅
−
;
(3.19)
1 2 2
2 1 2 2
2 1
1 3
1
y
yx x
b
x
x x
R
m
n
r
σ
σ
⋅
−
=
⋅
−
⋅
−
(3.20)
Существует связь между t -критерием Стьюдента и частным
F
- критерием Фишера:
i
i
b
x
t
F
=
(3.21)
32
Уравнения множественной регрессии могут включать в качестве независимых переменных качественные признаки (например, профессия, пол, образование, климатические условия, отдельные регионы и т.д.).
Чтобы ввести такие переменные в регрессионную модель, их необходимо упорядочить и присвоить им те или иные значения, т.е. качественные переменные преобразовать в количественные.
Такого вида сконструированные переменные принято в эконометрике называть
фиктивными
переменными
. Например, включать в модель фактор «пол» в виде фиктивной переменной можно в следующем виде:
1 мужской пол
,
0 женский пол
z
−
=
−
(3.22)
Коэффициент регрессии при фиктивной переменной интерпретируется как среднее изменение зависимой переменной при переходе от одной категории
(
женский пол
) к
другой
(
мужской пол
) при неизменных значениях остальных параметров
33
1 2 3 4