Файл: Практикум по эконометрике с применением ms excel линейные модели парной и множественной регрессии казань 2008.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 09.11.2023
Просмотров: 111
Скачиваний: 9
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
3.2. Решение типовой задачи
По
20 предприятиям региона изучается зависимость выработки продукции на одного работника
y (
тыс руб
.) от ввода в
действие новых основных фондов
1
x ( % от стоимости фондов на конец года
) и
от удельного веса рабочих высокой квалификации в
общей численности рабочих
2
x ( % ).
Номер предприятия
y
1
x
2
x
Номер предприятия
y
1
x
2
x
1 7,0 3,9 10,0 11 9,0 6,0 21,0 2
7,0 3,9 14,0 12 11,0 6,4 22,0 3
7,0 3,7 15,0 13 9,0 6,8 22,0 4
7,0 4,0 16,0 14 11,0 7,2 25,0 5
7,0 3,8 17,0 15 12,0 8,0 28,0 6
7,0 4,8 19,0 16 12,0 8,2 29,0 7
8,0 5,4 19,0 17 12,0 8,1 30,0 8
8,0 4,4 20,0 18 12,0 8,5 31,0 9
8,0 5,3 20,0 19 14,0 9,6 32,0 10 10,0 6,8 20,0 20 14,0 9,0 36,0
Требуется
:
1.
Построить линейную модель множественной регрессии
Записать стандартизованное уравнение множественной регрессии
На основе стандартизованных коэффициентов регрессии и
средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат
2.
Найти коэффициенты парной
, частной и
множественной корреляции
Проанализировать их
3.
Найти скорректированный коэффициент множественной детерминации
Сравнить его с
нескорректированным
(
общим
) коэффициентом детерминации
4.
С
помощью
F
- критерия
Фишера оценить статистическую надежность уравнения регрессии и
коэффициента детерминации
1 2 2
yx x
R
34
5.
С
помощью
t - критерия оценить статистическую значимость коэффициентов чистой регрессии
6.
С
помощью частных
F
- критериев
Фишера оценить целесообразность включения в
уравнение множественной регрессии фактора
1
x после
2
x и
фактора
2
x после
1
x .
7.
Составить уравнение линейной парной регрессии
, оставив лишь один значащий фактор
Решение
Для удобства проведения расчетов поместим результаты промежуточных расчетов в
таблицу
:
Таблица
3.1
№
y
1
x
2
x
1
yx
2
yx
1 2
x x
2 1
x
2 2
x
2
y
1
2
3
4
5
6
7
8
9
10
1 7,0 3,9 10,0 27,3 70,0 39,0 15,21 100,0 49,0 2
7,0 3,9 14,0 27,3 98,0 54,6 15,21 196,0 49,0 3
7,0 3,7 15,0 25,9 105,0 55,5 13,69 225,0 49,0 4
7,0 4,0 16,0 28,0 112,0 64,0 16,0 256,0 49,0 5
7,0 3,8 17,0 26,6 119,0 64,6 14,44 289,0 49,0 6
7,0 4,8 19,0 33,6 133,0 91,2 23,04 361,0 49,0 7
8,0 5,4 19,0 43,2 152,0 102,6 29,16 361,0 64,0 8
8,0 4,4 20,0 35,2 160,0 88,0 19,36 400,0 64,0 9
8,0 5,3 20,0 42,4 160,0 106,0 28,09 400,0 64,0 10 10,0 6,8 20,0 68,0 200,0 136,0 46,24 400,0 100,0 11 9,0 6,0 21,0 54,0 189,0 126,0 36,0 441,0 81,0 12 11,0 6,4 22,0 70,4 242,0 140,8 40,96 484,0 121,0 13 9,0 6,8 22,0 61,2 198,0 149,6 46,24 484,0 81,0 14 11,0 7,2 25,0 79,2 275,0 180,0 51,84 625,0 121,0 15 12,0 8,0 28,0 96,0 336,0 224,0 64,0 784,0 144,0 16 12,0 8,2 29,0 98,4 348,0 237,8 67,24 841,0 144,0 17 12,0 8,1 30,0 97,2 360,0 243,0 65,61 900,0 144,0 18 12,0 8,5 31,0 102,0 372,0 263,5 72,25 961,0 144,0 19 14,0 9,6 32,0 134,4 448,0 307,2 92,16 1024,0 196,0 20 14,0 9,0 36,0 126,0 504,0 324,0 81,0 1296,0 196,0
Сумма
192 123,8 446 1276,3 4581 2997,4 837,74 10828,0 1958,0
Ср. знач.
9,6 6,19 22,3 63,815 229,05 149,87 41,887 541,4 97,9
Найдем средние квадратические отклонения признаков
:
2 2
2 97,9 9,6 5,74 2,396
y
y
y
σ
=
−
=
−
=
=
;
35 1
2 2
2 1
1 41,887 6,19 3,571 1,890
x
x
x
σ
=
−
=
−
=
=
;
2 2
2 2
2 2
541, 4 22,3 44,11 6,642
x
x
x
σ
=
−
=
−
=
=
1.
Для нахождения параметров линейного уравнения множественной регрессии
1 1 2 2
ˆy
a
b x
b x
= +
+
необходимо решить систему линейных уравнений относительно неизвестных параметров
a ,
1
b ,
2
b (3.3) либо воспользоваться готовыми формулами
(3.4).
Рассчитаем сначала парные коэффициенты корреляции
:
(
)
1 1
1
cov
,
63,815 6,19 9,6 0,970 1,890 2,396
yx
y
x
y x
r
σ σ
−
⋅
=
=
=
⋅
⋅
;
(
)
2 2
2
cov
,
229,05 22,3 9,6 0,941 6,642 2,396
yx
y
x
y x
r
σ σ
−
⋅
=
=
=
⋅
⋅
;
(
)
1 2 1
2 1
2
cov
,
149,87 6,19 22,3 0,943 1,890 6,642
x x
x
x
x x
r
σ σ
−
⋅
=
=
=
⋅
⋅
Находим по формулам
(3.4) коэффициенты чистой регрессии и
параметр
a :
1 2
1 2 1
1 2 1
2 2
2,396 0,970 0,941 0,943 0,946 1
1,890 1 0,943
yx
yx
x x
y
x
x x
r
r r
b
r
σ
σ
−
−
⋅
=
⋅
=
⋅
=
−
−
;
2 1
1 2 2
1 2 2
2 2
2,396 0,941 0,970 0,943 0,0856 1
6,642 1 0,943
yx
yx
x x
y
x
x x
r
r r
b
r
σ
σ
−
−
⋅
=
⋅
=
⋅
=
−
−
;
1 1 2 2 9,6 0,946 6,19 0,0856 22,3 1,835
a
y
b x
b x
= −
−
=
−
⋅
−
⋅
=
Таким образом
, получили следующее уравнение множественной регрессии
:
1 2
ˆ
1,835 0,946 0,0856
y
x
x
=
+
⋅ +
⋅
Уравнение регрессии показывает
, что при увеличении ввода в
действие основных фондов на
1% (
при неизменном уровне удельного веса
36 рабочих высокой квалификации
) выработка продукции на одного рабочего увеличивается в
среднем на
0,946 тыс руб
., а
при увеличении удельного веса рабочих высокой квалификации в
общей численности рабочих на
1%
(
при неизменном уровне ввода в
действие новых основных фондов
) выработка продукции на одного рабочего увеличивается в
среднем на
0,086 тыс руб
После нахождения уравнения регрессии составим новую расчетную таблицу для определения теоретических значений результативного признака
, остаточной дисперсии и
средней ошибки аппроксимации
Таблица
3.2
№
y
1
x
2
x
ˆy
ˆ
y
y
−
(
)
2
ˆ
y
y
−
i
A , %
1 7,0 3,9 10,0 6,380 0,620 0,384 8,851 2
7,0 3,9 14,0 6,723 0,277 0,077 3,960 3
7,0 3,7 15,0 6,619 0,381 0,145 5,440 4
7,0 4,0 16,0 6,989 0,011 0,000 0,163 5
7,0 3,8 17,0 6,885 0,115 0,013 1,643 6
7,0 4,8 19,0 8,002
-1,002 1,004 14,317 7
8,0 5,4 19,0 8,570
-0,570 0,325 7,123 8
8,0 4,4 20,0 7,709 0,291 0,084 3,633 9
8,0 5,3 20,0 8,561
-0,561 0,315 7,010 10 10,0 6,8 20,0 9,980 0,020 0,000 0,202 11 9,0 6,0 21,0 9,309
-0,309 0,095 3,429 12 11,0 6,4 22,0 9,773 1,227 1,507 11,158 13 9,0 6,8 22,0 10,151
-1,151 1,325 12,789 14 11,0 7,2 25,0 10,786 0,214 0,046 1,944 15 12,0 8,0 28,0 11,800 0,200 0,040 1,668 16 12,0 8,2 29,0 12,075
-0,075 0,006 0,622 17 12,0 8,1 30,0 12,066
-0,066 0,004 0,547 18 12,0 8,5 31,0 12,530
-0,530 0,280 4,413 19 14,0 9,6 32,0 13,656 0,344 0,118 2,459 20 14,0 9,0 36,0 13,431 0,569 0,324 4,067
Сумма
192 123,8 446 191,992 0,008 6,093 95,437
Ср знач
9,6 6,19 22,3 9,6
–
0,305 4,77
Остаточная дисперсия
:
37
(
)
2 2
ост
ˆ
6,093 0,305 20
y
y
n
σ
−
=
=
=
∑
Средняя ошибка аппроксимации
:
ˆ
1 95, 437%
100%
4,77%
20
y
y
A
n
y
−
=
⋅
=
=
∑
Качество модели
, исходя из относительных отклонений по каждому наблюдению
, признается хорошим
, т
к средняя ошибка аппроксимации не превышает
10%.
Коэффициенты
1
β
и
2
β
стандартизованного уравнения регрессии
1 2
1 2
ˆ
,
y
x
x
t
t
t
β
β
ε
=
+
+
находятся по формуле
(3.7):
1 1
1 1,890 0,946 0,746 2,396
x
y
b
σ
β
σ
=
=
⋅
=
;
2 2
2 6,642 0,0856 0, 237 2,396
x
y
b
σ
β
σ
=
=
⋅
=
Т
е уравнение будет выглядеть следующим образом
:
1 2
ˆ
0,746 0, 237
y
x
x
t
t
t
=
⋅ +
⋅
Так как стандартизованные коэффициенты регрессии можно сравнивать между собой
, то можно сказать
, что ввод в
действие новых основных фондов оказывает большее влияние на выработку продукции
, чем удельный вес рабочих высокой квалификации
Сравнивать влияние факторов на результат можно также при помощи средних коэффициентов эластичности
(3.8):
i
i
i
i
x
x
Э
b
y
= ⋅
Вычисляем
:
1 6,19 0,946 0,61 9,6
Э
=
⋅
=
;
2 22,3 0,0856 0, 20 9,6
Э
=
⋅
=
38
Т
е увеличение только основных фондов
(
от своего среднего значения
) или только удельного веса рабочих высокой квалификации на
1% увеличивает в
среднем выработку продукции на
0,61% или
0,20% соответственно
Таким образом
, подтверждается большее влияние на результат
y фактора
1
x , чем фактора
2
x .
2.
Коэффициенты парной корреляции мы уже нашли
:
1 0,970
yx
r
=
;
2 0,941
yx
r
=
;
1 2 0,943
x x
r
=
Они указывают на весьма сильную связь каждого фактора с
результатом
, а
также высокую межфакторную зависимость
(
факторы
1
x и
2
x явно коллинеарны
, т
к
1 2 0,943 0,7
x x
r
=
>
).
При такой сильной межфакторной зависимости рекомендуется один из факторов исключить из рассмотрения
Частные коэффициенты корреляции характеризуют тесноту связи между результатом и
соответствующим фактором при элиминировании
(
устранении влияния
) других факторов
, включенных в
уравнение регрессии
При двух факторах частные коэффициенты корреляции рассчитываются следующим образом
:
(
) (
)
(
) (
)
1 2
1 2 1
2 2
1 2 2
2 2
2 0,970 0,941 0,943 0,734 1 0,941 1 0,943 1
1
yx
yx
x x
yx x
yx
x x
r
r
r
r
r
r
⋅
−
⋅
−
⋅
=
=
=
−
⋅ −
−
⋅ −
;
(
) (
)
(
) (
)
2 1
1 2 2
1 1
1 2 2
2 2
2 0,941 0,970 0,943 0,325 1 0,970 1 0,943 1
1
yx
yx
x x
yx x
yx
x x
r
r
r
r
r
r
⋅
−
⋅
−
⋅
=
=
=
−
⋅ −
−
⋅ −
Если сравнить коэффициенты парной и
частной корреляции
, то можно увидеть
, что из
- за высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные оценки тесноты связи
Именно по этой причине рекомендуется при наличии сильной коллинеарности
(
взаимосвязи
) факторов исключать из исследования тот
39 фактор
, у
которого теснота парной зависимости меньше
, чем теснота межфакторной связи
Коэффициент множественной корреляции определить через матрицы парных коэффициентов корреляции
(3.9):
1 2 11 1
yx x
r
R
r
∆
=
−
∆
, где
1 2
1 1 2 2
2 1 1
1 1
yx
yx
yx
x x
yx
x x
r
r
r
r
r
r
r
∆ =
– определитель матрицы парных коэффициентов корреляции
;
1 2 2 1 11 1
1
x x
x x
r
r
r
∆ =
– определитель матрицы межфакторной корреляции
Находим
:
1 0,970 0,941 0,970 1
0,943 1 0,8607 0,8607 0,941 0,943 1
0,8855 0,8892 0,9409 0,0058;
r
∆ =
= +
+
−
−
−
−
=
11 1
0,943 1 0,8892 0,1108 0,943 1
r
∆ =
= −
=
Коэффициент множественной корреляции
:
1 2 0,0058 1
0,973 0,1108
yx x
R
=
−
=
Аналогичный результат получим при использовании формул
(3.8) и
(3.10):
1 2 2
ост
2 0,305 1
1 0,973 5,74
yx x
y
R
σ
σ
=
−
=
−
=
;
40 1 2 0,746 0,970 0, 237 0,941 0,973
i
yx x
i
yx
R
r
β
=
⋅
=
⋅
+
⋅
=
∑
;
Коэффициент множественной корреляции указывает на весьма сильную связь всего набора факторов с
результатом
3.
Нескорректированный коэффициент множественной детерминации
1 2 2
0,947
yx x
R
=
оценивает долю дисперсии результата за счет представленных в
уравнении факторов в
общей вариации результата
Здесь эта доля составляет
94,7% и
указывает на весьма высокую степень обусловленности вариации результата вариацией факторов
, иными словами
– на весьма тесную связь факторов с
результатом
Скорректированный коэффициент множественной детерминации
(
)
(
)
(
)
(
)
2 2
1 20 1 1
1 1
1 0,947 0,941 1
20 2 1
n
R
R
n
m
−
−
= − −
= − −
=
− −
− −
определяет тесноту связи с
учетом степеней свободы общей и
остаточной дисперсий
Он дает такую оценку тесноты связи
, которая не зависит от числа факторов и
поэтому может сравниваться по разным моделям с
разным числом факторов
Оба коэффициента указывают на весьма высокую
(
более
94% ) детерминированность результата
y
в модели факторами
1
x и
2
x .
4.
Оценку надежности уравнения регрессии в
целом и
показателя тесноты связи
1 2
yx x
R
дает
F
- критерий
Фишера
:
2 2
1 1
R
n
m
F
R
m
− −
=
⋅
−
В
нашем случае фактическое значение
F
- критерия
Фишера
:
2
факт
2 0,973 20 2 1 151,88 1 0,973 2
F
− −
=
⋅
=
−
Получили
, что факт табл
151,88 3,59
F
F
=
>
=
(
при
20
n
=
), т
е вероятность случайно получить такое значение
F
- критерия не превышает
41 допустимый уровень значимости
5% .
Следовательно
, полученное значение не случайно
, оно сформировалось под влиянием существенных факторов
, т
е подтверждается статистическая значимость всего уравнения и
показателя тесноты связи
1 2
yx x
R
5.
Оценим статистическую значимость параметров чистой регрессии с
помощью
t - критерия
Стьюдента
Рассчитаем стандартные ошибки коэффициентов регрессии по формулам
(3.19) и
(3.20):
1 2 1
1 1 2 2
2 2
2 1
1 2,396 1 0,973 1
0, 2132 3
20 3 1
1,890 1 0,943
y
yx x
b
x
x x
R
m
n
r
σ
σ
⋅
−
⋅
−
=
⋅
=
⋅
=
−
−
⋅
−
⋅
−
;
1 2 2
2 1 2 2
2 2
2 1
1 2,396 1 0,973 1
0,0607 3
20 3 1
6,642 1 0,943
y
yx x
b
x
x x
R
m
n
r
σ
σ
⋅
−
⋅
−
=
⋅
=
⋅
=
−
−
⋅
−
⋅
−
Фактические значения
t - критерия
Стьюдента
:
1 1
1 0,946 4, 44 0, 2132
b
b
b
t
m
=
=
=
,
2 2
2 0,0856 1, 41 0,0607
b
b
b
t
m
=
=
=
Табличное значение критерия при уровне значимости
0,05
α
=
и числе степеней свободы
17
k
=
составит
(
)
табл
0,05;
17 2,11
t
k
α
=
=
=
Таким образом
, признается статистическая значимость параметра
1
b , т
к
1
табл
b
t
t
>
, и
случайная природа формирования параметра
2
b , т
к
2
табл
b
t
t
<
Доверительные интервалы для параметров чистой регрессии
:
1 1
*
1
табл
1 1
табл
b
b
b
m
t
b
b
m
t
−
⋅
≤ ≤ +
⋅
,
*
1 0, 496 1,396
b
≤ ≤
и
2 2
*
2
табл
2 2
табл
b
b
b
m
t
b
b
m
t
−
⋅
≤ ≤ +
⋅
,
*
1 0,0425 0, 2137
b
−
≤ ≤
6.
С
помощью частных
F
- критериев
Фишера оценим целесообразность включения в
уравнение множественной регрессии фактора
1
x после
2
x и
фактора
2
x после
1
x при помощи формул
(3.16):
42 1 2 2
1 1 2 2
2 2
1 1
1
yx x
yx
x
yx x
R
R
n
m
F
R
−
− −
=
⋅
−
;
1 2 1
2 2 2 2
2 2
1 1
1
yx x
yx
x
yx x
R
R
n
m
F
R
−
− −
=
⋅
−
Найдем
1 2
yx
R и
2 2
yx
R
:
1 1
2 2
2 0,970 0,941
yx
yx
R
r
=
=
=
;
2 2
2 2
2 0,941 0,885
yx
yx
R
r
=
=
=
Имеем
:
1 0,947 0,885 20 2 1 19,89 1 0,947 1
x
F
−
− −
=
⋅
=
−
;
2 0,947 0,941 20 2 1 1,924 1 0,947 1
x
F
−
− −
=
⋅
=
−
Получили
, что
(
)
2
табл
1 2
0,89 0,05;
1;
17 4, 45
x
F
F
k
k
α
=
<
=
=
=
=
Следовательно, включение в модель фактора
2
x после того, как в модель включен фактор
1
x статистически нецелесообразно: прирост факторной дисперсии за счет дополнительного признака
2
x оказывается незначительным, несущественным; фактор
2
x включать в уравнение после фактора
1
x не следует.
Если поменять первоначальный порядок включения факторов в модель и рассмотреть вариант включения
1
x после
2
x , то результат расчета частного F -критерия для
1
x будет иным.
1
табл
17,86 4, 45
x
F
F
=
>
=
, т.е. вероятность его случайного формирования меньше принятого стандарта
( )
0,05 5%
α
=
. Следовательно, значение частного F -критерия для дополнительно включенного фактора
1
x не случайно, является статистически значимым, надежным, достоверным: прирост факторной дисперсии за счет дополнительного фактора
1
x является существенным.
Фактор
1
x должен присутствовать в уравнении, в том числе в варианте, когда он дополнительно включается после фактора
2
x .
По
20 предприятиям региона изучается зависимость выработки продукции на одного работника
y (
тыс руб
.) от ввода в
действие новых основных фондов
1
x ( % от стоимости фондов на конец года
) и
от удельного веса рабочих высокой квалификации в
общей численности рабочих
2
x ( % ).
Номер предприятия
y
1
x
2
x
Номер предприятия
y
1
x
2
x
1 7,0 3,9 10,0 11 9,0 6,0 21,0 2
7,0 3,9 14,0 12 11,0 6,4 22,0 3
7,0 3,7 15,0 13 9,0 6,8 22,0 4
7,0 4,0 16,0 14 11,0 7,2 25,0 5
7,0 3,8 17,0 15 12,0 8,0 28,0 6
7,0 4,8 19,0 16 12,0 8,2 29,0 7
8,0 5,4 19,0 17 12,0 8,1 30,0 8
8,0 4,4 20,0 18 12,0 8,5 31,0 9
8,0 5,3 20,0 19 14,0 9,6 32,0 10 10,0 6,8 20,0 20 14,0 9,0 36,0
Требуется
:
1.
Построить линейную модель множественной регрессии
Записать стандартизованное уравнение множественной регрессии
На основе стандартизованных коэффициентов регрессии и
средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат
2.
Найти коэффициенты парной
, частной и
множественной корреляции
Проанализировать их
3.
Найти скорректированный коэффициент множественной детерминации
Сравнить его с
нескорректированным
(
общим
) коэффициентом детерминации
4.
С
помощью
F
- критерия
Фишера оценить статистическую надежность уравнения регрессии и
коэффициента детерминации
1 2 2
yx x
R
34
5.
С
помощью
t - критерия оценить статистическую значимость коэффициентов чистой регрессии
6.
С
помощью частных
F
- критериев
Фишера оценить целесообразность включения в
уравнение множественной регрессии фактора
1
x после
2
x и
фактора
2
x после
1
x .
7.
Составить уравнение линейной парной регрессии
, оставив лишь один значащий фактор
Решение
Для удобства проведения расчетов поместим результаты промежуточных расчетов в
таблицу
:
Таблица
3.1
№
y
1
x
2
x
1
yx
2
yx
1 2
x x
2 1
x
2 2
x
2
y
1
2
3
4
5
6
7
8
9
10
1 7,0 3,9 10,0 27,3 70,0 39,0 15,21 100,0 49,0 2
7,0 3,9 14,0 27,3 98,0 54,6 15,21 196,0 49,0 3
7,0 3,7 15,0 25,9 105,0 55,5 13,69 225,0 49,0 4
7,0 4,0 16,0 28,0 112,0 64,0 16,0 256,0 49,0 5
7,0 3,8 17,0 26,6 119,0 64,6 14,44 289,0 49,0 6
7,0 4,8 19,0 33,6 133,0 91,2 23,04 361,0 49,0 7
8,0 5,4 19,0 43,2 152,0 102,6 29,16 361,0 64,0 8
8,0 4,4 20,0 35,2 160,0 88,0 19,36 400,0 64,0 9
8,0 5,3 20,0 42,4 160,0 106,0 28,09 400,0 64,0 10 10,0 6,8 20,0 68,0 200,0 136,0 46,24 400,0 100,0 11 9,0 6,0 21,0 54,0 189,0 126,0 36,0 441,0 81,0 12 11,0 6,4 22,0 70,4 242,0 140,8 40,96 484,0 121,0 13 9,0 6,8 22,0 61,2 198,0 149,6 46,24 484,0 81,0 14 11,0 7,2 25,0 79,2 275,0 180,0 51,84 625,0 121,0 15 12,0 8,0 28,0 96,0 336,0 224,0 64,0 784,0 144,0 16 12,0 8,2 29,0 98,4 348,0 237,8 67,24 841,0 144,0 17 12,0 8,1 30,0 97,2 360,0 243,0 65,61 900,0 144,0 18 12,0 8,5 31,0 102,0 372,0 263,5 72,25 961,0 144,0 19 14,0 9,6 32,0 134,4 448,0 307,2 92,16 1024,0 196,0 20 14,0 9,0 36,0 126,0 504,0 324,0 81,0 1296,0 196,0
Сумма
192 123,8 446 1276,3 4581 2997,4 837,74 10828,0 1958,0
Ср. знач.
9,6 6,19 22,3 63,815 229,05 149,87 41,887 541,4 97,9
Найдем средние квадратические отклонения признаков
:
2 2
2 97,9 9,6 5,74 2,396
y
y
y
σ
=
−
=
−
=
=
;
35 1
2 2
2 1
1 41,887 6,19 3,571 1,890
x
x
x
σ
=
−
=
−
=
=
;
2 2
2 2
2 2
541, 4 22,3 44,11 6,642
x
x
x
σ
=
−
=
−
=
=
1.
Для нахождения параметров линейного уравнения множественной регрессии
1 1 2 2
ˆy
a
b x
b x
= +
+
необходимо решить систему линейных уравнений относительно неизвестных параметров
a ,
1
b ,
2
b (3.3) либо воспользоваться готовыми формулами
(3.4).
Рассчитаем сначала парные коэффициенты корреляции
:
(
)
1 1
1
cov
,
63,815 6,19 9,6 0,970 1,890 2,396
yx
y
x
y x
r
σ σ
−
⋅
=
=
=
⋅
⋅
;
(
)
2 2
2
cov
,
229,05 22,3 9,6 0,941 6,642 2,396
yx
y
x
y x
r
σ σ
−
⋅
=
=
=
⋅
⋅
;
(
)
1 2 1
2 1
2
cov
,
149,87 6,19 22,3 0,943 1,890 6,642
x x
x
x
x x
r
σ σ
−
⋅
=
=
=
⋅
⋅
Находим по формулам
(3.4) коэффициенты чистой регрессии и
параметр
a :
1 2
1 2 1
1 2 1
2 2
2,396 0,970 0,941 0,943 0,946 1
1,890 1 0,943
yx
yx
x x
y
x
x x
r
r r
b
r
σ
σ
−
−
⋅
=
⋅
=
⋅
=
−
−
;
2 1
1 2 2
1 2 2
2 2
2,396 0,941 0,970 0,943 0,0856 1
6,642 1 0,943
yx
yx
x x
y
x
x x
r
r r
b
r
σ
σ
−
−
⋅
=
⋅
=
⋅
=
−
−
;
1 1 2 2 9,6 0,946 6,19 0,0856 22,3 1,835
a
y
b x
b x
= −
−
=
−
⋅
−
⋅
=
Таким образом
, получили следующее уравнение множественной регрессии
:
1 2
ˆ
1,835 0,946 0,0856
y
x
x
=
+
⋅ +
⋅
Уравнение регрессии показывает
, что при увеличении ввода в
действие основных фондов на
1% (
при неизменном уровне удельного веса
36 рабочих высокой квалификации
) выработка продукции на одного рабочего увеличивается в
среднем на
0,946 тыс руб
., а
при увеличении удельного веса рабочих высокой квалификации в
общей численности рабочих на
1%
(
при неизменном уровне ввода в
действие новых основных фондов
) выработка продукции на одного рабочего увеличивается в
среднем на
0,086 тыс руб
После нахождения уравнения регрессии составим новую расчетную таблицу для определения теоретических значений результативного признака
, остаточной дисперсии и
средней ошибки аппроксимации
Таблица
3.2
№
y
1
x
2
x
ˆy
ˆ
y
y
−
(
)
2
ˆ
y
y
−
i
A , %
1 7,0 3,9 10,0 6,380 0,620 0,384 8,851 2
7,0 3,9 14,0 6,723 0,277 0,077 3,960 3
7,0 3,7 15,0 6,619 0,381 0,145 5,440 4
7,0 4,0 16,0 6,989 0,011 0,000 0,163 5
7,0 3,8 17,0 6,885 0,115 0,013 1,643 6
7,0 4,8 19,0 8,002
-1,002 1,004 14,317 7
8,0 5,4 19,0 8,570
-0,570 0,325 7,123 8
8,0 4,4 20,0 7,709 0,291 0,084 3,633 9
8,0 5,3 20,0 8,561
-0,561 0,315 7,010 10 10,0 6,8 20,0 9,980 0,020 0,000 0,202 11 9,0 6,0 21,0 9,309
-0,309 0,095 3,429 12 11,0 6,4 22,0 9,773 1,227 1,507 11,158 13 9,0 6,8 22,0 10,151
-1,151 1,325 12,789 14 11,0 7,2 25,0 10,786 0,214 0,046 1,944 15 12,0 8,0 28,0 11,800 0,200 0,040 1,668 16 12,0 8,2 29,0 12,075
-0,075 0,006 0,622 17 12,0 8,1 30,0 12,066
-0,066 0,004 0,547 18 12,0 8,5 31,0 12,530
-0,530 0,280 4,413 19 14,0 9,6 32,0 13,656 0,344 0,118 2,459 20 14,0 9,0 36,0 13,431 0,569 0,324 4,067
Сумма
192 123,8 446 191,992 0,008 6,093 95,437
Ср знач
9,6 6,19 22,3 9,6
–
0,305 4,77
Остаточная дисперсия
:
37
(
)
2 2
ост
ˆ
6,093 0,305 20
y
y
n
σ
−
=
=
=
∑
Средняя ошибка аппроксимации
:
ˆ
1 95, 437%
100%
4,77%
20
y
y
A
n
y
−
=
⋅
=
=
∑
Качество модели
, исходя из относительных отклонений по каждому наблюдению
, признается хорошим
, т
к средняя ошибка аппроксимации не превышает
10%.
Коэффициенты
1
β
и
2
β
стандартизованного уравнения регрессии
1 2
1 2
ˆ
,
y
x
x
t
t
t
β
β
ε
=
+
+
находятся по формуле
(3.7):
1 1
1 1,890 0,946 0,746 2,396
x
y
b
σ
β
σ
=
=
⋅
=
;
2 2
2 6,642 0,0856 0, 237 2,396
x
y
b
σ
β
σ
=
=
⋅
=
Т
е уравнение будет выглядеть следующим образом
:
1 2
ˆ
0,746 0, 237
y
x
x
t
t
t
=
⋅ +
⋅
Так как стандартизованные коэффициенты регрессии можно сравнивать между собой
, то можно сказать
, что ввод в
действие новых основных фондов оказывает большее влияние на выработку продукции
, чем удельный вес рабочих высокой квалификации
Сравнивать влияние факторов на результат можно также при помощи средних коэффициентов эластичности
(3.8):
i
i
i
i
x
x
Э
b
y
= ⋅
Вычисляем
:
1 6,19 0,946 0,61 9,6
Э
=
⋅
=
;
2 22,3 0,0856 0, 20 9,6
Э
=
⋅
=
38
Т
е увеличение только основных фондов
(
от своего среднего значения
) или только удельного веса рабочих высокой квалификации на
1% увеличивает в
среднем выработку продукции на
0,61% или
0,20% соответственно
Таким образом
, подтверждается большее влияние на результат
y фактора
1
x , чем фактора
2
x .
2.
Коэффициенты парной корреляции мы уже нашли
:
1 0,970
yx
r
=
;
2 0,941
yx
r
=
;
1 2 0,943
x x
r
=
Они указывают на весьма сильную связь каждого фактора с
результатом
, а
также высокую межфакторную зависимость
(
факторы
1
x и
2
x явно коллинеарны
, т
к
1 2 0,943 0,7
x x
r
=
>
).
При такой сильной межфакторной зависимости рекомендуется один из факторов исключить из рассмотрения
Частные коэффициенты корреляции характеризуют тесноту связи между результатом и
соответствующим фактором при элиминировании
(
устранении влияния
) других факторов
, включенных в
уравнение регрессии
При двух факторах частные коэффициенты корреляции рассчитываются следующим образом
:
(
) (
)
(
) (
)
1 2
1 2 1
2 2
1 2 2
2 2
2 0,970 0,941 0,943 0,734 1 0,941 1 0,943 1
1
yx
yx
x x
yx x
yx
x x
r
r
r
r
r
r
⋅
−
⋅
−
⋅
=
=
=
−
⋅ −
−
⋅ −
;
(
) (
)
(
) (
)
2 1
1 2 2
1 1
1 2 2
2 2
2 0,941 0,970 0,943 0,325 1 0,970 1 0,943 1
1
yx
yx
x x
yx x
yx
x x
r
r
r
r
r
r
⋅
−
⋅
−
⋅
=
=
=
−
⋅ −
−
⋅ −
Если сравнить коэффициенты парной и
частной корреляции
, то можно увидеть
, что из
- за высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные оценки тесноты связи
Именно по этой причине рекомендуется при наличии сильной коллинеарности
(
взаимосвязи
) факторов исключать из исследования тот
39 фактор
, у
которого теснота парной зависимости меньше
, чем теснота межфакторной связи
Коэффициент множественной корреляции определить через матрицы парных коэффициентов корреляции
(3.9):
1 2 11 1
yx x
r
R
r
∆
=
−
∆
, где
1 2
1 1 2 2
2 1 1
1 1
yx
yx
yx
x x
yx
x x
r
r
r
r
r
r
r
∆ =
– определитель матрицы парных коэффициентов корреляции
;
1 2 2 1 11 1
1
x x
x x
r
r
r
∆ =
– определитель матрицы межфакторной корреляции
Находим
:
1 0,970 0,941 0,970 1
0,943 1 0,8607 0,8607 0,941 0,943 1
0,8855 0,8892 0,9409 0,0058;
r
∆ =
= +
+
−
−
−
−
=
11 1
0,943 1 0,8892 0,1108 0,943 1
r
∆ =
= −
=
Коэффициент множественной корреляции
:
1 2 0,0058 1
0,973 0,1108
yx x
R
=
−
=
Аналогичный результат получим при использовании формул
(3.8) и
(3.10):
1 2 2
ост
2 0,305 1
1 0,973 5,74
yx x
y
R
σ
σ
=
−
=
−
=
;
40 1 2 0,746 0,970 0, 237 0,941 0,973
i
yx x
i
yx
R
r
β
=
⋅
=
⋅
+
⋅
=
∑
;
Коэффициент множественной корреляции указывает на весьма сильную связь всего набора факторов с
результатом
3.
Нескорректированный коэффициент множественной детерминации
1 2 2
0,947
yx x
R
=
оценивает долю дисперсии результата за счет представленных в
уравнении факторов в
общей вариации результата
Здесь эта доля составляет
94,7% и
указывает на весьма высокую степень обусловленности вариации результата вариацией факторов
, иными словами
– на весьма тесную связь факторов с
результатом
Скорректированный коэффициент множественной детерминации
(
)
(
)
(
)
(
)
2 2
1 20 1 1
1 1
1 0,947 0,941 1
20 2 1
n
R
R
n
m
−
−
= − −
= − −
=
− −
− −
определяет тесноту связи с
учетом степеней свободы общей и
остаточной дисперсий
Он дает такую оценку тесноты связи
, которая не зависит от числа факторов и
поэтому может сравниваться по разным моделям с
разным числом факторов
Оба коэффициента указывают на весьма высокую
(
более
94% ) детерминированность результата
y
в модели факторами
1
x и
2
x .
4.
Оценку надежности уравнения регрессии в
целом и
показателя тесноты связи
1 2
yx x
R
дает
F
- критерий
Фишера
:
2 2
1 1
R
n
m
F
R
m
− −
=
⋅
−
В
нашем случае фактическое значение
F
- критерия
Фишера
:
2
факт
2 0,973 20 2 1 151,88 1 0,973 2
F
− −
=
⋅
=
−
Получили
, что факт табл
151,88 3,59
F
F
=
>
=
(
при
20
n
=
), т
е вероятность случайно получить такое значение
F
- критерия не превышает
41 допустимый уровень значимости
5% .
Следовательно
, полученное значение не случайно
, оно сформировалось под влиянием существенных факторов
, т
е подтверждается статистическая значимость всего уравнения и
показателя тесноты связи
1 2
yx x
R
5.
Оценим статистическую значимость параметров чистой регрессии с
помощью
t - критерия
Стьюдента
Рассчитаем стандартные ошибки коэффициентов регрессии по формулам
(3.19) и
(3.20):
1 2 1
1 1 2 2
2 2
2 1
1 2,396 1 0,973 1
0, 2132 3
20 3 1
1,890 1 0,943
y
yx x
b
x
x x
R
m
n
r
σ
σ
⋅
−
⋅
−
=
⋅
=
⋅
=
−
−
⋅
−
⋅
−
;
1 2 2
2 1 2 2
2 2
2 1
1 2,396 1 0,973 1
0,0607 3
20 3 1
6,642 1 0,943
y
yx x
b
x
x x
R
m
n
r
σ
σ
⋅
−
⋅
−
=
⋅
=
⋅
=
−
−
⋅
−
⋅
−
Фактические значения
t - критерия
Стьюдента
:
1 1
1 0,946 4, 44 0, 2132
b
b
b
t
m
=
=
=
,
2 2
2 0,0856 1, 41 0,0607
b
b
b
t
m
=
=
=
Табличное значение критерия при уровне значимости
0,05
α
=
и числе степеней свободы
17
k
=
составит
(
)
табл
0,05;
17 2,11
t
k
α
=
=
=
Таким образом
, признается статистическая значимость параметра
1
b , т
к
1
табл
b
t
t
>
, и
случайная природа формирования параметра
2
b , т
к
2
табл
b
t
t
<
Доверительные интервалы для параметров чистой регрессии
:
1 1
*
1
табл
1 1
табл
b
b
b
m
t
b
b
m
t
−
⋅
≤ ≤ +
⋅
,
*
1 0, 496 1,396
b
≤ ≤
и
2 2
*
2
табл
2 2
табл
b
b
b
m
t
b
b
m
t
−
⋅
≤ ≤ +
⋅
,
*
1 0,0425 0, 2137
b
−
≤ ≤
6.
С
помощью частных
F
- критериев
Фишера оценим целесообразность включения в
уравнение множественной регрессии фактора
1
x после
2
x и
фактора
2
x после
1
x при помощи формул
(3.16):
42 1 2 2
1 1 2 2
2 2
1 1
1
yx x
yx
x
yx x
R
R
n
m
F
R
−
− −
=
⋅
−
;
1 2 1
2 2 2 2
2 2
1 1
1
yx x
yx
x
yx x
R
R
n
m
F
R
−
− −
=
⋅
−
Найдем
1 2
yx
R и
2 2
yx
R
:
1 1
2 2
2 0,970 0,941
yx
yx
R
r
=
=
=
;
2 2
2 2
2 0,941 0,885
yx
yx
R
r
=
=
=
Имеем
:
1 0,947 0,885 20 2 1 19,89 1 0,947 1
x
F
−
− −
=
⋅
=
−
;
2 0,947 0,941 20 2 1 1,924 1 0,947 1
x
F
−
− −
=
⋅
=
−
Получили
, что
(
)
2
табл
1 2
0,89 0,05;
1;
17 4, 45
x
F
F
k
k
α
=
<
=
=
=
=
Следовательно, включение в модель фактора
2
x после того, как в модель включен фактор
1
x статистически нецелесообразно: прирост факторной дисперсии за счет дополнительного признака
2
x оказывается незначительным, несущественным; фактор
2
x включать в уравнение после фактора
1
x не следует.
Если поменять первоначальный порядок включения факторов в модель и рассмотреть вариант включения
1
x после
2
x , то результат расчета частного F -критерия для
1
x будет иным.
1
табл
17,86 4, 45
x
F
F
=
>
=
, т.е. вероятность его случайного формирования меньше принятого стандарта
( )
0,05 5%
α
=
. Следовательно, значение частного F -критерия для дополнительно включенного фактора
1
x не случайно, является статистически значимым, надежным, достоверным: прирост факторной дисперсии за счет дополнительного фактора
1
x является существенным.
Фактор
1
x должен присутствовать в уравнении, в том числе в варианте, когда он дополнительно включается после фактора
2
x .