Файл: Практикум по эконометрике с применением ms excel линейные модели парной и множественной регрессии казань 2008.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.11.2023

Просмотров: 114

Скачиваний: 9

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

14
Для расчета доверительного интервала определяем предельную
ошибку

для каждого показателя:
a
a
m
t
табл
=

,
b
b
m
t
табл
=

Формулы для расчета доверительных интервалов имеют следующий вид:
a
a
a

±
=
γ
;
a
a
a


=
min
γ
;
a
a
a

+
=
max
γ
;
b
b
b

±
=
γ
;
b
b
b


=
min
γ
;
b
b
b

+
=
max
γ
;
Если в границы доверительного интервала попадает ноль, т.е. нижняя граница отрицательна, а верхняя положительна, то оцениваемый параметр принимается нулевым, так как он не может одновременно принимать и положительное, и отрицательное значения.
Связь между
F
-критерием Фишера и
t
-статистикой Стьюдента выражается равенством
r
b
t
t
F
=
=
(2.12)
В прогнозных расчетах по уравнению регрессии определяется
предсказываемое индивидуальное значение
0
y как точечный прогноз при
0
x
x
=
, т.е. путем подстановки в линейное уравнение
ˆ
x
y
a
b x
= + ⋅
соответствующего значения x . Однако точечный прогноз явно нереален, поэтому он дополняется расчетом стандартной ошибки
(
)
(
)
(
)
0 2
2 2
2
ˆ
ост ост
2 2
1 1
1 1
p
p
y
x
x
x
x
x
m
S
S
n
n
n
x
x
σ










=
+ +
=
+ +











, (2.13) где
(
)
2 2
ост
ˆ
2
x
y
y
S
n

=


, и построением доверительного интервала
прогнозного значения
0
y

:
0
ˆ
ˆ
0
табл
0
табл
ˆ
ˆ
x
y
x
y
y
m
t
y
y
m
t





+


15

2.2. Решение типовой задачи
Пример
. По территориям региона приводятся данные за 199X г.
Таблица 2.2
Номер региона
Среднедушевой прожиточный минимум в день одного трудоспособного, руб., x
Среднедневная заработная плата, руб., y
1 78 133 2
82 148 3
87 134 4
79 154 5
89 162 6
106 195 7
67 139 8
88 158 9
73 152 10 87 162 11 76 159 12 115 173
Требуется
:
1.
Построить линейное уравнение парной регрессии y по x .
2.
Рассчитать линейный коэффициент парной корреляции, коэффициент детерминации и среднюю ошибку аппроксимации.
3.
Оценить статистическую значимость уравнения регрессии в целом и отдельных параметров регрессии и корреляции с помощью
F
- критерия Фишера и
t
-критерия Стьюдента.
4.
Выполнить прогноз заработной платы
y
при прогнозном значении среднедушевого прожиточного минимума
x
, составляющем
107% от среднего уровня.
5.
Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
6.
На одном графике отложить исходные данные и теоретическую прямую.

16
Решение
1. Для расчета параметров уравнения линейной регрессии строим расчетную таблицу 2.3.
Таблица
2.3

x
y
y x

2
x
2
y
ˆ
x
y
ˆ
x
y
y

(
)
2
ˆ
x
y
y

i
A
1
2
3
4
5
6
7
8
9
10
1 78 133 10374 6084 17689 148,78
–15,78 249,01 11,86 2
82 148 12136 6724 21904 152,46
–4,46 19,89 3,01 3
87 134 11658 7569 17956 157,06
–23,06 531,76 17,21 4
79 154 12166 6241 23716 149,70 4,30 18,49 2,79 5
89 162 14418 7921 26244 158,90 3,10 9,61 1,91 6
106 195 20670 11236 38025 174,54 20,46 418,61 10,49 7
67 139 9313 4489 19321 138,66 0,34 0,12 0,24 8
88 158 13904 7744 24964 157,98 0,02 0,00 0,01 9
73 152 11096 5329 23104 144,18 7,82 61,15 5,14 10 87 162 14094 7569 26244 157,06 4,94 24,40 3,05 11 76 159 12084 5776 25281 146,94 12,06 145,44 7,58 12 115 173 19895 13225 29929 182,82
–9,82 96,43 5,68
Итого
1027 1869 161808 89907 294377 1869,08
–0,08 1574,91 68,97
Среднее значение
85,58 155,75 13484,0 7492,25 24531,4 155,76

131,24 5,75
σ
12,97 16,53






2
σ
168,31 273,34






По формулам (2.5) находим параметры регрессии
2 2
2 13484 155,75 85,58 154,915 0,92 7492, 25 85,58 168,31
y x
y x
b
x
x
⋅ − ⋅


=
=
=
=


;
155,75 0,92 85,58 77,02
a
y
b x
= − ⋅ =


=
Получено уравнение регрессии
:
77,02 0,92
y
x
=
+

Параметр регрессии позволяет сделать вывод
, что с
увеличением среднедушевого прожиточного минимума на
1 руб среднедневная заработная плата возрастает в
среднем на
0,92 руб
. (
или
92 коп
.).
После нахождения уравнения регрессии заполняем столбцы
7–10 таблицы
2.3.


17
2.
Тесноту линейной связи оценит коэффициент корреляции
(2.6):
12,97 0,92 0,722 16,53
x
xy
y
r
b
σ
σ
= ⋅
=

=
;
Т
к значение коэффициента корреляции больше
0,7, то это говорит о
наличии весьма тесной линейной связи между признаками
Коэффициент детерминации
:
2 0,521
xy
r
=
Это означает
, что
52% вариации заработной платы
( y ) объясняется вариацией фактора
x – среднедушевого прожиточного минимума
Качество модели определяет средняя ошибка аппроксимации
(2,7):
1 68,97 5,75%
12
i
A
A
n
=
=
=

Качество построенной модели оценивается как хорошее
, так как
A не превышает
10%.
3. Оценку статистической значимости уравнения регрессии в
целом проведем с
помощью
F
- критерия
Фишера
Фактическое значение
F
- критерия по формуле
(2.9) составит
(
)
2
факт
2 0,521 2
10 10,88 1
1 0,521
xy
xy
r
F
n
r
=
⋅ − =
⋅ =


Табличное значение критерия при пятипроцентном уровне значимости и
степенях свободы
1 1
k
=
и
2 12 2 10
k
= − =
составляет табл
4,96
F
=
Так как факт табл
10, 41 4,96
F
F
=
>
=
, то уравнение регрессии признается статистически значимым
Оценку статистической значимости параметров регрессии и
корреляции проведем с
помощью
t - статистики
Стьюдента и
путем расчета доверительного интервала каждого из параметров
Табличное значение
t - критерия для числа степеней свободы
2 12 2 10
df
n
= − = − =
и уровня значимости
0,05
α
=
составит табл
2, 23
t
=

18
Определим стандартные ошибки
a
m
,
b
m
,
xy
r
m
(остаточная дисперсия на одну степень свободы
(
)
2 2
ост
ˆ
1574,91 157, 49 2
10
x
y
y
S
n

=
=
=


):
2 2
ост
2 2
2 89907 157, 49 24, 42 12 164,94
a
x
x
m
S
n
σ
=
=

=


;
2
ост
2 157, 49 0, 282 12 164,94
b
x
S
m
n
σ
=
=
=


;
2 1
1 0,521 0, 219 2
12 2
xy
xy
r
r
m
n


=
=
=


Тогда
77,02 3,15 24, 42
a
a
a
t
m
=
=
=
;
0,92 3, 26 0, 282
b
b
b
t
m
=
=
=
;
0,722 3,30 0, 219
xy
xy
xy
r
r
r
t
m
=
=
=
Фактические значения
t - статистики превосходят табличное значение
: табл
3, 26 2,3
a
t
t
=
>
=
; табл
3,16 2,3
b
t
t
=
>
=
; табл
3, 25 2,3
xy
r
t
t
=
>
=
, поэтому параметры
a , b и
xy
r не случайно отличаются от нуля
, а
статистически значимы
Рассчитаем доверительные интервалы для параметров регрессии
a и
b .
Для этого определим предельную ошибку для каждого показателя
: табл
2, 23 24, 42 54, 46
a
a
t
m
∆ =

=

=
; табл
2, 23 0, 282 0,63
b
b
t
m
∆ =

=

=
Доверительные интервалы
77,02 54, 46
a
a
a
γ
= ± ∆ =
±
и
22,56 131, 48
a



;


19 0,92 0,63
b
b
b
γ
= ± ∆ =
±
и 0, 29 1,55
b

≤ ≤
Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью
1 0,95
p
α
= − =
параметры a и b , находясь в указанных границах, не принимают нулевых значений, т.е. являются статистически значимыми и существенно отличны от нуля.
4. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение прожиточного минимума составит:
0 1,07 85,6 1,07 91,6
x
x
= ⋅
=

=
руб., тогда индивидуальное прогнозное значение заработной платы составит:
0
ˆ
77,02 0,92 91,6 161, 29
y
=
+

=
руб.
5. Ошибка прогноза составит:
(
)
(
)
0 2
2 2
0
ˆ
ост
2 91,6 85,6 1
1 1
157, 49 1
13,17 12 12 164,94
y
x
x
x
m
S
n
n
σ






=
+ +
=
⋅ +
+
=














Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит:
0 0
ˆ
ˆ
табл
2, 23 13,17 29,37
y
y
t
m
∆ =

=

=
Доверительный интервал прогноза:
0 0
ˆ
ˆ
0
ˆ
161, 29 29,37
y
y
y
γ
=
± ∆ =
±
и
0 131,92 190,66
y



Выполненный прогноз среднемесячной заработной платы является надежным (
1 1 0,05 0,95
p
α
= − = −
=
) и находится в пределах от 131,92 руб. до 190,66 руб.
6. В заключение решения задачи построим на одном графике исходные данные и теоретическую прямую (рис. 2.1):

20
Рис
. 2.1.

21
2.3. Решение типовой задачи в MS Excel
C помощью инструмента анализа данных Регрессия можно получить результаты регрессионной статистики, дисперсионного анализа, доверительных интервалов, остатки и графики подбора линии регрессии.
Если в меню сервис еще нет команды Анализ данных, то необходимо сделать следующее. В главном меню последовательно выбираем Сервис→Надстройки и устанавливаем «флажок» в строке
Пакет
анализа (рис. 2.2):
Рис
. 2.2
Далее следуем по следующему плану.
1. Если исходные данные уже внесены, то выбираем
Сервис→Анализ
данных→Регрессия.

22 2. Заполняем диалоговое окно ввода данных и параметров вывода
(рис. 2.3):
Рис
. 2.3
Здесь:
Входной
интервал
Y
– диапазон, содержащий данные результативного признака;
Входной интервал X – диапазон, содержащий данные признака- фактора;
Метки – «флажок», который указывает, содержи ли первая строка названия столбцов;
Константа – ноль – «флажок», указывающий на наличие или отсутствие свободного члена в уравнении;


23
Выходной интервал – достаточно указать левую верхнюю ячейку будущего диапазона;
Новый рабочий лист – можно указать произвольное имя нового листа (или не указывать, тогда результаты выводятся на вновь созданный лист).
Получаем следующие результаты для рассмотренного выше примера:
Рис
. 2.4
Откуда выписываем, округляя до 4 знаков после запятой и переходя к нашим обозначениям:
Уравнение регрессии:
ˆ
76,9765 0,9204
x
y
x
=
+
Коэффициент корреляции:
0,7210
xy
r
=
Коэффициент детерминации:
2 0,5199
xy
r
=

24
Фактическое значение
F
-критерия Фишера:
10,8280
F
=
Остаточная дисперсия на одну степень свободы:
2
ост
157, 4922
S
=
Корень квадратный из остаточной дисперсии (стандартная ошибка): ост
12,5496
S
=
Стандартные ошибки для параметров регрессии:
24, 2116
a
m
=
,
0, 2797
b
m
=
Фактические значения t -критерия Стьюдента:
3,1793
a
t
=
,
3, 2906
b
t
=
Доверительные интервалы:
23,0298 130,9232
a



,
0, 2972 1,5437
b

≤ ≤
Как видим, найдены все рассмотренные выше параметры и характеристики уравнения регрессии, за исключением средней ошибки аппроксимации (значение t -критерия Стьюдента для коэффициента корреляции совпадает с
b
t ). Результаты «ручного счета» от машинного отличаются незначительно (отличия связаны с ошибками округления).

25
3. Множественная регрессия и корреляция
3.1.Теоретическая справка
Множественная регрессия – это уравнение связи с несколькими независимыми переменными:
(
)
1 2
,
, ...,
m
y
f x x
x
ε
=
+
, где y – зависимая переменная (результативный признак);
1 2
,
, ...,
m
x x
x – независимые переменные (признаки-факторы).
Для построения уравнения множественной регрессии чаще используются следующие функции:
• линейная –
1 1
2 2
m
m
y
a
b x
b
x
b
x
ε
= + ⋅ + ⋅ + + ⋅
+
;
• степенная –
1 2
1 2
m
b
b
b
m
y
a x
x
x
ε
= ⋅

⋅ ⋅

;
• экспонента –
1 1 2
2
e
m
m
a b x
b x
b x
y
ε
+ ⋅ + ⋅ + + ⋅ +
=
;
• гипербола –
1 1
2 2
1
m
m
y
a
b x
b
x
b
x
ε
=
+ ⋅ + ⋅ + + ⋅
+
Можно использовать и другие функции, приводимые к линейному виду.
Для оценки параметров уравнения множественной регрессий применяют метод наименьших квадратов (МНК). Для линейных уравнений
1 1
2 2
m
m
y
a
b x
b
x
b
x
ε
= + ⋅ + ⋅ + +

+
(3.1) строится следующая система нормальных уравнений, решение которой позволяет получить оценки параметров регрессии:
1 1
2 2
2 1
1 1
1 2
1 2 1
2 1
1 2
2
,
,
m
m
m
m
m
m
m
m
m
m
y
na
b
x
b
x
b
x
yx
a
x
b
x
b
x x
b
x x
yx
a
x
b
x x
b
x x
b
x

=
+
+
+ +

=
+
+
+ +




=
+
+
+















(3.2)